Identification d'une empreinte vocale pour les Nuls

download Identification d'une empreinte vocale pour les Nuls

of 44

Embed Size (px)

description

Présentation Devoxx France 2014 Les nouvelles perspectives offertes par la reconnaissance vocale vont tôt ou tard nous confronter à l'usage de librairies spécialisées dont le fonctionnement interne nous échappe totalement. Comment dès lors les évaluer, les utiliser correctement et en tirer le meilleur parti ? Cette présentation ludique et pratique a pour objectif de démystifier les arcanes de l'analyse de la voix humaine et ses contraintes en vous présentant les rouages internes du logiciel libre "Recognito", créé par le conférencier et permettant l'identification d'un locuteur à partir de son empreinte vocale.

Transcript of Identification d'une empreinte vocale pour les Nuls

  • 1. @AmauryCrickx#dv14ievn Identification dune Empreinte Vocale pour les Nuls @AmauryCrickx Dveloppeur Java Ingnieur du son Recognito

2. @YourTwitterHandle#DVXFR14{session hashtag} @AmauryCrickx#dv14ievn 3. @AmauryCrickx#dv14ievn Agenda Primtre du Problme Comment a marche ? Aspects Pratiques 4. @AmauryCrickx#dv14ievn Caractristiques de la voix p arle Tonalit Timbre AccentFlot Vocabulaire Physique Comportement 5. @AmauryCrickx#dv14ievn Do vient la diffrence ? Larynx Cordes vocales 1. Pharynx 3. Cavit nasale 2. Cavit buccale 4. Cavit labiale 6. @AmauryCrickx#dv14ievn Do vient la diffrence ? Larynx Cordes vocales 1. Pharynx 3. Cavit nasale 2. Cavit buccale 4. Cavit labiale 7. @AmauryCrickx#dv14ievn Captation du signal + - 0 8. @AmauryCrickx#dv14ievn Numrisation du signal Frquence dchantillonnage de 16 KHz Amplitude Temps Encod sur 16 bits 9. @AmauryCrickx#dv14ievn Empreinte vocale Modle mathmatique bas sur les formants de la voix Trigonomtrie Equations diffrentielles et intgrales Nombre Complexe (Rel + Imaginaire) 10. @AmauryCrickx#dv14ievn Buts poursuivis Authentification Classification Identification Segmentation (Diarisation) 11. @AmauryCrickx#dv14ievn En rsum Frquences Uniques Numriser Extraction Modle Mathmatique Authentifier Identifier Classifier Segmenter 12. @AmauryCrickx#dv14ievn Agenda Primtre du Problme Comment a marche ? Aspects Pratiques 13. @AmauryCrickx#dv14ievn Recognito ? Identification du locuteur indpendamment du texte Librairie oriente dveloppeurs Thread safe Licence Apache 2 14. @AmauryCrickx#dv14ievn Enrlement 15. @AmauryCrickx#dv14ievn Constructeur 2 16. @AmauryCrickx#dv14ievn Identification 17. @AmauryCrickx#dv14ievn Dans les coulisses 18. @AmauryCrickx#dv14ievn Suppression du silence 19. @AmauryCrickx#dv14ievn Normalisation du volume 20. @AmauryCrickx#dv14ievn Linear Predictive Coding LPC Utilis pour compresser la voix dans la tlphonie double[20] Fentres de 25ms Empreinte vocale = moyenne des double[20] Extraction des caractristiques Empreinte vocale Fen. 1 Fen. 2 Moyenne 21. @AmauryCrickx#dv14ievn Fentrage 22. @AmauryCrickx#dv14ievn Fentrage 23. @AmauryCrickx#dv14ievn Fentrage 24. @AmauryCrickx#dv14ievn Fentrage 25. @AmauryCrickx#dv14ievn Fentrage 26. @AmauryCrickx#dv14ievn Distance Euclidienne Somme du carr des diffrences 27. @AmauryCrickx#dv14ievn Une poigne de classes Recognito Voice Activity Detector Normalizer Features Extractor Window Function LPC Distance Calculator Voice Print 28. @AmauryCrickx#dv14ievn Agenda Primtre du Problme Comment a marche ? Aspects Pratiques 29. @AmauryCrickx#dv14ievn FOSS ALIZE C/C++ LGPL Laboratoire Informatique dAvignon Plateforme open source d'authentification biomtrique LIUM Java GPL Laboratoire Informatique de lUniversit du Maine (Le Mans) Diarisation des locuteurs VoiceId Python GPL Diarisation LIUM + Identification MARF Java GPL 30. @AmauryCrickx#dv14ievn De nombreux acteurs Nuance VoiceVault ValidSoft Agnitio VoiceSecure Verint SesTek SpeechPro VoiceTrust Authentify Voice Biometrics Group Neurotechnology OxfordWaveResearch Recognition Technologies Acustek 31. @AmauryCrickx#dv14ievn Marchs viss Institutions Gouvernementales Call Centers Applications Mobiles 32. @AmauryCrickx#dv14ievn Authentification Rfrence Individuelle Modle Universel seuil Echantillon authentifier 33. @AmauryCrickx#dv14ievn Indicateurs de performance Seuil %Erreur False Acceptance Rate False Rejection Rate Equal Error Rate 34. @AmauryCrickx#dv14ievn Indicateurs de performance FAR, FRR, EER Nont de sens que lorsquon compare les mmes jeux de donnes Par exemple : NIST, PRISM, 35. @AmauryCrickx#dv14ievn Modalits dauthentification 1. Phrase cl Ma voix est mon mot de passe Enrlement : rpter 3 fois la phrase 36. @AmauryCrickx#dv14ievn Modalits dauthentification Reconnaissance Vocale Intonation Flot Robuste au bruit 1. Phrase cl Ma voix est mon mot de passe 37. @AmauryCrickx#dv14ievn Modalits dauthentification Pas 2 enregistrements identiques Dtection de traitements numriques 1. Phrase cl Ma voix est mon mot de passe 38. @AmauryCrickx#dv14ievn Modalits dauthentification Plus difficile obtenir Dtection de traitements numriques 2. Phrase alatoire correct cheval batterie agrafe Enrlement : lire une (longue) liste de mots 39. @AmauryCrickx#dv14ievn Modalits dauthentification Vrificateur humain Encore plus difficile contrefaire Dtection de traitements numriques Sensible au bruit environnant 3. En continu au cours dune conversation Enrlement : premire conversation vrifie 40. @AmauryCrickx#dv14ievn Vrification facteurs multiples Savoir Possder Etre Mot de passe Question / rponse Gnrateur de Token Biomtrie 41. @YourTwitterHandle#DVXFR14{session hashtag} @AmauryCrickx#dv14ievn 42. @AmauryCrickx#dv14ievn En rsum Technologie mature Cot faible Meilleure exprience utilisateur Sensibilit au bruit Variabilit de la voix Statistique par nature 43. @YourTwitterHandle#DVXFR14{session hashtag} @AmauryCrickx#dv14ievn 44. @AmauryCrickx#dv14ievn Crdit image / Creative Commons Rue pave By-Nc-Sa http://www.flickr.com/photos/22914687@N05/4957591422/sizes/l/ Sous la Tour Eiffel By-Nc-Sa http://www.flickr.com/photos/stewiedewie/244850735/sizes/l/in/photostream/ Sous le pont photo par B.Monginoux - By-Nc-Nd http://www.landscape-photo.net/displayimage.php?pid=5194 Le Louvre Photo par Anthony Gaudun - By-Nc-Sa http://www.flickr.com/photos/anthonygaudun/7474397964/sizes/o/in/photostream/ Slide template created by @glaforge, completed by @nmartignole for Devoxx FR2014