Download - Identification d'une empreinte vocale pour les Nuls

Transcript
  • 1. @AmauryCrickx#dv14ievn Identification dune Empreinte Vocale pour les Nuls @AmauryCrickx Dveloppeur Java Ingnieur du son Recognito

2. @YourTwitterHandle#DVXFR14{session hashtag} @AmauryCrickx#dv14ievn 3. @AmauryCrickx#dv14ievn Agenda Primtre du Problme Comment a marche ? Aspects Pratiques 4. @AmauryCrickx#dv14ievn Caractristiques de la voix p arle Tonalit Timbre AccentFlot Vocabulaire Physique Comportement 5. @AmauryCrickx#dv14ievn Do vient la diffrence ? Larynx Cordes vocales 1. Pharynx 3. Cavit nasale 2. Cavit buccale 4. Cavit labiale 6. @AmauryCrickx#dv14ievn Do vient la diffrence ? Larynx Cordes vocales 1. Pharynx 3. Cavit nasale 2. Cavit buccale 4. Cavit labiale 7. @AmauryCrickx#dv14ievn Captation du signal + - 0 8. @AmauryCrickx#dv14ievn Numrisation du signal Frquence dchantillonnage de 16 KHz Amplitude Temps Encod sur 16 bits 9. @AmauryCrickx#dv14ievn Empreinte vocale Modle mathmatique bas sur les formants de la voix Trigonomtrie Equations diffrentielles et intgrales Nombre Complexe (Rel + Imaginaire) 10. @AmauryCrickx#dv14ievn Buts poursuivis Authentification Classification Identification Segmentation (Diarisation) 11. @AmauryCrickx#dv14ievn En rsum Frquences Uniques Numriser Extraction Modle Mathmatique Authentifier Identifier Classifier Segmenter 12. @AmauryCrickx#dv14ievn Agenda Primtre du Problme Comment a marche ? Aspects Pratiques 13. @AmauryCrickx#dv14ievn Recognito ? Identification du locuteur indpendamment du texte Librairie oriente dveloppeurs Thread safe Licence Apache 2 14. @AmauryCrickx#dv14ievn Enrlement 15. @AmauryCrickx#dv14ievn Constructeur 2 16. @AmauryCrickx#dv14ievn Identification 17. @AmauryCrickx#dv14ievn Dans les coulisses 18. @AmauryCrickx#dv14ievn Suppression du silence 19. @AmauryCrickx#dv14ievn Normalisation du volume 20. @AmauryCrickx#dv14ievn Linear Predictive Coding LPC Utilis pour compresser la voix dans la tlphonie double[20] Fentres de 25ms Empreinte vocale = moyenne des double[20] Extraction des caractristiques Empreinte vocale Fen. 1 Fen. 2 Moyenne 21. @AmauryCrickx#dv14ievn Fentrage 22. @AmauryCrickx#dv14ievn Fentrage 23. @AmauryCrickx#dv14ievn Fentrage 24. @AmauryCrickx#dv14ievn Fentrage 25. @AmauryCrickx#dv14ievn Fentrage 26. @AmauryCrickx#dv14ievn Distance Euclidienne Somme du carr des diffrences 27. @AmauryCrickx#dv14ievn Une poigne de classes Recognito Voice Activity Detector Normalizer Features Extractor Window Function LPC Distance Calculator Voice Print 28. @AmauryCrickx#dv14ievn Agenda Primtre du Problme Comment a marche ? Aspects Pratiques 29. @AmauryCrickx#dv14ievn FOSS ALIZE C/C++ LGPL Laboratoire Informatique dAvignon Plateforme open source d'authentification biomtrique LIUM Java GPL Laboratoire Informatique de lUniversit du Maine (Le Mans) Diarisation des locuteurs VoiceId Python GPL Diarisation LIUM + Identification MARF Java GPL 30. @AmauryCrickx#dv14ievn De nombreux acteurs Nuance VoiceVault ValidSoft Agnitio VoiceSecure Verint SesTek SpeechPro VoiceTrust Authentify Voice Biometrics Group Neurotechnology OxfordWaveResearch Recognition Technologies Acustek 31. @AmauryCrickx#dv14ievn Marchs viss Institutions Gouvernementales Call Centers Applications Mobiles 32. @AmauryCrickx#dv14ievn Authentification Rfrence Individuelle Modle Universel seuil Echantillon authentifier 33. @AmauryCrickx#dv14ievn Indicateurs de performance Seuil %Erreur False Acceptance Rate False Rejection Rate Equal Error Rate 34. @AmauryCrickx#dv14ievn Indicateurs de performance FAR, FRR, EER Nont de sens que lorsquon compare les mmes jeux de donnes Par exemple : NIST, PRISM, 35. @AmauryCrickx#dv14ievn Modalits dauthentification 1. Phrase cl Ma voix est mon mot de passe Enrlement : rpter 3 fois la phrase 36. @AmauryCrickx#dv14ievn Modalits dauthentification Reconnaissance Vocale Intonation Flot Robuste au bruit 1. Phrase cl Ma voix est mon mot de passe 37. @AmauryCrickx#dv14ievn Modalits dauthentification Pas 2 enregistrements identiques Dtection de traitements numriques 1. Phrase cl Ma voix est mon mot de passe 38. @AmauryCrickx#dv14ievn Modalits dauthentification Plus difficile obtenir Dtection de traitements numriques 2. Phrase alatoire correct cheval batterie agrafe Enrlement : lire une (longue) liste de mots 39. @AmauryCrickx#dv14ievn Modalits dauthentification Vrificateur humain Encore plus difficile contrefaire Dtection de traitements numriques Sensible au bruit environnant 3. En continu au cours dune conversation Enrlement : premire conversation vrifie 40. @AmauryCrickx#dv14ievn Vrification facteurs multiples Savoir Possder Etre Mot de passe Question / rponse Gnrateur de Token Biomtrie 41. @YourTwitterHandle#DVXFR14{session hashtag} @AmauryCrickx#dv14ievn 42. @AmauryCrickx#dv14ievn En rsum Technologie mature Cot faible Meilleure exprience utilisateur Sensibilit au bruit Variabilit de la voix Statistique par nature 43. @YourTwitterHandle#DVXFR14{session hashtag} @AmauryCrickx#dv14ievn 44. @AmauryCrickx#dv14ievn Crdit image / Creative Commons Rue pave By-Nc-Sa http://www.flickr.com/photos/22914687@N05/4957591422/sizes/l/ Sous la Tour Eiffel By-Nc-Sa http://www.flickr.com/photos/stewiedewie/244850735/sizes/l/in/photostream/ Sous le pont photo par B.Monginoux - By-Nc-Nd http://www.landscape-photo.net/displayimage.php?pid=5194 Le Louvre Photo par Anthony Gaudun - By-Nc-Sa http://www.flickr.com/photos/anthonygaudun/7474397964/sizes/o/in/photostream/ Slide template created by @glaforge, completed by @nmartignole for Devoxx FR2014