RPM - Reconnaissance de la Parole Multilingue

- Un début de Parcours -

- Un début de Parcours -

Chafic Mokbel et Gérard Chollet

Congrès 10ème Anniversaire Programme CEDRE

Chafic Mokbel et Gérard Chollet

Congrès 10ème Anniversaire Programme CEDRE

Un ParcoursUn Parcours

Qui Sommes Nous?Qui Sommes Nous? Université de Balamand

Chafic Mokbel Hanna Greige Walid Karam Rania Bayeh + des thésards et stagiaires

Université de Balamand Chafic Mokbel Hanna Greige Walid Karam Rania Bayeh + des thésards et stagiaires

ENST Gérard Chollet Dijana Petrovska Maurice Charbit Raphael Blouet Guido Aversano + des thésards et stagiaires

Le ProjetLe Projet

Base de donnéesBilingue

Reconnaissance deLa ParoleBilingue

Français/Arabe

HMMCART Reconnaissance du

LocuteurIndépendant du

BECARS

Base ScientifiqueBase Scientifique

Modèles stochastiques Les mélanges à composantes Gaussiennes Les chaînes de Markov Cachées Les arbres de classification et de régression

Spécialisation Adaptation ou algorithmes EM récursifs

Modèles stochastiques Les mélanges à composantes Gaussiennes Les chaînes de Markov Cachées Les arbres de classification et de régression

Spécialisation Adaptation ou algorithmes EM récursifs

Base ScientifiqueBase Scientifique Modèles de Markov Cachés (MMC ou “HMM”) A un instant t, le système est dans un état interne

(non observable) s(t) qui n’est observé qu’à travers une mesure x(t)

Modèles de Markov Cachés (MMC ou “HMM”) A un instant t, le système est dans un état interne

(non observable) s(t) qui n’est observé qu’à travers une mesure x(t)

s(t) x(t)

Base ScientifiqueMMC

1° 2°

3° 4°

Vitesse

Accélération1°

2°3°

Base Scientifique MMC

MMC () caractérisé par Probabilités d’occupation des états à l’instant

initial Probabilités de transition Distributions des observations

conditionnellement à l’état

Données incomplètes

MMC () caractérisé par Probabilités d’occupation des états à l’instant

initial Probabilités de transition Distributions des observations

conditionnellement à l’état

Données incomplètes ∑=

TssTTT ssxxpxxp

,...,111

)/,...,,,...,()/,...,( λλ

Base Scientifique MMC

Lors de la manipulation des MMCs, une partie des observations est cachée. Calcul de la vraisemblance (avant-arrière) Calcul du meilleur chemin (Viterbi) Apprentissage (EM)

Modèle stochastique: Besoin d’une base de données représentative Adaptation aux nouvelles conditions (EM récursif)

Lors de la manipulation des MMCs, une partie des observations est cachée. Calcul de la vraisemblance (avant-arrière) Calcul du meilleur chemin (Viterbi) Apprentissage (EM)

Modèle stochastique: Besoin d’une base de données représentative Adaptation aux nouvelles conditions (EM récursif)

Base ScientifiqueEM

Paramètres

Chemin ou Alignements

Base de donnéesBase de données

Avec CEDRE – RPM: Serveur de collecte de données parole Un programme de validation des données Une expérience en étiquettage 2 bases de données (BAD et BEAF) dont l’une

bilingue Plus d’expériences en reco

Avec CEDRE – RPM: Serveur de collecte de données parole Un programme de validation des données Une expérience en étiquettage 2 bases de données (BAD et BEAF) dont l’une

bilingue Plus d’expériences en reco

Reconnaissance MultilingueReconnaissance Multilingue

SpeechAnalysis and

FeatureExtraction

AcousticModeling

LexicalModeling

LinguisticModeling

P(wi / h)

DecisionModule

Inputspeech

Recognizedsentence

Reconnaissance MultilingueReconnaissance Multilingue

Peu de données dans BEAF partie arabe pour effectuer un apprentissage multilocuteur et surtout pour des modèles par mots Modélisation phonétique

Pas d’étiquettage phonétique lors du lancement des premières expériences

Peu de données dans BEAF partie arabe pour effectuer un apprentissage multilocuteur et surtout pour des modèles par mots Modélisation phonétique

Pas d’étiquettage phonétique lors du lancement des premières expériences

Modéliser les mots arabes en utilisant des modèles phonétiques français

Reconnaissance MultilingueReconnaissance Multilingue Modèles phonétiques français appris par l’Enst sur de large bases de données Inférence de structures phonétiques:

Description manuelle ta3deel tt aa dd ii ll

Inférence automatique: Trouver une ou plusieurs séquences phonétiques de manière que le modèle résultant soit le plus vraisemblable

Modèles phonétiques français appris par l’Enst sur de large bases de données Inférence de structures phonétiques:

Description manuelle ta3deel tt aa dd ii ll

Inférence automatique: Trouver une ou plusieurs séquences phonétiques de manière que le modèle résultant soit le plus vraisemblable

Vérification du LocuteurVérification du Locuteur

Identité proclamée Système de

Vérification du Locuteur

Acceptation

Technologie du Traitement Automatique de la Parole Technologie du Traitement Automatique de la Parole

Technologie Biométrique de l’Authentification

Automatique

Modélisation

Phase opérationnelle

Phase d’apprentissage

Paramétrisation

Base de donnéesId1 ,..,IdN

Comparaison et décision

Identité proclamée

Modélisation

Architecture des SystèmesArchitecture des Systèmes

Acceptation

RejetParamétrisation

Modélisation: travail effectuéModélisation: travail effectué

• Mise au point d’un système état-de-l’art• Mise au point d’un système avec adaptation MLLR des paramètres du mélange [Mokbel, 1992]• Participation commune aux évaluations NIST’2003

Organisée par le National Institute of Standard and Technologies (USA) 350 locuteurs – téléphones cellulaires – 20.000 accès

Regroupant les meilleurs laboratoires mondiaux: MIT, IBM… Résultats proches des meilleurs systèmes

BECARSBECARS

Balamand ENST CEDRE Automatic Recognition of SpeakersLogiciel libre (sous license cecile en France)http://tsi.enst.fr/becarshttp://www.balamand.edu.lb/english/

Research.asp

Balamand ENST CEDRE Automatic Recognition of SpeakersLogiciel libre (sous license cecile en France)http://tsi.enst.fr/becarshttp://www.balamand.edu.lb/english/

Research.asp

http://tsi.enst.fr/becars Utilisé par différents

labos dans différents pays

http://tsi.enst.fr/becars Utilisé par différents

labos dans différents pays

BioSecureBioSecure

NIST 2006NIST 2006

A la fin de RPMA la fin de RPM

Bases de données BEAF Système de reconnaissance multilingue BECARS

Suite à RPMSuite à RPM

BECARS

Reco Multi

NEMLAR

NIST 2004, 2005, 2006

Autres Domaines

Autres Projets

SecurePhone

BioSecure

Reco AudioVisuelle

Segmentation et codage Video

Imagerie Médicale

Prédiction d’erreur

Détection d’intrus

Transformation audio-visuelle

Reco de l’écriture manuscrite

Virgule fixe /PDA

Segmentation/Codage VideoSegmentation/Codage Video

Becars (G. Yazbek)

ConclusionsConclusions

CEDRE RPM était l’impulsion: Plusieurs technologies développées Plusieurs thèses en cours (5) Plusieurs projets en cours

Au delà et sur le plan scientifique: Le temps ou la position dans la séquence comme

paramètre (ou dimension de l’espace comme les autres dimensions)

Inférence de la connaissance à partir des données

CEDRE RPM était l’impulsion: Plusieurs technologies développées Plusieurs thèses en cours (5) Plusieurs projets en cours

Au delà et sur le plan scientifique: Le temps ou la position dans la séquence comme

paramètre (ou dimension de l’espace comme les autres dimensions)

Inférence de la connaissance à partir des données

RPM - Reconnaissance de la Parole Multilingue - Un début de Parcours - Chafic Mokbel et Gérard...

Transcript of RPM - Reconnaissance de la Parole Multilingue - Un début de Parcours - Chafic Mokbel et Gérard...

RPM - Reconnaissance de la Parole Multilingue - Un début de Parcours - Chafic Mokbel et Gérard...

Documents

Transcript of RPM - Reconnaissance de la Parole Multilingue - Un début de Parcours - Chafic Mokbel et Gérard...

MICROCONTROLEURS PIC PROGRAMMATION EN Cmpeea.free.fr/data/enique/cours-pic-13b.pdf · V. Chollet - cours-pic-13b - 09/12/2012 ...

BRARD ET SARRAN · BRARD ET SARRAN Z.A.E. DU CEDRE BRIARD TEL. : 01.64.01.07.56. 77320 BETON-BAZOCHES FAX : 01.64.01.06.17. courrier@brard-et …

COURS LabVIEW 12 - mpeea.free.frmpeea.free.fr/data/labview/cours-labview-09.pdf · V. Chollet - 29/01/2012 - COURS LabVIEW 12 ...

Cours parole du 9 Mars 2005 enseignants: Dr. Dijana Petrovska-Delacrétaz et Gérard Chollet

courbet - cedre face au cc colloque restit aforce 12dec12

Jacotte Chollet La Musique

Lettre Technique Mer - Littoral n°38 2 - Cedre

A Chollet - arasement digue - tmr-lathus.fr Chollet - arasement... · 2014. 2. 12. · L’ARASEMENT DE LA DIGUE DE BWA L’ARASEMENT DE LA DIGUE DE BWA SUR LA CORREZE A TULLE (19)SUR

The Mokbel Art Collection · Scénographie de l'exposition par Karim Bekdache Donner à voir le travail de Shafic Abboud imposait la création d'une scénographie specifique. Il ne

CEDREcache.media.education.gouv.fr/file/Cedre/14/9/DEPP-CEDRE... · 2015. 12. 21. · Sciences 2007 2013 2018 Math ematiques 2008 2014 2019 1.2 Les comp etences et connaissances vis

Une introduction à la vérification biométrique de l'identité Gérard CHOLLET chollet@tsi.enst.fr@ ENST/CNRS-LTCI 46 rue Barrault 75634 PARIS cedex 13 chollet.

Annonce - Lebanese University · 2015-09-22 · 30 INF1024 MOKBEL Bayan Saad 30 Admis 31 INF1043 TFAYLI Mhamad Ibrahim 31 Admis 32 INF1028 MOUSLIMANI Moustafa Mahmoud 32 Admis. Faculté

Historique de l’implication du Cedre dans les différentes ...cpham.perso.univ-pau.fr/iWEB/RESSACS2013/Programme... · Cedre, données ARGOS Bouées mises en œuvre dans le cadre

Améliorer le système de santé - BMZ · PDF fileger Composante 1 (Réforme du secteur santé); Rashad Mokbel, Conseiller technique en gestion ... unique au Maroc, destiné à soutenir

À du l jeune écoute Balzac Roland Chollet et Stéphane ... · Roland Chollet Directeur de recherches au C.N.R.S., Roland Chollet a publié La Comédie humaine, Les Cent Contes drolatiques,

Speaker Recognition G. CHOLLET, G. GRAVIER, J. KHARROUBI, D. PETROVSKA-DELACRETAZ (chollet, kharroub,petrovsk)@tsi.enst.fr ggravier@infres.enst.fr@ ENST/CNRS-LTCI.

Interactions langagières et parolières dans une société de linformation Gérard CHOLLET chollet@tsi.enst.fr chollet@tsi.enst.fr ENST/CNRS-LTCI 46 rue Barrault.

ROMARIN YLANG GERANIUM LAVANDIN CARDAMOME MENTHE EUCALYPTUS CEDRE ATLAS BOIS DE SIAM PIN SYLVESTRE TEA TREE CANNELLE ORANGE MANDARINE JAUNE PAMPLEMOUSSE.

Comparaison semis direct – labour Parcelle …agriculture-de-conservation.com/sites/.../IMG/pdf/...labour-suisse.pdf · Exploitant Yvan Chollet Denis Jotterand ... surface) que

Support de cours - Christian Chollet