Reconnaissance automatique des langues - IRITJerome.Farinas/ERMITES2007/ERMITES... ·...

51
Reconnaissance automatique des langues ERMITES 2007 http://www.irit.fr/~Jerome.Farinas/ERMITES2007/ Jérôme Farinas [email protected] Équipe SAMOVA (Structuration, Analyse et Modélisation de la Vidéo et de l’Audio)

Transcript of Reconnaissance automatique des langues - IRITJerome.Farinas/ERMITES2007/ERMITES... ·...

Page 1: Reconnaissance automatique des langues - IRITJerome.Farinas/ERMITES2007/ERMITES... · 2008-04-07 · 4 Problématique IAL Identification Automatique de la Langue (Language Identification)

Reconnaissance automatique des langues

ERMITES 2007

http://www.irit.fr/~Jerome.Farinas/ERMITES2007/

Jérôme [email protected]

Équipe SAMOVA(Structuration, Analyse et Modélisation de la Vidéo et de l’Audio)

Page 2: Reconnaissance automatique des langues - IRITJerome.Farinas/ERMITES2007/ERMITES... · 2008-04-07 · 4 Problématique IAL Identification Automatique de la Langue (Language Identification)

2

Organisation de la présentation

I. Analyse du mediao Problématique IALo Sources d’information

• Acoustique• Phonotactique• Lexicale• Prosodique

II. Modélisationo Sans prise en compte de l’enchaînement temporelo Stochastiqueo Enchaînement temporel

III. Fusion d’informationso Approche probabilisteo Approche arithmétiqueo PPRLMo Autres formalismeso Campagnes d’évaluation

IV. Synthèse

Page 3: Reconnaissance automatique des langues - IRITJerome.Farinas/ERMITES2007/ERMITES... · 2008-04-07 · 4 Problématique IAL Identification Automatique de la Langue (Language Identification)

3

Partie I

Analyse du média

Page 4: Reconnaissance automatique des langues - IRITJerome.Farinas/ERMITES2007/ERMITES... · 2008-04-07 · 4 Problématique IAL Identification Automatique de la Langue (Language Identification)

4

Problématique IAL

Identification Automatique de la Langue(Language Identification)

Définition : détecter la langue parlée à partir de quelques secondes d’un échantillon sonoreObjectif : aiguiller vers un système de reconnaissance de la parole multilingue, aiguiller vers standardiste parlant la langue pour un numéro urgence (ex : 911), central téléphonique hôtelier, bornes interactives multilingues, indexation multimédia, renseignement militaire, etc.Contraintes : nombre limité de langue connues ou bien pas de limite (rejet), décision rapide (dès les premières secondes)

Page 5: Reconnaissance automatique des langues - IRITJerome.Farinas/ERMITES2007/ERMITES... · 2008-04-07 · 4 Problématique IAL Identification Automatique de la Langue (Language Identification)

5

Sources d’information

Différentes sources d’informations sont exploitables pour l’IAL :

Acoustiques : les sons et leur fréquences d’apparition varient d’une langue à l’autrePhonotactiques : les enchaînements entre les sons et leur fréquence d’apparition caractérisent les languesLexicales : les mots sont souvent propres aux langues. Source d’information peu intéressante si l’on veut pouvoir rajouter une langue au système sans connaissances a priori.Prosodiques : le rythme et l’intonation varient d’une langue àl’autre.

Page 6: Reconnaissance automatique des langues - IRITJerome.Farinas/ERMITES2007/ERMITES... · 2008-04-07 · 4 Problématique IAL Identification Automatique de la Langue (Language Identification)

6

Sources d’information : acoustique

L’inventaire des sons varient d’une langue à l’autre (UPSID [Vallée 94])

Même si une langue partage les mêmes sons avec une autre, il est fort peu probable que leur fréquence d’apparition soit identique.

Nécessite des décodeurs acoustico-phonétiques ou bien une segmentation au niveau phonétique ou infra phonétique

Page 7: Reconnaissance automatique des langues - IRITJerome.Farinas/ERMITES2007/ERMITES... · 2008-04-07 · 4 Problématique IAL Identification Automatique de la Langue (Language Identification)

7

Sources d’information : phonotactique

L’enchaînement des sons est particulier aux langues

Certains enchaînements ne se retrouvent pas dans d’autres langues

Leur fréquence d’apparition est également unique

Page 8: Reconnaissance automatique des langues - IRITJerome.Farinas/ERMITES2007/ERMITES... · 2008-04-07 · 4 Problématique IAL Identification Automatique de la Langue (Language Identification)

8

Sources d’information : lexicale

Chaque langue possède son propre lexique.Difficulté : la frontière entre les mots n’est pas facile àtrouver quand on ne connaît pas la langue.Utiliser l’inventaire des mots d’une langue impose de disposer d’importantes ressources lexicales, qui ne sont pas forcément faciles à obtenir (langues rares ou bien langues ne disposant pas de transcriptions textuelles).Si l’on veut pouvoir rajouter une langue facilement à un système, cette source d’information n’est pas privilégiée car elle demande des ressources coûteuses ou bien demandant l’utilisation d’expertises.Quelques travaux ont été réalisés en utilisant partiellement cette ressource ([Hieronymous 96], [Adda 98])

Page 9: Reconnaissance automatique des langues - IRITJerome.Farinas/ERMITES2007/ERMITES... · 2008-04-07 · 4 Problématique IAL Identification Automatique de la Langue (Language Identification)

9

Sources d’information : prosodie (1/3)

émotionsstress colère

accentuation

intonationmélodie

rythme

emphase focalisationmodalité

Page 10: Reconnaissance automatique des langues - IRITJerome.Farinas/ERMITES2007/ERMITES... · 2008-04-07 · 4 Problématique IAL Identification Automatique de la Langue (Language Identification)

10

Sources d’information : prosodie (2/3)

Définition de la prosodie

(acoustique)(acoustique)= F0 + E + durée

(perceptuel)(perceptuel)= hauteur + intensité + longueur

(structure prosodique)(structure prosodique)= intonation + accentuation + rythme

Page 11: Reconnaissance automatique des langues - IRITJerome.Farinas/ERMITES2007/ERMITES... · 2008-04-07 · 4 Problématique IAL Identification Automatique de la Langue (Language Identification)

11

Sources d’information : prosodie (3/3)

Langues accentuelles- Anglais- Néerlandais- Polonais- …Langues syllabiques- Espagnol- Italien- Français- Catalan- …Langues moraïques- japonais

Page 12: Reconnaissance automatique des langues - IRITJerome.Farinas/ERMITES2007/ERMITES... · 2008-04-07 · 4 Problématique IAL Identification Automatique de la Langue (Language Identification)

12

Organisation de la présentation

I. Analyse du mediao Problématique IALo Sources d’information

o Acoustiqueo Phonotactiqueo Lexicaleo Prosodique

II. Modélisationo Sans prise en compte de l’enchaînement temporelo Stochastiqueo Enchaînement temporel

III. Fusion d’informationso Approche probabilisteo Approche arithmétiqueo PPRLMo Autres formalismeso Campagnes d’évaluation

IV. Synthèse

Page 13: Reconnaissance automatique des langues - IRITJerome.Farinas/ERMITES2007/ERMITES... · 2008-04-07 · 4 Problématique IAL Identification Automatique de la Langue (Language Identification)

13

Partie II

Modélisation

Page 14: Reconnaissance automatique des langues - IRITJerome.Farinas/ERMITES2007/ERMITES... · 2008-04-07 · 4 Problématique IAL Identification Automatique de la Langue (Language Identification)

14

Modélisations

Modélisations sans prise en compte de l’enchaînement temporel- Loi simple de probabilité- Mélange de gaussiennes- Machines à vecteur support

Modélisations en prenant en compte l’enchaînement temporel- Modèles de Markov Cachés

Modélisations de suites temporelles- N-gram- N-multigram

Page 15: Reconnaissance automatique des langues - IRITJerome.Farinas/ERMITES2007/ERMITES... · 2008-04-07 · 4 Problématique IAL Identification Automatique de la Langue (Language Identification)

15

Loi de probabilité

Soit un ensemble de langues à identifier :L = {L1, L2… Ln}

Et O une observation.P(L/O)

En utilisant la règle de Bayes :P(L/O)=P(O/L) / P(L)

En supposant les langues équiprobables il reste à définir :P(O/L)

L*=argmax(P(O/L))L

Page 16: Reconnaissance automatique des langues - IRITJerome.Farinas/ERMITES2007/ERMITES... · 2008-04-07 · 4 Problématique IAL Identification Automatique de la Langue (Language Identification)

16

Mélanges de lois Gaussiennes

En utilisant l’indépendance temporelle des observations :

Page 17: Reconnaissance automatique des langues - IRITJerome.Farinas/ERMITES2007/ERMITES... · 2008-04-07 · 4 Problématique IAL Identification Automatique de la Langue (Language Identification)

17

HMM

Page 18: Reconnaissance automatique des langues - IRITJerome.Farinas/ERMITES2007/ERMITES... · 2008-04-07 · 4 Problématique IAL Identification Automatique de la Langue (Language Identification)

18

SVM

Il s’agit ici de définit la frontière entre deux classes, il s’agit d’une modélisation discriminative et non générative (comme les GMM).But : trouver un hyperplan de séparation optimal

Marge : distance du point leplus proche à l’hyperplan

Page 19: Reconnaissance automatique des langues - IRITJerome.Farinas/ERMITES2007/ERMITES... · 2008-04-07 · 4 Problématique IAL Identification Automatique de la Langue (Language Identification)

19

N-gram

N-gram = sous séquence de n élémentsPr(wi | w1,...,wi − 1) = Pr(wi | wi − (n − 1),wi − (n − 2),...,wi − 1)

Ex : trigrammes (n=3)Pr(wi | w1,...,wi − 1) = Pr(wi | wi − 2,wi − 1)

Apprentissage : comptabiliser les séquences.Modélisation alternative : n-multigrammes (faire varier la taille des séquences).

Page 20: Reconnaissance automatique des langues - IRITJerome.Farinas/ERMITES2007/ERMITES... · 2008-04-07 · 4 Problématique IAL Identification Automatique de la Langue (Language Identification)

20

Un cas d’étude : prosodie (1/4)

Quelles modélisations sur quels paramètres?

Page 21: Reconnaissance automatique des langues - IRITJerome.Farinas/ERMITES2007/ERMITES... · 2008-04-07 · 4 Problématique IAL Identification Automatique de la Langue (Language Identification)
Page 22: Reconnaissance automatique des langues - IRITJerome.Farinas/ERMITES2007/ERMITES... · 2008-04-07 · 4 Problématique IAL Identification Automatique de la Langue (Language Identification)

22

Un cas d’étude : prosodie (2/4)

Extraction de paramètres- Segmentation du signal (algo. Divergence Forward-Backward [André-

Obrecht 1988])- Détection d’activité vocale- Classification consonne-voyelle- Calcul de caractéristiques

RythmeIntonation

Fréq

uenc

e(k

Hz) 8

4

0

0 0.2 0.4 0.6 0.8 1.0

Ampl

itude

Temps (s)

E l a Em E otR e bR n

Page 23: Reconnaissance automatique des langues - IRITJerome.Farinas/ERMITES2007/ERMITES... · 2008-04-07 · 4 Problématique IAL Identification Automatique de la Langue (Language Identification)

23

Un cas d’étude : prosodie (3/4)

}

}}

Fréq

uenc

e(k

Hz) 8

4

0

0 0.2 0.4 0.6 0.8 1.0

Ampl

itude

Temps (s)} } }}Rythme :- Durée C- Durée V- Complexité C

Intonation :- Skewness(F0)- Kurtosis(F0)- Place de l’accent

⎟⎟⎟

⎜⎜⎜

350

150msms

⎟⎟⎟

⎜⎜⎜

ms12041,025,0

E l a Em E otR e bR n

Page 24: Reconnaissance automatique des langues - IRITJerome.Farinas/ERMITES2007/ERMITES... · 2008-04-07 · 4 Problématique IAL Identification Automatique de la Langue (Language Identification)

24

Un cas d’étude : prosodie (4/4)

Problème ramené à un problème de modélisation statistiqueUn GMM pour chaque paramètreNombre de gaussiennes fixées lors de l’apprentissage

Page 25: Reconnaissance automatique des langues - IRITJerome.Farinas/ERMITES2007/ERMITES... · 2008-04-07 · 4 Problématique IAL Identification Automatique de la Langue (Language Identification)

25

Organisation de la présentation

I. Analyse du mediao Problématique IALo Sources d’information

• Acoustique• Phonotactique• Lexicale• Prosodique

II. Modélisationo Sans prise en compte de l’enchaînement temporelo Stochastiqueo Enchaînement temporel

III. Fusion d’informationso Approche probabilisteo Approche arithmétiqueo PPRLMo Autres formalismeso Campagnes d’évaluation

IV. Synthèse

Page 26: Reconnaissance automatique des langues - IRITJerome.Farinas/ERMITES2007/ERMITES... · 2008-04-07 · 4 Problématique IAL Identification Automatique de la Langue (Language Identification)

26

Partie III

Fusion d’information

Page 27: Reconnaissance automatique des langues - IRITJerome.Farinas/ERMITES2007/ERMITES... · 2008-04-07 · 4 Problématique IAL Identification Automatique de la Langue (Language Identification)

27

Fusion d’information

Phonetic Decoder

RhythmModeling

Intonation Modeling

LanguageModeling

Decision

Vocalic system

Occlusive system

Fricative system

{ }T

oooO ...21

={ }

Tψψψ=Ψ ...

21

),Pr( ii LO Ψ

)Pr( ii LΨ

{ }TsssS ...21=

)Pr( ii LS

{ }TfffF ...21=

)Pr( ii LF

Modèle Rythme

Modèle Intonation

Modèle

Multigramme

DecisionDécision

Vocalic system

Occlusive system

Fricative system

Vocalic systemYoyelles

Occlusive systemOcclusives

Fricative systemFricatives

{ }T

oooO ...21

={ }

Tψψψ=Ψ ...

21

),Pr( ii LO Ψ

)Pr( ii LΨ

{ }TsssS ...21=

)Pr( ii LS

{ }TfffF ...21=

)Pr( ii LF

Décodeur Grandes classes

Page 28: Reconnaissance automatique des langues - IRITJerome.Farinas/ERMITES2007/ERMITES... · 2008-04-07 · 4 Problématique IAL Identification Automatique de la Langue (Language Identification)

28

Approche probabiliste (1/2)

Décomposition du problème en sous problèmes [Hazen&Zue]•

Page 29: Reconnaissance automatique des langues - IRITJerome.Farinas/ERMITES2007/ERMITES... · 2008-04-07 · 4 Problématique IAL Identification Automatique de la Langue (Language Identification)

29

Approche probabiliste (2/2)

Décomposition du problème en sous problèmes [Hazen&Zue]• a : vecteur acoustique, f : vecteur prosodique• C : séquence phonétique S : segmentation associée

- Modèle acoustico-phonétique : - Modèle prosodique :- Modèle phonétique de langage :Hypothèses d’indépendance simplificatrices :

Page 30: Reconnaissance automatique des langues - IRITJerome.Farinas/ERMITES2007/ERMITES... · 2008-04-07 · 4 Problématique IAL Identification Automatique de la Langue (Language Identification)

30

Approche arithmétique

Exploiter les performances de chaque système pour combiner les sources d’information

[Hazen NIST 94]

Pondération des résultats pour le système complet.

Longueur fichier 10 s > 30 sModèle de langage 61,6% 72,7%Modèle acoustique 48,8% 52,9%Modèle de durée 34,7% 43,3%Modèle F0 12,4% 20,3%Système global 65,4% 70,1%

Page 31: Reconnaissance automatique des langues - IRITJerome.Farinas/ERMITES2007/ERMITES... · 2008-04-07 · 4 Problématique IAL Identification Automatique de la Langue (Language Identification)

31

PPRLM

Parallel Phone Recognition followed by Language Modeling[Zissman]

Page 32: Reconnaissance automatique des langues - IRITJerome.Farinas/ERMITES2007/ERMITES... · 2008-04-07 · 4 Problématique IAL Identification Automatique de la Langue (Language Identification)

32

Autres formalismes

Modéliser l’espace des scores par modèles génératifsThéorie des possibilités- Le fait d’avoir l’opinion possibiliste de N experts sur la langue

peut-être vue comme un événements dont on souhaite connaître la possibilité

- Prise en compte d’indices de confiance d’experts et de classeThéorie des fonctions de croyance- Utilisation de degrés de croyances pour représenter l’incertitude

sur un événementcf. [Gutierrez 2005]

Page 33: Reconnaissance automatique des langues - IRITJerome.Farinas/ERMITES2007/ERMITES... · 2008-04-07 · 4 Problématique IAL Identification Automatique de la Langue (Language Identification)

33

Campagnes d’évaluation (1/3)

NIST Language Recognition (http://www.nist.gov/speech/) - 1996- 2003- 2005- 2007 (en cours)

Corpus fournis par le LDC (OGI-MLTS, CALLFRIEND, SWITCHBOARD)- Grandes quantités pour l’apprentissage- Sélection de conditions d’enregistrement différents- Plus de 20 langues ou dialectes

Page 34: Reconnaissance automatique des langues - IRITJerome.Farinas/ERMITES2007/ERMITES... · 2008-04-07 · 4 Problématique IAL Identification Automatique de la Langue (Language Identification)

34

Campagnes d’évaluation (2/3)

Système MIT : fusion de 3 systèmes (classifieur Gaussien) :- PPRLM : Parallel Phone Recognition and Language Modeling- GMM : Gaussian Mixture Modeling- SVM : Support Vector Machine

PPRLM, évolution depuis 1996 :- 38 MFCC (ajout des coefs. d’accélération)- Cepstral Mean Normalisation- Ajout 3-gram + filtrage modèles de silence- Perte rapidité : 2.2 RT -> 15 RT

GMM- Shifted Delta Cepstra (SDC)- Modèles dépendants du genre

SVM- SDC- Produit info complémentaire au GMM et PPRLM

Page 35: Reconnaissance automatique des langues - IRITJerome.Farinas/ERMITES2007/ERMITES... · 2008-04-07 · 4 Problématique IAL Identification Automatique de la Langue (Language Identification)

35

Campagnes d’évaluation (3/3)

Résultats MIT 2003

Page 36: Reconnaissance automatique des langues - IRITJerome.Farinas/ERMITES2007/ERMITES... · 2008-04-07 · 4 Problématique IAL Identification Automatique de la Langue (Language Identification)

36

Synthèse (1/2)

Analyse- Observer le média pour en connaître sa spécificité, sa structure.- Réaliser un état de l’art (en parole ne pas négliger les théories

linguistiques)- Définir l’unité de travailModélisation- Choisir une modélisation adaptée en fonction de l’analyse du média- Conserver les caractéristiques temporelles quand cela est

nécessaireFusion- Conserver le maximum d’informations quand elles sont disponibles

(indices de confiance, experts).

Page 37: Reconnaissance automatique des langues - IRITJerome.Farinas/ERMITES2007/ERMITES... · 2008-04-07 · 4 Problématique IAL Identification Automatique de la Langue (Language Identification)

37

Synthèse (2/2)

Appliqué à un problème d’identification automatique des langues :Analyse- 4 niveaux participant à la discrimination des langues : acoustique,

phonotactique, lexique, prosodie- Prosodie : intonation et rythme, extraction de paramètres

correspondants (F0 et durée, mesures statistiques correspondantes), choix d’unités temporelles plus adaptées (syllabe)

Modélisation- GMM ou SVM pour les modélisations acoustiques- GMM, HMM ou n-gram pour la modélisation prosodiqueFusion- Prise en compte des performances des différents niveaux de

modélisationAttention aux protocoles d’évaluation !

Page 38: Reconnaissance automatique des langues - IRITJerome.Farinas/ERMITES2007/ERMITES... · 2008-04-07 · 4 Problématique IAL Identification Automatique de la Langue (Language Identification)

38

BibliographieF. Pellegrino, « Une approche phonétique en identification des langues : la modélisation acoustique des systèmes vocaliques », Thèse de doctorat, Université Paul Sabatier, Toulouse, France, décembre 1998J. Farinas, « Une modélisation automatique du rythme pour l’identification automatique des langues », Thèse de doctorat, Université Paul Sabatier, Toulouse, France, novembre 2002J. Gutierrez, « Fusion d’informations en Identification Automatique des Langues », Thèse de doctorat, Université Paul Sabatier, Toulouse, France, juillet 2005Y. K. Muthusamy et al., « A Comparison of Approaches to AutomaticLanguage Identification Using Telephone Speech », dans 3rd European Conference on Speech Communication and Technology, tome 2, p. 1307-1310, Berlin, Allemagne, septembre 1993NIST Language Recognition Evaluation, http://www.nist.gov/speech/tests/lang/A. Di Cristo, « Interpréter la prosodie », 23e JEP, Aussois, France, juin 2000

Page 39: Reconnaissance automatique des langues - IRITJerome.Farinas/ERMITES2007/ERMITES... · 2008-04-07 · 4 Problématique IAL Identification Automatique de la Langue (Language Identification)

39

Démos

Exemples de fichiers sonores traités- Démo 1

Système basique d’IAL réalisé à partir d’ALIZE/MISTRAL :- Démo 2

Page 40: Reconnaissance automatique des langues - IRITJerome.Farinas/ERMITES2007/ERMITES... · 2008-04-07 · 4 Problématique IAL Identification Automatique de la Langue (Language Identification)

40

Annexe 1

Machines à vecteur support

Page 41: Reconnaissance automatique des langues - IRITJerome.Farinas/ERMITES2007/ERMITES... · 2008-04-07 · 4 Problématique IAL Identification Automatique de la Langue (Language Identification)

41

SVM (1/9)

Il s’agit ici de définit la frontière entre deux classes, il s’agit d’une modélisation discriminative et non générative (comme les GMM).But : trouver un hyperplan de séparation optimal

Marge : distance du point leplus proche à l’hyperplan

Source : Olivier Bousquet

Page 42: Reconnaissance automatique des langues - IRITJerome.Farinas/ERMITES2007/ERMITES... · 2008-04-07 · 4 Problématique IAL Identification Automatique de la Langue (Language Identification)

42

SVM (2/9) : maximisation de la marge

Cas linéaireDéf. De l’hyperplan

Distance d’un point au plan

Maximiser la marge revient à minimiser sous contraintes

Page 43: Reconnaissance automatique des langues - IRITJerome.Farinas/ERMITES2007/ERMITES... · 2008-04-07 · 4 Problématique IAL Identification Automatique de la Langue (Language Identification)

43

SVM (3/9) : implémentation

Un point est bien classé si et seulement si :Comme le couple est défini à un coefficient multiplicateur près, on impose :

Rappelons que

On obtient le problème de minimisation sous contraintes

Page 44: Reconnaissance automatique des langues - IRITJerome.Farinas/ERMITES2007/ERMITES... · 2008-04-07 · 4 Problématique IAL Identification Automatique de la Langue (Language Identification)

44

SVM (4/9) : problème dual

On passe au problème dual en introduisant des multiplicateurs de Lagrange pour chaque contrainte.Ici on a une contrainte par exemple d’apprentissage

Problème de programmation quadratique de dimension(nombre d’exemples)

Matrice Hessienne :

Page 45: Reconnaissance automatique des langues - IRITJerome.Farinas/ERMITES2007/ERMITES... · 2008-04-07 · 4 Problématique IAL Identification Automatique de la Langue (Language Identification)

45

SVM (5/9) : Propriétés

Seuls les correspondants aux points les plus proches sont non nuls. On parle de vecteur de support.

Fonction de décision :

Page 46: Reconnaissance automatique des langues - IRITJerome.Farinas/ERMITES2007/ERMITES... · 2008-04-07 · 4 Problématique IAL Identification Automatique de la Langue (Language Identification)

46

SVM (6/9) : Cas non séparable

On introduit des variables pour assouplir les contraintes

On pénalise le dépassement de la contrainte.

Le problème dual a la même forme, on fixe juste une borne supérieure sur les

Page 47: Reconnaissance automatique des langues - IRITJerome.Farinas/ERMITES2007/ERMITES... · 2008-04-07 · 4 Problématique IAL Identification Automatique de la Langue (Language Identification)

47

SVM (7/9) : Espace intermédiaire

Au lieu de chercher un hyperplan dans l’espace des entrées, on passe d’abord dans un espace de représentation intermédiaire (feature space) de grande dimension.

On doit donc résoudre

Et la solution a la forme

Page 48: Reconnaissance automatique des langues - IRITJerome.Farinas/ERMITES2007/ERMITES... · 2008-04-07 · 4 Problématique IAL Identification Automatique de la Langue (Language Identification)

48

SVM (8/9) : Fonction noyau

Le problème et sa solution ne dépendent que des produits scalairesPlutôt que de choisir la fonction non linéaire on choisit une fonction appelée fonction noyau.- Elle représente un produit scalaire dans l’espace de

représentation intermédiaire. Elle traduit donc la répartition des exemples dans cet espace.

- Lorsque est bien choisie, on n’a pas besoin de calculer la représentation des exemples dans cet espace pour calculer la fonction

- Permet d’utiliser des représentations non vectoriellesLe noyau matérialise une notion de proximité adaptée au problème.

Page 49: Reconnaissance automatique des langues - IRITJerome.Farinas/ERMITES2007/ERMITES... · 2008-04-07 · 4 Problématique IAL Identification Automatique de la Langue (Language Identification)

49

SVM (9/9) : exemple de noyaux

Linéaire

Polynomial

Gaussien

Laplacien

Page 50: Reconnaissance automatique des langues - IRITJerome.Farinas/ERMITES2007/ERMITES... · 2008-04-07 · 4 Problématique IAL Identification Automatique de la Langue (Language Identification)

50

Annexe 2

Applications de la reconnaissancede la langue

Page 51: Reconnaissance automatique des langues - IRITJerome.Farinas/ERMITES2007/ERMITES... · 2008-04-07 · 4 Problématique IAL Identification Automatique de la Langue (Language Identification)

51

Applications en IAL

Renseignement militaire

Indexation audio- détection des interview en langue étrangère,- programmes bilingues,- alternance de langues (Arte TV…)

Sélection d’un flux audio avant de réaliser une transciption automatique

Communication internationale- Service de téléphone des hotels- Bornes interactives