Cédric Gendrot - TAL SLOW 5 - 2003-2004 - ILPGA 1 Cours SLOW5 Informatique et Phonétique.
-
Upload
yvain-moine -
Category
Documents
-
view
104 -
download
0
Transcript of Cédric Gendrot - TAL SLOW 5 - 2003-2004 - ILPGA 1 Cours SLOW5 Informatique et Phonétique.
Cédric Gendrot - TAL SLOW 5 - 2003-2004 - ILPGA
1
Cours SLOW5
Informatique
et
Phonétique
Cédric Gendrot - TAL SLOW 5 - 2003-2004 - ILPGA
2
Le but de ce cours est de présenter une approche similaire à celle du TAL ….
… mais appliqué au signal sonore :
une introduction au traitement automatique de la parole
• 1- L'analyse automatique du signal sonore
• 2- Un langage de requêtes sur le signal sonore
• 3- Des applications extérieures au signal
Cédric Gendrot - TAL SLOW 5 - 2003-2004 - ILPGA
3
Dans ce cours, cette automatisation sera vue grâce à un logiciel principalement...
PRAAT
Commençons par nous familiariser avec ce logiciel...
Cédric Gendrot - TAL SLOW 5 - 2003-2004 - ILPGA
4
PRAATPRAAT
Cédric Gendrot - TAL SLOW 5 - 2003-2004 - ILPGA
5
Présentation générale
Le problème avec tous les logiciels d’analyse de son..…
– à chacun son petit plus…– on finit toujours par trouver des défauts– certains ont tendance à « planter »…souvent
Cédric Gendrot - TAL SLOW 5 - 2003-2004 - ILPGA
6
un de plus......?
Gratuit, renouvelé, modelable
Praat devient la référence. Il est étayé d'un site web très complet (http://www.praat.org) + forum
le plus grand nombre de fonctionnalités
Un langage de programmation intégré (Cf. VB)
Cédric Gendrot - TAL SLOW 5 - 2003-2004 - ILPGA
7
Les aspects développés ici1. Lire un fichier son (se balader dans le fichier, écouter, découper…)
2. Analyse acoustique (durées, Fo, intensité, valeurs spectrales)
3. Étiqueter (savoir étiqueter pour mieux utiliser Praat)
4. Pouvoir automatiser des opérations systématiques
Cédric Gendrot - TAL SLOW 5 - 2003-2004 - ILPGA
8
Les aspects développés ici1. Lire un fichier son (se balader dans le fichier, écouter, découper…)
2. Analyse acoustique (durées, Fo, intensité, valeurs spectrales)
3. Étiqueter (savoir étiqueter pour mieux utiliser Praat)
4. Pouvoir automatiser des opérations systématiques
Cédric Gendrot - TAL SLOW 5 - 2003-2004 - ILPGA
9
Le voici, le voilà
Imaginons les premiers pas...
Après avoir téléchargé le logiciel (il tient sur une disquette), vous double cliquez sur l’icône...
...........et.....
Cédric Gendrot - TAL SLOW 5 - 2003-2004 - ILPGA
10
Cédric Gendrot - TAL SLOW 5 - 2003-2004 - ILPGA
11
Cédric Gendrot - TAL SLOW 5 - 2003-2004 - ILPGA
12
Cédric Gendrot - TAL SLOW 5 - 2003-2004 - ILPGA
13
Donc faites bien la différence...
Pour décompresserle logiciel
Pour ouvrirle logiciel
Cédric Gendrot - TAL SLOW 5 - 2003-2004 - ILPGA
14
Ouvrons le logiciel...
Il faut donc comme toujours (double) cliquer sur l’icône de démarrage.
Notez qu’aucun raccourci n’est placé par défaut dans le menu « Démarrer »…
Il faut créer des raccourcis!
Cédric Gendrot - TAL SLOW 5 - 2003-2004 - ILPGA
15
Cédric Gendrot - TAL SLOW 5 - 2003-2004 - ILPGA
16
Ici seront stockés temporairement les (noms des) fichiers lus ou crées pendant la session de travail.
Temporairement parce qu’ils ne sont pas encore enregistrés (menu Write)
On ne voit que les noms des fichiers, il faut cliquer sur un bouton pour les visionner.
1er principe
Cédric Gendrot - TAL SLOW 5 - 2003-2004 - ILPGA
17
Si vous voulez créer une image, avec un spectrogramme, le signal, votre étiquetage......au choix...
tout se passe ici!
Cédric Gendrot - TAL SLOW 5 - 2003-2004 - ILPGA
18
1. Le B.A BA
1. Ouvrir un fichier son
2. Se balader dans le fichier…l’écouter
3. découper son fichier
Cédric Gendrot - TAL SLOW 5 - 2003-2004 - ILPGA
19
Le menu Read (cf. open) vous permet d’ouvrir des fichiers...
...des fichiers sonores bien sûr...
...mais aussi d’autres types de fichiers
Ces deux choix sont les plus utilisés
Un fichier peut être considéré long à partir de 45 secondes.
Ouvrons un fichier......
Cédric Gendrot - TAL SLOW 5 - 2003-2004 - ILPGA
20
Cédric Gendrot - TAL SLOW 5 - 2003-2004 - ILPGA
21
Cédric Gendrot - TAL SLOW 5 - 2003-2004 - ILPGA
22
maintenant qu’un nom de fichier est inscrit dans la liste, il faut le visionner.Dans tous les cas....
...cliquez sur Edit
Cédric Gendrot - TAL SLOW 5 - 2003-2004 - ILPGA
23
Cette fenêtre est très riche en renseignements et possibilités divers
notez le curseur qui indique le temps en secondes
par rapport au début du fichier
L’axe à droite indique les valeurs de Fo
(en Hz)
L’axe à gauche correspond aux valeurs du spectrogramme
(en Hz)
Les trois barres ci-dessous sont indispensables1. elle se découpe en fonction du curseur ou de la sélection2. elle permet de lire la fenêtre présente3. pour lire tout le fichier
et enfin...les 4 boutons archi-classiques
de tout logiciel d’analyse de son
all : pour voir tout le fichier
in : pour zoomerout : pour dé-zoomer
sel : pour zoomer sur la sélection
Cédric Gendrot - TAL SLOW 5 - 2003-2004 - ILPGA
24
notez le curseur qui indique le temps en secondes
par rapport au début du fichier
L’axe à droite indique les valeurs de Fo
(en Hz)
L’axe à gauche correspond aux valeurs du spectrogramme
(en Hz)
Les trois barres ci-dessous sont indispensables1. elle se découpe en fonction du curseur ou de la sélection2. elle permet de lire la fenêtre présente3. pour lire tout le fichier
et enfin...les 4 boutons archi-classiques
de tout logiciel d’analyse de son
all: pour voir tout le fichier
in: pour zoomerout: pour dé-zoomer
sel: pour zoomer sur la sélection
Cédric Gendrot - TAL SLOW 5 - 2003-2004 - ILPGA
25
Ici on a non plus un curseur mais
une sélection.
Les affichages de durée et les
possibilités de lecturesse sont adaptés...
Cédric Gendrot - TAL SLOW 5 - 2003-2004 - ILPGA
26
Commençons...
Voyons comment découper ces quatre phrases en 4 fichiers distincts.
Il n’est pas possible de créer des fichiers vierges sur lesquels on pourrait coller des morceaux
il faut donc se débrouiller autrement...
Cédric Gendrot - TAL SLOW 5 - 2003-2004 - ILPGA
27
.....
Il faut en fait « extraire » les quatre phrases une par une. Elles ne disparaissent pas mais leur copie est transférée dans la liste d’objets.
Cédric Gendrot - TAL SLOW 5 - 2003-2004 - ILPGA
28
Cédric Gendrot - TAL SLOW 5 - 2003-2004 - ILPGA
29
Cédric Gendrot - TAL SLOW 5 - 2003-2004 - ILPGA
30
Rien n'a changé… sauf que...
… Le fichier est apparu dans le "plan" de travail : la fenêtre "Praat Objects"
Cédric Gendrot - TAL SLOW 5 - 2003-2004 - ILPGA
31
Si l'on clique sur
"Edit"
Cédric Gendrot - TAL SLOW 5 - 2003-2004 - ILPGA
32
Cédric Gendrot - TAL SLOW 5 - 2003-2004 - ILPGA
33
Notez que l'on peutle renommer
en cliquant sur
"Rename"
Cédric Gendrot - TAL SLOW 5 - 2003-2004 - ILPGA
34
… Mais on peutégalement
le supprimer de la liste
en cliquant sur
"Remove"
Cédric Gendrot - TAL SLOW 5 - 2003-2004 - ILPGA
35
Et pour sauvegarder...
…tout fonctionne comme sur Word (ou autre)
« Write > Write to WAV file »
Rajoutez tout de même « .wav » si ce n’est pas fait automatiquement
Cédric Gendrot - TAL SLOW 5 - 2003-2004 - ILPGA
36
Exercice 1
Cédric Gendrot - TAL SLOW 5 - 2003-2004 - ILPGA
37
Comment suivre ces exercices?
Cette série d’exercices a pour but de vous faire pratiquer les possibilités passées en revue ...
Pour chaque exercice, vous pourrez utiliser les fichiers contenus dans le dossier « cours_slow5 ».
Cédric Gendrot - TAL SLOW 5 - 2003-2004 - ILPGA
38
…….
Vous pourrez à tout moment consulter le fichier PowerPoint que vous suivez en ce moment. Il est intitulé « cours_slow5 » et se trouve dans le même dossier...
Cédric Gendrot - TAL SLOW 5 - 2003-2004 - ILPGA
39
Principe général
Il vous suffira de passer de ces consignes sur PowerPoint au logiciel Praat en utilisant
– la barre des tâches (en bas de l ’écran)ou bien
– Alt + Tab (qui permet de passer d ’un logiciel à l ’autre)
Cédric Gendrot - TAL SLOW 5 - 2003-2004 - ILPGA
40
– Lire un fichier son
• se balader dans le fichier
• écouter
• découper
• copier-coller
• sauver
Application de l’étape 1 :
Cédric Gendrot - TAL SLOW 5 - 2003-2004 - ILPGA
41
Ouvrez le fichier "Praat demo.wav"
sélectionnez les 4 phrases pour faire quatre fichiers individuels (utilisez "extract…")
Attention le fichier original doit pouvoir resservir dans son intégralité…donc il ne faut pas le modifier (ou ne pas enregistrer les modifications!!!)
enregistrez les 4 phrases (sous le format .wav) toujours dans le même dossier (nommez les par exemple phrase1.wav, phrase2.wav...)
Cédric Gendrot - TAL SLOW 5 - 2003-2004 - ILPGA
42
Les aspects développés ici1. Lire un fichier son (se balader dans le fichier, écouter, découper…)
2. Analyse acoustique (durées, Fo, intensité, valeurs spectrales)
3. Étiqueter (savoir étiqueter pour mieux utiliser Praat)
4. Pouvoir automatiser des opérations systématiques
Cédric Gendrot - TAL SLOW 5 - 2003-2004 - ILPGA
43
Les aspects développés ici1. Lire un fichier son (se balader dans le fichier, écouter, découper…)
2. Analyse acoustique (durées, Fo, intensité, valeurs spectrales)
3. Étiqueter (savoir étiqueter pour mieux utiliser Praat)
4. Pouvoir automatiser des opérations systématiques
Cédric Gendrot - TAL SLOW 5 - 2003-2004 - ILPGA
44
Étape 2L’analyse acoustique
Maintenant que l’on sait lire un fichier, le découper et le sauvegarder…
...occupons nous de l’essentiel…
Una analyse acoustique … pourquoi faire ??
Cédric Gendrot - TAL SLOW 5 - 2003-2004 - ILPGA
45
Voici la fenêtre d'édition du signal …
… que l'on obtient après avoir cliqué sur "Edit"
Cédric Gendrot - TAL SLOW 5 - 2003-2004 - ILPGA
46
Sur cette fenêtre on peut voir 1. le signal2. le spectrogramme3. la Fo
Cédric Gendrot - TAL SLOW 5 - 2003-2004 - ILPGA
47
Cédric Gendrot - TAL SLOW 5 - 2003-2004 - ILPGA
48
Voici comment faire apparaître ou disparaître les « décorations »...
Cédric Gendrot - TAL SLOW 5 - 2003-2004 - ILPGA
49
les 4 fonctions permettent de régler les préférences
notez que ce sont des fonctions déjà évoquées
Cédric Gendrot - TAL SLOW 5 - 2003-2004 - ILPGA
50
L’analyse des durées...
Elle a plus ou moins été abordée…
…grâce aux barres en haut et en bas qui découpent le signal
Cédric Gendrot - TAL SLOW 5 - 2003-2004 - ILPGA
51
Cédric Gendrot - TAL SLOW 5 - 2003-2004 - ILPGA
52
Principe général d’utilisation
Les valeurs de durée, Fo, intensité et spectro-grammes peuvent être obtenues visuellement en cliquant ça et là sur la fenêtre…
…comme nous le verrons…
…mais il y a d’autres moyens bien sûr !
Cédric Gendrot - TAL SLOW 5 - 2003-2004 - ILPGA
53
ces 4 fonctions permettent d’obtenir différentes durées
notez le raccourci
Cédric Gendrot - TAL SLOW 5 - 2003-2004 - ILPGA
54
Les valeurs de Fo
Même principe…
…méthode avec la souris…
…méthode avec « Query »Attention aux résultats aberrants
validité des résultats
surtout pour les segments non voisés
Cédric Gendrot - TAL SLOW 5 - 2003-2004 - ILPGA
55
Cédric Gendrot - TAL SLOW 5 - 2003-2004 - ILPGA
56
ces 3 fonctions permettent d’obtenir différentes valeurs
notez le raccourci
Cédric Gendrot - TAL SLOW 5 - 2003-2004 - ILPGA
57
Les valeurs d’intensité
Toujours pareil…….– Mesure visuelle– ou bien « Query > Get intensity » (F11)
Il faut que le contour d’intensité soit visible (« View > Show analyses > Intensity »)pas des mesures physiologiques
validité des résultats
précautions d’enregistrement
Cédric Gendrot - TAL SLOW 5 - 2003-2004 - ILPGA
58
Cédric Gendrot - TAL SLOW 5 - 2003-2004 - ILPGA
59
Pour la petite histoire...
….attention pour l’intensité comme pour la Fo, on ne voit parfois pas de courbes car les échelles sont inadaptées….
« View > xxxx Settings »
Cédric Gendrot - TAL SLOW 5 - 2003-2004 - ILPGA
60
ces 3 fonctions permettent de changer les paramètres
Cédric Gendrot - TAL SLOW 5 - 2003-2004 - ILPGA
61
… sur le spectrogramme
Toujours pareil ….
Cédric Gendrot - TAL SLOW 5 - 2003-2004 - ILPGA
62
Cédric Gendrot - TAL SLOW 5 - 2003-2004 - ILPGA
63
Cédric Gendrot - TAL SLOW 5 - 2003-2004 - ILPGA
64
détection de formants...
validité des résultats
1 vérification visuelle s’impose
Cédric Gendrot - TAL SLOW 5 - 2003-2004 - ILPGA
65
Et une nouvelle fois…
En cliquant sur « Query », on peut obtenir différentes valeurs de fréquence
Cédric Gendrot - TAL SLOW 5 - 2003-2004 - ILPGA
66
Pour obtenir des valeurs individuelles de formants et
leurs largeurs de bandes
Cédric Gendrot - TAL SLOW 5 - 2003-2004 - ILPGA
67
…..Notez que le principe est identique pour toutes les prises de mesures ….
En voici un autre…
…..les valeurs moyennes
Cédric Gendrot - TAL SLOW 5 - 2003-2004 - ILPGA
68
Intensité
Fo
Cédric Gendrot - TAL SLOW 5 - 2003-2004 - ILPGA
69
Sélectionnez unepetite portion de
signal et
appuyez surF1, F2, F3 ou F4
Cédric Gendrot - TAL SLOW 5 - 2003-2004 - ILPGA
70
Une petite fenêtre
apparaît alors...
Cédric Gendrot - TAL SLOW 5 - 2003-2004 - ILPGA
71
Exercice 2
Cédric Gendrot - TAL SLOW 5 - 2003-2004 - ILPGA
72
But de la manœuvre!
Sur un fichier de 4 phrases identiques mais prononcées de façons différentes, vous allez prendre manuellement des mesures diverses (sur 1 phonème seulement).
Puis plus tard dans ce cours...grâce à l’étiquetage réalisé sur les segments mesurés, vous pourrez demander à la machine de réaliser ces mêmes calculs…et ainsi comparer !
Cédric Gendrot - TAL SLOW 5 - 2003-2004 - ILPGA
73
Application de l’étape 2
– Analyse acoustique
• durées
• Fo
• intensité
• valeurs des formants (3 premiers formants)
Cédric Gendrot - TAL SLOW 5 - 2003-2004 - ILPGA
74
Pour le mot «Paris» de chaque phrase– prenez le phonème /a/
mesurez la durée, la Fo, l’intensité et les valeurs des 3 premiers formants.
Notez ces résultats (sur Excel ou sur un bout de papier.)