Cédric Gendrot - TAL SLOW 5 - 2003-2004 - ILPGA 1 Cours SLOW5 Informatique et Phonétique.

Post on 03-Apr-2015

104 views 0 download

Transcript of Cédric Gendrot - TAL SLOW 5 - 2003-2004 - ILPGA 1 Cours SLOW5 Informatique et Phonétique.

Cédric Gendrot - TAL SLOW 5 - 2003-2004 - ILPGA

1

Cours SLOW5

Informatique

et

Phonétique

Cédric Gendrot - TAL SLOW 5 - 2003-2004 - ILPGA

2

Le but de ce cours est de présenter une approche similaire à celle du TAL ….

… mais appliqué au signal sonore :

une introduction au traitement automatique de la parole

• 1- L'analyse automatique du signal sonore

• 2- Un langage de requêtes sur le signal sonore

• 3- Des applications extérieures au signal

Cédric Gendrot - TAL SLOW 5 - 2003-2004 - ILPGA

3

Dans ce cours, cette automatisation sera vue grâce à un logiciel principalement...

PRAAT

Commençons par nous familiariser avec ce logiciel...

Cédric Gendrot - TAL SLOW 5 - 2003-2004 - ILPGA

4

PRAATPRAAT

Cédric Gendrot - TAL SLOW 5 - 2003-2004 - ILPGA

5

Présentation générale

Le problème avec tous les logiciels d’analyse de son..…

– à chacun son petit plus…– on finit toujours par trouver des défauts– certains ont tendance à « planter »…souvent

Cédric Gendrot - TAL SLOW 5 - 2003-2004 - ILPGA

6

un de plus......?

Gratuit, renouvelé, modelable

Praat devient la référence. Il est étayé d'un site web très complet (http://www.praat.org) + forum

le plus grand nombre de fonctionnalités

Un langage de programmation intégré (Cf. VB)

Cédric Gendrot - TAL SLOW 5 - 2003-2004 - ILPGA

7

Les aspects développés ici1. Lire un fichier son (se balader dans le fichier, écouter, découper…)

2. Analyse acoustique (durées, Fo, intensité, valeurs spectrales)

3. Étiqueter (savoir étiqueter pour mieux utiliser Praat)

4. Pouvoir automatiser des opérations systématiques

Cédric Gendrot - TAL SLOW 5 - 2003-2004 - ILPGA

8

Les aspects développés ici1. Lire un fichier son (se balader dans le fichier, écouter, découper…)

2. Analyse acoustique (durées, Fo, intensité, valeurs spectrales)

3. Étiqueter (savoir étiqueter pour mieux utiliser Praat)

4. Pouvoir automatiser des opérations systématiques

Cédric Gendrot - TAL SLOW 5 - 2003-2004 - ILPGA

9

Le voici, le voilà

Imaginons les premiers pas...

Après avoir téléchargé le logiciel (il tient sur une disquette), vous double cliquez sur l’icône...

...........et.....

Cédric Gendrot - TAL SLOW 5 - 2003-2004 - ILPGA

10

Cédric Gendrot - TAL SLOW 5 - 2003-2004 - ILPGA

11

Cédric Gendrot - TAL SLOW 5 - 2003-2004 - ILPGA

12

Cédric Gendrot - TAL SLOW 5 - 2003-2004 - ILPGA

13

Donc faites bien la différence...

Pour décompresserle logiciel

Pour ouvrirle logiciel

Cédric Gendrot - TAL SLOW 5 - 2003-2004 - ILPGA

14

Ouvrons le logiciel...

Il faut donc comme toujours (double) cliquer sur l’icône de démarrage.

Notez qu’aucun raccourci n’est placé par défaut dans le menu « Démarrer »…

Il faut créer des raccourcis!

Cédric Gendrot - TAL SLOW 5 - 2003-2004 - ILPGA

15

Cédric Gendrot - TAL SLOW 5 - 2003-2004 - ILPGA

16

Ici seront stockés temporairement les (noms des) fichiers lus ou crées pendant la session de travail.

Temporairement parce qu’ils ne sont pas encore enregistrés (menu Write)

On ne voit que les noms des fichiers, il faut cliquer sur un bouton pour les visionner.

1er principe

Cédric Gendrot - TAL SLOW 5 - 2003-2004 - ILPGA

17

Si vous voulez créer une image, avec un spectrogramme, le signal, votre étiquetage......au choix...

tout se passe ici!

Cédric Gendrot - TAL SLOW 5 - 2003-2004 - ILPGA

18

1. Le B.A BA

1. Ouvrir un fichier son

2. Se balader dans le fichier…l’écouter

3. découper son fichier

Cédric Gendrot - TAL SLOW 5 - 2003-2004 - ILPGA

19

Le menu Read (cf. open) vous permet d’ouvrir des fichiers...

...des fichiers sonores bien sûr...

...mais aussi d’autres types de fichiers

Ces deux choix sont les plus utilisés

Un fichier peut être considéré long à partir de 45 secondes.

Ouvrons un fichier......

Cédric Gendrot - TAL SLOW 5 - 2003-2004 - ILPGA

20

Cédric Gendrot - TAL SLOW 5 - 2003-2004 - ILPGA

21

Cédric Gendrot - TAL SLOW 5 - 2003-2004 - ILPGA

22

maintenant qu’un nom de fichier est inscrit dans la liste, il faut le visionner.Dans tous les cas....

...cliquez sur Edit

Cédric Gendrot - TAL SLOW 5 - 2003-2004 - ILPGA

23

Cette fenêtre est très riche en renseignements et possibilités divers

notez le curseur qui indique le temps en secondes

par rapport au début du fichier

L’axe à droite indique les valeurs de Fo

(en Hz)

L’axe à gauche correspond aux valeurs du spectrogramme

(en Hz)

Les trois barres ci-dessous sont indispensables1. elle se découpe en fonction du curseur ou de la sélection2. elle permet de lire la fenêtre présente3. pour lire tout le fichier

et enfin...les 4 boutons archi-classiques

de tout logiciel d’analyse de son

all : pour voir tout le fichier

in : pour zoomerout : pour dé-zoomer

sel : pour zoomer sur la sélection

Cédric Gendrot - TAL SLOW 5 - 2003-2004 - ILPGA

24

notez le curseur qui indique le temps en secondes

par rapport au début du fichier

L’axe à droite indique les valeurs de Fo

(en Hz)

L’axe à gauche correspond aux valeurs du spectrogramme

(en Hz)

Les trois barres ci-dessous sont indispensables1. elle se découpe en fonction du curseur ou de la sélection2. elle permet de lire la fenêtre présente3. pour lire tout le fichier

et enfin...les 4 boutons archi-classiques

de tout logiciel d’analyse de son

all: pour voir tout le fichier

in: pour zoomerout: pour dé-zoomer

sel: pour zoomer sur la sélection

Cédric Gendrot - TAL SLOW 5 - 2003-2004 - ILPGA

25

Ici on a non plus un curseur mais

une sélection.

Les affichages de durée et les

possibilités de lecturesse sont adaptés...

Cédric Gendrot - TAL SLOW 5 - 2003-2004 - ILPGA

26

Commençons...

Voyons comment découper ces quatre phrases en 4 fichiers distincts.

Il n’est pas possible de créer des fichiers vierges sur lesquels on pourrait coller des morceaux

il faut donc se débrouiller autrement...

Cédric Gendrot - TAL SLOW 5 - 2003-2004 - ILPGA

27

.....

Il faut en fait « extraire » les quatre phrases une par une. Elles ne disparaissent pas mais leur copie est transférée dans la liste d’objets.

Cédric Gendrot - TAL SLOW 5 - 2003-2004 - ILPGA

28

Cédric Gendrot - TAL SLOW 5 - 2003-2004 - ILPGA

29

Cédric Gendrot - TAL SLOW 5 - 2003-2004 - ILPGA

30

Rien n'a changé… sauf que...

… Le fichier est apparu dans le "plan" de travail : la fenêtre "Praat Objects"

Cédric Gendrot - TAL SLOW 5 - 2003-2004 - ILPGA

31

Si l'on clique sur

"Edit"

Cédric Gendrot - TAL SLOW 5 - 2003-2004 - ILPGA

32

Cédric Gendrot - TAL SLOW 5 - 2003-2004 - ILPGA

33

Notez que l'on peutle renommer

en cliquant sur

"Rename"

Cédric Gendrot - TAL SLOW 5 - 2003-2004 - ILPGA

34

… Mais on peutégalement

le supprimer de la liste

en cliquant sur

"Remove"

Cédric Gendrot - TAL SLOW 5 - 2003-2004 - ILPGA

35

Et pour sauvegarder...

…tout fonctionne comme sur Word (ou autre)

« Write > Write to WAV file »

Rajoutez tout de même « .wav » si ce n’est pas fait automatiquement

Cédric Gendrot - TAL SLOW 5 - 2003-2004 - ILPGA

36

Exercice 1

Cédric Gendrot - TAL SLOW 5 - 2003-2004 - ILPGA

37

Comment suivre ces exercices?

Cette série d’exercices a pour but de vous faire pratiquer les possibilités passées en revue ...

Pour chaque exercice, vous pourrez utiliser les fichiers contenus dans le dossier « cours_slow5 ».

Cédric Gendrot - TAL SLOW 5 - 2003-2004 - ILPGA

38

…….

Vous pourrez à tout moment consulter le fichier PowerPoint que vous suivez en ce moment. Il est intitulé « cours_slow5 » et se trouve dans le même dossier...

Cédric Gendrot - TAL SLOW 5 - 2003-2004 - ILPGA

39

Principe général

Il vous suffira de passer de ces consignes sur PowerPoint au logiciel Praat en utilisant

– la barre des tâches (en bas de l ’écran)ou bien

– Alt + Tab (qui permet de passer d ’un logiciel à l ’autre)

Cédric Gendrot - TAL SLOW 5 - 2003-2004 - ILPGA

40

– Lire un fichier son

• se balader dans le fichier

• écouter

• découper

• copier-coller

• sauver

Application de l’étape 1 :

Cédric Gendrot - TAL SLOW 5 - 2003-2004 - ILPGA

41

Ouvrez le fichier "Praat demo.wav"

sélectionnez les 4 phrases pour faire quatre fichiers individuels (utilisez "extract…")

Attention le fichier original doit pouvoir resservir dans son intégralité…donc il ne faut pas le modifier (ou ne pas enregistrer les modifications!!!)

enregistrez les 4 phrases (sous le format .wav) toujours dans le même dossier (nommez les par exemple phrase1.wav, phrase2.wav...)

Cédric Gendrot - TAL SLOW 5 - 2003-2004 - ILPGA

42

Les aspects développés ici1. Lire un fichier son (se balader dans le fichier, écouter, découper…)

2. Analyse acoustique (durées, Fo, intensité, valeurs spectrales)

3. Étiqueter (savoir étiqueter pour mieux utiliser Praat)

4. Pouvoir automatiser des opérations systématiques

Cédric Gendrot - TAL SLOW 5 - 2003-2004 - ILPGA

43

Les aspects développés ici1. Lire un fichier son (se balader dans le fichier, écouter, découper…)

2. Analyse acoustique (durées, Fo, intensité, valeurs spectrales)

3. Étiqueter (savoir étiqueter pour mieux utiliser Praat)

4. Pouvoir automatiser des opérations systématiques

Cédric Gendrot - TAL SLOW 5 - 2003-2004 - ILPGA

44

Étape 2L’analyse acoustique

Maintenant que l’on sait lire un fichier, le découper et le sauvegarder…

...occupons nous de l’essentiel…

Una analyse acoustique … pourquoi faire ??

Cédric Gendrot - TAL SLOW 5 - 2003-2004 - ILPGA

45

Voici la fenêtre d'édition du signal …

… que l'on obtient après avoir cliqué sur "Edit"

Cédric Gendrot - TAL SLOW 5 - 2003-2004 - ILPGA

46

Sur cette fenêtre on peut voir 1. le signal2. le spectrogramme3. la Fo

Cédric Gendrot - TAL SLOW 5 - 2003-2004 - ILPGA

47

Cédric Gendrot - TAL SLOW 5 - 2003-2004 - ILPGA

48

Voici comment faire apparaître ou disparaître les « décorations »...

Cédric Gendrot - TAL SLOW 5 - 2003-2004 - ILPGA

49

les 4 fonctions permettent de régler les préférences

notez que ce sont des fonctions déjà évoquées

Cédric Gendrot - TAL SLOW 5 - 2003-2004 - ILPGA

50

L’analyse des durées...

Elle a plus ou moins été abordée…

…grâce aux barres en haut et en bas qui découpent le signal

Cédric Gendrot - TAL SLOW 5 - 2003-2004 - ILPGA

51

Cédric Gendrot - TAL SLOW 5 - 2003-2004 - ILPGA

52

Principe général d’utilisation

Les valeurs de durée, Fo, intensité et spectro-grammes peuvent être obtenues visuellement en cliquant ça et là sur la fenêtre…

…comme nous le verrons…

…mais il y a d’autres moyens bien sûr !

Cédric Gendrot - TAL SLOW 5 - 2003-2004 - ILPGA

53

ces 4 fonctions permettent d’obtenir différentes durées

notez le raccourci

Cédric Gendrot - TAL SLOW 5 - 2003-2004 - ILPGA

54

Les valeurs de Fo

Même principe…

…méthode avec la souris…

…méthode avec « Query »Attention aux résultats aberrants

validité des résultats

surtout pour les segments non voisés

Cédric Gendrot - TAL SLOW 5 - 2003-2004 - ILPGA

55

Cédric Gendrot - TAL SLOW 5 - 2003-2004 - ILPGA

56

ces 3 fonctions permettent d’obtenir différentes valeurs

notez le raccourci

Cédric Gendrot - TAL SLOW 5 - 2003-2004 - ILPGA

57

Les valeurs d’intensité

Toujours pareil…….– Mesure visuelle– ou bien « Query > Get intensity » (F11)

Il faut que le contour d’intensité soit visible (« View > Show analyses > Intensity »)pas des mesures physiologiques

validité des résultats

précautions d’enregistrement

Cédric Gendrot - TAL SLOW 5 - 2003-2004 - ILPGA

58

Cédric Gendrot - TAL SLOW 5 - 2003-2004 - ILPGA

59

Pour la petite histoire...

….attention pour l’intensité comme pour la Fo, on ne voit parfois pas de courbes car les échelles sont inadaptées….

« View > xxxx Settings »

Cédric Gendrot - TAL SLOW 5 - 2003-2004 - ILPGA

60

ces 3 fonctions permettent de changer les paramètres

Cédric Gendrot - TAL SLOW 5 - 2003-2004 - ILPGA

61

… sur le spectrogramme

Toujours pareil ….

Cédric Gendrot - TAL SLOW 5 - 2003-2004 - ILPGA

62

Cédric Gendrot - TAL SLOW 5 - 2003-2004 - ILPGA

63

Cédric Gendrot - TAL SLOW 5 - 2003-2004 - ILPGA

64

détection de formants...

validité des résultats

1 vérification visuelle s’impose

Cédric Gendrot - TAL SLOW 5 - 2003-2004 - ILPGA

65

Et une nouvelle fois…

En cliquant sur « Query », on peut obtenir différentes valeurs de fréquence

Cédric Gendrot - TAL SLOW 5 - 2003-2004 - ILPGA

66

Pour obtenir des valeurs individuelles de formants et

leurs largeurs de bandes

Cédric Gendrot - TAL SLOW 5 - 2003-2004 - ILPGA

67

…..Notez que le principe est identique pour toutes les prises de mesures ….

En voici un autre…

…..les valeurs moyennes

Cédric Gendrot - TAL SLOW 5 - 2003-2004 - ILPGA

68

Intensité

Fo

Cédric Gendrot - TAL SLOW 5 - 2003-2004 - ILPGA

69

Sélectionnez unepetite portion de

signal et

appuyez surF1, F2, F3 ou F4

Cédric Gendrot - TAL SLOW 5 - 2003-2004 - ILPGA

70

Une petite fenêtre

apparaît alors...

Cédric Gendrot - TAL SLOW 5 - 2003-2004 - ILPGA

71

Exercice 2

Cédric Gendrot - TAL SLOW 5 - 2003-2004 - ILPGA

72

But de la manœuvre!

Sur un fichier de 4 phrases identiques mais prononcées de façons différentes, vous allez prendre manuellement des mesures diverses (sur 1 phonème seulement).

Puis plus tard dans ce cours...grâce à l’étiquetage réalisé sur les segments mesurés, vous pourrez demander à la machine de réaliser ces mêmes calculs…et ainsi comparer !

Cédric Gendrot - TAL SLOW 5 - 2003-2004 - ILPGA

73

Application de l’étape 2

– Analyse acoustique

• durées

• Fo

• intensité

• valeurs des formants (3 premiers formants)

Cédric Gendrot - TAL SLOW 5 - 2003-2004 - ILPGA

74

Pour le mot «Paris» de chaque phrase– prenez le phonème /a/

mesurez la durée, la Fo, l’intensité et les valeurs des 3 premiers formants.

Notez ces résultats (sur Excel ou sur un bout de papier.)