L’analyse en unités de base du discours – pourquoi et comment

Post on 05-Jan-2016

41 views 5 download

description

L’analyse en unités de base du discours – pourquoi et comment. Liesbeth Degand, Anne Catherine Simon. Problématique: unités syntaxiques, unités prosodiques et … unités de base du discours. - PowerPoint PPT Presentation

Transcript of L’analyse en unités de base du discours – pourquoi et comment

L’analyse en unités de base du discours – pourquoi et comment

Liesbeth Degand, Anne Catherine Simon

Problématique: unités syntaxiques, unités prosodiques et … unités de base du discours

H1 Les BDU sont les étapes de production et de traitement du discours (fonction cognitive) (van Dijk 1997; Berrendonner 2004)

H2 Ni la complétude syntaxique (Roulet 1991), ni la complétude prosodique (Chafe 1994) n'est une condition suffisante pour délimiter une BDU (Halford 1996, Selting 2000)

H2' Il existe différents types de BDU selon la manière dont syntaxe et prosodie sont conformées

H3 Les types de BDU se distribuent différemment selon les genres de discours

H3' Les types de BDU correspondent à des stratégies discursives

Plan de la contribution

1. Principes d'analyse et méthodologie

2. Annotation prosodique, et discussion

3. Annotation syntaxique, et discussion

4. Les BDU dans le corpus Anita Musso

5. Discussion

Remerciements

Anne Dister, Jean-Philippe Goldman, Piet Mertens, Hubert Naets, Jean-Denis Spinel

1. Principes d'analyse et méthodologie

• analyse et annotation autonomes des niveaux syntaxique et prosodique

• la mise en relation des 2 niveaux génère un niveau spécifique qui correspond à l'organisation proprement discursive

Outils

• fichier d'annotation (TEXTGRID) + fichier son (WAV)

• automatisation (scripts)– alignement (phones, syll, words) du texte au son (Goldman)

– pré-détection des frontières intonatives (Mertens&Simon)

– mise en relation des niveaux d'annotation– description quantifiée

• annotation manuelle– unités de rection, séquences fonctionnelles– validation des frontières intonatives

2. Annotation prosodique

Unités prosodiques majeures (///), intermédiaires (//) et mineures (/)

• alternance des tours et critères acoustiques (Lacheret-Dujour & Victorri 2002; Simon et al. 2008)

• automatisation de l'annotation (Mertens&Simon): 85.5% des frontières détectées (score inférieur sur la conversation)

majeure - changement de locuteur

- pause silencieuse > 200 ms- non précédée d'une marque

d'hésitation

- ou dur rel > 3- ou montée mélodique > 10 ST- ou contour de finalité

///

intermédiaire - dur rel > 2- ou f0 rise (intrasyll) > 4 ST- ou f0 moyenne > 5 ST

//

mineure - syll dur > 40 ms- et dur rel > 1.5- (légère montée mélodique)

/

2. Annotation prosodique, discussion

• non-fiabilité d'une approche tout automatique aujourd'hui– problèmes de traitement acoustique– difficulté de poser des seuils (adaptation au locuteur,

pondération, etc.)

• subjectivité du travail (de validation) de l'annotation

• dans notre annotation, pas (encore) de statut spécifique pour les contours de finalité (de type B-B-)

2. Annotation prosodique, discussion

Exemples• montée + écart mélodiques marqués, sans pause

niveau // réinterprété en niveau ///

2. Annotation prosodique, discussion

Exemples• frontière /// recatégorisée en hesi

2. Annotation prosodique, discussion

Exemples• contour descendant de finalité niveau ///

(difficile à modéliser et à détecter automatiquement)

3. Annotation syntaxique, unités de rection

• Une UR est organisée autour d’un noyau (en général un verbe tensé)

• Une UR est composée du verbe (nom) recteur et des éléments régis par celui-ci

• Les éléments non régis entrent linéairement dans la composition d’une urc+

urc unité de rection complète

uri unité de rection inachevée

ura unité de rection averbale

ure unité de rection elliptique

urc+ unité incluant un élément non régi

Exemples d'unités de rection

URC <parce que> [(je pense) (que je suis très malade)]

URI [(faudrait je)] URE [(il y a) (un côté de facilité de passer devant sa

voiture)] <et> [(de se dire)]

URA [(sur ce domaine) (oui)]URC+ [(comme) (j’ai jamais fait quasi de vélo) (de ma vie)

<euh> (en tant que vraie parisienne et en étant très peu partie à la campagne) (je suis pas pas très à l’aise)]

[(il faut) (quand même)md (me mettre) (des limites)]

3. Annotation syntaxique, séquences

• séquences maximales « qui représentent les constituants fonctionnels rencontrés dans les textes sans entrer dans le détail de leur composition » (Bilger & Campione 2002: 118)

• toute séquence peut faire l’objet – d’expansions: liste, adjectif, participe passé, relative, etc. – de mise en dispositif (extraction, binarisation, pseudoclivée…)

SS séquence sujet

SV séquence verbe

SO séquence objet

SR séquence rection

SA adjoint

insert unité de rection qui interrompt une unité en cours

Exemples de séquences

<parce que>md [(je pense)SV (que je suis très malade)SO]

<à mon avis>A [(c’est pas très malin)SV]

[(il faut)SV (quand même)md (me mettre)SV-suite (des limites)SO (pour m’empêcher de prendre la voiture)SRd]

3. Annotation syntaxique, remarques

• les adverbes de modalité, marqueurs de discours (y compris les connecteurs) et hésitations sont annotés au niveau des séquences

• au niveau des unités de rection, ils sont "sortis" uniquement lorsqu'ils se situent entre deux unités de rection, sinon ils restent intégrés dans une URC+

3. Annotation syntaxique, discussion

3.1. Séquences régie / adjoint

• je suis pour en rentrant dans un processus que je n’aime pas trop vis-à-vis de moi(SV) (SRd) ou (SV) (A)

• je le sais que je suis perdante(SV) (A) ou (SV) (SRd), parce que tous les auteurs ne s'accordent pas sur le caractère (non) régi des "doubles marquages à droite"

3. Annotation syntaxique, discussion

3.2. URI ou URC avec autoréparation?

• un cas clair d'URI[(faudrait je)] [(c'est une habitude) (en tous cas) (que j’aimerais changer)]

• URC avec autoréparation?<euh> [(il y a) (quand même)]URI? [(il y a il y a) (des sous) (sur le compte)]

[(il faut me mettre) (des li)] [(il faut) (quand même) (me mettre) (des limites) (pour … )]

[(elles)] <non> <non> [(elles ont tendance à)] <hum> <non> <non> [(elles adorent marcher)]

3. Annotation syntaxique, discussion

3.3. Présence/absence du "que" et conséquence sur l'analyse • présence de "que"

[(c'est une habitude)SS (en tous cas)md (que j’aimerais changer)SV]urc+ (dispositif, insert)

[(je pense)SV (que je suis très malade)SO]urc

• absence de "que"[(je me conditionne) (dans mon appartement) (en me disant)]urc [(j’y vais à pied)]urc

[(sur le coup) (je me dis)]urc [(je vais mettre) (cinq minutes)]urc

4. Les BDU dans le corpus Anita Musso

Types de BDU (Degand & Simon 2009)

• BDU-c congruente: une unité de rection correspond à une unité prosodique majeure

• BDU-s groupée par la syntaxe: plusieurs unités prosodiques majeures correspondent à une unité de rection

• BDU-i groupée par l'intonation: plusieurs unités de rection correspondent à une unité prosodique majeure

• BDU-a adjoint: un élément non régi est autonomisé dans une unité prosodique majeure

• BDU-x mixtes

4.1. Illustrations dans le corpus

BDU-C [(combien de fois) (ça m’est arrivé///)]

BDU-S [(je suis pour///) (en rentrant// dans un processus que je n’aime pas trop vis-à-vis de moi///)]

BDU-I [(moi)] [(ma voiture)] [(elle est garée) (dans la rue//)] [(j’ai) (un stationnement résident///)]

BDU-A <c’est-à-dire que///>

BDU-X [(sur le coup///) (je me dis//)] [(je vais mettre) (cinq minutes///)]

4.2. Distribution des types de BDU

Distribution des types de BDU

0%

10%

20%

30%

40%

50%

60%

70%

80%

90%

100%

politique journal radio conférence conversation Musso

BDU a

BDU x

BDU i

BDU s

BDU c

4.3. Description quantifiée des unités

Genre politiquejournal

radio conférence conversation Musso

# tokens/BDU

16.9 20.5 26.7 16.2 15.9

(11.1) (12,3) (17.8) (11.1) (11.5)

# tokens/ u. rection

15.6 16.7 15.1 6.2 6.2

(11.1) (11.3) (13.7) (6.3) (5.3)

# tokens/ séquence

6 5.6 6.9 3.6 3.3

(7.1) (6) (9.3) (3.2) (2.58)

# séquences/BDU 1.1 1.2 1.7 2.4 2.3

5. Discussion, structure interne des BDU

Les types de BDU correspondent à des stratégies discursives

• BDU-C: présentation de l'information d'une manière directe et relativement neutre

• BDU-I: créer une macro-unité informationnelle• BDU-S: style emphatique; style didactique; planification

discursive • BDU-A: régulation (interactionnelle ou métadiscursive)

5. Discussion, unités régulatives

Selon Chafe (1994: 64), les regulatory units régulent le développement du discours, au niveau interactionnel, modal ou textuel (métadiscours)

A quoi correspondent les regulatory units dans notre typologie?

• les BDU-a• Les URI internes à des BDU leur donnent-elles un statut

spécifique? En d'autres termes, faut-il distinguer les BDU formées d'URC/URE de celles formées d'URI?

5. Discussion, enchainement entre BDU

Hypothèses• il existe des relations de cohérence d'une nature spécifique

entre BDU – telles qu'on peut les décrire dans un modèle de la structure du discours (RST, modèle genevois)

• les BDU sont les empans d'interprétation pour construire le modèle du texte et le modèle de la situation (Van Dijk)

Merci de votre attention!