Post on 04-Apr-2015
Proposition de typologie argumentative des collocations textuelles
Estelle Dubreil
Estelle.Dubreil@univ-nantes.fr
2
Plan
Collocations textuelles Modèle SPA Hypothèses et validation Résultats Conclusion
3
Introduction – 1
Problème de définition• dynamique : question cruciale• libre – figé : envie de chocolat – pomme de terre• prototypique : gravement malade [Bally 1909] Solution de description critères• figement
• (non) transparence [Cruse 1986] : buveur invétéré• arbitraire [Benson 1989] : faim de loup, *appétit de loup
• définitoires• binaire – dissymétrique – restreint [Tutin et Grossmann 2002]• habituel – bien formé syntaxiquement [Williams 2001]
Collocations
4
Introduction – 2
Solution de description typologies Lexicologique – lexicographique• définition restreinte [Hausmann 1989 ; Mel’cuk 1998]• typologies critères
• sémantiques : opaque peur bleue – transparente désir ardent – régulière nez aquilin• syntaxiques : nom/adj. amour platonique – nom/nom bourreau des cœurs …
Linguistique de corpus• définition large [Kilgarriff 1992 ; Williams 2003]• typologies critères
• contextualistes : textuelle – associative – … [Partington 1998]• statistiques : descendante – montante [Sinclair 1991]• sémantiques : libre – restreinte [Cowie 1978, 1983]
Collocations
5
Introduction – 3
Problématiques convergentes Description lexico-syntaxique• description formelle : explicite – cohérente – prédictive• modélisation/fonctions lexicales [Mel’cuk 1984, 2003] Motivation sémantique• procédés sémantiques productifs
Ex : travail de bénédictin, construire une argumentation• régularités sémantiques [Grossmann et Tutin 2003]
• le renforcement : profond désespoir, profondément ému• la convergence de polarité : affreux désespoir, parfait bonheur
Collocations
6
Introduction – 4
Description lexico-discursive• Motivation argumentative
• relativiser le critère « arbitraire »• expliquer la formation des collocations
• SPA : pouvoir descriptif – explicatif… prédictif• hypothèse argumentative – sémantico-discursive• collocation libre/restreinte 1 seul principe descriptif• régularités sémantiques
Filiation contextualiste [Firth 1957]• collocation textuelle lexicale• critère statistique qualitatif• base et collocatif régularités sémantiques
Collocations
7
Modèle SPA
Description de la signification lexicale Double filiation• description en termes de noyau
[Putnam 1975, 1990, 1994]• conception argumentative
[Anscombre 1995 ; Ducrot 1995]
Approche tridimensionnelle Représentation de la signification lexicale – SL
8
Approche tridimensionnelle
SL : postulats [Galatanu 1999 – 2006]• dénotative et référentielle [Kleiber 1984]
• dénomination : association référentielle durable• activation discursive
• argumentative et encyclopédique• organisation argumentative des représentations du monde• ensemble(s) ouvert(s) de séquences discursives
• associative et holistique• conjugaison : dénotatif et argumentatif• exhaustivité : prédictible et culturelleEx : *gentil donc agressif, musulman donc pratique du jeûne
Modèle SPA
9
Représentation de la SL – 1
SL : stabilisation monde/langue [Kleiber 1999]• 3 strates – Ex : amélioration(s)• noyau : traits nécessaires de catégorisation – TNC
• type grammatical : nom• genre : féminin• nombre : sing./pl.• zone modale : axiologique• orientation axiologique : monovalent positif
• noyau : primitifs sémantiques invariants• processus• rendre meilleur, plus satisfaisant
Modèle SPA
10
Représentation de la SL – 2
Stéréotypes• blocs d’argumentations internes [Carel et Ducrot 1999]• invariants du noyau
Ex : donc perfectionnement, progrès…
Ex : donc correction, retouche, révision…
Possibles argumentatifs – PA
Modèle SPA
11
Représentation de la SL – 3
PA• association potentielle du mot• éléments de ses stéréotypes• blocs d’argumentations externes [Carel et Ducrot 1999]
Ex : amélioration donc progrès moral
Ex : amélioration donc correction d’un travail• nature évaluative
• axiologisation positiveEx : amélioration donc succès (positif)• axiologisation négativeEx : erreur donc échec (négatif)
Modèle SPA
12
Hypothèses et validation
Hypothèses de recherche• 1 intuition• 3 postulats
• collocation argumentative• motivation argumentative• collocation arbitraire
Protocole de validation pluridisciplinaire• repérage des unités lexicales• dépouillement des données• aspect sémantico-discursif
13
Intuition
Définitions• collocation textuelle :
• Relation de sens portée par des mots qui tendent à apparaître ensemble dans un contexte textuel donné [Firth 1957]
• PA :• Association de deux unités lexicales liées par une relation
d’argumentation et « calculable » sur la base des enchaînements linguistiques que la SL est susceptible de générer en contexte [Galatanu 1999]
• collocation textuelle lexicale = concrétisation PA• 3 postulats
Hypothèses de recherche
14
Collocation argumentative
Ex : problème épineux• base – collocatif fréquence significative• bloc d’argumentation externe
Ex : problème donc plein de difficultés/délicat, embarrassant
• collocation argumentative• caractère prédictible• axiologisation intrinsèque
Ex : problème épineux donc négatif
Hypothèses de recherche
15
Motivation argumentative
Ex : amélioration sensible• base – collocatif fréquence significative• déploiement argumentatif possible
Ex : amélioration donc intense, importante, manifeste
• motivation argumentative• principes associatifs récurrents• axiologisation intrinsèque
Ex : amélioration sensible donc positive
Hypothèses de recherche
16
Collocation arbitraire
Ex : évaluation manuelle• base – collocatif fréquence significative• ni bloc – ni déploiement possible
• *évaluation donc se servir de la main/travailler physiquement
• *évaluation pourtant se servir de la main/travailler physiquement
• collocation arbitraire réalité discursive• base potentiel axiologique
• *évaluation manuelle donc négative
• * évaluation manuelle donc positive
Hypothèses de recherche
17
Repérage des unités lexicales
Liste des mots bases collocationnelles Démarche inductive données du corpus• liste de fréquences (Wordsmith Tools)• mots axiologisés• propension candidats (Contextes)• paradigme équilibré
• 2 monovalents + : amélioration(s) et performance(s)
• 2 monovalents – : erreur(s) et problème(s)
• 2 bivalents : évaluation(s) et résultat(s)
Protocole de validation
18
Dépouillement des données
4 critères• statistique : « règle » des 3 – 3
Ex : amélioration constante (1) ; résultats spectaculaires (2)• pertinence : candidats – mots grammaticaux
Ex : amélioration par rapport ; performance sur• lexical : toutes les lexies
Ex : poser problème ; résultat brut• terminologique : termes complexes
Ex : détection d’erreurs ; corpus d’évaluation
6 bases 164 collocations 1670 occurrences
Protocole de validation
19
Aspect sémantico-discursif
Validation des données• TSA
• collocatif représentations sémantiquesEx : amélioration sensible donc intense, importante, manifeste…• Grand Robert électronique et TLFi
• TEA• Axiologisation• orientation + ou –• enchaînements normatif et transgressif possiblesEx : amélioration sensible donc progrès/pourtant échec
Protocole de validation
20
Résultats
Le corpus Synthèse des résultats
• hypothèse posée• typologies « classiques » – argumentatives• mécanismes de formation
21
TAL(N)
Corpus électronique spécialisé TAL Circonscrire un domaine• théorie des communautés de discours [Swales 1991]
• délimitation de la communauté de l’intérieur• désignation objective des sources
• critères de sélection• diversité des sources : revues TAL et actes TALN• textes entiers français• type de texte : écrit scientifique• genre : article de recherche (193 : 69 + 124)• période et durée identique : TAL 98-2002, TALN 99-2003
Le corpus
22
Hypothèse
Relation sémantico-discursive • collocations argumentatives
• possible – peu fréquentes
Ex : gain de performance
• motivations argumentatives• possible – très fréquentes
Ex : réduction des erreurs
• collocations arbitraires• possible – fréquentes
Ex : évaluation automatique
Synthèse des résultats
23
Typologies
Parallèle inattendu/intéressant typologies• « classiques »• argumentative Collocations libres motivation argumentative
Ex : problème crucial ; fiabilité du résultat
Collocations restreintes argumentativeEx : évaluation fine ; problème épineux
Collocations arbitraires TAL [L’homme 2003]Ex : pourcentage d’erreur ; évaluation automatique
Synthèse des résultats
24
Mécanismes
6 mécanismes discursifs 4 transposables 4 mécanismes et règle de convergence de polarité• renforcement : B +/– et Col +/– : gain de P.• activation :
• B +/– et Col bi/neutre : problème du choix• B bi et Col +/– : évaluation objective
• neutralisation : B bi + Col bi/neutre : R. d’expériences• interversion : B et Col (antéposé) valeurs opposées
Ex : dégradation de performance ; solution du problème
Synthèse des résultats
25
Conclusion
Hypothèses validées• collocations argumentatives/motivées/arbitraires• 4 mécanismes macro-sémantiques• « règles » de convergence de polarité
Description – explication/prédiction• 1 principe descriptif collocations libres/restreintes
• collocations libres contraintes relation argumentative• collocations restreintes nouveau mécanisme de formation• collocations argumentatives prédictibles/stéréotypes