Cours Mod lisation des associations lexicalesagnes.tutin.u-grenoble3.fr/Cours_M2.pdf ·...

27
A. Tutin : Sémantique – Modélisation des associations lexicales - UFR des Sciences du Langage, Université Stendhal Grenoble 3 Agnès Tutin Master 2 des Sciences du Langage Année 2009-2010 Linguistique Vendredi 10h30-12h30 B 220 6 séances de 2 h Sémantique : modélisation des associations lexicales Plan de cours 1. Introduction 2. Typologie des expressions figées 3. Les collocations : des expressions semi-figées entre lexique et syntaxe, entre langue et parole 4. Collocations et motivation 5. Les modélisations des collocations Evaluation 1 travail personnel à partir du contenu du cours et des lectures. Bibliographie de base (elle sera complétée en cours) Tous les ouvrages et articles mentionnés sont disponibles à la bibliothèque des sciences du langage (ou en ligne). Des copies d’articles seront distribuées ou mises en ligne sur le BV. Cowie A. (ed.) (2001). Phraseology : theory, analysis, and applications. New-York : Oxford University Press Fónagy I. (1997). Figement et changement sémantique, in La Locution entre langue et usages, M. Martins-Baltar (ed.), Fontenay-Saint-Cloud, ENS Editions, 131-164. Gonzalez-Rey I. (2002). La phraséologie du français. Toulouse, Presses universitaires du Mirail. Gross G. (1986). Les expressions figées en français : noms composés et autres locutions. Paris, Ophrys. Grossmann Francis, Tutin Agnès (eds.) (2003), Les collocations : analyse et traitement, Travaux et recherches en linguistique appliquée, Amsterdam, de Werelt. Grossmann, F., Tutin, A. (2007). Motivation of lexical associations in collocations: the case of intensifiers for “nouns of joy”, in Wanner L. (ed), Selected Lexical and Grammatical Issues in the Meaning-Text Theory In honor of Igor Mel’čuk. Amsterdam (Pays Bas) Philadelphia (USA), John Benjamins, 139 -165. Hoey M. (2005). Lexical priming : A New Theory of Words and Language. London: Routledge. Nunberg G., Sag I., Wasow Th. (1994). Idioms. Language, vol 70, n°3, 491- 538. Tutin A, Grossmann F. (2002). “Collocations régulières et irrégulières : esquisse de typologie du phénomène collocatif”, Revue française de Linguistique appliquée, « Lexique : recherches actuelles », vol. VII-1. 7-25. Verlinde S., Selva Th., Binon J. (2003).Les collocations dans les dictionnaires d'apprentissage: repérage, présentation et accès. In: Les collocations: analyse et traitement / Ed. Francis Grosman et Agnès Tutin. - Amsterdam: De Werelt, 2003. - p. 105-115. Supports de cours Sur le BV à : http://grenoble.bv.rhone-alpes.fr/personal/tutina_ugr3/SharedDocuments Aller dans M2_sémantique Permanences Lundi de 15h30 à 16h30 en D208. courriel : [email protected]

Transcript of Cours Mod lisation des associations lexicalesagnes.tutin.u-grenoble3.fr/Cours_M2.pdf ·...

Page 1: Cours Mod lisation des associations lexicalesagnes.tutin.u-grenoble3.fr/Cours_M2.pdf · générative, les expressions figées sont considérées comme des exceptions, dont les règles

A. Tutin : Sémantique – Modélisation des associations lexicales - UFR des Sciences du Langage, Université Stendhal Grenoble 3

Agnès Tutin Master 2 des Sciences du Langage

Année 2009-2010 Linguistique

Vendredi 10h30-12h30 B 220

6 séances de 2 h

Sémantique : modélisation des associations lexicales Plan de cours

1. Introduction 2. Typologie des expressions figées 3. Les collocations : des expressions semi-figées entre lexique et

syntaxe, entre langue et parole 4. Collocations et motivation 5. Les modélisations des collocations

Evaluation

1 travail personnel à partir du contenu du cours et des lectures. Bibliographie de base (elle sera complétée en cours) Tous les ouvrages et articles mentionnés sont disponibles à la bibliothèque des sciences du langage (ou en ligne). Des copies d’articles seront distribuées ou mises en ligne sur le BV.

Cowie A. (ed.) (2001). Phraseology : theory, analysis, and applications. New-York : Oxford University Press

Fónagy I. (1997). Figement et changement sémantique, in La Locution entre langue et usages, M. Martins-Baltar (ed.), Fontenay-Saint-Cloud, ENS Editions, 131-164.

Gonzalez-Rey I. (2002). La phraséologie du français. Toulouse, Presses universitaires du Mirail.

Gross G. (1986). Les expressions figées en français : noms composés et autres locutions. Paris, Ophrys.

Grossmann Francis, Tutin Agnès (eds.) (2003), Les collocations : analyse et traitement, Travaux et recherches en linguistique appliquée, Amsterdam, de Werelt.

Grossmann, F., Tutin, A. (2007). Motivation of lexical associations in collocations: the case of intensifiers for “nouns of joy”, in Wanner L. (ed), Selected Lexical and Grammatical Issues in the Meaning-Text Theory In honor of Igor Mel’čuk. Amsterdam (Pays Bas) Philadelphia (USA), John Benjamins, 139 -165.

Hoey M. (2005). Lexical priming : A New Theory of Words and Language. London: Routledge.

Nunberg G., Sag I., Wasow Th. (1994). Idioms. Language, vol 70, n°3, 491-538.

Tutin A, Grossmann F. (2002). “Collocations régulières et irrégulières : esquisse de typologie du phénomène collocatif”, Revue française de Linguistique appliquée, « Lexique : recherches actuelles », vol. VII-1. 7-25.

Verlinde S., Selva Th., Binon J. (2003).Les collocations dans les dictionnaires d'apprentissage: repérage, présentation et accès. In: Les collocations: analyse et traitement / Ed. Francis Grosman et Agnès Tutin. - Amsterdam: De Werelt, 2003. - p. 105-115.

Supports de cours

Sur le BV à : http://grenoble.bv.rhone-alpes.fr/personal/tutina_ugr3/SharedDocuments Aller dans M2_sémantique Permanences

Lundi de 15h30 à 16h30 en D208. courriel : [email protected]

Page 2: Cours Mod lisation des associations lexicalesagnes.tutin.u-grenoble3.fr/Cours_M2.pdf · générative, les expressions figées sont considérées comme des exceptions, dont les règles

2

Introduction

1 L’objet de la sémantique

1.1 Définition

La sémantique est une branche de la linguistique qui étudie les signifiés véhiculés par différents types d’unités linguistiques (les morphèmes lexicaux ou grammaticaux, les énoncés, voire les discours). Voici quelques-uns des objets possibles de la sémantique : . Sémantique lexicale :

- la signification des mots simples ou des mots composés ; la signification des expressions figées (il a cassé sa pipe) ;

- les relations lexicales (les rapports de sens entre les mots : relations d'homonymie, de synonymie, antonymie, hyperonymie, partie-tout, etc.) ;

- la polysémie des mots (ex. écrire : graphier, rédiger, communiquer par lettre… ) ;

- les champs ou les réseaux sémantiques, c’est-à-dire les liens qui unissent des unités lexicales ayant une parenté sémantique (ex. le champ sémantique des sentiments).

. Sémantique du discours - le sens et l’usage linguistique des connecteurs (ex. les connecteurs

justificatifs comme car, parce que, puisque, etc.) oppositifs (mais, pourtant, quand même), consécutifs (donc, par conséquent, ainsi…).

. Sémantique grammaticale : - la distribution des actants au sein d'un énoncé, qui correspond à

des rôles sémantiques (ex. La pâtisserie Lenoir a fourni la mairie en petits fours : 3 actants).

- la valeur sémantique des temps verbaux ainsi que les aspects (accompli, non accompli, perfectifs, imperfectifs, etc : ex. voyager = imperfectif ; partir = perfectif).

. Sémantique formelle : - les conditions de vérité d'un énoncé qui permettent le calcul du

sens. Dans le cadre de ce cours, nous nous intéresserons principalement à la sémantique lexicale, mais nous aborderons également la sémantique grammaticale et la sémantique du discours. � Exercice : voici quelques unes des définitions de la sémantique. Laquelle vous semble la plus claire et la plus complète ? (Référez vous à ce qui précède). (1) « La sémantique est l'étude du sens » (J. Lyons, 1978, Eléments de sémantique, Paris, Larousse). (2) La sémantique est l'étude du sens des mots (P. Guiraud, la sémantique, coll. Que-sais-je ?,1955) (3) « La sémantique est l'étude du sens des mots, des phrases et des énoncés » (Lerat, Sémantique descriptive, 1983). (4) « La sémantique se charge (…) de rendre compte de tous les aspects de la signification que l’on ne peut mettre directement en relation avec des caractéristiques formelles, mais qui appartiennent néanmoins au savoir partagé par les membres d’une communauté linguistique. » (V. Nyckees, La sémantique, Paris, Belin, 1998). (5) La sémantique, (du grec sèmantikos, dérivé adjectival de sèmainein : signifier) a pour objet l’étude du sens véhiculé par les formes linguistiques. Elle décrit la partie de notre compétence qui nous permet d’interpréter les énoncés, d’évaluer leur bonne formation au regard du sens et de reconnaître intuitivement des relations de sens telles que la synonymie et la paraphrase (…), l’implication (« Si c’est une tulipe, alors c’est une fleur »), l’incompatibilité (« Si c’est une tulipe, ça ne peut être une rose, et réciproquement »), etc. (Riegel, Pellat, Rioul, Grammaire méthodique du français, Paris, PUF, 1994, p.24).

Page 3: Cours Mod lisation des associations lexicalesagnes.tutin.u-grenoble3.fr/Cours_M2.pdf · générative, les expressions figées sont considérées comme des exceptions, dont les règles

3

2 Sémantique et disciplines connexes

Le niveau sémantique ne peut être appréhendé sans être mis en relation avec d’autres niveaux sémantiques. Les phénomènes analysés relèvent donc également d’autres disciplines linguistiques, en particulier la syntaxe et la pragmatique.

2.1.1 Sémantique et sémiologie

La sémiologie est la science des signes (et pas seulement des signes linguistiques) ; il s’agit d’un domaine beaucoup plus large que la sémantique, qui a parfois cependant besoin de certains de ces concepts, à commencer par le premier, celui de signe.

2.1.2 Sémantique vs syntaxe

Les relations entre syntaxe et sémantique sont complexes. En effet, la syntaxe s’efforce de faire abstraction du sens pour se limiter aux relations formelles entre les constituants. Historiquement, cette position est relativement récente : en grammaire traditionnelle, l’utilisation de critères sémantiques dans les définitions grammaticales (ex. sujet/objet direct/verbe transitif, etc.) était courante. La position moderne est plutôt de considérer qu’il y a bien autonomie du niveau syntaxique par rapport au sens, mais qu’en même temps, il est possible, dans une certaine mesure, de corréler certains rôles sémantiques et leurs réalisations syntaxiques.

Cette conception ne remet pas en cause l’autonomie nécessaire du plan morphosyntaxique par rapport au plan sémantique, mais elle montre qu’on a intérêt à explorer leurs relations de manière systématique. 2.1.3 Sémantique et pragmatique

La pragmatique s’intéresse aux effets de sens, produits en contexte et non à la part du sens qui se trouve codée par la langue. Quand je dis il fait froid, dans une pièce dans laquelle la fenêtre est ouverte, je suggère qu’il serait bon de la fermer. La pragmatique étudie donc la valeur actionnelle du langage, dans la suite de l’étude des actes de langage, issue de la philosophie analytique (Austin, Strawson, Searle).

Il existe une discussion sur le statut exact de la pragmatique : doit-on ou non l’intégrer à la sémantique ? Dans la pratique, il est en effet parfois difficile de savoir quelle est la part du codage linguistique. Tout un courant de la sémantique moderne (celui de l’école du linguiste belge Oswald Ducrot) défend l’idée que les mots, grâce à leurs signifiés, ont en eux-mêmes une orientation argumentative. Ainsi, dire d’une personne qu’ « elle est peu intelligente » c’est vouloir dire en fait « qu’elle n’est pas intelligente », et pourquoi pas «elle est bête », voire « elle est complètement stupide ». La description linguistique de peu dans des énoncés de ce type en français devrait donc prendre en compte ces effets de sens sur l’énoncé. 2.1.4 Sémantique et lexicologie

La lexicologie, étude des unités lexicales, s’intéresse à la fois à la morphologie lexicale et à la sémantique lexicale. Elle comporte donc une intersection avec une branche de la sémantique, la sémantique lexicale, qui s’intéresse à la manière dont se construit le sens des mots.

On verra dans ce cours que l’examen des expressions figées ou associations polylexicales remet parfois en cause l’autonomie des niveaux lexical et syntaxique, les deux niveaux étant inextricablement liés. Les grammaires de construction (par exemple, Croft & Cruse 2000) tendent à considérer les expressions figées comme des constructions syntaxiques où les positions syntaxiques sont saturées par des éléments spécifiques. Dans la tradition contextualiste anglaise à la suite des travaux de Halliday (Cf. par exemple, Hunston & Francis (2000) ou Hoey (2005)), on n’oppose pas non lexique et syntaxe. Ces approches fonctionnalistes soulignent le fonctionnement phraséologique de la langue.

3 La question de la phraséologie en linguistique

Les expressions polylexicales posent des problèmes théoriques tout à fait intéressants pour la théorie linguistique. Elles ont longtemps été considérées comme des anomalies, des exceptions aux règles linguistiques, qui mettaient à mal la compositionnalité linguistique. Ainsi, dans la tradition de la grammaire générative, les expressions figées sont considérées comme des exceptions, dont les règles habituelles ne peuvent pas rendre compte, et qui doivent être traitées de

Page 4: Cours Mod lisation des associations lexicalesagnes.tutin.u-grenoble3.fr/Cours_M2.pdf · générative, les expressions figées sont considérées comme des exceptions, dont les règles

4

façon spécifique. A l’heure actuelle, de nombreux modèles linguistiques prennent en compte cette composante comme un élément central de la théorie linguistique, comme le mentionnent Legallois et François ci-dessous.

On pourrait parler d’un tournant phraséologique de la linguistique ; non pas parce que, au regard des publications et des colloques, la phraséologie est devenu un objet de plus en plus fréquent d’analyse – il n’y aurait là qu’une « institutionnalisation » d’un thème de recherche parmi d’autres – mais bien plutôt parce que la phraséologie, obligeant il y a peu la théorie à un détours, est devenue la matière première de certaines conceptions linguistiques : elle propose un renouvellement de l’analyse syntaxique, sémantique, textuelle et psycholinguistique sur la base d’observations plus empiriques, grâce, notamment, au recours aux corpus de grandes dimensions. (Legallois & François 2006 : 4).

• La phraséologie met à mal la distinction nette entre syntaxe et lexique :

Les expressions semblent relever du lexique, en tant qu’elles sont mémorisées par les utilisateurs, présentent souvent une unité référentielle et se traduisent souvent par un mot simple dans une autre langue. Elles relèvent aussi de la syntaxe dans la mesure où ces expressions sont mises en œuvre par les règles de la syntaxe (et nombre d’entre elles auront en outre un comportement assez régulier du point de vue syntaxique).

• La phraséologie réactualise le débat entre langue et parole

Les phénomènes phraséologiques, en particulier les moins figés comme les collocations, remettent en question la distinction classique entre langue et parole, entre compétence et performance. Ils appartiennent à la langue dans la mesure où ils sont stockés dans le lexique, mais relèvent aussi de la parole, étant étroitement liés à des phénomènes de fréquence et d’usage.

• La phraséologie remet en question le principe de compositionnalité classique en sémantique

Le principe de compositionnalité repose sur trois conditions :

(1) le sens d’une expression linguistique complexe est entièrement déterminé par le sens de ses constituants ;

(2) le sens d’une expression complexe peut être prédit en fonction des règles générales, à partir du sens de ses constituants ;

(3) chaque constituant (au sens syntaxique du terme) a un sens et ce sens contribue au sens de l’ensemble de l’expression.

En principe, les énoncés des langues naturelles respectent le principe de compositionnalité : ainsi, dans une phrase comme le chat a attrapé la souris, le sens du tout (la phrase) dépend entièrement du sens des constituants. Le sens de la phrase peut être prédit, à condition que l’on connaisse les règles de la syntaxe française. Cependant, dans les expressions figées, le principe de compositionnalité est souvent mis à mal. Un cordon bleu n’est pas un cordon qui est bleu, un dos d’âne (dans une route) ne peut pas être interprété de façon littérale. La non compositionnalité n’empêche pas une certaine motivation, ce que nous allons examiner en détail dans ce cours.

4 Méthodes d’observation et d’analyse

La sémantique utilise différentes méthodes : - l’observation du comportement des mots dans les textes, dans des contextes artificiellement créés mais aussi dans des corpus ; dans le cadre du cours, nous recourrons fréquemment aux exemples sur corpus. - des tests linguistiques : ex. le test de substitution en contexte qui permet de tester le degré de synonymie de deux unités lexicales : ex.X. éprouve de la haine pour Z ; X éprouve de l’inimitié pour Z. Nous utiliserons régulièrement ce type de test pour mettre en évidence les propriétés sémantiques.

5 Complément bibliographique

• Croft, Cruse (2000). Cognitive linguistics. Cambridge University Press 2000.

• Legallois, D., François J. (2006). Autour des grammaires de construction et de patterns. Cahier du Crisco n° 21. Janvier 2006.

Page 5: Cours Mod lisation des associations lexicalesagnes.tutin.u-grenoble3.fr/Cours_M2.pdf · générative, les expressions figées sont considérées comme des exceptions, dont les règles

5

• Hoey M. (2005). Lexical priming : A New Theory of Words and Language. London: Routledge.

• Hunston S. & Francis G. (2000). Pattern Grammar: a corpus-driven approach to the lexical grammar of English (Studies in Corpus Linguistics 4). Amsterdam: John Benjamins.

6 Exercices

1. Repérez les expressions qui ne paraissent pas compositionnelles

sur le plan sémantique. Y en a-t-il beaucoup ? Y a-t-il des expressions polylexicales qui ne paraissent pas véritablement figées ?

La ministre de l'Enseignement supérieur et de la Recherche Valérie Pécresse a multiplié les annonces de réforme. Après la loi très contestée sur l'autonomie des universités (la LRU), elle a promis de rénover la licence, de moderniser le système d'aides sociales, d'améliorer la vie étudiante, etc. Retour sur ce qui va vraiment changer à la rentrée, alors que les inscriptions seront closes demain.

Des «patrons» à la tête des universités. La LRU commence juste à s'appliquer et il faudra attendre pour en mesurer les effets. Seules les instances dirigeantes des universités ont été renouvelées. Désormais elles ont à leur tête des conseils d'administration (CA) resserrés avec des présidents aux pouvoirs renforcés et une représentation étudiante amoindrie. La plupart des présidents sortants ont été reconduits. Beaucoup ont toutefois eu la mauvaise surprise de voir que le nouveau mode d'élection renforçait leur opposition interne. Les listes syndicales, hostiles à la LRU, l'ont souvent emporté chez les maîtres de conférences. Les étudiants, eux, se sont retrouvés en position d'arbitre. Du coup on a vu des blocages lors de l'élection au CA des personnalités extérieures choisies par le président.

La partie cruciale commence maintenant. La semaine prochaine, le ministère annoncera la liste des premières universités qui deviendront autonomes au 1er janvier 2009 avec un budget, incluant les salaires, qu'elles vont gérer elles-mêmes. Il faudra alors négocier la masse budgétaire avec l'Etat. Et cela s'annonce rude. «Certains pensent encore que l'université coûte trop cher», expliquait récemment Michel Lussault, vice-président de la CPU (conférence des présidents d'université). Des promesses pour la licence. Dans le cadre du plan «Réussite en licence», Valérie Pécresse a annoncé une série de mesures pour diminuer les forts taux d'abandon des premières années : la multiplication des cours en petits groupes, cinq heures

d'enseignement hebdomadaires en plus, un effort sur les langues, l'informatique et la méthodologie, un tutorat systématique en première année, etc. Mais les organisations étudiantes ne voient rien venir, ou presque. Les universités où le tutorat existait déjà vont le généraliser. Celles qui avaient un bureau d'insertion professionnelle vont le développer. Mais la plupart restent discrètes sur leurs novations de rentrée. «Pour renforcer l'encadrement des premières années, il faut des enseignants supplémentaires, et c'est le premier obstacle», explique Thiébaut Weber, président de la Fage, la seconde organisation étudiante. Valérie Pécresse, qui avait réussi à geler les effectifs de son ministère en 2008, a dû annoncer des réductions de postes en 2009 - un départ à la retraite sur six ne sera pas remplacé. Son budget reste malgré tout l'un des rares à augmenter - de 10 % pour 2009-2011. «On risque de se retrouver avec des moyens en plus mais pas assez de postes pour les mettre en place», poursuit Thiébaut Weber. (extrait de Libération, 17 juillet 2008).

2. Les expressions polylexicales sont souvent motivées sémantiquement. En particulier, elles expriment souvent une métaphore analysable. Essayez d’expliquer la métaphore dans les expressions suivantes. Avoir un poil dans la main. Mettre la main à la poche. Manger les pissenlits par la racine. Trouver chaussure à son pied. Mettre un cautère sur une jambe de bois.

Page 6: Cours Mod lisation des associations lexicalesagnes.tutin.u-grenoble3.fr/Cours_M2.pdf · générative, les expressions figées sont considérées comme des exceptions, dont les règles

6

Chapitre 1 : Caractéristiques des expressions polylexicales

1 Introduction

Les expressions polylexicales ne constituent pas du tout une classe homogène. Elles sont extrêmement variées et reçoivent de très nombreuses appellations, comme nous le verrons. Il est usuel de les appréhender dans un continuum, à travers leur « degré de figement ». Shapira (1999 : 10), par exemple, considère que « le figement est un phénomène scalaire, ses produits pouvant présenter une rigidité plus ou moins intense ». Tout le monde s’accordera en effet sur le fait que dos d’âne ou cordon bleu présentent intuitivement un degré de figement plus élevé que amour propre qui lui-même sera perçu comme plus figé que amour passionnel ou amour haine. Cependant, la notion de continuum, si elle apparaît intuitive, ne va pas sans poser de problèmes : - D’une part, les différents critères utilisés pour déterminer le figement sont

souvent indépendants. Le figement s’exprime donc sur plusieurs échelles, qui ne sont pas nécessairement parallèles. Par exemple, le caractère syntaxique contraint de certaines expressions polylexicales ne s’accompagne pas nécessairement d’une opacité sémantique, et inversement. Par exemple, peur bleue est très contraint sur le plan syntaxique (pas de possibilité d’insertion de modifieur ou de verbe d’état : *une peur très bleue, *sa peur était bleue). Sur le plan sémantique cependant, on peut considérer que l’expression n’est pas complètement opaque, puisque le sens habituel de peur reste accessible. Inversement, une expression comme fermer sa porte à qqch (=’exclure’ qqch) est peu compositionnelle au sens strict (même si le sens est déductible par métaphore). En revanche, cette expression peut connaître des alternances et insertions syntaxiques :

o Cette porte n’est pas complètement fermée (= cette solution n’est pas complètement exclue).

o Nous n’avons fermé définitivement notre/cette/la porte à cette solution.

- D’autre part, la notion de continuum est finalement peu utile. Placer des éléments sur une échelle de figement ne constitue nullement un traitement suffisant, en tout cas pour de nombreux traitements linguistiques, comme pour les applications en didactique des langues ou en traitement automatique des langues. Il conviendra davantage pour nous de caractériser les expressions polylexicales à partir d’un ensemble de critères pertinents.

En bref, si la notion de continuum du figement apparaît intuitivement pertinente, elle doit être maniée finement. Précision terminologique : Le terme « expression figée » (« frozen expression » ou « fixed expression » en anglais), même s’il est très employé – y compris ici ! – apparaît trop limitatif pour couvrir l’ensemble des phénomènes que nous souhaitons examiner dans ce cours et nous lui préférerons le terme plus neutre (et peu théorique) d’ « expression polylexicale » (« multiword expression » en anglais), plus générique, pour désigner l'ensemble des éléments qui nous intéressent. On ne peut en effet appeler « expressions figées » des expressions qui ne sont ni véritablement figées sur le plan sémantique, ni sur le plan syntaxique comme grièvement blessé, immense regret, joie indicible, perpétrer un crime et qui sont pourtant perçues comme lexicalisées. Nous définirons les expressions polylexicales comme : Des expressions : - qui comprennent plusieurs mots (graphiques), - dont les composants apparaissent fréquemment en cooccurrence, mais

peuvent également apparaître de façon autonome. - qui sont mémorisées comme un tout par les locuteurs. Cette définition large permet d’englober aussi bien des « mots composés » que des « collocations » ou des « formules routinières ».

Page 7: Cours Mod lisation des associations lexicalesagnes.tutin.u-grenoble3.fr/Cours_M2.pdf · générative, les expressions figées sont considérées comme des exceptions, dont les règles

2 Types de constituants des expressions polylexicales

La question des constituants est tout à fait centrale dans la typologie des expressions polylexicales. Nous n’aborderons ici que des séquences intégrant des éléments lexicalisées. Cela exclut donc les pures constructions syntaxiques chères aux linguistes du courant des « grammaires de constructions ». Les constituants mettant en jeu les expressions figées sont extrêmement divers. Ils vont de la phrase dans le cas des parémies ou proverbes aux locutions faisant fonction de déterminants ou de prépositions. Certaines séquences préconstruites (certaines colligations et collocations) ne peuvent d’ailleurs pas être véritablement considérées comme des constituants au sens traditionnel du terme.

2.1 Phrases

Les expressions préconstruites constituant des phrases « verbales » (à temps fini) apparaissent dans les proverbes ou parémies.

1. Pierre qui roule n’amasse pas mousse. 2. Qui a bu boira.

Ces expressions peuvent d’une certaine façon être considérées comme appartenant à la phraséologie, du fait de leur caractère préconstruit et mémorisé. Elles sont généralement très figées sur le plan syntaxique et présentent des constructions tout à fait caractéristiques (Cf. Anscombre 2003, Schapira 1999). En revanche, elles présentent des spécificités par rapport aux autres expressions figées qui les rendent tout à fait marginales. Leur caractère phrastique les exclut bien entendu du lexique. De plus, contrairement aux autres expressions figées, elles constituent des prédications autonomes. Enfin, elles ont une valeur rhétorique spécifique, illustrative, et sont très liées au genre oral. Les phrases, verbales ou averbales, apparaissent également dans ce que Mel’čuk (par exemple, 1998) appelle les « pragmatèmes », ces expressions « toutes faites » qui apparaissent dans des situations de communication spécifiques, généralement à l’oral, comme les formules de politesse ou les formules rituelles, comme les suivantes :

3. comment allez-vous ? 4. par exemple !

Ces expressions reçoivent d’autres appellations : « phrases de routine » chez Schapira (1999) ou « énoncés de motif usuels » chez Martins-Baltar (1995). Fónagy (1997) les appelle « énoncés liés », et remarque que ces expressions ne peuvent être traduites littéralement, sous peine de contresens. La formule de politesse répondant un remerciement en français de rien a ainsi comme contrepartie anglaise le très éloigné you’re welcome. Comme le souligne Fónagy, décrire adéquatement ces expressions est une véritablement gageure, l’accès sémasiologique étant de peu d’utilité. C’est essentiellement la composante pragmatique qui doit être ici privilégiée.

2.2 Constituants sub-phrastiques

Les expressions polylexicales sont plus couramment des constituants sub-phrastiques. Certaines expressions correspondent à ce que l’on peut analyser comme des syntagmes dans la tradition des grammaires de constituants. Dans certains cas, la formation syntaxique de la séquence polylexicale correspondra à une expansion obéissant aux règles habituelles de la grammaire : une séquence lexicale associable à une structure XP pourra être analysée comme ayant la catégorie X. Par exemple, le syntagme tête de turc est construite comme une expansion nominale a une structure classique de type N1 de N2 et la catégorie syntaxique que l’on peut associer à cet élément est le nom. On parle souvent de structure endocentrique pour ce type de formation des séquences polylexicales. C’est ainsi le cas d’expressions :

expansions du nom : tête de turc peur bleue

expansions de l’adjectif fou amoureux bête comme ses pieds

expansions du verbe faire la manche

Page 8: Cours Mod lisation des associations lexicalesagnes.tutin.u-grenoble3.fr/Cours_M2.pdf · générative, les expressions figées sont considérées comme des exceptions, dont les règles

péter les plombs avoir peur expansions de la préposition par monts et par vaux

En revanche, d’autres séquences à structure exocentrique, généralement perçues comme très figées, ne sont pas analysables sur le plan syntaxique à l’aide des règles habituelles de la syntaxe. Dans un crève la faim, crève la faim s’analyserait comme un syntagme verbal alors qu’il a une fonction nominale. bon marché s’apparente à un adjectif (dans un livre bon marché), alors qu’il a une structure nominale. ventre à terre, qui a aussi une structure nominale, a une fonction adverbiale dans il court ventre à terre. Enfin, mentionnons les séquences polylexicales correspondant à des mots grammaticaux, qui ont un fonctionnement tout à fait atypique sur le plan syntaxique. Ils ne renvoient pas à des catégories syntaxiques majeures et ont un fonctionnement syntaxique tout à fait idiosyncrasiques, pour la plupart d’entre eux :

déterminants : la plupart des, bien des … pronoms : le mien, autre chose conjonctions : bien que, avant que … prépositions : au dessus-de, en dehors de …

Ces expressions, souvent négligées par la phraséologie, sont extrêmement nombreuses. Légèrement différent apparaît être le cas d’expressions comme les suivantes qui semblent répondre à des patrons productifs, et qu’on pourra analyser, pour nombre d’entre elles, comme des collocations :

Une foule de Une nuée de dans l’espoir de/que de crainte de

2.3 Séquences subphrastiques qui n’ont pas véritablement valeurs

de constituants

Certaines séquences polylexicales ne peuvent s’analyser ni comme syntagmes au sens de la grammaire de constituants, ni commuter avec des mots simples. C’est en particulier le cas de certaines formules routinières (formulaic sequences) très étudiées dans le cadre de la phraséologie anglo-saxonne (par exemple, Schmitt 2004), parfois considérées comme des « colligations » (Siepmann 2006), auxquelles il n’est pas facile d’attribuer une catégorie syntaxique claire. Il s’agit d’expressions comme :

5. tout se passe comme si … 6. it is argued that … 7. plus … , plus …. 8. En ce qui concerne …

Il s’agit souvent de marqueurs discursifs, ayant une fonction rhétorique et pragmatique spécifique (Siepmann 2006). D’autres types de séquences ne constituent pas des syntagmes au sens des grammaires de constituants. Il s’agit par exemple d’associations de type sujet-verbe comme les suivantes :

9. La peur paralyse … Les éléments de l’expression entretiennent toutefois une relation syntaxique classique (sujet-verbe).

3 Le comportement syntaxique des expressions polylexicales

Il a été remarqué depuis longtemps et par de nombreux linguistes que les séquences polylexicales présentaient des comportements très variables par rapport au figement syntaxique, qu’il s’agisse de l’insertion d’éléments, de la commutation ou des alternances syntaxiques. On trouve ainsi chez Svensson (2004) et Gross (1996) un inventaire de critères syntaxiques permettant de déterminer le degré de figement syntaxique d’une expression, dont nous mentionnons quelques-uns :

Page 9: Cours Mod lisation des associations lexicalesagnes.tutin.u-grenoble3.fr/Cours_M2.pdf · générative, les expressions figées sont considérées comme des exceptions, dont les règles

- Inséparabilité des constituants de l’unité : cordon bleu : °un cordon vraiment bleu1. vs jupe marron : jupe vraiment marron.

- Substitution difficile, blocage lexical : pomme de terre, °poire de terre, °pomme de glaise. Vs cours de linguistique, cours de sémantique, livre de linguistique.

- Alternances syntaxiques (surtout pour les verbes) difficiles : o Passif :

Il a cassé sa pipe � °sa pipe a été cassée. Vs Il a brisé son verre � son verre a été brisé.

o Transformation relative : Il a mordu la poussière � °La poussière qu’il a mordue. Vs Le chien a mordu le garçon � Le garçon que le chien a mordu.

- Anomalies syntaxiques fréquentes (par exemple, absence de déterminants, structure spécifique), normalement impossibles. Il s’agit souvent d’archaïsmes. Il a plié bagage. Vs *Il a plié feuille. Il est ivre mort. Vs *Il est soul mort.

Ces différents critères syntaxiques ne sont cependant pas nécessairement convergents, ce qui rend parfois difficile l’application de degré de figement syntaxique.

� Exercice : En appliquant les critères examinés plus haut, déterminez dans quelle mesure les expressions ci-dessous sont figées sur le plan syntaxique. Le figement syntaxique va-t-il de pair avec le figement sémantique ? - Péter les plombs - Rompre la glace.

1 Le signe “ ° ” indique un changement de sens par rapport à l’unité de départ.

- Avoir faim. - Plier bagage.

4 Critères sémantiques

La question de la compositionnalité sémantique est centrale dans la définition des expressions polylexicales. Toutes les définitions des expressions figées (phrasèmes, locutions) intègrent d’une façon ou d’une autre cette notion, … mais n’en donne pas la même définition (Voir aussi la définition donnée en introduction)!

une locution prototypique est caractérisée […] par sa non-compositionnalité. On a beau comprendre tous les mots qui entrent dans tirer le diable par la queue cela ne suffit pas pour comprendre ce que cette locution veut dire. (Martin 1997 : 293) compositionality – that is, the degree to which the phrasal meaning, once known, can be analyzed in terms of the of the contribution of the idiom parts (Nunberg et al. 1994 : 498)

Le critère de compositionnalité peut mettre en jeu deux notions : - Le calcul d’un sens sémantique à partir de sens associés aux composantes

de l’expression. - La prédictibilité du sens de l’expression à partir du sens des composants. Pour Nunmberg et al., certaines expressions relativement « opaques », mais résultent d’une combinaison de parties, et ces auteurs préfèrent recourir au terme de conventionnality (caractère conventionnel dans ce second cas) pour la deuxième notion. Ils montrent ainsi que de nombreuses expressions a priori opaques (et donc « conventionnelles ») sont en fait compositionnelles, une fois que l’on connaît le sens de l’expression. Ils distinguent ainsi les idiomatic phrases comme casser sa pipe (syntagmes idiomatiques, non compositionnels) des idiomatically combining expression (expression compositionnellement idiomatiques, comme vendre la mèche ou rompre la glace, pour lesquelles on peut décomposer le sens en un sens calculable à partir des parties (pour vendre la mèche, ‘vendre’ = ‘diffuser’ et ‘la mèche’ = ‘le secret’. Des critères syntaxiques sont aussi employés. La définition de la compositionnalité de Nunberg et al. rejoint le critère d’opacité souvent utilisé pour définir les expressions figées : les expressions figées seraient difficiles à interpréter si on ne connaît pas a priori leur sens. Certaines expressions

Page 10: Cours Mod lisation des associations lexicalesagnes.tutin.u-grenoble3.fr/Cours_M2.pdf · générative, les expressions figées sont considérées comme des exceptions, dont les règles

au sens non prédictible à partir des sens littéral des parties, sont cependant relativement transparentes, leur sens étant calculé par métaphore, par exemple, mauvaise graine ou séparer le bon grain de l’ivraie. � Exercice : Indiquer pour chaque expression suivante dans quelle mesure elle est opaque sur le plan sémantique et dans quelle mesure le sens est prédictible par le calcul du sens des parties. - Pied à terre. - Peur bleue. - Mettre les voiles. - Coup d’œil. - Pertes abyssales.

5. Autres critères

Certains paramètres caractérisent particulièrement certaines expressions polylexicales : - Le caractère métaphorique, qui concerne de nombreuses expressions

(mauvaise graine, pomme de terre), mais pas toutes, par exemple bien que, fait divers, pèse-bébé.

- Le registre peu soutenu de certaines expressions : hurler de rire, avoir le feu aux fesses.

- Le caractère souvent subjectif des expressions (langage évaluatif) : travailler d’arrache-pied, un ennui mortel, un amour fou.

6. Bibliographie (hors bibliographie de base)

Anscombre J-C. (2003). Les proverbes sont-ils des expressions figées ?.

Cahiers de lexicologie 82, pp. 159-173.

Martins-Baltar M. (1995). Enoncés de motif usuels : figures de phrase et procès en déraison. Cahiers du Français Contemporain, « La locution en discours », M. Martins-Baltar (ed.). N° 2, Décembre 1995. 87-118.

Mel’čuk I. (1998). Collocations and Lexical Functions. In A. P. Cowie (ed.), Phraseology. Theory, Analysis and Applications. Oxford, Clarendon Press, 23-53.

Schapira C. (1999). Les Stéréotypes en français. Proverbes et autres formules. Paris : Ophrys.

Svensson M.H. (2004). Critères de figement : L’identification des expressions figées en français contemporain. Umeå Universitet, Umeå.

Page 11: Cours Mod lisation des associations lexicalesagnes.tutin.u-grenoble3.fr/Cours_M2.pdf · générative, les expressions figées sont considérées comme des exceptions, dont les règles

Chapitre 2 : Les collocations : des expressions semi-figées, entre

lexique et syntaxe, entre langue et parole

Les collocations : plusieurs définitions pour plusieurs traditions

La notion de collocation est souvent décrite comme floue dans la littérature linguistique. Williams (2003 : 33) dit ainsi :

Les collocations sont en quelque sorte l’Arlésienne de la linguistique : tout le monde en parle, mais elles restent difficilement saisissables.

Depuis quelques années néanmoins, cette notion, sous l’influence de la lexicographie et des applications de traitement automatique du langage, commence à être plus finement étudiée et définie, et une terminologie plus stable se fait jour.

Dans le cadre de ce cours, nous nous intéresserons sous le terme de collocations à des expressions stéréotypées, parfois partiellement figées comme avoir faim, perte abyssale, ivre mort, formuler une hypothèse … D’autres définitions sont cependant parfois utilisées, comme nous allons le voir.

4.1 Les collocations chez Firth et dans la tradition

contextualiste anglaise : “you shall know a word by the

company it keeps”

Firth, dans les années 40, est l’un des premiers à utiliser la notion de collocation en linguistique. Pour lui, le sens doit s’analyser dans le contexte textuel, et pas en recourant à l’intuition :

Meaning by collocation is an abstraction at the syntagmatic level and is not directly concerned with the conceptual or idea approach to the meaning of words. One of the meanings of night is its collocability with dark, and of dark, of course, collocation with night. (Firth 1957 : 196)

[Le sens dans les collocations est une abstraction au niveau syntagmatique et n’est pas directement concerné par l’approche conceptuelle ou idéationnelle du sens des mots. Un des sens de nuit est sa relation collocationnelle avec noir et, pour noir, évidemment, la collocation avec nuit.]

C’est Firth qui est à l’origine de la fameuse citation : « you shall know a word by the company it keeps “, qui comme le souligne Williams (2003), n’est pas extrêmement claire. Ses disciples, en particulier, Halliday, Sinclair et plus tard Hoey, proposeront des définitions plus claires de la notion de collocation. Halliday, avec une approche fonctionnelle, s’intéresse aux structures de la langue. Dans approche « lexico-grammaticale », il étudie comment les associations lexicales, les collocations, participent à la cohésion textuelle.

laugh … joke, blade … sharp, ill… doctor […] The cohesive effect of such pairs depends not so much on any systematic relationship as on their tendency to

Page 12: Cours Mod lisation des associations lexicalesagnes.tutin.u-grenoble3.fr/Cours_M2.pdf · générative, les expressions figées sont considérées comme des exceptions, dont les règles

12

share the same lexical environment, to occur in COLLOCATION with one another. In general, any two lexical items having similar patterns of collocation – that is, tending to appear in similar contexts – will generate a cohesive force if they occur in adjacent sentences. (Halliday & Hasan 1976: 285-286)

John Sinclair (Sinclair 1991: 170) n’adopte pas une définition fondamentalement différente de la notion de collocation, et insiste sur les critères de type statistique :

Collocation is the occurrence of two or more words within a space of each other in a text ... Collocations [...] can be important in the lexical structure of the language because of being frequently repeated. This second kind of collocation, often related to measure of statistical significance, is one that is usually meant in linguistic discussions (Sinclair 91, p 170).

Cette approche large est encore partagée par certains chercheurs en Traitement Automatique des Langues ou par des chercheurs se situant dans la lignée des contextualistes anglais comme Hoey (2005).

4.2 La tradition « continentale »

Dans la tradition continentale (terme de Williams (2003)), les collocations sont modélisées dans un cadre lexicologique et lexicographique. Cette conception plus étroite associe les collocations à des associations lexicales fréquentes où les éléments entretiennent des relations syntaxiques. C’est cette conception de la notion de collocation, parfois appelée collocation lexicale restreinte, que nous adopterons ici. La notion n’est pas nouvelle : elle apparaissait déjà chez Bally dans son traité de stylistique française (1909) sous le terme de séries phraséologiques.

Entre les extrêmes (groupements passagers et unités indécomposables) se placent des groupes intermédiaires appelés séries phraséologiques (p.ex. les séries d’intensité ou les périphrases verbales). (p 66) Il y a série ou groupement usuel lorsque les éléments du groupe conservent leur autonomie, tout en laissant voir une affinité évidente qui les rapproche, de sorte que l’ensemble présente des contours arrêtés et donne l’impression du “ déjà vu ”. (p 70)

Depuis le début des années 80 cependant, une plus grande attention a été prêtée à ce phénomène par des linguistes, qui ont essayé d’en donner des définitions précises (par exemple, Cruse 1986 ; Hausmann 1989 ; Mel’čuk 1998 ; ou plus récemment, Bartsch 2004). [Remarque : l’inventaire des définitions « classiques » n’est pas exhaustif ici].

• Cruse (1986 : 40)

The term collocation will be used to refer to sequences of lexical items which habitually co-occur, but which are nonetheless fully transparent in the sense that each lexical constituent is also a semantic constituent. Such expressions as (to pitch a semantic area at random) fine weather, torrential rain, light drizzle, high winds are examples of collocations. These are or course easy to distinguish from idioms; nonethless, they have a kind of semantic cohesion — the constituent elements are, to varying degrees, mutually selective. The semantic integrity on cohesion of a collocate is the more marked if the meaning carried by one (or more) restricted contextually, and different from its meaning in more neutral contexts.

• Hausmann (1989 : 1010)

On appellera collocation la combinaison caractéristique de deux mots dans une des structures suivantes : a) substantif + adjectif (épithète) b) substantif + verbe c) verbe + substantif (objet) d) verbe + adverbe e) adjectif + adverbe f) substantif + (prép.) + substantif La collocation se distingue de la combinaison libre (the book is useful/ das Buch ist nützlich/ le livre est utile) par la combinabilité restreinte (ou affinité) des mots combinés (feuilleter un livre vs. acheter un livre). La collocation se distingue d’autre part des locutions (idioms, Redewendungen, par ex. monter un bateau à qn/jdn. durch den Kakao ziehen/ to pull sb’s leg) par son non-figement et sa transparence. Or, cette transparence n’empêche nullement la collocation d’être imprédictible. L’apprenant étranger, tout en la comprenant (s’il comprend les mots combinés), ne saurait automatiquement la reproduire. Il doit l’apprendre, parce que les langues, dans la totalité des combinaisons possibles, font un choix idiosyncratique.

Page 13: Cours Mod lisation des associations lexicalesagnes.tutin.u-grenoble3.fr/Cours_M2.pdf · générative, les expressions figées sont considérées comme des exceptions, dont les règles

13

• Mel’čuk (1998 : 30-31) A COLLOCATION AB of L is a semantic phraseme of L such that its signified ‘X’ is constructed out of the signified of the one of its two constitueny lexemes - say, of A - and a signified ‘C’ [‘X’ = ‘A⊕ B’] such that the lexeme B expresses ‘C’ contingent on A. The formulation “B expresses ‘C’ contingent on A » covers four major cases, which correspond to the following four major types of collocations : 1. either ‘C’ ≠ ‘B’, i.e. B does not have (in the dictionary) the corresponded signified; and a. ‘C’ is empty, that is, the lexeme B is, so to speak, a semi-auxiliary slected by A to support it in a particular syntactic configuration; Or b. ‘C’ is not empty but the lexeme B expresses ‘C’ only in combination with A (or with a few other similar lexemes)]; 2. or ‘C’ = ‘B’, i.e., B has (in the dictionary) the corresponding signified; and a. ‘B’ cannot be expressed with A by any otherwise possible synonym of B; or b. ‘B’ includes (an important part of) the signified ‘A’, that is, it is utterly specific, and this B is ‘bound’ by A]. Examples (lexeme A is in small caps) Case 1a : collocations with support (= ‘light’) verbs, such as [to] do a FAVOR, [to] give a LOOK, [to] take a STEP, [to] launch an APPEAL, [to] lay SIEGE [to N]. Case 1b : collocations such as black COFFEE, French WINDOW, Fr. BIÈRE bien frappée <*battue> ... Case 2a : collocations with intensifiers, such as strong <*powerful> COFFEE, heavy <*weighty> SMOKER, deeply <*profoundly> MOVED, [to] ILLUSTRATE vividly. Case 2b : collocations such as The HORSE neighs, aquiline NOSE, rancid BUTTER or artesian WELL.

• Bartsch (2004 : 76-77) Collocations are lexically and/or pragmatically constrained recurrent cooccurrences of at least two lexical items which are in a direct syntactic relation with each other. The following criteria are employed in the empirical part of the study for the computer-aided extraction of collocation candidates from the corpus:

1) Within a span of 3:3 (or 5:5) words to the left and right of a node word (the search node).

2) two (or more) words which co-occur recurrently with the node word, 3) and whose frequency of co-occurrence can be said to be statistically

significant according to at least one of the three statistical algorithms employed (the default threshold values are MI ≥ 10,00 and t-score ≥ 2,5% for 95% certainty and a significantly high chi-square rating.

are said to constitute collocation candidates. These collocation candidates are subsequently subjected to qualitative criteria. In order to qualify as genuine collocations, the constituents 4) must be in a direct syntactic relation with each other, and 5) display either lexically and/or pragmatically constrained lexical

selection, or 6) have an element of semantic opacity such that the meaning of the

collocation cannot be said to be deducible as a function of the meanings of the constituents.

Ces différentes définitions mettent en jeu un ensemble de paramètres qu’il conviendra d’examiner de plus près.

5 Paramètres définitoires des collocations

Plusieurs critères définitoires sont proposés dans les définitions « lexicales » de la notion de collocation si l’on se base sur les définitions classiques des auteurs de référence. - La fréquence de la cooccurrence des éléments Ce critère, qui apparaissait essentiel dans la tradition contextualiste, est exploité de façon informelle chez Cruse (« habitually cooccur »), est défini comme élément nécessaire (mais non suffisant) chez Bartsch. L’utilisation de seuils précis permet n’apparaît pas inutile en linguistique de corpus, et évite d’une certaine façon l’arbitraire. On notera que le critère statistique est absent chez Hausmann et Mel’čuk. - L’aspect arbitraire (la non prédictibilité) de l’association lexicale : La réalisation lexicale de collocation n’est pas prévisible (Hausmann : “ [la] transparence n’empêche nullement la collocation d’être imprédictible ”). Si

Page 14: Cours Mod lisation des associations lexicalesagnes.tutin.u-grenoble3.fr/Cours_M2.pdf · générative, les expressions figées sont considérées comme des exceptions, dont les règles

14

torrentielle peut en effet apparaître en cooccurrence avec pluie, cela paraît nettement moins naturel avec précipitations torrentielles. Cela est encore plus manifeste pour les collocations imagées du type appétit d’ogre ou faim de loup (vs. ?appétit de loup et ?faim d’ogre). Il faut cependant tempérer cette affirmation en signalant : 1) que les associations sont peut-être arbitraires lexicalement mais

qu’elles concernent des parties du discours précises, comme cela est souligné par Hausmann,

2) que certaines relations sémantiques et syntaxiques favorisent l’apparition des collocations (le modèle des fonctions lexicales code précisément ces relations syntactico-sémantiques),

3) que dans de nombreux cas, on peut expliquer la cooccurrence des éléments de la collocation à l’aide de principes sémantiques.

Nous reviendrons sur ces points plus loin dans le cours. - La transparence sémantique de la collocation. Cruse et Hausmann soulignent que les collocations peuvent être facilement interprétées par le locuteur, même si leur forme n’est pas prévisible. Leur sens se déduit, même s’il apparaît difficile de prévoir la réalisation lexicale des éléments. Les exemples de Hausmann (célibataire endurci, feuilleter un livre) seront facilement compris par un locuteur non natif du français qui serait toutefois tout à fait incapable de les produire spontanément. Pour Mel’čuk, les choses sont un peu plus complexes. Dans certains cas de figure, le sens n’est pas réellement transparent. C’est le cas d’expressions comme peur bleue ou colère noire, généralement intégrées dans la définition de collocation, dont l’adjectif n’est pas immédiatement interprétable. La “ transparence ” ne caractérise donc peut-être pas l’ensemble de la classe. Bartsch, comme Mel’čuk, considère que les collocations peuvent comporter une part d’opacité sémantique telle que le sens de la collocation n’apparaît pas déductible du sens des composants. - Le caractère binaire de la collocation Pour Hausmann comme pour Mel’čuk, la collocation est essentiellement constituée de deux mots ou de deux lexies. Cette bipartition n’est pas aussi marquée chez Cruse ou Bartsch. Même si ce caractère duel est vérifié dans la plupart des collocations, il nous paraît plus pertinent de parler d’association

de constituants (plutôt que de lexies) pour englober des exemples comme les suivants, pour lesquels l’élément qualifiant se ré alise par un syntagme : il y a ici association d’un mot (par exemple, fort, bruit) avec un syntagme (comme un turc, à crever les tympans). Il paraît en revanche justifié de considérer les collocations comme constituées de deux parties dont le statut est d’ailleurs inégal. Il arrive cependant que des expressions englobent davantage que deux termes : essuyer un échec cuisant, avoir une peur bleue. Dans la plupart des cas, il est possible de considérer qu’on a simplement affaire à deux collocations distinctes qui ont été fusionnées et sont ici superposées : essuyer un échec et échec cuisant, avoir peur et peur bleue, même si la fusion est parfois bloquée, essentiellement pour des raisons syntaxiques. Nous avons montré récemment (Tutin, 2008) que de nombreuses collocations considérées comme ternaires, pouvaient en fait être analysées comme des superpositions de collocations, ou des collocations récursives. - La dissymétrie des composants de la collocation (un élément

conserve son sens habituel).

Mel’cuk et Hausmann considèrent tous deux que les composants de la collocation n’ont pas le même statut. (Hausmann : “ Dans la collocation, le statut des deux partenaires combinés n’est pas égal. ”). Pour Hausmann, un élément est autonome (la base), il a son sens habituel. L’autre (le collocatif) dépend du premier, qui conserve son sens habituel. Mel’čuk propose une analyse comparable. Cette dissymétrie de la collocation a été remise en question par plusieurs linguistes comme Bartsch, qui ne l’emploie pas. Force est de constater néanmoins qu’elle est institutionnalisée dans les dictionnaires de collocations où les informations collocationnelles sont généralement entrées sous l’article de la base (Par exemple, faire peur, avoir peur ou peur bleue S.V. peur). Nous reviendrons sur ce point plus loin. - La notion de sélection lexicale Pour Mel’čuk et Hausmann, les collocations doivent surtout être envisagées dans le cadre de la production, l’encodage. Hausmann (1989) suggère que la base impose la sélection du collocatif. Cette perspective apparaît encore plus claire pour Mel’cuk. Pour lui, il y a collocation, lorsque, voulant “ produire ”

Page 15: Cours Mod lisation des associations lexicalesagnes.tutin.u-grenoble3.fr/Cours_M2.pdf · générative, les expressions figées sont considérées comme des exceptions, dont les règles

15

une suite de deux expressions, le choix d’une des expressions n’est pas libre, mais imposé par l’autre élément. - La relation syntaxique entre les deux composantes de la

collocation Les éléments de la collocation doivent entretenir une relation syntaxique. Ce point important est souligné par Hausmann (qui donne cependant une définition trop restreinte des schémas syntaxiques possibles) et par Bartsch. Ce point distingue la définition « continentale » de nombre de définitions de la tradition contextualiste anglaise.

6 Une définition de travail pour les collocations

Dans le cadre du cours, nous adoptons l’approche « continentale » sur les collocations. Voici un ensemble de critères que nous retiendrons pour définir les collocations : - Les collocations sont des associations mettant en jeu

(prototypiquement) deux éléments linguistiques sémantiquement pleins :

o Nous excluons ainsi les associations d’un élément lexical plein avec un mot grammatical. Par exemple, dans : Il donne le livre à Max. donner à ne sera pas considéré comme une collocation. En revanche, dans : Elle a commis ce crime par amour. par amour pourra être considéré comme une collocation, car la préposition, ici pleine, indique la cause.

o La plupart des collocations qui semblent comporter davantage que deux termes peuvent être analysées :

- comme des superpositions de collocations : il avait une faim de loup.

Dans ce cas, on peut décomposer la collocation comme deux collocations superposées : avoir faim + faim de loup. Les deux expressions apparaissent indépendamment. - comme des collocations qui s’appliquent de façon récursive : ce problème l’a mis en colère. en colère peut être analysé comme une collocation. Cette expression entre elle-même dans une collocation plus large mettre en colère (ou être en colère). En colère peut se rencontrer en dehors de ces environnements : Je ne l’ai jamais vu en colère. La question de la binarité des collocations est un point important dans la modélisation lexicographique des collocations, comme on le verra au chapitre 4.

- Des associations qui présentent des propriétés syntaxiques spécifiques :

o Les éléments de la collocation entretiennent (ou peuvent entretenir) une relation syntaxique directe de type sujet-verbe, verbe-complément, nom-épithète, … qui peut facilement être représenté par des grammaires de dépendance à la Tesnière.

o Les collocations sont généralement des expressions polylexicales endogènes, qui se forment pour la plupart d’entre elles à l’aide des règles habituelles de la syntaxe. Ainsi, une expression comme pèse-bébé ne peut pas être une collocation.

o Il arrive cependant que certaines collocations présentent un construction syntaxique atypique comme dans ivre mort ou amour haine.

- Sur le plan sémantique, les collocations présentent les propriétés

suivantes : o Elles sont en partie (ou parfois complètement

compositionnelles). Un élément de la collocation conserve son sens habituel. L’autre élément peut être relativement régulier (gros fumeur), transparent en analyse (ou reconnaissance) (un appétit d’ogre) ou relativement opaque (peur bleue).

Page 16: Cours Mod lisation des associations lexicalesagnes.tutin.u-grenoble3.fr/Cours_M2.pdf · générative, les expressions figées sont considérées comme des exceptions, dont les règles

16

o Les collocations peuvent généralement être analysées comme des relations de type prédicat-argument. L’élément qui conserve son sens habituel est l’argument, alors que l’élément plus imprédictible est le prédicat. Dans appétit d’ogre , d’ogre est un prédicat qui intensifie l’argument appétit . Dans donner faim, donner est le prédicat causatif qui porte sur l’argument faim.

o On appelle généralement base l’élément stable et prédictible de la collocation, alors que l’élément moins prédictible est appelé collocatif. Dans donner faim, faim serait le collocatif et faim serait la base.

- Sur le plan de l’usage, les éléments de la collocation apparaissent de façon récurrente. Si le sens de la collocation est souvent transparent, les éléments qui la lexicalisent sont souvent arbitraires. Les locuteurs non natifs comprennent ainsi souvent les collocations mais ne savent pas nécessairement comment les produire. C’est pourquoi la question des collocations apparaît essentielle en didactique du lexique et est beaucoup étudiée dans ce cadre. Ces expressions polylexicales doivent être apprises et mémorisées.

7 Classification des collocations

Les classifications syntaxiques prennent souvent en compte la structure syntaxique des collocations, par exemple : - Collocations verbales

o Où le collocatif est sujet : la peur paralyse

o ou complément nominal : mourir de peur

o ou un constituant infinitif : rire à pleurer …..

- Collocations adjectivales : o Où le collocatif est un autre adjectif :

ivre mort o ou un adverbe :

immensément riche

o ou un syntagme prépositionnel : ennuyeux comme la pluie ….

- Collocations nominales : o Où le collocatif est un adjectif :

perte abyssale o Où le collocatif est un complément nominal :

temps de chien, hypothèse de départ - où la base est le complément de nom :

bouffée de haine, histoire d’amour … Nous avons proposé une classification sémantique prenant en compte l’opacité du collocatif (Tutin & Grossmann 2002). - Sont considérées comme collocations opaques les collocations dans

lesquelles le sens du collocatif n’est ni prédictible, ni transparent : peur bleue, colère noire.

- Les collocations transparentes sont difficilement prédictibles sur le plan lexical, mais transparentes en compréhension : triste à pleurer, bête à manger du foin, courir à perdre haleine.

- Les collocations régulières sont transparentes et généralement prédictibles (l’usage est ici déterminant) : gros mangeur, tristesse affreuse. Elles sont préférées par les locuteurs natifs.

Bibliographie

Bartsch S. (2004), Structural and functional properties of collocations in English, A corpus study of lexical and pragmatic constraints on lexical co-occurrence. Tübingen, Narr.

Cruse D.A. (1986). Lexical Semantics. Cambridge. London, Cambridge University Press (Cambridge Textbooks in Linguistics).

Firth J.R. (1957) : Papers in Linguistics 1934-1951. Oxford, Oxford University Press.

Halliday, M.A.K., Hasan, R. (1976) : Cohesion in English. London, Longman. Hausmann F. J. (1989), Le dictionnaire de collocations. In Hausmann F.J.,

Reichmann O., Wiegand H.E., Zgusta L. (eds), Wörterbücher : ein internationales Handbuch zur Lexicographie. Dictionaries. Dictionnaires.

Page 17: Cours Mod lisation des associations lexicalesagnes.tutin.u-grenoble3.fr/Cours_M2.pdf · générative, les expressions figées sont considérées comme des exceptions, dont les règles

A. Tutin : Sémantique – Modélisation des associations lexicales - UFR des Sciences du Langage, Université Stendhal Grenoble 3

Berlin/New-York : De Gruyter. 1010-1019. Mel’čuk I. (1998). Collocations and Lexical Functions. In A. P. Cowie (ed.),

Phraseology. Theory, Analysis and Applications. Oxford, Clarendon Press, 23-53.

Sinclair J. (1991) : Corpus, Collocation, Collocation. Oxford, Oxford University Press.

Tutin A. (2008), For an extended definition of lexical collocations, Proceedings of Euralex, Barcelone 15-19 juillet 2008, Université Pompeu Fabra.

Williams G. (2003). Les collocations et l’école contextualiste britannique » In F. Grossmann et A. Tutin (éd.). Les collocations : analyse et traitement, coll. Travaux de recherches en linguistique appliquée, Paris : Éditions De Werelt, p. 33-44.

� Exercice 1 : Pour chaque collocation suivante, indiquez a) la base et le collocatif, b) la structure générale de la collocation (type syntaxique de la collocation) c) la relation syntaxique entre la base et le collocatif, d) le type sémantique de la collocation.

Les critères proposés sont-ils faciles à appliquer ? Observe-t-on des exceptions ? Le gilet est bleu ciel. Il est bête à manger du foin. Nous avons crié haut et fort notre attachement à ce principe. Jean est ivre de colère. Je vous remercie infiniment de votre bienveillance.

� Exercice 2 : Collocation ou pas collocation ? Telle est la question du lexicographe. Imaginez que vous ayez à sélectionner les collocations pour un dictionnaire comme le TLF, qui comporte un champ syntagme.

Dans la concordance suivante (extrait du mot amour dans Une vie de Maupassant), quelles expressions aimeriez-vous sélectionner comme collocations ? Les collocations sont-elles nombreuses ? it heureuse d'être enfermée dans cette aventure d'amour qui parlerait sans cesse à sa pensée des espoirs un souffle de bonheur. Et elle se mit à rêver d'amour. L'amour ! Il l'emplissait depuis deux années d l'haleine du printemps lui eût donné un baiser d'amour. Tout à coup, là-bas, derrière le château, sur he mystérieuse de bonheurs planant sur elle. Un amour de la solitude l'envahissait dans la douceur de c ut-il comme elle envahi par une sorte d'ivresse d'amour ? ou bien, savait-il seulement par expérience qu' amps, elle ne songeait encore qu'à la poésie de l'amour, et fut surprise. Sa femme ? ne l'était-elle pas

on mystérieuse de ce qui est le grand secret de l'amour. Sans qu'elle eût entendu monter l'escalier, on les tapisseries du mur, sur la vieille légende d'amour qui enveloppait sa chambre. Mais, comme Julien e courant. Soudain Jeanne eut une inspiration d'amour. Elle emplit sa bouche du clair liquide, et, les 'intimité enfantine et charmante des niaiseries d'amour, des petits mots bêtes et délicieux, le baptême a s où ses illusions étaient écloses, son attente d'amour se trouvait tout de suite accomplie. L'homme espé Julien, pour la première fois, lui avait parlé d'amour ; et elle resta là, rêvassant, presque sans songe ait d'elle, s'il lui parlait même ; toute trace d'amour avait subitement disparu ; et les nuits étaient r mable comme autrefois. Ses larges yeux, miroirs d'amour, étaient redevenus caressants ; et ses cheveux, t lus exaltée qu'elle avait été plus déçue dans son amour, plus trompée dans ses espérances. Il lui fallait des souvenirs attendris des premiers temps de son amour ; non qu'il lui revînt au coeur un renouveau d'af e de l'affreux secret n'amoindrirait-elle pas son amour filial ? L'embrasserait-elle des mêmes lèvres pie ités, son dégoût des préoccupations humaines, son amour de Dieu, son inexpérience juvénile et sauvage, sa de lui. Le printemps était venu, ravivant leur amour, les jetant chaque jour aux bras l'un de l'autre, ec mère et tante. Ils avaient maintenant un grand amour pour la culture de la terre ; et tous trois plant lettres de cette créature qui paraissait folle d'amour pour lui. Elle parlait d'un voyage en Angleterre, affreuse de désespoir, embrassant, en des élans d'amour exalté, tout ce qu'elle ne pouvait prendre avec e plus longtemps sans reconnaître publiquement son amour et son dévouement si fidèles. Elle a du reste de

Page 18: Cours Mod lisation des associations lexicalesagnes.tutin.u-grenoble3.fr/Cours_M2.pdf · générative, les expressions figées sont considérées comme des exceptions, dont les règles

18

Chapitre 3 : Collocations et motivation

Les collocations sont souvent présentées comme des associations arbitraires, mais ce point de vue peut, selon nous, être tempéré, en tout cas pour nombre de collocations. On repère en effet de nombreuses zones de régularités, tant syntaxiques, que sémantiques dans ces associations. On a déjà vu au chapitre précédent que les collocations présentaient des schémas syntaxiques réguliers (structures syntaxique endogènes), communs pour la plupart avec les expressions « libres ». Sur le plan sémantique, de nombreuses régularités se font jour, d’une part, en ce qui concerne le type de relations liant les éléments de la collocation, et d’autre part, dans les interactions sémantiques entre les éléments de la collocation, comme nous le verrons dans une étude de cas autour des noms d’émotion.

1 Des relations sémantiques productives

1.1 Des schémas syntaxiques auxquels on peut associer des

instructions sémantiques : « comment la syntaxe produit

du sens »

On relève que dans de nombreuses collocations, les collocatifs utilisent des schémas syntaxiques spécifiques auxquels on peut associer des sens spécifiques. C’est en particulier le cas des structures comparatives comme les suivantes qui ont généralement un sens intensif :

- Adj comme N : pâle comme la mort, rusé comme un renard, beau comme un astre…

- V comme N : pleurer comme une Madeleine, rire comme un bossu, … - Adj à Vinf : triste à pleurer, ennuyeux à mourir, … - V à Vinf : geler à pierre fendre, pleuvoir à boire debout (Québec) …

Il est intéressant de remarquer que la quasi-totalité de ce type de schémas a une fonction sémantique intensive, comme si le schéma produisait en quelque sorte le sens intensif, quel que soit le contenu lexical de l’expression. On peut ainsi relever dans Frantext des expressions peu stéréotypées mais pour lesquelles le sens intensif est néanmoins associable, comme le suivant :

R529/ BOULANGER.D / LE TEMERAIRE / 1962 page 43 / III Que c'était long à crever ce cri déchirant, de plus en plus vif, de plus en plus en sang, de plus en plus, ah vite !

1.2 Des relations sémantiques productives entre la base et le

collocatif : le modèle des Fonctions Lexicales

Certaines relations sémantiques sont particulièrement productives. Le modèle des fonctions lexicales standard, utilisé dans le cadre du Dictionnaire Explicatif et Combinatoire développé par Igor Mel’cuk et ses collègues à l’Université de Montréal, rend compte de ces relations. Les FL associent “ un sens très général et abstrait ” à “ un rôle syntaxique profond, qui peut s’exprimer lexicalement de plusieurs façons selon l’unité lexicale à laquelle ce sens s’applique ” (Mel’čuk 1998 : 32). • Exemple : la fonction Magn (qui exprime l’intensité) s’appliquant à peur

(ici, la base) produira des mots comme bleue, intense, grande, panique… Elles sont de la forme f(x) = y x : argument (mot-clé). y : valeur(s).

Page 19: Cours Mod lisation des associations lexicalesagnes.tutin.u-grenoble3.fr/Cours_M2.pdf · générative, les expressions figées sont considérées comme des exceptions, dont les règles

19

Magn(fort) = comme un turc. Magn(peur) = bleue, grande, immense … Magn(travailler) = d’arrache-pied, énormément, comme un fou Les FL standard : • reçoivent une étiquette conventionnelle : Magn (intensité), Oper

(verbe support), Ver (tel qu’il doit être) … (nom choisi d’après le latin). • Ont les propriétés suivantes :

o La FL est généralement productive : il y a beaucoup de valeurs pour ce sens dans la langue.

o La FL a généralement beaucoup de valeurs. o La FL se retrouve dans beaucoup de langues.

• Une cinquantaine de FL standard. Les FL non standard couvrent des cas moins productifs. • Ex : ‘ qui est présente à la naissance ’ (maladie) = congénitale. • Quelques exemples de FL syntagmatiques très productives :

Verbes supports (terme de M. Gross.

Verbes qui sont sémantiquement vides en cooccurrence avec des noms (prédicatifs). D’après la Grammaire Méthodique du Français (1994 : 232) : “ On appelle verbes supports des verbes comme faire, donner, mettre, etc., qui, à côté de leurs emplois ordinaires, se combinent avec un nom, un adjectif ou un groupe prépositionnel pour construire une forme complexe fonctionnellement équivalente à un verbe. ” Dans les verbes supports, la prédication est portée par le nom, non par le verbe.

Operi : verbe support qui prend comme sujet le i-ième actant comme sujet et le mot-clé comme premier complément du verbe. Oper1(visite) = rendre Oper2(visite) = recevoir

Funci : verbe support qui prend comme sujet le mot-clé et le i-ème actant comme premier complément du verbe. Func2(douleur) = se manifester dans Laborij : verbe support qui prend comme sujet le i-ième actant comme sujet, le j-ième comme premier complément du verbe et le mot-clé comme deuxième complément du verbe. Labor12(interrogatoire) = soumettre

Verbes phasiques Verbes exprimant le début, la fin et la continuation d’un procès. Se combinent généralement avec une FL verbale (d’où la classification dans les FL syntagmatiques).

IncepOper1(amour) = tomber (Qu.) FinOper1(patience) = perdre ContOper1(sang froid) = garder

Modifieurs adjectivaux ou adverbiaux

Magn(peur) = bleue, intense, panique … Ver(argument) = valable Bon(conseil) = précieux

Quasi-méronymes (plus moins des relations partie-tout)

Sing(savon) = barre Mult(soldat) = régiment Culm(bonheur) = comble Culm(carrière) = sommet

Page 20: Cours Mod lisation des associations lexicalesagnes.tutin.u-grenoble3.fr/Cours_M2.pdf · générative, les expressions figées sont considérées comme des exceptions, dont les règles

20

2 Des associations lexicales motivées entre base et

collocatif

Comme on l’a vu au chapitre précédent, certaines collocations peuvent d’une certaine façon être considérées comme transparentes ou régulières, car le collocatif est facilement compréhensible, voire explicable. Nous aimerions montrer dans cette partie que pour nombre de collocations, la cooccurrence entre base et collocatif (et le choix lexical) n’est pas fortuite, mais explicable à l’aide de règles de sélection sémantiques, parfois un peu complexes à mettre en évidence.

Notre démonstration s’appuiera ici sur le champ sémantique des noms d’émotion et les collocatifs d’intensité (Grossmann & Tutin 2007), mais elle pourrait être étendue à d’autres champs sémantiques.

2.1 Les noms de joie et les intensifieurs

L’objectif dans ce travail était de montrer que les associations lexicales collocatives étaient motivées par la structure sémantique des composants de la collocation. Pour ce faire, nous avons d’abord dans un premier temps, analysé la structure sémantique des composants.

2.1.1 Les noms de « joie »

Pour les noms de sentiment, nous avons limité notre étude aux noms de joie (et leurs antonymes), en sélectionnant les noms les plus fréquents dans un corpus contemporain de Frantext : joie, bonheur, gaieté, désespoir, tristesse, chagrin, peine. Nous avons caractérisé ensuite ces noms à l’aide de dimensions sémantiques.

� L’intensité. � La polarité (agréable ou désagréable, positif ou négatif). � La qualité (= disposition du sujet). � L’état (duratif). � Le dynamisme (mouvement intérieur ou extérieur). � L’intériorité (une émotion intérieure est une émotion qui ne s’extériorise

pas). � Le contrôle : Le Ndj envahit, submerge l’individu qui perd le contrôle sur

l’émotion ressentie. Cette dimension est bien entendu corrélée à l’intensité.

Voici une synthèse de ce traitement : Intensité Polarité Qualité Etat Dynamis

me Intériorité Contrôle

Bonheur ++ + - + - + + Chagrin + - - + - ?

+

Désespoir ++ - - + + + - Gaieté + + + - + - ? Joie + + - + + +/- - Peine + - - - - - + Tristesse + - + + - + -

Tableau 1 : Description des noms de joie à l’aide de dimensions

2.1.2 Les adjectifs intensifieurs

Les Adjintens apparaissant en cooccurrence avec les Ndj sont extrêmement variés et peu d’entre eux se combinent avec l’ensemble des Ndj. Ils sont peu idiosyncrasiques (beaucoup apparaissent avec plusieurs Ndj), et sont peu idiomatiques (i.e. facilement interprétables par des règles de compositionnalité). Les données, comportant a priori peu d’anomalies, semblent donc aller dans le sens de notre hypothèse. Cependant, la distribution des AdjIntens les plus fréquents, semble aléatoire et laisse un peu perplexe. Bonheur Gaieté Joie Tristesse

Page 21: Cours Mod lisation des associations lexicalesagnes.tutin.u-grenoble3.fr/Cours_M2.pdf · générative, les expressions figées sont considérées comme des exceptions, dont les règles

21

Grand (a) 112 Vrai (a)69 Petit (a) 47 Pur (a) 19 Parfait (p) 18 Immense (a) 10 Absolu (p) 10 Intense (p) 9 Immense (p) 7 Parfait (a) 6

Grand (a) 4 Vrai (a) 2 Fou (p) 2 Gros (a) 2 Franc (a) 2 Réel (a) 1 Eclatant (p) 1 Léger (a) 1 Formidable (a) 1

Grand (a) 169 Immense (a) 24 Profond (p) 24 Immense (p) 19 Pur (p) 12 Petit (a) 11 Enorme (p) 11 Fou (p) 8 Terrible (p) 7 Gros (a) 6

Grand (a) 40 Profond (p) 13 Profond (a) 11 Infini (a) 11 Immense (a) 9 Infini (p) 8 Affreux (a) 7 Immense (p) 5 Indicible (a) 4 Indicible (p) 3

Désespoir Chagrin Peine Grand (a) 10 Profond (a) 6 Total (p) 6 Immense (a) 5 Affreux (p) 4 Absolu (p) 3 Atroce (a) 3 Vrai (p) 2 Violent (p) 2 Parfait (a) 2

Grand (a) 30 Gros (a) 13 Vrai (a)10 Petit (a) 7 Profond (p) 5 Immense (a) 3 Affreux (a) 3 Véritable (a) 3 Infini (a) 2 Immense (p) 2

Grand (a) 14 Vrai (a) 4 Profond (p) 4 Immense (p) 4 Gros (a) 3 Infini (p) 3 Affreux (a) 2 Horrible (a) 2 Petit (a) 2 Affreux (p) 2

Tableau 2 : Les adjectifs intensifieurs les plus fréquents avec les noms de joie Seuls grand et vrai (que nous considérons ici comme un intensif) apparaissent avec l’ensemble des Ndj. Les généralisations, si elles sont possibles, ne seraient donc pas très productives au niveau de la classe des Ndj. Par ailleurs, il saute aux yeux que de nombreux Adjintens, hormis grand et vrai qui semblent des intensifs “ à tout faire ”, s’emploient avec d’autres types de noms d’émotions que les Ndj : un ennui profond, une envie folle, etc. Nous faisons l’hypothèse que certains Adjintens s’associent de façon privilégiée avec certaines dimensions (profond par exemple semble fonctionner avec l’intériorité).

Il convient alors, comme pour les noms, de proposer une analyse des dimensions sémantiques des adjectifs. • Mesure. Cette dimension apparaît pour les adjectifs qui s’appliquent

prototypiquement à des grandeurs physiques2 et offre un moyen standard de coder l’intensité des Ndj.

• Authenticité (vrai, réel …). • Complétude. Cette dimension, qui décrit la plénitude de l’émotion

ressentie. • Incommunicabilité (ineffable, indicible). • Manifestation (traduit extériorité). • Polarité. • Temporalité. L’analyse est résumée dans le tableau 3.

2 L’adjectif grand, appliqué à la taille d’un individu, signale que celui-ci dépasse la moyenne. Immense signifie littéralement “ qui n’a ni borne ni mesures ”, etc.

Page 22: Cours Mod lisation des associations lexicalesagnes.tutin.u-grenoble3.fr/Cours_M2.pdf · générative, les expressions figées sont considérées comme des exceptions, dont les règles

22

Mesure Authenti

cité Complétud

e

Incommunicabilité

Manifestation

Polarité Temporalité

Absolu (p) Affreux (ap) Atroce (a) Enorme (p) Fou (p) Franc (a) Fugitif (p) Grand (a) Gros (a) Immense (ap) Indicible (ap) Ineffable (ap) Infini (ap) Intense (p) Léger (a) Parfait (ap) Petit (a) Profond (ap) Pur (ap) Terrible (p) Total (p) Violent (p) Véritable (a) Vrai (ap)

+ + + + + + + + +

+ + + + +

+ +

+ +

+ + +

+ + + +

+

Tableau 3 : Les dimensions des Adjintens Une fois noms et adjectifs analysés, on peut observer le fonctionnement des affinités et proposer des principes d’appariement qui permettront de rendre compte de la cooccurrence.

Page 23: Cours Mod lisation des associations lexicalesagnes.tutin.u-grenoble3.fr/Cours_M2.pdf · générative, les expressions figées sont considérées comme des exceptions, dont les règles

23

2.1.3 Principes d’appariement

L’observation des cooccurrences et des dimensions dégagées permet de proposer un ensemble de principes de cooccurrences expliquant les appariements.

a. Renforcement

Si le nom comporte déjà le trait intensif, l’utilisation de l’adjectif intensif conduit à un renforcement. Dans ce cas, la tendance observée est l’utilisation d’un intensif adjectival de degré élevé (souvent un superlatif). Le désespoir se définit comme une “ très forte émotion désagréable ” (DEC) ou comme une “ extrême affliction ” (TLF et PR). Petit désespoir ne pourrait guère être utilisé qu’ironiquement ; grand (a) est utilisé 40x dans le corpus avec tristesse contre seulement 10x avec désespoir (sur 335 co-occurrences) : le désespoir, par définition est grand, et si on veut l’intensifier, il vaut mieux utiliser un intensif plus fort (désespoir immense : 5x ; désespoir total : 6x).

b. Convergence de polarité

Si la base comporte le trait de polarité agréable, le collocatif revêt en principe le trait “ appréciatif ”, ou un trait neutre. Même chose en ce qui concerne le trait de polarité désagréable. L’exemple qui illustre le mieux ce principe est celui de l’adjectif affreux, de polarité dépréciative, qui n’exprime l’intensité qu’en cooccurrence avec un substantif orienté négativement comme déesespoir.

c. Cohérence avec le type sémantique du Ndj

Certains noms ont une certaine ambivalence, inhérente à leur sémantisme, et peuvent dénoter une émotion au sens strict, mais parfois aussi un état ou une qualité. Certaines contraintes de sélection liées aux AdjIntens peuvent favoriser ou bloquer l'association avec ces noms polysémiques. Par exemple, absolu ou total semblent convenir à un Ndj qui peut se traduire par un état, comme bonheur ou désespoir, tandis qu'ils apparaissent quasiment impossibles avec un Ndj comme chagrin. Un Ndj comme gaieté, qui peut être considéré, dans certains de ses emplois, comme un nom de qualité (cf. elle était d'une gaieté folle) peut plus facilement que d'autres, semble-t-il, être associé à des adjectifs marquant la manifestation.

Les remarques qui précèdent débouchent sur l'idée que, hors le cas des intensifs standard du type GRAND, les AdjIntens permettent l'intensification des Ndj sur différentes dimensions. Les affinités lexicales offrent au locuteur un choix restreint lié aux dimensions qu'il veut sélectionner.

En bref, peu de collocatifs s’associent fréquemment avec l’ensemble des noms d’un champ sémantique homogène. L’étude lexicale fine des composantes sémantiques des éléments de la collocation montre que les associations ne sont pas aléatoires, mais régies par des principes d’appariement réguliers. Les associations lexicales ne peuvent donc pas dans ce cas être véritablement considérées comme arbitraires.

Bibliographie

Mel’čuk I. (1998). Collocations and Lexical Functions. In A. P. Cowie (ed.), Phraseology. Theory, Analysis and Applications. Oxford, Clarendon Press, 23-53.

Grossmann F., Tutin A. (2007). Motivation of Lexical Associations in Collocations : the Case of Intensifiers denoting ‘Joy’, Festchrift in Honour of Igor Mel’čuk, Leo Wanner (ed), Benjamins, 139-165.

� Exercice 1 : Par analogie avec les FL rencontrées dans les exemples, déterminez les FL qui rendent compte des collocations suivantes :

prendre peur une hypothèses adaptée un séjour de rêve un essaim d’abeilles assister à un cours la peur gagne (qqun) une bouffée de haine

Que pensez-vous du codage des Fonctions Lexicales ?

Page 24: Cours Mod lisation des associations lexicalesagnes.tutin.u-grenoble3.fr/Cours_M2.pdf · générative, les expressions figées sont considérées comme des exceptions, dont les règles

A. Tutin : Sémantique – Modélisation des associations lexicales - UFR des Sciences du Langage, Université Stendhal Grenoble 3

Chapitre 4 : Modélisation des collocations dans les

dictionnaires spécialisés

Le repérage et l’étude des propriétés des expressions polylexicales doit permettre de déboucher sur une modélisation de ces expressions adaptée, et permettant de déboucher sur des propositions de description concrètes en linguistique appliquée, qu’il s’agisse de la lexicographie, du traitement automatique des langues ou des applications en didactique des langues.

Dans ce chapitre, nous nous intéresserons particulièrement aux applications lexicographiques, en particulier autour du codage des collocations. Signalons aussi qu’en traitement automatique du langage, la modélisation des expressions polylexicales fait aussi l’objet de nombreuses modélisations, parfois complexes.

3 Dictionnaires de collocations : des ouvrages récents

L’encodage des expressions polylexicales dans les dictionnaires est directement relié est la modélisation linguistique qu’on en propose. Depuis quelques années, l’intérêt croissant des études sur la phraséologie a permis de déboucher sur des produits lexicographiques plus innovants, qui distinguent les différents types d’expressions polylexicales. On a ainsi vu apparaître dans les pays anglo-saxons, à côté des classiques dictionnaires d’ idioms, des dictionnaires de collocations dès les années 80. La plupart de ces dictionnaires sont explicitement destinés aux apprenants de l’anglais langue étrangère. Voici quelques-uns de ces dictionnaires :

- BBI : The BBI dictionary of English word combinations , Benson M., Benson E. and Ilson R. Amsterdam ; Philadelphia, J. Benjamins. Première édition : 1986.

- LTP : Dictionary of selected collocations (1997), Hill J., Lewis M. Hove, Language teaching publications LTP.

- OCDSE : Oxford Collocations Dictionary for students of English (2002), Crowther, J. et al. Oxford, Oxford University Press.

L’OCDSE , le dernier né des dictionnaires anglais de collocations, présente une nomenclature riche (9000 mots clés). Voici ci-dessous un exemple d’article pour le mot flower.

Fig. 1 : L’article du mot flower dans le OCDSE

Page 25: Cours Mod lisation des associations lexicalesagnes.tutin.u-grenoble3.fr/Cours_M2.pdf · générative, les expressions figées sont considérées comme des exceptions, dont les règles

25

Dans le domaine français, la lexicographie est moins riche dans ce champ. Les dictionnaires de collocations y sont aussi plus récents, si l’on excepte le Dictionnaire Explicatif et Combinatoire, qui n’a pas une vocation grand public :

- DC : Beauchesne, J. (2001). Dictionnaire des cooccurrences. Montréal, Guérin.

- DCM : Le Fur D. (Dir.) (2008). Dictionnaires des combinaisons de mots : les synonymes en contexte. Paris, Le Robert.

- LAF : Mel’čuk I., Polguère A. (2007). Lexique Actif du Français. Bruxelles, De Boeck.

Le LAF n’est pas exclusivement un dictionnaire de collocations, comme on le verra plus loin.

Voici un exemple de traitement pour l’article du mot admiration dans le DC.

Figure 2 : L’article du mot admiration dans le Dictionnaire des cooccurrences de

Beauchesne

On remarque en outre que le terme de collocation n’apparaît pas dans les titres français (frilosité des éditeurs ? peur d’effrayer les usagers ?).

4 Le codage des informations linguistiques dans les

dictionnaires de collocations

4.1 Le codage de la collocation à partir de la base

Si la dissymétrie des collocations est parfois remise en question par les linguistes, elle est de fait institutionnalisée dans les dictionnaires de

collocations : la collocation est codée à partir de la base, qui est l’élément stable et « normal » de la collocation. Ainsi, par exemple, la collocation soulever l’admiration est codée dans l’article de admiration dans le Dictionnaire des cooccurrences de Beauchesne.

Cette façon de faire pose peu de problèmes lorsque la distinction entre base et collocatif est claire, mais peut apparaître problématique lorsque l’analyse est plus délicate. C’est souvent le cas de certaines expressions de structures N prep N comme meute de chiens. Doit-on considérer meute comme une sorte de quantifieur, auquel cas le terme chien peut être considéré comme la base ? Ou bien doit-on considérer le terme meute comme étant précisé sémantiquement par chien, et ici c’est meute qui serait la base ? Les cas ambigus comme ceux-ci peuvent donc conduire à deux analyses, et les dictionnaires de collocations devraient ici proposer une double entrée pour ces éléments.

Le traitement des collocations atypiques, comme les coordinations (sain et sauf, pur et dur …) ou les collocations ternaires est également problématique. Plusieurs types de traitement sont proposés selon les dictionnaires.

4.2 Le traitement syntaxique

Le traitement syntaxique proposé dans la plupart des dictionnaires de collocations est assez succinct et porte principalement sur les types de constituants (Cette information est cependant absente de certains dictionnaires de collocations comme le DC). Dans le OCDSE (Figure 1), on indique ici généralement le constituant occupé par le collocatif en précisant l’ordre des mots.

Dans de nombreux dictionnaires de collocations (par exemple, LTP, DC, DCM), seules les collocations à base nominale sont traitées, et les structures des collocations ne sont pas très diversifiées.

D’une manière générale, les informations syntaxiques sont assez succinctes et ne permettent pas toujours facilement d’employer le dictionnaire de façon adaptée en encodage. Par exemple, dans le DC, l’ordre des adjectifs (anté- ou postposé) n’est pas indiqué.

Page 26: Cours Mod lisation des associations lexicalesagnes.tutin.u-grenoble3.fr/Cours_M2.pdf · générative, les expressions figées sont considérées comme des exceptions, dont les règles

26

4.3 Le traitement sémantique

Dans la plupart des dictionnaires de collocations, le traitement sémantique est très restreint.

Le traitement est absent dans certains dictionnaires comme le DC où une énumération en vrac est proposée. Le dictionnaire servira surtout d’aide-mémoire dans ce cas, mais ne pourra pas être utilisé pour l’encodage.

Un traitement par rapprochement synonymique est proposé dans le DCM ou l’OCDSE où les collocatifs sont regroupés par analogie.

Enfin, le LAF propose un encodage sémantique plus fin, à l’aide d’étiquettes inspirées du Dictionnaire Explicatif et Combinatoire (voir chapitre 3), comme on peut le voir dans la figure 3.

Figure 3 : Un extrait du LAF

Le traitement, inspiré du DEC, indique la structure syntaxique dans laquelle le mot s’insère et propose les associations lexicales paradigmatiques et syntagmatiques. Par exemple, l’étiquette Intense est utilisée pour des associations comme grande admiration, profonde admiration ou vive admiration.

Page 27: Cours Mod lisation des associations lexicalesagnes.tutin.u-grenoble3.fr/Cours_M2.pdf · générative, les expressions figées sont considérées comme des exceptions, dont les règles

27

� Exercice : Le traitement des expressions polylexicales dans le TLFi.

Vous comparerez le traitement des expressions suivantes dans le TLFi (http://atilf.atilf.fr/tlf.htm).

- pied fin.

- pied bot.

- pied à terre.

- pied grec.

- pied plat.

- pied noir. Le traitement du TLF vous paraît-il adapté ?