Analyse distributionnelle et synonymie

11
1 Analyse distributionnelle et synonymie Edith GALY

description

Analyse distributionnelle et synonymie. Edith GALY. Problématique. Utilisation des résultats de Upery sur deux corpus : LM10 Frantext ADA sur langue « générale ». Difficulté : la masse. Au niveau quantitatif : LM10 : 6 183 862 couples de mots rapprochés - PowerPoint PPT Presentation

Transcript of Analyse distributionnelle et synonymie

Page 1: Analyse distributionnelle et synonymie

1

Analyse distributionnelle et synonymie

Edith GALY

Page 2: Analyse distributionnelle et synonymie

2

Problématique

Utilisation des résultats de Upery sur deux corpus : – LM10

– Frantext

ADA sur langue « générale »

Page 3: Analyse distributionnelle et synonymie

3

Difficulté : la masse

Au niveau quantitatif : – LM10 : 6 183 862 couples de mots rapprochés

– Frantext20 : 792 354 couples de mots rapprochés

Au niveau qualitatif : – Variétés des types de relation entre les deux éléments d’un couple.

– Exemples

Page 4: Analyse distributionnelle et synonymie

4

Variétés des types de rapprochements

NN– chien ; truffe– navire ; viaduc– promenade ; visite– naïveté ; maladresse– naïveté ; cynisme– beau-père ; compagne– escorte ; garde du corps– électeur ; meeting– électeur ; vote– truffe ; terre– avion ; concorde

NV– couler ; goutte– naviguer ; berge– navigation ; naviguer– enquête ; enquêter– magasin ; vendre

VV– naviguer ; se jeter– exporter ; consommer– déjeuner ; convier– mâcher ; coller– pleuvoir ; fuser– présager ; pronostiquer

AA– originaire ; issu– absurde ; insensé– douzième ; quinzième– nombreux ; classique– japonais ; traditionnel– européen ; stratégique– esthétique ; idéologique– sec ; humide

froid ~sable ~sol ~climat ~bois ~été ~air ~vent ~oeil ~pied ~endroit ~terrain ~temps ~

se déplacer sans ~entourer de ~~ protéger~ accompagneraccompagner de ~servir de ~chef de ~

~ chewing-gum~ feuille~ mot~ papier

~ sur Internet~ sur toile~ sur fleuve~ sur canal~ sur réseau

Page 5: Analyse distributionnelle et synonymie

5

Une première expérimentation

Comment appréhender ces données ? – Une relation : la synonymie

– Une ressource : le DES

• http://elsap1.unicaen.fr/dicosyn.html

• Laboratoire CRISCO, responsable du DES : J-Luc Manguin

• Compilation de 7 dictionnaires classiques (Bailly, Benac, Du Chazaud, Guizot, Lafaye, Larousse et Robert)

• Il contient 397 098 couples de synonymes

– Comparaison

Page 6: Analyse distributionnelle et synonymie

6

Recouvrement : synonymes / voisins

Recouvrement LM10– 22% des synonymes se retrouvent dans les voisins

– 1% de voisins sont des synonymes

Recouvrement Frantext20– 10 % des synonymes se retrouvent dans les voisins

– 3 % de voisins sont des synonymes

Page 7: Analyse distributionnelle et synonymie

7

Contextualisation de la synonymie

éprouver / ressentir– (éprouver suj ; ressentir suj) = {lecteur, spectateur, visiteur,

individu, français, allemands, gens, citoyen, peuple, américain, génération, responsable, etc.} a= 34

– (éprouver obj ; ressentir obj) = {certain malaise, gêne, dégoût, honte, tristesse, sensation, besoin, lassitude, compassion, soulagement, fascination, culpabilité, désir, etc.} a = 61

souligner / insister– (souligner dans ; insister dans) = {entourage, discours, rapport,

mode} a= 4

– (souligner obj ; insister sur) = {nécessité, importance, fragilité, importance de rôle, etc.} a= 184

Page 8: Analyse distributionnelle et synonymie

8

Synonymie partielle des contextes

Embrasser / voir– Embrasser : 4 sens

1. prendre et serrer dans ses bras

2. donner un baiser à qqun

3. Adopter, embrasser la carrière de

4. saisir par la vue dans toute son étendue – par analogie (comprendre, concevoir) synonyme de voir

– (embrasser obj; voir obj) = {petite fille, bébé, dame, totalité, horizon, champ, carrière, cause, garçon, paysage, univers, monde, etc.} a= 40

– Tous les contextes ne sont pas pertinents pour la synonymie

• Sens 1 et/ou 2 : {petite fille, bébé, dame, garçon}

• Sens 3 : {carrière, cause}

• Sens 4 : {totalité, horizon champ, paysage, univers, monde}

Page 9: Analyse distributionnelle et synonymie

9

Synonymes pas voisins dans LM10 abattement / désespoir

abattement

~ de : {taxe, cotisation, charge,impôt, etc.} n=17

~ pour : {frais professionnel, charge, embauche,etc} n=7

~ sur : {succession, revenu imposable,taxe, etc} n= 19

~ mod : {forfaitaire, fiscal,mensuel, profond} n=15

~ _ : {dispenser de, coefficient de, déduire obj, état de, pouvoir suj, forme de, moment de} n=48

désespoir

~ de : {chômeur, jeunesse, peintre, mère } n=12

~ mod : {profond, latent, métaphysique, amoureux}

n=2

~ _ : {comprendre obj, acculer à, fou de, état de, pouvoir suj, forme de, moment

de} n=66

Page 10: Analyse distributionnelle et synonymie

10

Synonymes voisins dans Frantext20 abattement / désespoir

abattement

~ mod : {profond} n=1

~ _ : {heure de, plonger dans, état de, crise de, moment de, sorte de, passer à} n=7

désespoir

~ de : {peintre, amour, enfant,

vie} n=6

~ mod : {atroce, absolu, violent, sombre} n=20

~ _ : {énergie de, acculer à , crise de, plonger dans, moment de, sorte de , passer à } n= 66

Page 11: Analyse distributionnelle et synonymie

11

Conclusion et perspectives

Résultats de l’analyse sur les synonymes : – Un outil pour contextualiser la synonymie

– Encore beaucoup de travail à faire (dégroupement de sens)

Travaux à venir– Contraster les corpus pour étudier la variation des proximités

sémantiques

– Analyse en fonction de modèles théoriques existants