Base lexicale ESF SFP Bordeaux 12 sept 2008

24
Base lexicale trilingue ESF Base lexicale trilingue ESF Mesure du partage orthographique Mesure du partage orthographique et du recouvrement sémantique interlangue et du recouvrement sémantique interlangue Jannika LAXEN, Xavier APARICIO et Jean- Jannika LAXEN, Xavier APARICIO et Jean- Marc LAVAUR Marc LAVAUR

Transcript of Base lexicale ESF SFP Bordeaux 12 sept 2008

Page 1: Base lexicale ESF SFP Bordeaux 12 sept 2008

Base lexicale trilingue ESFBase lexicale trilingue ESF

Mesure du partage orthographique Mesure du partage orthographique et du recouvrement sémantique et du recouvrement sémantique

interlangueinterlangue

Jannika LAXEN, Xavier APARICIO et Jean-Marc Jannika LAXEN, Xavier APARICIO et Jean-Marc LAVAURLAVAUR

Page 2: Base lexicale ESF SFP Bordeaux 12 sept 2008

La psychologie et les La psychologie et les langueslangues

Les langues sont au cœur du Les langues sont au cœur du développement Européendéveloppement Européen

Vecteurs d’échange de savoirs et de Vecteurs d’échange de savoirs et de connaissances connaissances

Nécessité pour les psychologues d’étudier Nécessité pour les psychologues d’étudier les mécanismes impliqués dans la les mécanismes impliqués dans la communication multilinguecommunication multilingue

Page 3: Base lexicale ESF SFP Bordeaux 12 sept 2008

Bilinguisme et psychologie Bilinguisme et psychologie cognitivecognitive

De nombreuses recherches concernent le De nombreuses recherches concernent le Bilinguisme Bilinguisme en Psychologie Cognitiveen Psychologie Cognitive

Une large part de ces recherches concerne Une large part de ces recherches concerne l’étude dul’étude du lexique mental lexique mental chez les bilingues chez les bilingues

Importance de développer des Importance de développer des outils adaptés outils adaptés aux aux études portant sur deux ou plusieurs languesétudes portant sur deux ou plusieurs langues

Page 4: Base lexicale ESF SFP Bordeaux 12 sept 2008

Objectifs généraux de la Objectifs généraux de la basebase

Objectif : rendre compte des différentes Objectif : rendre compte des différentes relations de relations de formeforme et deet de senssens entre les entre les mots de deux langues ou plus (forte mots de deux langues ou plus (forte proximité vs. faible proximité).proximité vs. faible proximité).

Influence de ces relations sur Influence de ces relations sur l’organisation et le fonctionnement du l’organisation et le fonctionnement du lexique mentallexique mental (bilingue ou multilingue)(bilingue ou multilingue)

Page 5: Base lexicale ESF SFP Bordeaux 12 sept 2008

La base trilingue ESFLa base trilingue ESF Base lexicale trilingueBase lexicale trilingue (Aparicio, Laxen et Lavaur, 2007)(Aparicio, Laxen et Lavaur, 2007)

Elle regroupe des équivalents de traduction de 3 langues Elle regroupe des équivalents de traduction de 3 langues : : Anglais (CELEX) Anglais (CELEX) Espagnol (LEXESP)Espagnol (LEXESP)Français (LEXIQUE 3)Français (LEXIQUE 3)

Elle inclut : Elle inclut : les caractéristiques fondamentales des mots les caractéristiques fondamentales des mots fréquence et nombre de lettresfréquence et nombre de lettresDes indices de comparaison entre les langues Des indices de comparaison entre les langues recouvrements orthographique et sémantique entre les recouvrements orthographique et sémantique entre les

motsmots

Page 6: Base lexicale ESF SFP Bordeaux 12 sept 2008

Organisation des équivalents Organisation des équivalents de traductionde traduction

Plusieurs indices de recouvrement Plusieurs indices de recouvrement permettent de classer les équivalents de permettent de classer les équivalents de traduction de la base : traduction de la base :

proximité orthographique proximité orthographique (IPO)(IPO)

proximité sémantiqueproximité sémantique (IRS) (IRS)

Mise au point d’un Mise au point d’un indice global de indice global de proximité (IGP)proximité (IGP) qui prend en compte ces qui prend en compte ces deux dimensionsdeux dimensions

Page 7: Base lexicale ESF SFP Bordeaux 12 sept 2008

Différents niveaux de Différents niveaux de proximitéproximité

CognatsCognats = = mots de langues différentes proches mots de langues différentes proches orthographiquement et/ou phonologiquement et ayant le même orthographiquement et/ou phonologiquement et ayant le même senssens

miroir/miroir/mirrormirror

Traités différemment par le système cognitif par rapport aux Traités différemment par le système cognitif par rapport aux autres mots « autres mots « spécifiquesspécifiques » ou «  » ou « non cognatsnon cognats »  » (Font et Lavaur, 2004; (Font et Lavaur, 2004; Lavaur, Aparicio, Vandeberg et Dijkstra, 2008)Lavaur, Aparicio, Vandeberg et Dijkstra, 2008)

livre/livre/bookbook

Homographes interlangues Homographes interlangues == même orthographe, sens différents. même orthographe, sens différents. (Dijkstra, Grainger & Van Heuven, 1999; Lemhöfer & Dijkstra, 2004)(Dijkstra, Grainger & Van Heuven, 1999; Lemhöfer & Dijkstra, 2004)

chair/chair/chairchair (chaise)(chaise)

Page 8: Base lexicale ESF SFP Bordeaux 12 sept 2008

Proximité OrthographiqueProximité Orthographique

Le premier indice de la base : Le premier indice de la base : IPO (Indice IPO (Indice de Partage Orthographique)de Partage Orthographique)

permet de calculer la distance formelle permet de calculer la distance formelle entre deux équivalents de traduction ou entre deux équivalents de traduction ou simplement entre deux mots simplement entre deux mots (Font et (Font et Lavaur, 2004)Lavaur, 2004)

(Nombre de lettres en commun x 2)(Nombre de lettres en commun x 2)

Nombre total de lettres des 2 motsNombre total de lettres des 2 mots

Page 9: Base lexicale ESF SFP Bordeaux 12 sept 2008

ExemplesExemples

K IPO = 0

IPO = 0,5

IPO = 1

S I R T

AF K E

IXAT

UJ EP

AF XU

AT IX

KLIMAL TI

Page 10: Base lexicale ESF SFP Bordeaux 12 sept 2008

IPO 2IPO 2

L’IPO 2 prend en compte les L’IPO 2 prend en compte les lettres communeslettres communes entre 2 équivalents de traduction dans une entre 2 équivalents de traduction dans une position donnée position donnée (Aparicio, Laxen et Lavaur, 2007) (Aparicio, Laxen et Lavaur, 2007)

(nombres de lettres en commun + 1pt par lettre dans la même position)(nombres de lettres en commun + 1pt par lettre dans la même position)

nombre total de lettres des 2 motsnombre total de lettres des 2 mots

Le principe de base est identique à celui de l’IPO mais les Le principe de base est identique à celui de l’IPO mais les données fournies par le calcul sont d’une plus grande données fournies par le calcul sont d’une plus grande précisionprécision

Page 11: Base lexicale ESF SFP Bordeaux 12 sept 2008

ExemplesExemples

LUNE O

FLEUR

IPO2 = 0,125

IPO2 = 0,5

IPO2 = 1

ANIMAL

M O N

LF OW

MINA

E R

LA

Page 12: Base lexicale ESF SFP Bordeaux 12 sept 2008

IPO3IPO3

Estime la similarité orthographique des Estime la similarité orthographique des mots des 3 langues (moyenne des IPO2 mots des 3 langues (moyenne des IPO2 pour les langues prises deux à deux, pour les langues prises deux à deux, respectivement L1-L2, respectivement L1-L2,

L1-L3, L2-L3)L1-L3, L2-L3)

∑ ∑ (IPO2)(IPO2) 33

Page 13: Base lexicale ESF SFP Bordeaux 12 sept 2008

ExemplesExemples

Moon

Falda

Skirt

IPO3 = 1

IPO3 = 0,33 IPO3 = 0

Page 14: Base lexicale ESF SFP Bordeaux 12 sept 2008

La proximité sémantiqueLa proximité sémantique

Le degré de Le degré de proximité sémantiqueproximité sémantique des équivalents de traduction est des équivalents de traduction est estimé à l’aide de plusieurs variables.estimé à l’aide de plusieurs variables.

nombre de traductions nombre de traductions

dominance de la traduction dominance de la traduction

écart sémantique entre les traductions écart sémantique entre les traductions

(1 ou 2)

(dominante ou non-dominante)

(élevé ou faible)

Page 15: Base lexicale ESF SFP Bordeaux 12 sept 2008

Modèle distribué de la mémoire Modèle distribué de la mémoire bilinguebilingue

(De Groot, 1992) (De Groot, 1992)

Une traduction

ARBRE TREE

Plusieurs traductions

FEMME WOMAN WIFEdominant non-dominant

Le recouvrement sémantique dépend du nombre de traductions d’un mot

Page 16: Base lexicale ESF SFP Bordeaux 12 sept 2008

Extension du modèle distribuéExtension du modèle distribué de la mémoire bilingue de la mémoire bilingue

(Lavaur & Laxen, 2008)(Lavaur & Laxen, 2008)

Sens proches

BATEAU BOAT SHIP dominant non-

dominant

Sens différents

TEMPS TIME WEATHER

dominant non-dominant

Le recouvrement sémantique dépend des écarts de sens entre les deux traductions du mot

Page 17: Base lexicale ESF SFP Bordeaux 12 sept 2008

IRSIRS

Comme l’IPO, Comme l’IPO, l’IRSl’IRS (Indice de Recouvrement (Indice de Recouvrement Sémantique)Sémantique) peut prendre des valeurs peut prendre des valeurs variant de 0 à 1. variant de 0 à 1.

lune lune moonmoon fille fille girlgirl fille fille daughterdaughter arbre arbre woodwood carotte carotte airplaneairplane

1

0,75

0,5

0,25

0IRS

Page 18: Base lexicale ESF SFP Bordeaux 12 sept 2008

Reconnaissance en Reconnaissance en traduction traduction

L’IRS peut être affiné avec des données L’IRS peut être affiné avec des données expérimentales (reconnaissance en expérimentales (reconnaissance en traduction). traduction).

ouinon

WOOD

**SHIPBATEAU

*BOAT

BATEAU

*ARBRESKIRTLAPIN

Page 19: Base lexicale ESF SFP Bordeaux 12 sept 2008

Résultats expérimentauxRésultats expérimentauxLaxen & Lavaur (soumis)Laxen & Lavaur (soumis)

450

500

550

600

650

700

L1L2 L2L1

Une traductionTraduction dominanteTraduction non dominante

Temps de réaction (Ms) dans les deux Temps de réaction (Ms) dans les deux sens de traduction (L1L2, L2L1)sens de traduction (L1L2, L2L1)

Page 20: Base lexicale ESF SFP Bordeaux 12 sept 2008

Indice Global de ProximitéIndice Global de Proximité

Il prend en compte l’orthographe (IPO) et la Il prend en compte l’orthographe (IPO) et la sémantique (IRS).sémantique (IRS).

Animal/AnimalLune/

Moon

Lapin/Skirt

Main/Main

Page 21: Base lexicale ESF SFP Bordeaux 12 sept 2008

Autres dimensionsAutres dimensions

Les autres dimensions Les autres dimensions ((phonologique et phonologique et morphologiquemorphologique) ) seront graduellement seront graduellement insérées à l’aide d’indices de même type insérées à l’aide d’indices de même type (recouvrement entre équivalents)(recouvrement entre équivalents)

Aparicio, Laxen, Bairstow et Lavaur (en préparation)Aparicio, Laxen, Bairstow et Lavaur (en préparation)

La dimension phonologique peut modifier considérablement les relations entre les mots.

Système phonologique différent selon les langues (TABLE/TABLE ; PUR/PURO)

Page 22: Base lexicale ESF SFP Bordeaux 12 sept 2008

*FALDA

Espagnol

*SKIRT

Anglais

Décisions lexicales, décisions de langues, EEG, reconnaissance en traduction (données chronométriques et électrophysiologiques).

Applications

MANNERMANERA**

Page 23: Base lexicale ESF SFP Bordeaux 12 sept 2008

PerspectivesPerspectives

Introduction d’une 4ème langue (Langues Introduction d’une 4ème langue (Langues proches 2 à 2 –français et espagnol; proches 2 à 2 –français et espagnol; anglais et allemand)anglais et allemand)

Anglais

Page 24: Base lexicale ESF SFP Bordeaux 12 sept 2008

Merci pour votre attention!Merci pour votre attention!

Thank you for your Thank you for your attention!attention!

¡Gracias por su atencíon!¡Gracias por su atencíon!