Ph.D. Defense: Représentation des connaissances sémantiques lexicales de la Théorie Sens-Texte

64
Représentation des connaissances sémantiques lexicales de la Théorie Sens-Texte: Conceptualisation, représentation, et opérationnalisation des définitions lexicographiques par Maxime Lefrançois Thèse de doctorat ès sciences dirigée par Fabien Gandon (DR Inria), et co-dirigée par Christian Boitet (PR Grenoble 1)

description

slides of Ph.D. defense: "Meaning-Text Theory Lexical Semantic Knowledge Representation : Conceptualization, Representation, and Operationalization of Lexicographic Definitions" Maxime Lefrançois (2014) Représentation des connaissances sémantiques lexicales de la Théorie Sens-Texte : Conceptualisation, représentation, et opérationnalisation des définitions lexicographiques.

Transcript of Ph.D. Defense: Représentation des connaissances sémantiques lexicales de la Théorie Sens-Texte

Page 1: Ph.D. Defense: Représentation des connaissances sémantiques lexicales de la Théorie Sens-Texte

Représentation des connaissances sémantiques lexicales

de la Théorie Sens-Texte:Conceptualisation, représentation, et opérationnalisation

des définitions lexicographiques

par

Maxime Lefrançois

Thèse de doctorat ès sciences

dirigée par Fabien Gandon (DR Inria),

et co-dirigée par Christian Boitet (PR Grenoble 1)

Page 2: Ph.D. Defense: Représentation des connaissances sémantiques lexicales de la Théorie Sens-Texte

Explosion des ressources numériques textuelles

24 juin 2014 2M. Lefrançois - Représentation des connaissances sémantiques lexicales de la théorie Sens-Texte

Besoin de modèles et algorithmes pour des applications de TALN

(Traitement Automatique des Langues Naturelles)

• Traduction automatique

• Génération automatique de textes

• Réponse aux questions en langage naturel

• Recherche d’information

• Résumé automatique

• Inférence du premier ordre

• ...

Page 3: Ph.D. Defense: Représentation des connaissances sémantiques lexicales de la Théorie Sens-Texte

Traitement des ressources numériques textuelles

les approches basées sur les statistiques et l’apprentissage automatique atteignent leurs limites

24 juin 2014 3M. Lefrançois - Représentation des connaissances sémantiques lexicales de la théorie Sens-Texte

prise de conscience

du besoin de connaissances formalisées

pour les traitements automatiques

Page 4: Ph.D. Defense: Représentation des connaissances sémantiques lexicales de la Théorie Sens-Texte

Plan

24 juin 2014 M. Lefrançois - Représentation des connaissances sémantiques lexicales de la théorie Sens-Texte 4

1. L’explicitation de la conceptualisation de ces connaissances est-elle adaptée à une formalisation ?

3. Comment peut-on opérationnaliser ce formalisme ?a. pour le raisonnement logique b. sur le web des données

2. Quel formalisme de représentation des connaissancesest adapté à l’explicitation de cette conceptualisation ?

0. Pourquoi formaliser les connaissances sémantiques lexicales de la Théorie Sens-Texte ?

Page 5: Ph.D. Defense: Représentation des connaissances sémantiques lexicales de la Théorie Sens-Texte

Trois approches en sémantique lexicale

24 juin 2014 M. Lefrançois - Représentation des connaissances sémantiques lexicales de la théorie Sens-Texte 5

1. Sémantique décompositionnelle2. Sémantique componentielle3. Sémantique relationnelle

Page 6: Ph.D. Defense: Représentation des connaissances sémantiques lexicales de la Théorie Sens-Texte

1. Sémantique décompositionnelle2. Sémantique componentielle3. Sémantique relationnelle

24 juin 2014 6M. Lefrançois - Représentation des connaissances sémantiques lexicales de la théorie Sens-Texte

BROUTER, verbe trans.

A.− [Le suj. désigne un

mammifère herbivore]

Manger l'herbe, les jeunes

pousses, les feuilles des

arbres en les arrachant sur

la plante, sur l'arbre même

• Définition explicite, par décomposition en unités de sens sémantiquement plus simple.

• Approche lexicographique classique= forme aristotélicienne = genre proche et différences spécifiques

• A l’extrême: recherche de primitives de sens(Wierzbicka, 1996)

• Approche extrêmement précise : La Théorie Sens-Texte

ex: TLFi

Page 7: Ph.D. Defense: Représentation des connaissances sémantiques lexicales de la Théorie Sens-Texte

1. Sémantique décompositionnelle2. Sémantique componentielle3. Sémantique relationnelle

24 juin 2014 7M. Lefrançois - Représentation des connaissances sémantiques lexicales de la théorie Sens-Texte

• Unité lexicale = deux lambda-expressions:• compositionnalité sémantique• compositionnalité syntaxique

• Différentes représentations du lexique• DATR, LFG, Lexique Génératif de Pustejovsky, ...

• Sémantique et syntaxe de la phrase = calcul de la composition de ces expressions

• Différentes grammaires• HPSG, GUST

Théorie Sens Texte !

Pas de représentation des définitions lexicographiques

Page 8: Ph.D. Defense: Représentation des connaissances sémantiques lexicales de la Théorie Sens-Texte

1. Sémantique décompositionnelle2. Sémantique componentielle3. Sémantique relationnelle

24 juin 2014 8M. Lefrançois - Représentation des connaissances sémantiques lexicales de la théorie Sens-Texte

ex: WordNet

• Sens de l’unité lexicale = relations entre l’unité lexicale et ses voisines dans un réseau lexical

couverture: WordNet, EuroWordNet, ...

& axiomatisation: Multi-Net, HowNet, ...

• Une approche extrêmement précise en lexicographie:Les fonctions lexicales

de la Théorie Sens-Texte

• Approche cognitiviste proche de la TST: FrameNet

Page 9: Ph.D. Defense: Représentation des connaissances sémantiques lexicales de la Théorie Sens-Texte

• fin des années 65 à Moscou

• Dans les trois approches de sémantique lexicale, la théorie Sens-Texte est intéressante pour sa richesse descriptive ...

24 juin 2014 M. Lefrançois - Représentation des connaissances sémantiques lexicales de la théorie Sens-Texte 9

Pourquoi la Théorie linguistique Sens-Texte ?

Page 10: Ph.D. Defense: Représentation des connaissances sémantiques lexicales de la Théorie Sens-Texte

- Postule différents niveaux de représentation- Des règles de transformation entre les niveaux...- ... générées à partir du lexique

Le Dictionnaire Explicatif et Combinatoire (DEC)

24 juin 2014 10M. Lefrançois - Représentation des connaissances sémantiques lexicales de la théorie Sens-Texte

Cadre d’étude - la théorie Sens-Texte

Page 11: Ph.D. Defense: Représentation des connaissances sémantiques lexicales de la Théorie Sens-Texte

Richesse descriptive du DEC

principal sujet d’étude des linguistes de la Théorie Sens-Texte

• zone phonologique

• zone morphologique

• zone sémantique

• zone de combinatoire

• zone de stylistique,

• zone d’exemple,

• zone phraséologique,

• zone de nota bene4 volumes papier

= environ 500 entrées seulement

24 juin 2014 M. Lefrançois - Représentation des connaissances sémantiques lexicales de la théorie Sens-Texte 11

Page 12: Ph.D. Defense: Représentation des connaissances sémantiques lexicales de la Théorie Sens-Texte

24 juin 2014 12M. Lefrançois - Représentation des connaissances sémantiques lexicales de la théorie Sens-Texte

« Le DEC, dans sa conception, est fait pour être informatisé ... » (Mel’čuk et al., 1995)

ex: éditeur DECID (Sérasset, 1997)

informatisation, mais manque la formalisation

aspect prédicatif de acheter

Page 13: Ph.D. Defense: Représentation des connaissances sémantiques lexicales de la Théorie Sens-Texte

• Dans les trois approche à la sémantique lexicale, la théorie Sens-Texte est intéressante pour sa richesse descriptive ...

• ... qui implique des défis à relever

▫ couverture de la langue

▫ axiomatisation

24 juin 2014 M. Lefrançois - Représentation des connaissances sémantiques lexicales de la théorie Sens-Texte 13

Il faut formaliser les connaissances

Page 14: Ph.D. Defense: Représentation des connaissances sémantiques lexicales de la Théorie Sens-Texte

• vérifier la validité du lexique

• découvrir des connaissances sur la langue

• + raisonner sur les textes

24 juin 2014 M. Lefrançois - Représentation des connaissances sémantiques lexicales de la théorie Sens-Texte 14

« Le DEC, dans sa conception, est fait pour être informatisé [...]Le seul intérêt véritable de formaliser une description linguistique

est de se donner les moyens de “faire tourner” un appareillage logicodéductif sur cette description »

(Mel’čuk et al., 1995)

Page 15: Ph.D. Defense: Représentation des connaissances sémantiques lexicales de la Théorie Sens-Texte

• vérifier la validité du lexique

• découvrir des connaissances sur la langue

• + raisonner sur les textes

L’ingénierie des connaissances

24 juin 2014 15M. Lefrançois - Représentation des connaissances sémantiques lexicales de la théorie Sens-Texte

Ingénierie des connaissances

• valider

• inférer

• raisonner

• manipuler

• interroger

• échanger

Page 16: Ph.D. Defense: Représentation des connaissances sémantiques lexicales de la Théorie Sens-Texte

24 juin 2014 M. Lefrançois - Représentation des connaissances sémantiques lexicales de la théorie Sens-Texte 16

Une approche d’ingénierie des connaissances

Question de recherche:

Comment représenter les connaissances

sémantiques lexicales de la théorie Sens-Texte ?

Page 17: Ph.D. Defense: Représentation des connaissances sémantiques lexicales de la Théorie Sens-Texte

1. Extension de l’explicitation de la conceptualisation

24 juin 2014 M. Lefrançois - Représentation des connaissances sémantiques lexicales de la théorie Sens-Texte 17

Explicitation de la conceptualisation

Conceptualisationdu domaine

2.

3.

1. L’explicitation de la conceptualisation de ces connaissances est-elle adaptée à une formalisation ?2. Quel formalisme de représentation des connaissancesest adapté à l’explicitation de cette conceptualisation ?3. Comment peut-on opérationnaliser ce formalisme ?a. pour le raisonnement logique b. sur le web des données

Méthodologie

Page 18: Ph.D. Defense: Représentation des connaissances sémantiques lexicales de la Théorie Sens-Texte

1.a. Conceptualisation des prédicats linguistiques1.b. Conceptualisation des définitions lexicographiques1.a. Conceptualisation des prédicats linguistiques1.b. Conceptualisation des définitions lexicographiques

t

24 juin 2014 M. Lefrançois - Représentation des connaissances sémantiques lexicales de la théorie Sens-Texte 18

3. Comment peut-on opérationnaliser ce formalisme ?

3.a. Pour le raisonnement logique3.b. Sur le web des données lexicales liées

2.a. Formalismes existants2.b. Construction du formalisme des Graphes d’Unités

1. L’explicitation de la conceptualisation de ces connaissances est-elle adaptée à une formalisation ?

2. Quel formalisme de représentation des connaissancesest adapté à l’explicitation de cette conceptualisation ?

0. Pourquoi formaliser les connaissances sémantiques lexicales de la Théorie Sens-Texte ?

Page 19: Ph.D. Defense: Représentation des connaissances sémantiques lexicales de la Théorie Sens-Texte

19

Extension de l’explicitation de la conceptualisation- Précision de la terminologie

Unité lexicale&

Unité lexicale

24 juin 2014 M. Lefrançois - Représentation des connaissances sémantiques lexicales de la théorie Sens-Texte

Langage :

Usage :

Type d’

(Instance d’)

« Rachel est une acrobate extraordinaire »

Page 20: Ph.D. Defense: Représentation des connaissances sémantiques lexicales de la Théorie Sens-Texte

20

Extension de l’explicitation de la conceptualisation- Structure actancielle sémantique

• Type d’unité lexicale

▫ instancié dans les RSyn,

▫ possède une structure actancielle sémantique

« achat par X de Y à Z pour W »

• Type d’unité sémantique

▫ instancié dans les RSém,

▫ possède une structure actancielle

24 juin 2014 M. Lefrançois - Représentation des connaissances sémantiques lexicales de la théorie Sens-Texte

« Paul a acheté sa maison pour une bouchée de pain »

Page 21: Ph.D. Defense: Représentation des connaissances sémantiques lexicales de la Théorie Sens-Texte

21

Détermination de la structure actancielle sémantique

Positions actantielles sémantiques: obligatoires ou optionnelles= Les participants de la situation linguistique dénotée par Lqui ont une position privilégiées auprès de L dans les phrases

+ critères linguistiques !

24 juin 2014 M. Lefrançois - Représentation des connaissances sémantiques lexicales de la théorie Sens-Texte

Pour nous: processus « boîte noire »

Page 22: Ph.D. Defense: Représentation des connaissances sémantiques lexicales de la Théorie Sens-Texte

2224 juin 2014 M. Lefrançois - Représentation des connaissances sémantiques lexicales de la théorie Sens-Texte

Exemples de structures actancielles sémantiques

Page 23: Ph.D. Defense: Représentation des connaissances sémantiques lexicales de la Théorie Sens-Texte

23

Hiérarchie des types d’unités sémantiques:- hiérarchie des sens - et spécialisation de la structure actancielle ?

24 juin 2014 M. Lefrançois - Représentation des connaissances sémantiques lexicales de la théorie Sens-Texte

Contre-exempleMotivations

1. Le niveau sémantique est censé représenter les sens

2. Les participants de la situation linguistique sont censés être hérités.

DEC IV

Page 24: Ph.D. Defense: Représentation des connaissances sémantiques lexicales de la Théorie Sens-Texte

2424 juin 2014 M. Lefrançois - Représentation des connaissances sémantiques lexicales de la théorie Sens-Texte

Introduction d’un niveau Sémantique Profond

Page 25: Ph.D. Defense: Représentation des connaissances sémantiques lexicales de la Théorie Sens-Texte

25

Les types d’unité sémantique profonds

24 juin 2014 M. Lefrançois - Représentation des connaissances sémantiques lexicales de la théorie Sens-Texte

SémP SémS

• introduction d’une notation /to eat\

• définition de la structure actancielle sémantique profonde

▫ choix des Symboles d’Actants: des rôles sémantiques lexicalisés

▫ introduction des positions actancielles interdites

- correspondance simple avec le niveau SémS- hiérarchie des sens - héritage et spécialisation des structures actancielles

Page 26: Ph.D. Defense: Représentation des connaissances sémantiques lexicales de la Théorie Sens-Texte

1.a. Conceptualisation des prédicats linguistiques1.b. Conceptualisation des définitions lexicographiques1.a. Conceptualisation des prédicats linguistiques1.b. Conceptualisation des définitions lexicographiques

t

24 juin 2014 M. Lefrançois - Représentation des connaissances sémantiques lexicales de la théorie Sens-Texte 26

3. Comment peut-on opérationnaliser ce formalisme ?

3.a. Pour le raisonnement logique3.b. Sur le web des données lexicales liées

2.a. Formalismes existants2.b. Construction du formalisme des Graphes d’Unités

1. L’explicitation de la conceptualisation de ces connaissances est-elle adaptée à une formalisation ?

2. Quel formalisme de représentation des connaissancesest adapté à l’explicitation de cette conceptualisation ?

0. Pourquoi formaliser les connaissances sémantiques lexicales de la Théorie Sens-Texte ?

Page 27: Ph.D. Defense: Représentation des connaissances sémantiques lexicales de la Théorie Sens-Texte

27

• Composante centrale et composantes périphériques (projet Definiens)

• Composantes périphériques choisies pour une catégorie d’unités lexicales précise (ex: sentiments)

• Composantes périphériques suggérées par une étiquette sémantique choisie dans une hiérarchie

• Dans la littérature: Représentation Sémantique

Les définitions lexicographiques- Conceptualisations existantes

24 juin 2014 M. Lefrançois - Représentation des connaissances sémantiques lexicales de la théorie Sens-Texte

(projet RELIEF, ATILF Nancy)

Page 28: Ph.D. Defense: Représentation des connaissances sémantiques lexicales de la Théorie Sens-Texte

28

Une "reconceptualisation" nécessaire

1. Le niveau sémantique profond porte les sens

24 juin 2014 M. Lefrançois - Représentation des connaissances sémantiques lexicales de la théorie Sens-Texte

Page 29: Ph.D. Defense: Représentation des connaissances sémantiques lexicales de la Théorie Sens-Texte

29

Une "reconceptualisation" nécessaire

1. Le niveau sémantique profond porte les sens

2. Une représentation linguistique n’est qu’une instanciation de la définition

24 juin 2014 M. Lefrançois - Représentation des connaissances sémantiques lexicales de la théorie Sens-Texte

Page 30: Ph.D. Defense: Représentation des connaissances sémantiques lexicales de la Théorie Sens-Texte

30

Re-conceptualisation nécessaire

1. Le niveau sémantique profond porte les sens

2. Une représentation linguistique n’est qu’une instanciation de la définition

3. Un participant peut être obligatoire, optionnel ou interdit.

24 juin 2014 M. Lefrançois - Représentation des connaissances sémantiques lexicales de la théorie Sens-Texte

Page 31: Ph.D. Defense: Représentation des connaissances sémantiques lexicales de la Théorie Sens-Texte

3124 juin 2014 M. Lefrançois - Représentation des connaissances sémantiques lexicales de la théorie Sens-Texte

Prototype d’éditeur de définitions lexicographiquesStage M2 Romain Gugert – (Lefrançois, Giboin)

Page 32: Ph.D. Defense: Représentation des connaissances sémantiques lexicales de la Théorie Sens-Texte

3224 juin 2014 M. Lefrançois - Représentation des connaissances sémantiques lexicales de la théorie Sens-Texte

Prototype d’éditeur de définitions lexicographiquesStage M2 Romain Gugert – (Lefrançois, Giboin)

Page 33: Ph.D. Defense: Représentation des connaissances sémantiques lexicales de la Théorie Sens-Texte

3324 juin 2014 M. Lefrançois - Représentation des connaissances sémantiques lexicales de la théorie Sens-Texte

Prototype d’éditeur de définitions lexicographiquesStage M2 Romain Gugert – (Lefrançois, Giboin)

Page 34: Ph.D. Defense: Représentation des connaissances sémantiques lexicales de la Théorie Sens-Texte

34

• Maquettage et prototypage d’une application web

▫ javascript, mxGraphs

▫ interactions innovantes de manipulation directe de graphes

• Evaluation coopérative sur 6 lexicographes du projet RELIEF

▫ Offre une première base de discussion essentielle

▫ Confirme les attentes des lexicographes pour un tel outil

▫ Permet d’identifier des directions d’amélioration possible

amélioration du workflow

amélioration de la manipulation de graphes

"cacher" le niveau sémantique profond si possible

24 juin 2014 M. Lefrançois - Représentation des connaissances sémantiques lexicales de la théorie Sens-Texte

Prototype d’éditeur de définitions lexicographiquesStage M2 Romain Gugert – (Lefrançois, Giboin)

Page 35: Ph.D. Defense: Représentation des connaissances sémantiques lexicales de la Théorie Sens-Texte

1.a. Conceptualisation des prédicats linguistiques1.b. Conceptualisation des définitions lexicographiques1.a. Conceptualisation des prédicats linguistiques1.b. Conceptualisation des définitions lexicographiques

t

24 juin 2014 M. Lefrançois - Représentation des connaissances sémantiques lexicales de la théorie Sens-Texte 35

3. Comment peut-on opérationnaliser ce formalisme ?

3.a. Pour le raisonnement logique3.b. Sur le web des données lexicales liées

2.a. Formalismes existants2.b. Construction du formalisme des Graphes d’Unités

1. L’explicitation de la conceptualisation de ces connaissances est-elle adaptée à une formalisation ?

2. Quel formalisme de représentation des connaissancesest adapté à l’explicitation de cette conceptualisation ?

0. Pourquoi formaliser les connaissances sémantiques lexicales de la Théorie Sens-Texte ?

Page 36: Ph.D. Defense: Représentation des connaissances sémantiques lexicales de la Théorie Sens-Texte

24 juin 2014 M. Lefrançois - Représentation des connaissances sémantiques lexicales de la théorie Sens-Texte 36

• Evaluation selon les critères de Gruber, 1995

▫ la formalisation doit être claire

▫ la formalisation doit être cohérente avec la conceptualisation

▫ la formalisation doit être extensible

▫ la formalisation ne doit pas déformer la conceptualisation

▫ la formalisation doit permettre la déduction logique souhaitée

Détermination des formalismes candidats

Mel’čuk, 65Grammaires

de dépendanceThéorie Sens-Texte

Graphes Conceptuels

Logiques de description

Sowa, 84

Brachman, 85

Tesnière, 56

Page 37: Ph.D. Defense: Représentation des connaissances sémantiques lexicales de la Théorie Sens-Texte

24 juin 2014 M. Lefrançois - Représentation des connaissances sémantiques lexicales de la théorie Sens-Texte 37

Deux aspects à formaliser

• Les types d’unité▫ avec des positions actancielles signées,

obligatoires, optionnelles, ou interdites...

▫ ... héritées et spécialisées dans la hiérarchie

• Les définitions lexicographiques▫ et les règles de contraction et d’expansion

Page 38: Ph.D. Defense: Représentation des connaissances sémantiques lexicales de la Théorie Sens-Texte

24 juin 2014 M. Lefrançois - Représentation des connaissances sémantiques lexicales de la théorie Sens-Texte 38

Inadéquation des logiques de description

ExpansionContractionRôles fonctionnels

- trop d’axiomes- rôle utilitaire abstrait- indécidable

• Les types d’unité

• Les définitions lexicographiques

Page 39: Ph.D. Defense: Représentation des connaissances sémantiques lexicales de la Théorie Sens-Texte

- structure actancielle conceptuellement inexistante- grand nombre de règles à maintenir- problème d’héritage à arité variable

• Les types d’unité

• Les définitions lexicographiques

24 juin 2014 M. Lefrançois - Représentation des connaissances sémantiques lexicales de la théorie Sens-Texte 39

Inadéquation des Graphes Conceptuels

Page 40: Ph.D. Defense: Représentation des connaissances sémantiques lexicales de la Théorie Sens-Texte

24 juin 2014 M. Lefrançois - Représentation des connaissances sémantiques lexicales de la théorie Sens-Texte 40

Le formalisme des Graphes d’Unités

• un formalisme à base de graphes inspiré des GC

• construit pour la théorie Sens-Texte mais réutilisable pour modéliser d’autres connaissances

Page 41: Ph.D. Defense: Représentation des connaissances sémantiques lexicales de la Théorie Sens-Texte

1.a. Conceptualisation des prédicats linguistiques1.b. Conceptualisation des définitions lexicographiques1.a. Conceptualisation des prédicats linguistiques1.b. Conceptualisation des définitions lexicographiques

t

24 juin 2014 M. Lefrançois - Représentation des connaissances sémantiques lexicales de la théorie Sens-Texte 41

3. Comment peut-on opérationnaliser ce formalisme ?

3.a. Pour le raisonnement logique3.b. Sur le web des données lexicales liées

2.a. Formalismes existants2.b. Construction du formalisme des Graphes d’Unités

1. L’explicitation de la conceptualisation de ces connaissances est-elle adaptée à une formalisation ?

2. Quel formalisme de représentation des connaissancesest adapté à l’explicitation de cette conceptualisation ?

0. Pourquoi formaliser les connaissances sémantiques lexicales de la Théorie Sens-Texte ?

Page 42: Ph.D. Defense: Représentation des connaissances sémantiques lexicales de la Théorie Sens-Texte

24 juin 2014 M. Lefrançois - Représentation des connaissances sémantiques lexicales de la théorie Sens-Texte 42

Formalisation de la structure actancielle• Pour un symbole d’actant s

▫ : s est une position actancielle possible

▫ : s est une position actancielle obligatoire

▫ : s est une position actancielle interdite

▫ : définit le type des unités qui prennent la position actancielle s d’une unité de type t

hiérarchie des types primitifs =superposition intriquée de telles structures

Page 43: Ph.D. Defense: Représentation des connaissances sémantiques lexicales de la Théorie Sens-Texte

24 juin 2014 M. Lefrançois - Représentation des connaissances sémantiques lexicales de la théorie Sens-Texte 43

Formalisation de la hiérarchie des types d’unités

hiérarchie des types conjonctifs =superposition intriquée

de hiérarchies de types primitifs

Prise en compte des types conjonctifs

Page 44: Ph.D. Defense: Représentation des connaissances sémantiques lexicales de la Théorie Sens-Texte

24 juin 2014 M. Lefrançois - Représentation des connaissances sémantiques lexicales de la théorie Sens-Texte 44

Graphes d’Unités

RSémS

RSynP

« John feels no revulsion at the sight of a dead animal »

Page 45: Ph.D. Defense: Représentation des connaissances sémantiques lexicales de la Théorie Sens-Texte

24 juin 2014 M. Lefrançois - Représentation des connaissances sémantiques lexicales de la théorie Sens-Texte 45

Règles de graphes d’unités

• une hypothèse

• une conclusion

• des nœuds frontière

Page 46: Ph.D. Defense: Représentation des connaissances sémantiques lexicales de la Théorie Sens-Texte

24 juin 2014 M. Lefrançois - Représentation des connaissances sémantiques lexicales de la théorie Sens-Texte 46

Définitions de types d’unité= deux règles contraposées

Page 47: Ph.D. Defense: Représentation des connaissances sémantiques lexicales de la Théorie Sens-Texte

1.a. Conceptualisation des prédicats linguistiques1.b. Conceptualisation des définitions lexicographiques1.a. Conceptualisation des prédicats linguistiques1.b. Conceptualisation des définitions lexicographiques

t

24 juin 2014 M. Lefrançois - Représentation des connaissances sémantiques lexicales de la théorie Sens-Texte 47

3. Comment peut-on opérationnaliser ce formalisme ?

3.a. Pour le raisonnement logique3.b. Sur le web des données lexicales liées

2.a. Formalismes existants2.b. Construction du formalisme des Graphes d’Unités

1. L’explicitation de la conceptualisation de ces connaissances est-elle adaptée à une formalisation ?

2. Quel formalisme de représentation des connaissancesest adapté à l’explicitation de cette conceptualisation ?

0. Pourquoi formaliser les connaissances sémantiques lexicales de la Théorie Sens-Texte ?

Page 48: Ph.D. Defense: Représentation des connaissances sémantiques lexicales de la Théorie Sens-Texte

24 juin 2014 48M. Lefrançois - Représentation des connaissances sémantiques lexicales de la théorie Sens-Texte

Sémantique logique

Théorie des modèles & algèbre relationnelle

G implique H =pour tout modèle M qui satisfait G,

il existe un modèle qui satisfait H

Un modèle qui satisfait la hiérarchie des types d’unité

Un modèle qui satisfait un graphe d’unités

Page 49: Ph.D. Defense: Représentation des connaissances sémantiques lexicales de la Théorie Sens-Texte

Quelles connaissances peut-on expliciter dans G ?

24 juin 2014 49M. Lefrançois - Représentation des connaissances sémantiques lexicales de la théorie Sens-Texte

Règles d’inférence

...

G

OUI !

... et déduction logiqueH est-il déductible de G ?

Page 50: Ph.D. Defense: Représentation des connaissances sémantiques lexicales de la Théorie Sens-Texte

24 juin 2014 50M. Lefrançois - Représentation des connaissances sémantiques lexicales de la théorie Sens-Texte

Décidabilité de la déduction logique

• Condition suffisante: expansion finie

▫ Des conditions d’acyclicité

sur la hiérarchie des types d’unités

sur les définitions lexicographiques

▫ Les lexicographes de la Théorie Sens-Texte s’imposaient déjà ces conditions par intuition

▫ Mais on peut trouver mieux

Page 51: Ph.D. Defense: Représentation des connaissances sémantiques lexicales de la Théorie Sens-Texte

24 juin 2014 51M. Lefrançois - Représentation des connaissances sémantiques lexicales de la théorie Sens-Texte

correction

et complétude

La déduction logique par rapport à l’implication logique...

(sous réserve de consistance)

Page 52: Ph.D. Defense: Représentation des connaissances sémantiques lexicales de la Théorie Sens-Texte

1.a. Conceptualisation des prédicats linguistiques1.b. Conceptualisation des définitions lexicographiques1.a. Conceptualisation des prédicats linguistiques1.b. Conceptualisation des définitions lexicographiques

t

24 juin 2014 M. Lefrançois - Représentation des connaissances sémantiques lexicales de la théorie Sens-Texte 52

3. Comment peut-on opérationnaliser ce formalisme ?

3.a. Pour le raisonnement logique3.b. Sur le web des données lexicales liées

2.a. Formalismes existants2.b. Construction du formalisme des Graphes d’Unités

1. L’explicitation de la conceptualisation de ces connaissances est-elle adaptée à une formalisation ?

2. Quel formalisme de représentation des connaissancesest adapté à l’explicitation de cette conceptualisation ?

0. Pourquoi formaliser les connaissances sémantiques lexicales de la Théorie Sens-Texte ?

Page 53: Ph.D. Defense: Représentation des connaissances sémantiques lexicales de la Théorie Sens-Texte

24 juin 2014 53M. Lefrançois - Représentation des connaissances sémantiques lexicales de la théorie Sens-Texte

• profiter des architectures existantes...

Choix du métamodèle OWL 2 RL

Publication du modèle et des règles sur le web des données

- partage

- règles d’inférence- interrogation

- raisonnement (partiel)

Page 54: Ph.D. Defense: Représentation des connaissances sémantiques lexicales de la Théorie Sens-Texte

Deux modèles différents, mais interopérables

24 juin 2014 M. Lefrançois - Représentation des connaissances sémantiques lexicales de la théorie Sens-Texte 54

Alignement avec

ontolex

Page 55: Ph.D. Defense: Représentation des connaissances sémantiques lexicales de la Théorie Sens-Texte

24 juin 2014 55M. Lefrançois - Représentation des connaissances sémantiques lexicales de la théorie Sens-Texte

A partir d’une représentation des définitions lexicographiques formelles:

Génération automatique a l’aide de règles SPARQL des règles SPARQL d’expansion et de contraction

Page 56: Ph.D. Defense: Représentation des connaissances sémantiques lexicales de la Théorie Sens-Texte

24 juin 2014 56M. Lefrançois - Représentation des connaissances sémantiques lexicales de la théorie Sens-Texte

Publication sur le web des données

Page 57: Ph.D. Defense: Représentation des connaissances sémantiques lexicales de la Théorie Sens-Texte

24 juin 2014 57M. Lefrançois - Représentation des connaissances sémantiques lexicales de la théorie Sens-Texte

Ingénierie des connaissances

• valider

• inférer

• raisonner

• manipuler

• interroger

• échanger

Conclusion: contributions

Page 58: Ph.D. Defense: Représentation des connaissances sémantiques lexicales de la Théorie Sens-Texte

Contributions

• Choix d’une méthodologie en trois étapes

1. Extension de l’explicitation de la conceptualisation

▫ Conceptualisation du sens au niveau sémantique profond

▫ Conceptualisation des définitions lexicographiques

▫ Développement d’un prototype d’éditeur

2. Choix d’un formalisme de représentation des connaissances

▫ Justification de l’inadéquation des standards existants

▫ Construction du formalisme des Graphes d’Unités

3. Opérationnalisation du formalisme des Graphes d’Unités

▫ Définition et caractérisation du raisonnement logique

▫ Opérationnalisation sur le web des données

24 juin 2014 M. Lefrançois - Représentation des connaissances sémantiques lexicales de la théorie Sens-Texte 58

Page 59: Ph.D. Defense: Représentation des connaissances sémantiques lexicales de la Théorie Sens-Texte

Perspectives

• Approfondir l’opérationnalisation

▫ Conditions nécessaires et suffisantes de décidabilité

▫ Etude de la complexité

▫ Implémentation sur le web des données

• Approfondir la formalisation

▫ Réviser les règles pour prendre en compte les composantes optionnelles et interdites dans les définitions lexicographiques

▫ Impact sur l’opérationnalisation

• Complétion de la conceptualisation des définitions lexicographiques

▫ Composantes faibles, parties présuppositionnelles, polysémie lexicale

▫ Impact sur la formalisation et l’opérationnalisation

24 juin 2014 M. Lefrançois - Représentation des connaissances sémantiques lexicales de la théorie Sens-Texte 59

Page 60: Ph.D. Defense: Représentation des connaissances sémantiques lexicales de la Théorie Sens-Texte

Perspectives

• Application aux projets de lexicographie explicative et combinatoire

▫ v2 du prototype d’éditeur de définitions lexicographiques

RELIEF Nancy, Moscou

▫ population automatisée ou semi-automatisée à l’aide de ressources lexicales existantes sur le web des données

• Etude en lexicographie multilingue

• Représentation des fonctions lexicales

• Représentation d’autres niveaux linguistiques

24 juin 2014 M. Lefrançois - Représentation des connaissances sémantiques lexicales de la théorie Sens-Texte 60

Page 61: Ph.D. Defense: Représentation des connaissances sémantiques lexicales de la Théorie Sens-Texte

Perspectives• Applications au TALN

▫ étude des transducteurs des graphes d’unités

▫ traduction automatique

24 juin 2014 M. Lefrançois - Représentation des connaissances sémantiques lexicales de la théorie Sens-Texte 61

Page 62: Ph.D. Defense: Représentation des connaissances sémantiques lexicales de la Théorie Sens-Texte

Perspectives• Applications au TALN

▫ étude des transducteurs des graphes d’unités

▫ traduction automatique

▫ interaction en langue naturelle avec une base de connaissances

24 juin 2014 M. Lefrançois - Représentation des connaissances sémantiques lexicales de la théorie Sens-Texte 62

Page 63: Ph.D. Defense: Représentation des connaissances sémantiques lexicales de la Théorie Sens-Texte

Perspectives• Applications au TALN

▫ étude des transducteurs des graphes d’unités

▫ traduction automatique

▫ interaction en langue naturelle avec une base de connaissances

▫ cercle vertueux

24 juin 2014 M. Lefrançois - Représentation des connaissances sémantiques lexicales de la théorie Sens-Texte 63

Page 64: Ph.D. Defense: Représentation des connaissances sémantiques lexicales de la Théorie Sens-Texte

Publications

24 juin 2014 M. Lefrançois - Représentation des connaissances sémantiques lexicales de la théorie Sens-Texte 64

Lefrançois, Gandon, Giboin. TOTh’2014Méthodologie d’ingénierie des connaissances pour la représentation des définitions lexicographiques de la théorie Sens-Texte

Lefrançois, Gandon. IC’2014Un éditeur de définitions formelles pour les connaissances lexicales de la Théorie Sens-Texte

Lefrançois, Gandon. RANLP’2013Rationale, Concepts, and Current Outcome of the Unit Graphs Framework

Lefrançois, Gandon. RANLP’2013The Unit Graphs Framework: Foundational Concepts and Semantic Consequence

Lefrançois, Gandon. MTT’2013The Unit Graphs Framework: A graph-based Knowledge Representation Formalism designed for the Meaning-Text Théory

Lefrançois, Gugert, Gandon, Giboin. MTT’2013Application of the Unit Graphs Framework to Lexicographic Definitions in the RELIEF project

Lefrançois, Gandon. Depling’2013Reasoning with Dependency Structures and Lexicographic Definitions using Unit Graphs

Lefrançois. RECITAL’2013Représentation des connaissances du DEC: Concepts fondamentaux du formalisme des Graphes d’Unités

Lefrançois, Gandon. RR-8212, Inria, 2013The Unit Graphs Mathematical Framework

Lefrançois, Gandon. MTT’2011ILexicOn: Toward an ECD-Compliant Interlingual Lexical Ontology Described with Semantic Web Formalisms

Lefrançois, Gandon. TIA’2011ULiS: An Expert System on Linguistics to Support Multilingual Management of Interlingual Knowledge bases

Lefrançois, Gandon. MSW’2011ULiS: An Expert System on Linguistics to Support Multilingual Management of Interlingual Semantic Web Knowledge bases