Soutenance de thèse Loïc Maisonnasse Sous la direction de

37
Les supports de vocabulaires pour les systèmes de recherche d’information orientés précision : application aux graphes pour la recherche d’information médicale Soutenance de thèse Loïc Maisonnasse Sous la direction de Catherine Berrut et Jean-Pierre Chevallet Équipe MRIM, laboratoire LIG Le 6 mai 2008

description

Les supports de vocabulaires pour les systèmes de recherche d’information orientés précision : application aux graphes pour la recherche d’information médicale. Soutenance de thèse Loïc Maisonnasse Sous la direction de Catherine Berrut et Jean-Pierre Chevallet Équipe MRIM, laboratoire LIG - PowerPoint PPT Presentation

Transcript of Soutenance de thèse Loïc Maisonnasse Sous la direction de

Page 1: Soutenance de thèse Loïc Maisonnasse Sous la direction de

Les supports de vocabulaires pour les systèmes de recherche d’information orientés précision :

application aux graphes pour la recherche d’information médicale

Soutenance de thèseLoïc Maisonnasse

Sous la direction de Catherine Berrut et Jean-Pierre Chevallet

Équipe MRIM, laboratoire LIG

Le 6 mai 2008

Page 2: Soutenance de thèse Loïc Maisonnasse Sous la direction de

Loïc MAISONNASSEPage 2 / 36

IntroductionContexteObjectifs

État de l’art

Modélisation Cadre Modèle localModèle global

ApplicationModèle intermModèle localModèle global

ExpérimentationModèle intermModèle localModèle global

ConclusionContributionsPerspectives

PLANContexte

Recherche d’information orientée précision Des besoins experts et ciblésDes besoins multilinguesLes mots-clés ne suffisent plus

Besoin d’expressivité

Modéliser l’expressivitéComparer les modèles Choisir le modèle approprié

Supports de vocabulaires

"Montre-moi des images d'une pneumonie du lobe médial droit." 

Page 3: Soutenance de thèse Loïc Maisonnasse Sous la direction de

Loïc MAISONNASSEPage 3 / 36

IntroductionContexteObjectifs

État de l’art

Modélisation Cadre Modèle localModèle global

ApplicationModèle intermModèle localModèle global

ExpérimentationModèle intermModèle localModèle global

ConclusionContributionsPerspectives

PLAN

La nocivité du mercure Le mercure se retrouve

concentré dans les poissons. Les plombages dentaires peuvent aussi en libérer.

Je suis à la recherche des dangers des plombages au mercure chez l’enfant

Le mercure sans dangerLes amalgames dentaires contenant du mercure ne présentent pas de risques pour la santé des enfants.

Mercury in FillingsMercury in dental work does

not hinder children's development.

mercure, danger,

amalgame, dentaire, enfant, …

Ensemble de motsMots clefsRelations

document

Je suis à la recherche des dangers des plombages au mercure chez l’enfant

Le danger des piles Elle contient du mercure qui produit des vapeurs toxiques

pour l’enfant. Les piles au plomb

danger, mercure, vapeur, enfant,

plomb, …

nocivité, mercure, poisson,

plombage, dentaire, …

mercury,filling,hinder,

children, ...

{danger, risque…}{amalgame dentaire,

plombage…} {mercure,

vif-argent…}

{nocivité, danger …}, {amalgame dentaire,

plombage …} {mercure,

vif-argent…}

{filling, dental work, plombage, …}

{mercury,mercure...}{children, enfant…}

(danger - enfant)(plombage - mercure)(plombage - enfant)(mercure - danger)

(nocivité - mercure)(plombage - mercure)

{danger, risque …} {toxique, poison},

{plomb,Pb…}…

(plombage - mercure)(Mercure - enfant)

(danger - pile)(Mercure - toxique)(toxique - enfant)

(pile - plomb)…

Page 4: Soutenance de thèse Loïc Maisonnasse Sous la direction de

Loïc MAISONNASSEPage 4 / 36

IntroductionContexteObjectifs

État de l’art

Modélisation Cadre Modèle localModèle global

ApplicationModèle intermModèle localModèle global

ExpérimentationModèle intermModèle localModèle global

ConclusionContributionsPerspectives

PLANRendre compte de l’expressivité

L’expressivité 1.Plusieurs points de vue

2.L’espace d’expression de chacun de ces points de vue.

Modéliser l’expressivité par des supports de vocabulaires

1.Plusieurs vocabulaires

2.Vocabulaire

ExpressivitéForteFaible

Mots-Clefs

Langages complexes

Page 5: Soutenance de thèse Loïc Maisonnasse Sous la direction de

Loïc MAISONNASSEPage 5 / 36

IntroductionContexteObjectifs

État de l’art

Modélisation Cadre Modèle localModèle global

ApplicationModèle intermModèle localModèle global

ExpérimentationModèle intermModèle localModèle global

ConclusionContributionsPerspectives

PLANObjectifs de la thèse

Modéliser l’expressivité en recherche d’information

Proposer des modèles à expressivité forte Modèle de recherche d’information Local

Modèle de recherche d’information Global

Appliquer ces modèles à la recherche d’information

Modèle global

Modèle local

Modélisation de l’expressivité

Modèles à expressivité forte

Application des modèles

Système de recherche d’information orienté

précisionSupport de vocabulaires

Cadre deModélisation

Page 6: Soutenance de thèse Loïc Maisonnasse Sous la direction de

Loïc MAISONNASSEPage 6 / 36

IntroductionContexteObjectifs

État de l’art

Modélisation Cadre Modèle localModèle global

ApplicationModèle intermModèle localModèle global

ExpérimentationModèle intermModèle localModèle global

ConclusionContributionsPerspectives

PLAN

L’expressivité dans les modèles de recherche d’information

Utilisateur

Besoin d’informationCorpus de documents

Pertinence

Requête Indexation

?

Modèle de requête

Modèle de document

Correspondance

Expressivité

Support de vocabulaires

Support de vocabulaires

modèle

Page 7: Soutenance de thèse Loïc Maisonnasse Sous la direction de

Loïc MAISONNASSEPage 7 / 36

IntroductionContexteObjectifs

État de l’art

Modélisation Cadre Modèle localModèle global

ApplicationModèle intermModèle localModèle global

ExpérimentationModèle intermModèle localModèle global

ConclusionContributionsPerspectives

PLAN

Exhaustif Spécifique

Portée des vocabulaires

Explorer les possibilités du support de vocabulaires

Deux modèles

Portée des représentations de documents

Document seul

Vocabulaires

Expressivité

Modèle global

Modèle local

Page 8: Soutenance de thèse Loïc Maisonnasse Sous la direction de

Loïc MAISONNASSEPage 8 / 36

IntroductionContexteObjectifs

État de l’art

Modélisation Cadre Modèle localModèle global

ApplicationModèle intermModèle localModèle global

ExpérimentationModèle intermModèle localModèle global

ConclusionContributionsPerspectives

PLAN

Application des modèles à la recherche d’information orienté précision

Cadre de modélisation

Deux Modèles d’expressivité forte

Modèlelocal

Modèle global

Instanciation au texte

Application au médical

Modèle

Représentation intermédiaire

Supports de vocabulaires Corpus de documents

Représentation &Correspondance

Représentation &Correspondance

Modélisation de l’expressivité Système orienté précision

Corpus de documents

Modèle intermédiaire

Page 9: Soutenance de thèse Loïc Maisonnasse Sous la direction de

Loïc MAISONNASSEPage 9 / 36

IntroductionContexteObjectifs

État de l’art

Modélisation Cadre Modèle localModèle global

ApplicationModèle intermModèle localModèle global

ExpérimentationModèle intermModèle localModèle global

ConclusionContributionsPerspectives

PLANPlan

État de l’art à travers l’expressivité

Modélisation de l’expressivité basée sur les supports de vocabulairesCadre de formalisationModèle localModèle global

Application à la recherche d’information orientée précisionModèle intermédiaireModèle localModèle global

ExpérimentationModèle intermédiaireModèle localModèle global

ConclusionContributionsPerspectives

Page 10: Soutenance de thèse Loïc Maisonnasse Sous la direction de

Loïc MAISONNASSEPage 10 / 36

IntroductionContexteObjectifs

État de l’art

Modélisation Cadre Modèle localModèle global

ApplicationModèle intermModèle localModèle global

ExpérimentationModèle intermModèle localModèle global

ConclusionContributionsPerspectives

PLAN

La dimension expressivité en recherche d’information

Expressivité

Mots-Clefs

Modèles intégrant la dépendance

Informations syntaxiques

Informations sémantiquesFamilles de

langages d’indexation

en recherche d’information

ForteFaible

(Gaussier et al., 2000)(Strzalkowski et al., 1994)(Zhai et al., 1997)

Syntagmes

(Ho, 2004)(Matsumura et al., 2000) (Metzler et Haas, 1989) (Smeaton, 1999)

Structures syntaxiques

(Losee, 1994) (Lee et Lee, 2005) (Nallapati et Allan, 2002) (Gao et al., 2004)

(Vintar et al., 2003)

(Aronson et al., 1994)

Concepts

(Sebastiani, 1994)(Berrut, 1988)(Chevallet, 1992) (Genest, 2000)(Mulhem, 2001)

Structure sémantique

Page 11: Soutenance de thèse Loïc Maisonnasse Sous la direction de

Loïc MAISONNASSEPage 11 / 36

IntroductionContexteObjectifs

État de l’art

Modélisation Cadre Modèle localModèle global

ApplicationModèle intermModèle localModèle global

ExpérimentationModèle intermModèle localModèle global

ConclusionContributionsPerspectives

PLAN

Comparer l’expressivité des modèles est difficileQuels sont les vocabulaires ?

Quel est leur espace d’expression ?

Comment sont-ils utilisés ?

Modéliser l’expressivité

Pour la recherche d’information orientée précisionPlusieurs vocabulaires

Forte expressivité Graphe de concepts

Difficulté d’extraction

Bilan

ExpressivitéForteFaible

Page 12: Soutenance de thèse Loïc Maisonnasse Sous la direction de

Loïc MAISONNASSEPage 12 / 36

IntroductionContexteObjectifs

État de l’art

Modélisation Cadre Modèle localModèle global

ApplicationModèle intermModèle localModèle global

ExpérimentationModèle intermModèle localModèle global

ConclusionContributionsPerspectives

PLANPlan

État de l’art à travers l’expressivité

Modélisation de l’expressivité basée sur les supports de vocabulairesCadre de formalisationModèle localModèle global

Application à la recherche d’information orientée précisionModèle intermédiaireModèle localModèle global

ExpérimentationModèle intermédiaireModèle localModèle global

ConclusionContributionsPerspectives

Page 13: Soutenance de thèse Loïc Maisonnasse Sous la direction de

Loïc MAISONNASSEPage 13 / 36

IntroductionContexteObjectifs

État de l’art

Modélisation Cadre Modèle localModèle global

ApplicationModèle intermModèle localModèle global

ExpérimentationModèle intermModèle localModèle global

ConclusionContributionsPerspectives

PLAN

Modélisation de l’expressivité en recherche d’information

Cadre de modélisation Deux Modèles d’expressivité forte

Modèle local

Modèle global

Modèle

Supports de vocabulaires

Page 14: Soutenance de thèse Loïc Maisonnasse Sous la direction de

Loïc MAISONNASSEPage 14 / 36

IntroductionContexteObjectifs

État de l’art

Modélisation Cadre Modèle localModèle global

ApplicationModèle intermModèle localModèle global

ExpérimentationModèle intermModèle localModèle global

ConclusionContributionsPerspectives

PLANSupport de vocabulaires

vocabulaires

Vocabulaire pondéré ( (C081(poumon), partie de, C022(cage thoracique)), 0.4, 0.7) …

Vocabulaire simple C081(poumon)C022(cage thoracique),…

Vocabulaire complexe( (C081(poumon), partie de, C022(cage thoracique))…

SV=(V1, V2, …,Vn)

types

Nom de relationlocalisation, mesure, partie de, touche, …

Nom de conceptC003(plèvre),C001(cœur),C022(cage thoracique),…

ST=(T1, T2, …,Tn)

V1 V2 V3

T2T1

Support de vocabulaires

Support de types

Page 15: Soutenance de thèse Loïc Maisonnasse Sous la direction de

Loïc MAISONNASSEPage 15 / 36

IntroductionContexteObjectifs

État de l’art

Modélisation Cadre Modèle localModèle global

ApplicationModèle intermModèle localModèle global

ExpérimentationModèle intermModèle localModèle global

ConclusionContributionsPerspectives

PLAN

Représenter à l’aide d’un support de vocabulairesDéfinir le support de vocabulaire de la représentation

Un ou plusieurs vocabulaires

Définir la représentationSélection sur les vocabulaires

avec ,...,,...,1 iinvdi VDVDVDVDVdi

d

Document

(C081(poumon),partie de, C022(cage thoracique), 0.4,0.7)

(C003(plèvre),partie de, C022(cage thoracique), 0.26,0.39)(C08( poumon), touche, C003(plèvre), 0.15, 0.5)

Dans la cage thoracique, la

plèvre touche les poumons.

(C081(poumon)) (C003(plèvre))

(C022(cage thoracique))

ConceptsDV ionspoidsRelatDV

Exemple de document indexé à l’aide d’un support de vocabulaire

,...,,...,1 nvi VVVSV

, ionspoidsRelatConceptsGraphes VVSV

ionspoidsRelatConcepts DVDVdi ,

Page 16: Soutenance de thèse Loïc Maisonnasse Sous la direction de

Loïc MAISONNASSEPage 16 / 36

IntroductionContexteObjectifs

État de l’art

Modélisation Cadre Modèle localModèle global

ApplicationModèle intermModèle localModèle global

ExpérimentationModèle intermModèle localModèle global

ConclusionContributionsPerspectives

PLAN

Relation decorrespondance

RC

Modèle de recherche d’information basé sur des supports de vocabulaires

M= (ST, SVQ, SVD, RC)

Support de typesST

Utilisateur

Besoin d’informationCorpus de documents

Pertinence

Requête Indexation

?

Modèle de requête

Modèle de document

Correspondance

Support de vocabulaires

de documentSVD

Support de vocabulaires

de requêteSVQ

modèle

Page 17: Soutenance de thèse Loïc Maisonnasse Sous la direction de

Loïc MAISONNASSEPage 17 / 36

IntroductionContexteObjectifs

État de l’art

Modélisation Cadre Modèle localModèle global

ApplicationModèle intermModèle localModèle global

ExpérimentationModèle intermModèle localModèle global

ConclusionContributionsPerspectives

PLAN

Expressivité

Faible

Forte

Deux modèles expressifs

Expressivité forteNiveau sémantique

Vocabulaires complexes

Même support de typesNom de concepts

Nom de relations

Vocabulaires de base prochesConcepts

Couples

Relations

C081(poumon)

(C081(poumon), C022(cage thoracique))

(C081(poumon), partie de, C022(cage thoracique) )

Exhaustif Spécifique

Portée des vocabulaires

Portée des représentations de documents

Document seul

Vocabulaires

Page 18: Soutenance de thèse Loïc Maisonnasse Sous la direction de

Loïc MAISONNASSEPage 18 / 36

IntroductionContexteObjectifs

État de l’art

Modélisation Cadre Modèle localModèle global

ApplicationModèle intermModèle localModèle global

ExpérimentationModèle intermModèle localModèle global

ConclusionContributionsPerspectives

PLANModèle local

Inspiré des graphes conceptuels

Support de vocabulaires Graphe Conceptuel Pondéré

Concepts

Relations

Relation de correspondance Projection des graphes conceptuels

Degrés de correspondance

partie de|0.32, 0.25

partie de | 0.4, 0.1

touche |0.82, 0.62C081(poumon) | 0.4, 0.3

C003(plèvre) |0.6, 0.2

C022(cage thoracique) | 0.8, 0.5

Exhaustif Spécifique

Portée des vocabulaires

Portée des représentations de documents

Document seul

Vocabulaires

concept relation

relationrelationconceptconceptdiq ,,,

Page 19: Soutenance de thèse Loïc Maisonnasse Sous la direction de

Loïc MAISONNASSEPage 19 / 36

IntroductionContexteObjectifs

État de l’art

Modélisation Cadre Modèle localModèle global

ApplicationModèle intermModèle localModèle global

ExpérimentationModèle intermModèle localModèle global

ConclusionContributionsPerspectives

PLANModèle global

Inspiré des modèles de langue(Ponte et Croft, 98)

Support de vocabulaires de documentModélisation statistique du document :

ConceptsCouplesRelations

Support de vocabulaires de requête

Un graphe :

Concepts :

Relations :

Relation de correspondance Vraisemblance de la requête

Probabilité de générer le graphe de la requête

gDQQgDQ

gDQ MCRPMCPMGP ,

Exhaustif Spécifique

Portée des vocabulaires

Portée des représentations de documents

Document seul

Vocabulaires

gDM

QG

QCQR

Page 20: Soutenance de thèse Loïc Maisonnasse Sous la direction de

Loïc MAISONNASSEPage 20 / 36

IntroductionContexteObjectifs

État de l’art

Modélisation Cadre Modèle localModèle global

ApplicationModèle intermModèle localModèle global

ExpérimentationModèle intermModèle localModèle global

ConclusionContributionsPerspectives

PLAN

Récapitulatif:Modélisation de l’expressivité

Cadre de modélisation Deux modèles d’expressivité forte

Modèle local

Modèle global

Modèle

Supportsde vocabulaires

de requête

Supportsde vocabulaires

de document

Support de typesSupport de types

Supportsde vocabulaires

de document

Supportsde vocabulaires

de requête

Supportsde vocabulaires

de document

Supportsde vocabulaires

de requête

RC

RC

RC

Page 21: Soutenance de thèse Loïc Maisonnasse Sous la direction de

Loïc MAISONNASSEPage 21 / 36

IntroductionContexteObjectifs

État de l’art

Modélisation Cadre Modèle localModèle global

ApplicationModèle intermModèle localModèle global

ExpérimentationModèle intermModèle localModèle global

ConclusionContributionsPerspectives

PLANPlan

État de l’art à travers l’expressivité

Modélisation de l’expressivité basée sur les supports de vocabulairesCadre de formalisationModèle localModèle global

Application à la recherche d’information orientée précisionModèle intermédiaireModèle localModèle global

ExpérimentationModèle intermédiaireModèle localModèle global

ConclusionContributionsPerspectives

Page 22: Soutenance de thèse Loïc Maisonnasse Sous la direction de

Loïc MAISONNASSEPage 22 / 36

IntroductionContexteObjectifs

État de l’art

Modélisation Cadre Modèle localModèle global

ApplicationModèle intermModèle localModèle global

ExpérimentationModèle intermModèle localModèle global

ConclusionContributionsPerspectives

PLANSystème orienté précision

Modèle intermédiaire

Modèle local

Modèle global

Instanciation au texte

Applicationau médical

représentation intermédiaire

Corpus de documents

Représentation &Correspondance

Représentation &Correspondance

UMLS

détection

Page 23: Soutenance de thèse Loïc Maisonnasse Sous la direction de

Loïc MAISONNASSEPage 23 / 36

IntroductionContexteObjectifs

État de l’art

Modélisation Cadre Modèle localModèle global

ApplicationModèle intermModèle localModèle global

ExpérimentationModèle intermModèle localModèle global

ConclusionContributionsPerspectives

PLANModèle intermédiaire

Ensemble de graphesUn par phraseSupport de vocabulaire

Concepts Relations

Utilise deux pondérationsFréquenceScore de confiance

Défini à l’aide d’UMLS (Unified Medical Language System)

Concepts : méta-thésaurusRelations : réseau sémantique

partie de|1,0.25

partie de | 1,0.1

touche |1,0.62

C081(poumon) | 2 ,0.3

C003(plèvre) |1,0.2

C022(cage thoracique) | 1,0.5

Page 24: Soutenance de thèse Loïc Maisonnasse Sous la direction de

Loïc MAISONNASSEPage 24 / 36

IntroductionContexteObjectifs

État de l’art

Modélisation Cadre Modèle localModèle global

ApplicationModèle intermModèle localModèle global

ExpérimentationModèle intermModèle localModèle global

ConclusionContributionsPerspectives

PLAN

Détection des concepts : 3 méthodesMapTreeTagger

Analyse morphosyntaxique TreeTaggerCorrespondance de termes

MapMiniParAnalyse morphosyntaxique MiniParCorrespondance de termes

MetaMap (Aronson, 2001)

Détection des relationsDétection au niveau de la phrase Calcul d’un score de confiance a posteriori sur MapMiniPar

Méthodes de détection de la représentation intermédiaire

UMLS

Détection des concepts Détection des relationsphrase

représentation intermédiaire

Page 25: Soutenance de thèse Loïc Maisonnasse Sous la direction de

Loïc MAISONNASSEPage 25 / 36

IntroductionContexteObjectifs

État de l’art

Modélisation Cadre Modèle localModèle global

ApplicationModèle intermModèle localModèle global

ExpérimentationModèle intermModèle localModèle global

ConclusionContributionsPerspectives

PLANModèle local

Représentation Concaténation des graphes de phrasesDeux pondérations pour les relations et les concepts

Un poids (tf-idf) Un score de confiance

CorrespondanceIntersection de graphePondération de l’intersection

Sans ou sans score de confiance

Modèle local

représentation intermédiaire

Représentation &Correspondance

Supportsde vocabulaires

dri

dconfiance

qri

qconfiance

dq ppppconceptconcept ,

ripconfiancep

Page 26: Soutenance de thèse Loïc Maisonnasse Sous la direction de

Loïc MAISONNASSEPage 26 / 36

IntroductionContexteObjectifs

État de l’art

Modélisation Cadre Modèle localModèle global

ApplicationModèle intermModèle localModèle global

ExpérimentationModèle intermModèle localModèle global

ConclusionContributionsPerspectives

PLANModèle global

ReprésentationModélisation de l’ensemble des graphes de phrases

Estimation du modèle Probabilité des concepts, des couples et des relations

Lissage avec la collection

CorrespondanceProbabilité de la requête

Plusieurs modèlesSans étiquette

Avec étiquettes

Modèle global

Supportsde vocabulaires

représentation intermédiaire

Représentation &Correspondance

Page 27: Soutenance de thèse Loïc Maisonnasse Sous la direction de

Loïc MAISONNASSEPage 27 / 36

IntroductionContexteObjectifs

État de l’art

Modélisation Cadre Modèle localModèle global

ApplicationModèle intermModèle localModèle global

ExpérimentationModèle intermModèle localModèle global

ConclusionContributionsPerspectives

PLANPlan

État de l’art à travers l’expressivité

Modélisation de l’expressivité basée sur les supports de vocabulairesCadre de formalisationModèle localModèle global

Application à la recherche d’information orientée précisionModèle intermédiaireModèle localModèle global

ExpérimentationModèle intermédiaireModèle localModèle global

ConclusionContributionsPerspectives

Page 28: Soutenance de thèse Loïc Maisonnasse Sous la direction de

Loïc MAISONNASSEPage 28 / 36

IntroductionContexteObjectifs

État de l’art

Modélisation Cadre Modèle localModèle global

ApplicationModèle intermModèle localModèle global

ExpérimentationModèle intermModèle localModèle global

ConclusionContributionsPerspectives

PLANPlan d’expérimentation

Mise en œuvreCollection CLEF médicale (2005-07)

85 requêtes50 000 documents

Ressources UMLS1 million de concepts pour 5 millions de termes54 relations sémantiques

MesuresPrécision moyennePrécision à 5 documents

ExpériencesModèle intermédiaire

Détection des concepts

Modèle localMéthode MapMiniPar (avec confiance sur les relations)

Modèle globalAvec étiquettes

Page 29: Soutenance de thèse Loïc Maisonnasse Sous la direction de

Loïc MAISONNASSEPage 29 / 36

IntroductionContexteObjectifs

État de l’art

Modélisation Cadre Modèle localModèle global

ApplicationModèle intermModèle localModèle global

ExpérimentationModèle intermModèle localModèle global

ConclusionContributionsPerspectives

PLAN

Modèle intermédiaire :détection des concepts

Détection des concepts MapTreeTagger

Correspondance

Filtrages

Comparaison des méthodes

étiquettes syntaxiques

types sémantiques

thésaurus tf.idf DFR

0,156 0,165X 0,157 0,186X X 0,155 0,184X X X 0,154 0,183

filtrages précision moyenne

tf.idf DFR tf.idf DFRMapTreeTagger + filtrages 0,154 0,183 0,304 0,448

MapMiniPar + filtrages 0,146 0,178 0,312 0,440MetaMap 0,164 0,198 0,304 0,440

Précision moyenne Précision à 5 documents

Page 30: Soutenance de thèse Loïc Maisonnasse Sous la direction de

Loïc MAISONNASSEPage 30 / 36

IntroductionContexteObjectifs

État de l’art

Modélisation Cadre Modèle localModèle global

ApplicationModèle intermModèle localModèle global

ExpérimentationModèle intermModèle localModèle global

ConclusionContributionsPerspectives

PLAN

Précision moyenne Collection CLEF médical 2005 niveau diagnostic (tf)

Précision à 5 documents Collection CLEF médical 2005 niveau diagnostic (tf)

Modèle localModèle intermédiaire

Modèle local : MapMiniPar avec confiance(relation)

0,2

0,25

0,3

0,35

0,4

0,45

0,5

mots-clefs relation concept sans confiance avec confiance

Modèle localModèle intermédiaire

0,12

0,16

0,2

0,24

0,28

mots-clefs relation concept sans confiance avec confiance

Page 31: Soutenance de thèse Loïc Maisonnasse Sous la direction de

Loïc MAISONNASSEPage 31 / 36

IntroductionContexteObjectifs

État de l’art

Modélisation Cadre Modèle localModèle global

ApplicationModèle intermModèle localModèle global

ExpérimentationModèle intermModèle localModèle global

ConclusionContributionsPerspectives

PLAN

méthode résultat résultatMetaMap 0,2 0.4733 0.1 0.7 0.4600

MapMiniPar 0.1 0.4533 0.1 0.1 0.4867MapTreeTagger 0.1 0.4533 0.1 0.1 0.4733

modèle de langue modèle de grapheconcept relationconcept

0,42

0,45

0,48

0,51

MapTreeTagger MapMiniPar MetaMap

unigramme

global

Précision moyenne Collection CLEF médical 2005 et 2006

Précision à 5 documents Collection CLEF médical 2005 et 2006

méthode résultat résultatMetaMap 0.1 0.3371 0.1 0.4 0.3437

MapMiniPar 0.1 0.3390 0.1 0.4 0.3486MapTreeTagger 0.1 0.3653 0.1 0.4 0.3722

modèle de langue modèle de grapheconcept relationconcept

Modèle Global : avec étiquettes

0,3

0,33

0,36

0,39

MapTreeTagger MapMiniPar MetaMap

unigramme

global

Page 32: Soutenance de thèse Loïc Maisonnasse Sous la direction de

Loïc MAISONNASSEPage 32 / 36

IntroductionContexteObjectifs

État de l’art

Modélisation Cadre Modèle localModèle global

ApplicationModèle intermModèle localModèle global

ExpérimentationModèle intermModèle localModèle global

ConclusionContributionsPerspectives

PLANComparaison des deux modèles

Meilleurs résultats des deux méthodes Collection CLEF médical 2006

RésultatsPrécisions moyennes fortement différentes

Précisions à 5 documents proches

ModèlesModèle global : adapté à des corpus stables

Modèle local : bons résultats sur les premiers documents

méthode Modèle local Modèle global Modèle local Modèle globalMapTreeTagger 0.2935 0.3722 0.4400 0.4733

MapMiniPar 0.2893 0.3486 0.4933 0.4867MetaMap 0.2802 0.3437 0.3733 0.4600

Précision à 5 documentsPrécision moyenne

Page 33: Soutenance de thèse Loïc Maisonnasse Sous la direction de

Loïc MAISONNASSEPage 33 / 36

IntroductionContexteObjectifs

État de l’art

Modélisation Cadre Modèle localModèle global

ApplicationModèle intermModèle localModèle global

ExpérimentationModèle intermModèle localModèle global

ConclusionContributionsPerspectives

PLANPlan

État de l’art à travers l’expressivité

Modélisation de l’expressivité basée sur les supports de vocabulairesCadre de formalisationModèle localModèle global

Application à la recherche d’information orientée précisionModèle intermédiaireModèle localModèle global

ExpérimentationModèle intermédiaireModèle localModèle global

ConclusionContributionsPerspectives

Page 34: Soutenance de thèse Loïc Maisonnasse Sous la direction de

Loïc MAISONNASSEPage 34 / 36

IntroductionContexteObjectifs

État de l’art

Modélisation Cadre Modèle localModèle global

ApplicationModèle intermModèle localModèle global

ExpérimentationModèle intermModèle localModèle global

ConclusionContributionsPerspectives

PLANContributions (1/2)

Niveau modélisationProposition d’un cadre générique pour la modélisation de

l’expressivitéSupports de vocabulaires

Espace de positionnement

Description de deux modèles dans ce cadreModèle local

Modèle global

Niveau traitementMéthodes d’extraction de graphe

Sur-ensemble, améliore les mots-clefs

Score de confianceAméliore les résultats notamment en précision

Méthode générique en deux étapes

Non supervisé

Meilleurs résultats à CLEF 2007 sur la tâche médicale

Précision moyenne sur 147 participations

0

0,05

0,1

0,15

0,2

0,25

0,3

0,35

0,4

Page 35: Soutenance de thèse Loïc Maisonnasse Sous la direction de

Loïc MAISONNASSEPage 35 / 36

IntroductionContexteObjectifs

État de l’art

Modélisation Cadre Modèle localModèle global

ApplicationModèle intermModèle localModèle global

ExpérimentationModèle intermModèle localModèle global

ConclusionContributionsPerspectives

PLANContributions (2/2)

Niveau développementsProgrammation modulaire

Basée sur XIOTA (Chevallet, 2004)

Facilite les expérimentations

Implémentation des modèles Détection des graphesCréation des représentations finalesCorrespondance

Exécution rapide

Niveau expérimentationsDifférentes variations de chaque modèleApplication des modèles au niveau syntaxiqueParticipation à différentes campagnes d’évaluation

CLEF’05, recherche d’information multilingueDEFT’05, attribution de discoursDEFT’06, segmentationCLEF’07, recherche d’information médicale

Page 36: Soutenance de thèse Loïc Maisonnasse Sous la direction de

Loïc MAISONNASSEPage 36 / 36

IntroductionContexteObjectifs

État de l’art

Modélisation Cadre Modèle localModèle global

ApplicationModèle intermModèle localModèle global

ExpérimentationModèle intermModèle localModèle global

ConclusionContributionsPerspectives

PLANPerspectives

Court termeDétection des graphes

Améliorer l’extraction des concepts et des relations

Utiliser la complémentarité des méthodes

Calcul de scores de confiance

ModèleRelations lexicales

Score de confiance (modèle global)

Autres corpus

Long termeÉlargir les applications

Autres domaines

Autres medias

Explorer l’espace de positionnement