distances sémantiques

Post on 12-Jan-2016

99 views 0 download

description

distances sémantiques. dans des applications de gestion d'information utilisant le web sémantique. fabien, gandon, inria. métaphore mathématique. pour une comparaison intuitive. métaphore mathématique. pour une comparaison intuitive. simuler la mémoire. - PowerPoint PPT Presentation

Transcript of distances sémantiques

fabien, gandon, inria

distance

s

sémantiq

ues

distance

s

sémantiq

ues

dans desdans desapplications deapplications de

gestion d'informationgestion d'informationutilisant le web sémantiqueutilisant le web sémantique

métaphore mathématiquepour une comparaison intuitive

2

métaphore mathématiquepour une comparaison intuitive

3

simuler la mémoiresémantique est une idée ancienne(Quillian, 1968) (Collins & Loftus, 1975)

mais avec de nouveaux besoins

4

? ?

??

gérer la distributionun premier scénario motivant

5

6

la spécialisationmise aux enchères

1:cfp

2:cfp

2:cfp

3:propose

3:propose

:protocol fipa contract net:content <RDF Annotation>:language CoMMA-RDF:ontology CoMMA Ontology

5:accept/reject

:protocol fipa contract net:content <propose bid = distance archive / refuse / not understood>:language CoMMA-RDF:ontology CoMMA Ontology

4:propose

6:accept/reject

6:accept/reject

7:inform

7:inform8:informAMLocal:Med *:Med *:Arch

*:Arch

7

Article

Title

Literal: "CfP UMTS Analysis"

Article

Author

Person

AnnotationAnnotation

ArchiveArchive

Report

Title

Literal: "Negotiation in C-Net"

Literal: "Zeno paradox"......

31 31 instancesinstances

Report

Author

Person

27 27 instancesinstances

Report

Author

Comity

10 10 instancesinstances

Book

Author

Person

19 19 instancesinstances

Book

Title

Literal: "Agents for dummies"

Literal: "Franc and Euro"......

7 7 instancesinstances

StatisticsStatistics

dist(triple1,triple2)=

dist(domain(triple1), domain(triple2)) +

dist(predicate(triple1), predicate(triple2)) +

dist(range(triple1), range(triple2))

8

Distance agrégée

),( ),( j

Antriple j

ABIStripledistABISAndist

),((min ),( iABIStriple

tripletripledistABIStripledisti

dist(t1,t2) =length(t1,lcst(t1,t2)) + length(t2, lcst(t1,t2))

où , lcst(t1,t2)) est le plus proche supertype commun de t1 et t2.

Informatique

ProgrammationRéseau

EthernetSans-fil

WifiBluetooth

9

de l'intérêt d'un à peu près

ma montre n'a qu'une aiguillemais elle n'est pas cassée.

projection de graphes conceptuels

10

voiture

véhicule

t1 < t2 i.e. t1(x)t2(x) T1 T2

voiture(x)véhicule(x)

relaxer une contrainte de typage

11

camion

voiture

voiture(x) .... camion(x)

t1(x)t2(x) d(t1,t2)<seuil

121 ,, )(21212

212

1),( aon ;),(

ttttt tdepthHc ttlttHttc

),(),(min),( aon ),( 21,212

21 21ttlttlttdistHtt

cc HHttttc

organiserun tas d'objets

13

organiserdes compétences

14

Market : SI Market : IT Applications

Clusters (groups of bubbles) represent complementary competencies i.e. similar from technology stand point

Bubbles (circles) represent similar competences ; their size represent their frequency

Market : Telecoms

Market : SI Market : IT Applications

Clusters (groups of bubbles) represent complementary competencies i.e. similar from technology stand point

Bubbles (circles) represent similar competences ; their size represent their frequency

Market : Telecoms

Pro

f. 2

Pro

f. 1

2

Racines (38 termes)

Compétences (36 termes)

Echanges (70 termes)

Actions (116 termes)

Délivrables (145 termes)

Sys. Offres (120 termes)

Ressources (616 termes)

Pro

f. 2

+41 +180+3 +43

organiserdes compétences

15

Pro

f. 2

Pro

f. 1

2

Racines (38 termes)

Compétences (36 termes)

Echanges (70 termes)

Actions (116 termes)

Délivrables (145 termes)

Sys. Offres (120 termes)

Ressources (616 termes)

Pro

f. 2

+41 +180+3 +43

1)(1)(2)),((21 2121 2

1

2

1

2

1),(

tdepthtdepthttlcstdepthttdist

2121),(

21 quand ),(,max),(21

ttttlcststdistttdistttlcstst

CH

2121 quand 0),( ttttdistCH

A B C D H IGFE M NLKJ

.25.5.75

1.75

0

deux aspects

métaphore mathématiqueles distances au naturel

16

simulations informatiquesespaces & métriques, problème double face

tester les distances au naturel

17

tester les distances au naturel

18

0

0,2

0,4

0,6

0,8

1

1,2

1,4

1,6

1,8

camion...

usage effectiffréquences de co-utilisation de types

19

count(tx,ty)=||{t triplets RDF |t =(x,Tp,y)(x,rdf:type,Tx)(y,rdf:type,Ty)}||

1,0),(1

1),(

yxyxcount TTcount

TTdist

(philosophe, auteur, traité)(personne, auteur, document)

20

intention d'usageutilisables dans un même graphe concis

21

Définition : la relation sous-type-et-signature est telle querdfs:domain(Tp, Tx) sous-type-et-signature (Tp, Tx, wsig)rdfs:range(Tp, Tx) sous-type-et-signature (Tp, Tx, wsig)subClassOf(Ty, Tx) sous-type-et-signature(Ty, Tx, wclass)subPropertyOf(Ty, Tx) sous-type-et-signature(Ty, Tx, wprop)sous-type-et-signature(Tx,Ty, w) sous-type-et-signature(Tx,Ty, w)

Technologie

AppareilRéseau

Sans-fil

WifiGSM

Téléphone

Cellulaire

connexion

sous-type-et-signature

intention d'usagedésambigüiser l'extraction de termes

22

Définition : la relation sous-type-et-signature est telle querdfs:domain(Tp, Tx) sous-type-et-signature (Tp, Tx, wsig)rdfs:range(Tp, Tx) sous-type-et-signature (Tp, Tx, wsig)subClassOf(Ty, Tx) sous-type-et-signature(Ty, Tx, wclass)subPropertyOf(Ty, Tx) sous-type-et-signature(Ty, Tx, wprop)sous-type-et-signature(Tx,Ty, w) sous-type-et-signature(Tx,Ty, w)

0,00

10,00

20,00

30,00

40,00

50,00

60,00

70,00

80,00

90,00

1 2 3 4 5 6 7 8 9

[Khelif et al.]wclass 0.2wprop 0.4wsig 0.4

oui et... ?

proximité naturelle vs. distance mathématique

distance conceptuelle vs. espaces métriques

combinaisons

apprentissage

23

24

fabien, gandon