Download - distances sémantiques

Transcript
Page 1: distances               sémantiques

fabien, gandon, inria

distance

s

sémantiq

ues

distance

s

sémantiq

ues

dans desdans desapplications deapplications de

gestion d'informationgestion d'informationutilisant le web sémantiqueutilisant le web sémantique

Page 2: distances               sémantiques

métaphore mathématiquepour une comparaison intuitive

2

Page 3: distances               sémantiques

métaphore mathématiquepour une comparaison intuitive

3

Page 4: distances               sémantiques

simuler la mémoiresémantique est une idée ancienne(Quillian, 1968) (Collins & Loftus, 1975)

mais avec de nouveaux besoins

4

Page 5: distances               sémantiques

? ?

??

gérer la distributionun premier scénario motivant

5

Page 6: distances               sémantiques

6

la spécialisationmise aux enchères

1:cfp

2:cfp

2:cfp

3:propose

3:propose

:protocol fipa contract net:content <RDF Annotation>:language CoMMA-RDF:ontology CoMMA Ontology

5:accept/reject

:protocol fipa contract net:content <propose bid = distance archive / refuse / not understood>:language CoMMA-RDF:ontology CoMMA Ontology

4:propose

6:accept/reject

6:accept/reject

7:inform

7:inform8:informAMLocal:Med *:Med *:Arch

*:Arch

Page 7: distances               sémantiques

7

Article

Title

Literal: "CfP UMTS Analysis"

Article

Author

Person

AnnotationAnnotation

ArchiveArchive

Report

Title

Literal: "Negotiation in C-Net"

Literal: "Zeno paradox"......

31 31 instancesinstances

Report

Author

Person

27 27 instancesinstances

Report

Author

Comity

10 10 instancesinstances

Book

Author

Person

19 19 instancesinstances

Book

Title

Literal: "Agents for dummies"

Literal: "Franc and Euro"......

7 7 instancesinstances

StatisticsStatistics

Page 8: distances               sémantiques

dist(triple1,triple2)=

dist(domain(triple1), domain(triple2)) +

dist(predicate(triple1), predicate(triple2)) +

dist(range(triple1), range(triple2))

8

Distance agrégée

),( ),( j

Antriple j

ABIStripledistABISAndist

),((min ),( iABIStriple

tripletripledistABIStripledisti

dist(t1,t2) =length(t1,lcst(t1,t2)) + length(t2, lcst(t1,t2))

où , lcst(t1,t2)) est le plus proche supertype commun de t1 et t2.

Informatique

ProgrammationRéseau

EthernetSans-fil

WifiBluetooth

Page 9: distances               sémantiques

9

de l'intérêt d'un à peu près

ma montre n'a qu'une aiguillemais elle n'est pas cassée.

Page 10: distances               sémantiques

projection de graphes conceptuels

10

voiture

véhicule

t1 < t2 i.e. t1(x)t2(x) T1 T2

voiture(x)véhicule(x)

Page 11: distances               sémantiques

relaxer une contrainte de typage

11

camion

voiture

voiture(x) .... camion(x)

t1(x)t2(x) d(t1,t2)<seuil

121 ,, )(21212

212

1),( aon ;),(

ttttt tdepthHc ttlttHttc

),(),(min),( aon ),( 21,212

21 21ttlttlttdistHtt

cc HHttttc

Page 12: distances               sémantiques
Page 13: distances               sémantiques

organiserun tas d'objets

13

Page 14: distances               sémantiques

organiserdes compétences

14

Market : SI Market : IT Applications

Clusters (groups of bubbles) represent complementary competencies i.e. similar from technology stand point

Bubbles (circles) represent similar competences ; their size represent their frequency

Market : Telecoms

Market : SI Market : IT Applications

Clusters (groups of bubbles) represent complementary competencies i.e. similar from technology stand point

Bubbles (circles) represent similar competences ; their size represent their frequency

Market : Telecoms

Pro

f. 2

Pro

f. 1

2

Racines (38 termes)

Compétences (36 termes)

Echanges (70 termes)

Actions (116 termes)

Délivrables (145 termes)

Sys. Offres (120 termes)

Ressources (616 termes)

Pro

f. 2

+41 +180+3 +43

Page 15: distances               sémantiques

organiserdes compétences

15

Pro

f. 2

Pro

f. 1

2

Racines (38 termes)

Compétences (36 termes)

Echanges (70 termes)

Actions (116 termes)

Délivrables (145 termes)

Sys. Offres (120 termes)

Ressources (616 termes)

Pro

f. 2

+41 +180+3 +43

1)(1)(2)),((21 2121 2

1

2

1

2

1),(

tdepthtdepthttlcstdepthttdist

2121),(

21 quand ),(,max),(21

ttttlcststdistttdistttlcstst

CH

2121 quand 0),( ttttdistCH

A B C D H IGFE M NLKJ

.25.5.75

1.75

0

Page 16: distances               sémantiques

deux aspects

métaphore mathématiqueles distances au naturel

16

simulations informatiquesespaces & métriques, problème double face

Page 17: distances               sémantiques

tester les distances au naturel

17

Page 18: distances               sémantiques

tester les distances au naturel

18

0

0,2

0,4

0,6

0,8

1

1,2

1,4

1,6

1,8

camion...

Page 19: distances               sémantiques

usage effectiffréquences de co-utilisation de types

19

count(tx,ty)=||{t triplets RDF |t =(x,Tp,y)(x,rdf:type,Tx)(y,rdf:type,Ty)}||

1,0),(1

1),(

yxyxcount TTcount

TTdist

(philosophe, auteur, traité)(personne, auteur, document)

Page 20: distances               sémantiques

20

Page 21: distances               sémantiques

intention d'usageutilisables dans un même graphe concis

21

Définition : la relation sous-type-et-signature est telle querdfs:domain(Tp, Tx) sous-type-et-signature (Tp, Tx, wsig)rdfs:range(Tp, Tx) sous-type-et-signature (Tp, Tx, wsig)subClassOf(Ty, Tx) sous-type-et-signature(Ty, Tx, wclass)subPropertyOf(Ty, Tx) sous-type-et-signature(Ty, Tx, wprop)sous-type-et-signature(Tx,Ty, w) sous-type-et-signature(Tx,Ty, w)

Technologie

AppareilRéseau

Sans-fil

WifiGSM

Téléphone

Cellulaire

connexion

sous-type-et-signature

Page 22: distances               sémantiques

intention d'usagedésambigüiser l'extraction de termes

22

Définition : la relation sous-type-et-signature est telle querdfs:domain(Tp, Tx) sous-type-et-signature (Tp, Tx, wsig)rdfs:range(Tp, Tx) sous-type-et-signature (Tp, Tx, wsig)subClassOf(Ty, Tx) sous-type-et-signature(Ty, Tx, wclass)subPropertyOf(Ty, Tx) sous-type-et-signature(Ty, Tx, wprop)sous-type-et-signature(Tx,Ty, w) sous-type-et-signature(Tx,Ty, w)

0,00

10,00

20,00

30,00

40,00

50,00

60,00

70,00

80,00

90,00

1 2 3 4 5 6 7 8 9

[Khelif et al.]wclass 0.2wprop 0.4wsig 0.4

Page 23: distances               sémantiques

oui et... ?

proximité naturelle vs. distance mathématique

distance conceptuelle vs. espaces métriques

combinaisons

apprentissage

23

Page 24: distances               sémantiques

24

fabien, gandon