Modélisation des connaissances et Web sémantique 1 Modélisation des connaissances pour le Web...

25
Modélisation des connaiss ances et Web sémantique 1 Mod Mod é é lisation des lisation des connaissances pour le connaissances pour le Web sémantique Web sémantique [email protected] [email protected] nria.fr nria.fr Alain Giboin Alain Giboin Brigitte Trousse Brigitte Trousse Knowledge is Power” Knowledge is Power”

Transcript of Modélisation des connaissances et Web sémantique 1 Modélisation des connaissances pour le Web...

Page 1: Modélisation des connaissances et Web sémantique 1 Modélisation des connaissances pour le Web sémantique Olivier.Corby@sophia.inria.fr Alain Giboin Brigitte.

Modélisation des connaissances et Web sémantique

1

ModModéélisation des connaissances lisation des connaissances pour le pour le Web sémantiqueWeb sémantique

[email protected]@sophia.inria.fr

Alain GiboinAlain Giboin

Brigitte TrousseBrigitte Trousse““Knowledge is Power”Knowledge is Power”

Page 2: Modélisation des connaissances et Web sémantique 1 Modélisation des connaissances pour le Web sémantique Olivier.Corby@sophia.inria.fr Alain Giboin Brigitte.

Modélisation des connaissances et Web sémantique

2

PLANPLAN• IntroductionIntroduction• Web sWeb séémantiquemantique

– XMLXML– OntologieOntologie– RDF, OWLRDF, OWL– Moteur de recherche sMoteur de recherche sémantique Coreseémantique Corese– ApplicationsApplications

• Aspects ergonomiques et organisationnelsAspects ergonomiques et organisationnels• Recherche d’information sur le WebRecherche d’information sur le Web

– Réutilisation de traces d'usagesRéutilisation de traces d'usages– Extraction de connaissances à partir de données, Extraction de connaissances à partir de données,

raisonnement à partir de cas raisonnement à partir de cas

Page 3: Modélisation des connaissances et Web sémantique 1 Modélisation des connaissances pour le Web sémantique Olivier.Corby@sophia.inria.fr Alain Giboin Brigitte.

Modélisation des connaissances et Web sémantique

3

Web sWeb séémantique d’entreprisemantique d’entreprise

• RENAULT : RENAULT : mémoire d’un projet véhiculemémoire d’un projet véhicule pour pour en réutiliser les solutions lors de projets ultérieursen réutiliser les solutions lors de projets ultérieurs

• Deutsche Telekom : aide à Deutsche Telekom : aide à l’insertion d’un nouvel l’insertion d’un nouvel employéemployé

• CSTB : aide à la CSTB : aide à la veille technologiqueveille technologique• IPMC : mémoire des IPMC : mémoire des expériences menées par un expériences menées par un

biologistebiologiste. . • Telecom Valley : Telecom Valley : cartographie des compcartographie des compéétences tences

inter-entreprisesinter-entreprises

Page 4: Modélisation des connaissances et Web sémantique 1 Modélisation des connaissances pour le Web sémantique Olivier.Corby@sophia.inria.fr Alain Giboin Brigitte.

Modélisation des connaissances et Web sémantique

4

Mémoire d’entrepriseMémoire d’entreprise• MatérialisationMatérialisation explicite et persistanteexplicite et persistante des des

connaissances et informations cruciales (explicites connaissances et informations cruciales (explicites

ou tacites)ou tacites) d’une organisation d’une organisation

• pour pour faciliter leurfaciliter leur accès, partage et réutilisationaccès, partage et réutilisation

par les membres de l’organisation par les membres de l’organisation

• dans leurs dans leurs tâches individuelles et collectivestâches individuelles et collectives..

Page 5: Modélisation des connaissances et Web sémantique 1 Modélisation des connaissances pour le Web sémantique Olivier.Corby@sophia.inria.fr Alain Giboin Brigitte.

Modélisation des connaissances et Web sémantique

5

Mémoire d’entrepriseMémoire d’entreprise• Les Les IndividusIndividus + l’ + l’OrganisationOrganisation + la + la

TechnologieTechnologie

Approche pluridisciplinaireApproche pluridisciplinaire

Page 6: Modélisation des connaissances et Web sémantique 1 Modélisation des connaissances pour le Web sémantique Olivier.Corby@sophia.inria.fr Alain Giboin Brigitte.

Modélisation des connaissances et Web sémantique

6

MEMOIRE D ’ENTREPRISE

Notre visionNotre vision

Ontologies Base de connaissances

Doc. électronique

BDDoc. multimédiaVeilleur /

Documentaliste

Administrateur /Gestionnaire mémoire

Auteurde doc.

Utilisateur(tâche individuelle)

Utilisateur(tâche collective)

Mon

de ex

térieu

r

(Inter

net &

Web

...)

Expert

Système de Gestion des Connaissances

Page 7: Modélisation des connaissances et Web sémantique 1 Modélisation des connaissances pour le Web sémantique Olivier.Corby@sophia.inria.fr Alain Giboin Brigitte.

Modélisation des connaissances et Web sémantique

7

IntraWeb & Mémoire d’entrepriseIntraWeb & Mémoire d’entreprise• Les technologies du WebLes technologies du Web permettent une large diffusion permettent une large diffusion

d’information.d’information.• Les Intranets ou IntraWebsLes Intranets ou IntraWebs, , basbaséés sur les techno du s sur les techno du

Web, peuvent améliorer le partage d’infos et de conn. Web, peuvent améliorer le partage d’infos et de conn. dans les entreprises.dans les entreprises.

• Besoin d’Besoin d’accéderaccéder à des pers. compétentes, de à des pers. compétentes, de retrouverretrouver des infos pertinentes dans des documents, de des infos pertinentes dans des documents, de découvrirdécouvrir des services utiles, de des services utiles, de communiquercommuniquer ou ou publier pour publier pour partager partager des conn. spécifiques ….des conn. spécifiques ….

• Analogie entre Analogie entre les ressources du Webles ressources du Web et les et les ressources ressources de la mémoire d’entreprisede la mémoire d’entreprise. .

Page 8: Modélisation des connaissances et Web sémantique 1 Modélisation des connaissances pour le Web sémantique Olivier.Corby@sophia.inria.fr Alain Giboin Brigitte.

Modélisation des connaissances et Web sémantique

8

Vers leVers le Web S Web Séémantimantiqueque• Langages pour Langages pour représenter des metadonnreprésenter des metadonnééeses (ou (ou

annotations sémantiques) : RDFannotations sémantiques) : RDF• Vers un Vers un langagelangage standard pour représenter des standard pour représenter des

ontologiesontologies: RDF Schema, OIL, DAML, : RDF Schema, OIL, DAML, DAML+OIL DAML+OIL OWLOWL

• Méthodes & outils pour construction Méthodes & outils pour construction (semi)-(semi)-automatique ou coopérativeautomatique ou coopérative des ontologies & des ontologies & des annotations: WebOde, OntoEdit, Annotea...des annotations: WebOde, OntoEdit, Annotea...

• Langages de requêtesLangages de requêtes ddéédidiéés RDF : RQL... s RDF : RQL... • Outils dédiOutils dédiéés s àà RDF RDF : CORESE, : CORESE,

ICS Forth RDFSuite, JENA, SESAME, TRIPLE ICS Forth RDFSuite, JENA, SESAME, TRIPLE

Page 9: Modélisation des connaissances et Web sémantique 1 Modélisation des connaissances pour le Web sémantique Olivier.Corby@sophia.inria.fr Alain Giboin Brigitte.

Modélisation des connaissances et Web sémantique

9

Vers leVers le Web S Web Séémantimantiqueque• Services d’inférenceServices d’inférence sur les m sur les méétadonntadonnééeses• Passage Passage àà l’échelle l’échelle & performance & performance

vs vs puissance d’expressionpuissance d’expression & puissantes capacités & puissantes capacités d’inférenced’inférence

• Le Web Sémantique vs Le Web Sémantique vs plusieurs webs plusieurs webs sémantiquessémantiques iinteropnteropéérablrableses

• Comparaison, Fusion, ou Comparaison, Fusion, ou Intégration d’ontologiesIntégration d’ontologies• Web Sémantique et Web Sémantique et Web servicesWeb services: DAML-S: DAML-S• Fouille du Web SémantiqueFouille du Web Sémantique• AgentsAgents pour recherche d’info pour recherche d’info ou fouille ou fouille

Page 10: Modélisation des connaissances et Web sémantique 1 Modélisation des connaissances pour le Web sémantique Olivier.Corby@sophia.inria.fr Alain Giboin Brigitte.

Modélisation des connaissances et Web sémantique

10

ApprocheApproche« Web sémantique d’entreprise » « Web sémantique d’entreprise »

• Mémoire d’entreprise matérialisée dans :Mémoire d’entreprise matérialisée dans :– des des ressourcesressources ( (documents documents (XML, HTML, ...) ou (XML, HTML, ...) ou logiciels logiciels ouou

matériels matériels ouou personnes personnes ou services ou services)), ,

– des des ontologiesontologies (décrivant le vocabulaire conceptuel partagé par (décrivant le vocabulaire conceptuel partagé par une communauté),une communauté),

– des des annotations sémantiquesannotations sémantiques sur ces ressources (i.e. le sur ces ressources (i.e. le contenu des documentscontenu des documents ou les ou les caractéristiques des caractéristiques des logiciels/matérielslogiciels/matériels/services/services ou les ou les compétences des compétences des personnespersonnes), en se basant sur ces ), en se basant sur ces ontologiesontologies, ,

– avec diffusion sur l’avec diffusion sur l’IntranetIntranet ou le ou le WebWeb..

Page 11: Modélisation des connaissances et Web sémantique 1 Modélisation des connaissances pour le Web sémantique Olivier.Corby@sophia.inria.fr Alain Giboin Brigitte.

Modélisation des connaissances et Web sémantique

11

Spécificités Spécificités d’un Web sd’un Web séémantique mantique d’entreprise d’entreprise / au Web Sémantique/ au Web Sémantique

• Organisation limitéeOrganisation limitée Accord plus facile sur une Accord plus facile sur une politique d’entreprisepolitique d’entreprise Ontologies & annotations plus faciles à créerOntologies & annotations plus faciles à créer Vérif. de la Vérif. de la validité & fiabilité des sources d’infovalidité & fiabilité des sources d’info plus facile plus facile ProfilsProfils utilisateursutilisateurs plus précisplus précis Echelle plus réduite Echelle plus réduite pour les corpus de documents, pour les corpus de documents, les ontologies…les ontologies…

• Mais:Mais: contraintescontraintes dede sécurité & confidentialitésécurité & confidentialité

– Besoin de Besoin de stabilitéstabilité, , compatibilité & facile compatibilité & facile intégrationintégration dans l’ dans l’environnementenvironnement interne de interne de travailtravail

Page 12: Modélisation des connaissances et Web sémantique 1 Modélisation des connaissances pour le Web sémantique Olivier.Corby@sophia.inria.fr Alain Giboin Brigitte.

Modélisation des connaissances et Web sémantique

12

Ontologies et Annotations Ontologies et Annotations

• L’ontologie permet de L’ontologie permet de capturer les aspects pertinents capturer les aspects pertinents de la signification des conceptsde la signification des concepts utilisés dans les utilisés dans les scénarios d’application.scénarios d’application.

• Ontologies et annotationsOntologies et annotations peuvent être représentées en: peuvent être représentées en:– Graphes Conceptuels Graphes Conceptuels (langage de représentation(langage de représentation

des connaissances, utilisé en IA), des connaissances, utilisé en IA), – ou ou RDF(S)RDF(S) (langage recommandé par le W3C (langage recommandé par le W3C

pour la description des ressources sur le Web)pour la description des ressources sur le Web) traducteur entre ces langagestraducteur entre ces langages

Page 13: Modélisation des connaissances et Web sémantique 1 Modélisation des connaissances pour le Web sémantique Olivier.Corby@sophia.inria.fr Alain Giboin Brigitte.

Modélisation des connaissances et Web sémantique

13

Principe d’un Web sémantique d’entreprise

<accident> <date> 19 Mai 2000 </date> <description> <facteur>le facteur d ’accident mis en cause est un problème d ambiguïté clignotant sur une nationale très fréquentée</facteur> </description></accident>

Documents (XML)

Traduction RDF -> GC

Ontologies Annotations sémantiques

Représent.

RDF Schema<rdfs:Class rdf:ID=« Facteur-Accident »><rdfs:suclassOf rdf:ressource=« http:/…></rdfs: Class><rdfs:Class rdf:ID=« Ambiguite-clignotant »><rdfs:SuClassOf rdf:ressource=« #Facteur-Accident » /></rdfs:Class>

RDF

RDF

RDF

Recherche d’info utilisant les capacités des GC

(CORESE)

Page 14: Modélisation des connaissances et Web sémantique 1 Modélisation des connaissances pour le Web sémantique Olivier.Corby@sophia.inria.fr Alain Giboin Brigitte.

Modélisation des connaissances et Web sémantique

14

Rôles possibles de l’ontologieRôles possibles de l’ontologie• Un Un composant de la mémoirecomposant de la mémoire, destiné à être , destiné à être

exploré par l’utilisateur finalexploré par l’utilisateur final• vs Une référence pour vs Une référence pour indexer/annoter indexer/annoter

sémantiquementsémantiquement la mémoire à des fins la mémoire à des fins d’amélioration de la d’amélioration de la recherche de ressources ou recherche de ressources ou d’informationd’information dans la mémoire dans la mémoire

• vs Une base pour la vs Une base pour la communication et l'échange communication et l'échange d’informationd’information entre des programmes, des entre des programmes, des agents agents logicielslogiciels

Page 15: Modélisation des connaissances et Web sémantique 1 Modélisation des connaissances pour le Web sémantique Olivier.Corby@sophia.inria.fr Alain Giboin Brigitte.

Modélisation des connaissances et Web sémantique

15

ThThèèmes de recherchemes de recherche

• Comment Comment construire et faire évoluer les ontologies construire et faire évoluer les ontologies et les annotationset les annotations ? ?

• Comment les Comment les représenterreprésenter et et raisonner raisonner dessus ?dessus ?• Comment les exploiter pour la Comment les exploiter pour la recherche recherche

d’informationd’information ou pour la ou pour la dissémination pro-active dissémination pro-active d’informationsd’informations ? ?

• Comment Comment gérer une mémoire distribuéegérer une mémoire distribuée ? ?• Comment manipuler de Comment manipuler de multiples ontologiesmultiples ontologies ou ou

des des annotations multi-annotations multi-ppooiintnts de vs de vueue ??

Page 16: Modélisation des connaissances et Web sémantique 1 Modélisation des connaissances pour le Web sémantique Olivier.Corby@sophia.inria.fr Alain Giboin Brigitte.

Modélisation des connaissances et Web sémantique

16

Projet Européen COMMA

Annotations RDF

Documents

Ontologies, modèles d ’entreprise,modèles utilisateurs (RDFS),

Système Multi-Agentsde Gestion des Connaissances

Mémoire distribuée

Utilisateur final(Nouvel employé,Veilleur…)

AuteurDocuments

Créateur d ’ontologies

Page 17: Modélisation des connaissances et Web sémantique 1 Modélisation des connaissances pour le Web sémantique Olivier.Corby@sophia.inria.fr Alain Giboin Brigitte.

Modélisation des connaissances et Web sémantique

17

Niveau spécifique

Haut niveau

Niveau médian

Ontologie O ’CoMMAOntologie O ’CoMMA

Aspects Aspects EntrepriseEntreprise

Aspects Aspects DocumentDocument

Aspects Aspects UtilisateurUtilisateur

Aspects Aspects DomaineDomaine

• Méthode: Recueil, Phase terminologique, Méthode: Recueil, Phase terminologique, Structuration, Validation, Formalisation en RDFSStructuration, Validation, Formalisation en RDFS

• Résultat: Résultat: 44770 concepts, 0 concepts, 880 relations, 10 relations, 133 niveaux de niveaux de profondeurprofondeur

Page 18: Modélisation des connaissances et Web sémantique 1 Modélisation des connaissances pour le Web sémantique Olivier.Corby@sophia.inria.fr Alain Giboin Brigitte.

Modélisation des connaissances et Web sémantique

18

CoMMA : ConclusionsCoMMA : Conclusions

• MéthodeMéthode de construction de construction de l’ontologiede l’ontologie + + Structure Structure de l’ontologie de l’ontologie

• Recherche d’infos par des Recherche d’infos par des agents guidés par des agents guidés par des ontologies et des modèlesontologies et des modèles : “agents Corese” : “agents Corese”

• Possibilité de Possibilité de distribution de la mémoire :distribution de la mémoire :distribution des distribution des annotationsannotations et distribution des et distribution des requêtesrequêtes

Page 19: Modélisation des connaissances et Web sémantique 1 Modélisation des connaissances pour le Web sémantique Olivier.Corby@sophia.inria.fr Alain Giboin Brigitte.

Modélisation des connaissances et Web sémantique

19

Mémoire de projet véhicule Mémoire de projet véhicule (RENAULT)(RENAULT)

• Objectif : Capitaliser les connaissances sur Objectif : Capitaliser les connaissances sur les les problèmes d’un projet véhiculeproblèmes d’un projet véhicule..

• Approche SAMOVAR :Approche SAMOVAR :– Exploiter un Exploiter un outil de traitement linguistiqueoutil de traitement linguistique sur les sur les

champs textuelschamps textuels du Système de Gestion de Pbs du Système de Gestion de Pbs

– Construire une Construire une ontologieontologie ((ProblèmeProblème, , PiècePièce...)...)

– AnnoterAnnoter les descriptions de pb avec cette ontologie les descriptions de pb avec cette ontologie

– Exploiter le moteur de recherche Exploiter le moteur de recherche CORESECORESE pour la rech. pour la rech. d’infosd’infos

Page 20: Modélisation des connaissances et Web sémantique 1 Modélisation des connaissances pour le Web sémantique Olivier.Corby@sophia.inria.fr Alain Giboin Brigitte.

Modélisation des connaissances et Web sémantique

20

Construction de l’Ontologie Construction de l’Ontologie ProblèmeProblème

Ontologie Pièce

Base règles heuristiques

terminol.

Champs textuels de la base SGP

Sorties Nomino UCN(A), N, ...

Extraction Nomino

Enrichiss. ontologie

Problèmes Candidats

à insérer dans l’onto Problème

Ontologie Problème

Validation

Interviews

Bootstrap de l’ontologieProblèmeInitialisation

ontologie

Page 21: Modélisation des connaissances et Web sémantique 1 Modélisation des connaissances pour le Web sémantique Olivier.Corby@sophia.inria.fr Alain Giboin Brigitte.

Modélisation des connaissances et Web sémantique

21

SAMOVAR

II

HH

MM

Organisation de SAMOVAROrganisation de SAMOVAR

Je cherche

toutes les pièces

sur lesquelles

des problèmes

de claquement

ont été observés

Ontologie RDFS

Base annotée

RDF

Moteur de

recherche

CORESE

Page 22: Modélisation des connaissances et Web sémantique 1 Modélisation des connaissances pour le Web sémantique Olivier.Corby@sophia.inria.fr Alain Giboin Brigitte.

Modélisation des connaissances et Web sémantique

22

Recherche guidée par l’ontologieRecherche guidée par l’ontologie

Zone

Poste deConduite Latéral

Climatisation InstrumentationPlanchede Bord

Climatiseur

Traverses Poste de Conduite

Vide Poche

Levier devitesse

Evacuation decondensation

Volant dedirection

Tableaude bord

ARCHITECTEARCHITECTE

G F E G F E

PIECESPIECES

Extrait de l’ontologie Pièce

Problème

Montage Géométrie

Fixation CentrageMEP

Vissage

Clipsage

Agrafage

Accostage

Chaussage

Extrait de l’ontologie Problème

Page 23: Modélisation des connaissances et Web sémantique 1 Modélisation des connaissances pour le Web sémantique Olivier.Corby@sophia.inria.fr Alain Giboin Brigitte.

Modélisation des connaissances et Web sémantique

23

SAMOVAR : ConclusionsSAMOVAR : Conclusions• Ontologie dans une véritable Ontologie dans une véritable application application

industrielleindustrielle• Méthode de construction d’une ontologie Méthode de construction d’une ontologie à à

partir de textespartir de textes : :Exploitation d’outils de TALN + Exploitation d’outils de TALN + validation humainevalidation humaine

• Méthode de construction d’une Méthode de construction d’une mémoire de mémoire de projetprojet

Page 24: Modélisation des connaissances et Web sémantique 1 Modélisation des connaissances pour le Web sémantique Olivier.Corby@sophia.inria.fr Alain Giboin Brigitte.

Modélisation des connaissances et Web sémantique

24

Projet RNRT « KMP »Projet RNRT « KMP »KMP = KMP = KKnowledge nowledge MManagement anagement PPlatformlatform• Objectifs Objectifs :: Concevoir unConcevoir un prototype prototype d’und’un ServeServeuurr WebWeb

SSéémantimantiqueque dede compcompéétencestences ppoouur r le le partparteennaaririat at inter-inter-firmfirmeses dadannss lle domaine domaine dese des t téélléécommunicationcommunicationss && Analy Analyserser lesles us usagages collecties collectifsfs dudu prototype prototypeExExeemple mple dede rereququêêtete visviséée e ::

I am seeking for an industrial partner knowing how to I am seeking for an industrial partner knowing how to design integrated circuits within the GSM field for design integrated circuits within the GSM field for cellular/mobile phone manufacturerscellular/mobile phone manufacturers

• Zone Zone :: Telecom Valley (Sophia Antipolis) Telecom Valley (Sophia Antipolis)

• Equipe mEquipe multi-disciplinaulti-disciplinaiirree• Conception centrConception centréée utilisateur et participativee utilisateur et participative

Page 25: Modélisation des connaissances et Web sémantique 1 Modélisation des connaissances pour le Web sémantique Olivier.Corby@sophia.inria.fr Alain Giboin Brigitte.

Modélisation des connaissances et Web sémantique

25

ConclusionsConclusions• Approche « Web sémantique d’entreprise » :Approche « Web sémantique d’entreprise » : recherche recherche

d’info guidée par des ontologies et des annotationsd’info guidée par des ontologies et des annotations• Comparable Comparable àà d’autres projets : d’autres projets : C-WEB, C-WEB, DECOR, DECOR,

FRODO, MESMUSES, OntoKnowledge,...FRODO, MESMUSES, OntoKnowledge,...• DiffDifféérents rrents rôôles de l’ontologieles de l’ontologie• ApplicationsApplications : accidentologie, bâtiment, automobile, : accidentologie, bâtiment, automobile,

télécommunications, santétélécommunications, santé, biologie, biologie • Scénarios :Scénarios : mémoire de projet, veille techno, cartographie mémoire de projet, veille techno, cartographie

des compétences...des compétences...• Perspectives : Perspectives : « Web sémantique inter-entreprises / « Web sémantique inter-entreprises /

inter-communautés »inter-communautés »Passage Passage àà l’ l’ééchelle + hchelle + hééttéérogrogéénnééititéé + dynamique + + dynamique + servicesservices web s web séémantiquemantique Knowledge Web Knowledge Web