Post on 03-Apr-2015
Modélisation des connaissances et Web sémantique
1
ModModéélisation des connaissances lisation des connaissances pour le pour le Web sémantiqueWeb sémantique
Olivier.Corby@sophia.inria.frOlivier.Corby@sophia.inria.fr
Alain GiboinAlain Giboin
Brigitte TrousseBrigitte Trousse““Knowledge is Power”Knowledge is Power”
Modélisation des connaissances et Web sémantique
2
PLANPLAN• IntroductionIntroduction• Web sWeb séémantiquemantique
– XMLXML– OntologieOntologie– RDF, OWLRDF, OWL– Moteur de recherche sMoteur de recherche sémantique Coreseémantique Corese– ApplicationsApplications
• Aspects ergonomiques et organisationnelsAspects ergonomiques et organisationnels• Recherche d’information sur le WebRecherche d’information sur le Web
– Réutilisation de traces d'usagesRéutilisation de traces d'usages– Extraction de connaissances à partir de données, Extraction de connaissances à partir de données,
raisonnement à partir de cas raisonnement à partir de cas
Modélisation des connaissances et Web sémantique
3
Web sWeb séémantique d’entreprisemantique d’entreprise
• RENAULT : RENAULT : mémoire d’un projet véhiculemémoire d’un projet véhicule pour pour en réutiliser les solutions lors de projets ultérieursen réutiliser les solutions lors de projets ultérieurs
• Deutsche Telekom : aide à Deutsche Telekom : aide à l’insertion d’un nouvel l’insertion d’un nouvel employéemployé
• CSTB : aide à la CSTB : aide à la veille technologiqueveille technologique• IPMC : mémoire des IPMC : mémoire des expériences menées par un expériences menées par un
biologistebiologiste. . • Telecom Valley : Telecom Valley : cartographie des compcartographie des compéétences tences
inter-entreprisesinter-entreprises
Modélisation des connaissances et Web sémantique
4
Mémoire d’entrepriseMémoire d’entreprise• MatérialisationMatérialisation explicite et persistanteexplicite et persistante des des
connaissances et informations cruciales (explicites connaissances et informations cruciales (explicites
ou tacites)ou tacites) d’une organisation d’une organisation
• pour pour faciliter leurfaciliter leur accès, partage et réutilisationaccès, partage et réutilisation
par les membres de l’organisation par les membres de l’organisation
• dans leurs dans leurs tâches individuelles et collectivestâches individuelles et collectives..
Modélisation des connaissances et Web sémantique
5
Mémoire d’entrepriseMémoire d’entreprise• Les Les IndividusIndividus + l’ + l’OrganisationOrganisation + la + la
TechnologieTechnologie
Approche pluridisciplinaireApproche pluridisciplinaire
Modélisation des connaissances et Web sémantique
6
MEMOIRE D ’ENTREPRISE
Notre visionNotre vision
Ontologies Base de connaissances
Doc. électronique
BDDoc. multimédiaVeilleur /
Documentaliste
Administrateur /Gestionnaire mémoire
Auteurde doc.
Utilisateur(tâche individuelle)
Utilisateur(tâche collective)
Mon
de ex
térieu
r
(Inter
net &
Web
...)
Expert
Système de Gestion des Connaissances
Modélisation des connaissances et Web sémantique
7
IntraWeb & Mémoire d’entrepriseIntraWeb & Mémoire d’entreprise• Les technologies du WebLes technologies du Web permettent une large diffusion permettent une large diffusion
d’information.d’information.• Les Intranets ou IntraWebsLes Intranets ou IntraWebs, , basbaséés sur les techno du s sur les techno du
Web, peuvent améliorer le partage d’infos et de conn. Web, peuvent améliorer le partage d’infos et de conn. dans les entreprises.dans les entreprises.
• Besoin d’Besoin d’accéderaccéder à des pers. compétentes, de à des pers. compétentes, de retrouverretrouver des infos pertinentes dans des documents, de des infos pertinentes dans des documents, de découvrirdécouvrir des services utiles, de des services utiles, de communiquercommuniquer ou ou publier pour publier pour partager partager des conn. spécifiques ….des conn. spécifiques ….
• Analogie entre Analogie entre les ressources du Webles ressources du Web et les et les ressources ressources de la mémoire d’entreprisede la mémoire d’entreprise. .
Modélisation des connaissances et Web sémantique
8
Vers leVers le Web S Web Séémantimantiqueque• Langages pour Langages pour représenter des metadonnreprésenter des metadonnééeses (ou (ou
annotations sémantiques) : RDFannotations sémantiques) : RDF• Vers un Vers un langagelangage standard pour représenter des standard pour représenter des
ontologiesontologies: RDF Schema, OIL, DAML, : RDF Schema, OIL, DAML, DAML+OIL DAML+OIL OWLOWL
• Méthodes & outils pour construction Méthodes & outils pour construction (semi)-(semi)-automatique ou coopérativeautomatique ou coopérative des ontologies & des ontologies & des annotations: WebOde, OntoEdit, Annotea...des annotations: WebOde, OntoEdit, Annotea...
• Langages de requêtesLangages de requêtes ddéédidiéés RDF : RQL... s RDF : RQL... • Outils dédiOutils dédiéés s àà RDF RDF : CORESE, : CORESE,
ICS Forth RDFSuite, JENA, SESAME, TRIPLE ICS Forth RDFSuite, JENA, SESAME, TRIPLE
Modélisation des connaissances et Web sémantique
9
Vers leVers le Web S Web Séémantimantiqueque• Services d’inférenceServices d’inférence sur les m sur les méétadonntadonnééeses• Passage Passage àà l’échelle l’échelle & performance & performance
vs vs puissance d’expressionpuissance d’expression & puissantes capacités & puissantes capacités d’inférenced’inférence
• Le Web Sémantique vs Le Web Sémantique vs plusieurs webs plusieurs webs sémantiquessémantiques iinteropnteropéérablrableses
• Comparaison, Fusion, ou Comparaison, Fusion, ou Intégration d’ontologiesIntégration d’ontologies• Web Sémantique et Web Sémantique et Web servicesWeb services: DAML-S: DAML-S• Fouille du Web SémantiqueFouille du Web Sémantique• AgentsAgents pour recherche d’info pour recherche d’info ou fouille ou fouille
Modélisation des connaissances et Web sémantique
10
ApprocheApproche« Web sémantique d’entreprise » « Web sémantique d’entreprise »
• Mémoire d’entreprise matérialisée dans :Mémoire d’entreprise matérialisée dans :– des des ressourcesressources ( (documents documents (XML, HTML, ...) ou (XML, HTML, ...) ou logiciels logiciels ouou
matériels matériels ouou personnes personnes ou services ou services)), ,
– des des ontologiesontologies (décrivant le vocabulaire conceptuel partagé par (décrivant le vocabulaire conceptuel partagé par une communauté),une communauté),
– des des annotations sémantiquesannotations sémantiques sur ces ressources (i.e. le sur ces ressources (i.e. le contenu des documentscontenu des documents ou les ou les caractéristiques des caractéristiques des logiciels/matérielslogiciels/matériels/services/services ou les ou les compétences des compétences des personnespersonnes), en se basant sur ces ), en se basant sur ces ontologiesontologies, ,
– avec diffusion sur l’avec diffusion sur l’IntranetIntranet ou le ou le WebWeb..
Modélisation des connaissances et Web sémantique
11
Spécificités Spécificités d’un Web sd’un Web séémantique mantique d’entreprise d’entreprise / au Web Sémantique/ au Web Sémantique
• Organisation limitéeOrganisation limitée Accord plus facile sur une Accord plus facile sur une politique d’entreprisepolitique d’entreprise Ontologies & annotations plus faciles à créerOntologies & annotations plus faciles à créer Vérif. de la Vérif. de la validité & fiabilité des sources d’infovalidité & fiabilité des sources d’info plus facile plus facile ProfilsProfils utilisateursutilisateurs plus précisplus précis Echelle plus réduite Echelle plus réduite pour les corpus de documents, pour les corpus de documents, les ontologies…les ontologies…
• Mais:Mais: contraintescontraintes dede sécurité & confidentialitésécurité & confidentialité
– Besoin de Besoin de stabilitéstabilité, , compatibilité & facile compatibilité & facile intégrationintégration dans l’ dans l’environnementenvironnement interne de interne de travailtravail
Modélisation des connaissances et Web sémantique
12
Ontologies et Annotations Ontologies et Annotations
• L’ontologie permet de L’ontologie permet de capturer les aspects pertinents capturer les aspects pertinents de la signification des conceptsde la signification des concepts utilisés dans les utilisés dans les scénarios d’application.scénarios d’application.
• Ontologies et annotationsOntologies et annotations peuvent être représentées en: peuvent être représentées en:– Graphes Conceptuels Graphes Conceptuels (langage de représentation(langage de représentation
des connaissances, utilisé en IA), des connaissances, utilisé en IA), – ou ou RDF(S)RDF(S) (langage recommandé par le W3C (langage recommandé par le W3C
pour la description des ressources sur le Web)pour la description des ressources sur le Web) traducteur entre ces langagestraducteur entre ces langages
Modélisation des connaissances et Web sémantique
13
Principe d’un Web sémantique d’entreprise
<accident> <date> 19 Mai 2000 </date> <description> <facteur>le facteur d ’accident mis en cause est un problème d ambiguïté clignotant sur une nationale très fréquentée</facteur> </description></accident>
Documents (XML)
Traduction RDF -> GC
Ontologies Annotations sémantiques
Représent.
RDF Schema<rdfs:Class rdf:ID=« Facteur-Accident »><rdfs:suclassOf rdf:ressource=« http:/…></rdfs: Class><rdfs:Class rdf:ID=« Ambiguite-clignotant »><rdfs:SuClassOf rdf:ressource=« #Facteur-Accident » /></rdfs:Class>
RDF
RDF
RDF
Recherche d’info utilisant les capacités des GC
(CORESE)
Modélisation des connaissances et Web sémantique
14
Rôles possibles de l’ontologieRôles possibles de l’ontologie• Un Un composant de la mémoirecomposant de la mémoire, destiné à être , destiné à être
exploré par l’utilisateur finalexploré par l’utilisateur final• vs Une référence pour vs Une référence pour indexer/annoter indexer/annoter
sémantiquementsémantiquement la mémoire à des fins la mémoire à des fins d’amélioration de la d’amélioration de la recherche de ressources ou recherche de ressources ou d’informationd’information dans la mémoire dans la mémoire
• vs Une base pour la vs Une base pour la communication et l'échange communication et l'échange d’informationd’information entre des programmes, des entre des programmes, des agents agents logicielslogiciels
Modélisation des connaissances et Web sémantique
15
ThThèèmes de recherchemes de recherche
• Comment Comment construire et faire évoluer les ontologies construire et faire évoluer les ontologies et les annotationset les annotations ? ?
• Comment les Comment les représenterreprésenter et et raisonner raisonner dessus ?dessus ?• Comment les exploiter pour la Comment les exploiter pour la recherche recherche
d’informationd’information ou pour la ou pour la dissémination pro-active dissémination pro-active d’informationsd’informations ? ?
• Comment Comment gérer une mémoire distribuéegérer une mémoire distribuée ? ?• Comment manipuler de Comment manipuler de multiples ontologiesmultiples ontologies ou ou
des des annotations multi-annotations multi-ppooiintnts de vs de vueue ??
Modélisation des connaissances et Web sémantique
16
Projet Européen COMMA
Annotations RDF
Documents
Ontologies, modèles d ’entreprise,modèles utilisateurs (RDFS),
Système Multi-Agentsde Gestion des Connaissances
Mémoire distribuée
Utilisateur final(Nouvel employé,Veilleur…)
AuteurDocuments
Créateur d ’ontologies
Modélisation des connaissances et Web sémantique
17
Niveau spécifique
Haut niveau
Niveau médian
Ontologie O ’CoMMAOntologie O ’CoMMA
Aspects Aspects EntrepriseEntreprise
Aspects Aspects DocumentDocument
Aspects Aspects UtilisateurUtilisateur
Aspects Aspects DomaineDomaine
• Méthode: Recueil, Phase terminologique, Méthode: Recueil, Phase terminologique, Structuration, Validation, Formalisation en RDFSStructuration, Validation, Formalisation en RDFS
• Résultat: Résultat: 44770 concepts, 0 concepts, 880 relations, 10 relations, 133 niveaux de niveaux de profondeurprofondeur
Modélisation des connaissances et Web sémantique
18
CoMMA : ConclusionsCoMMA : Conclusions
• MéthodeMéthode de construction de construction de l’ontologiede l’ontologie + + Structure Structure de l’ontologie de l’ontologie
• Recherche d’infos par des Recherche d’infos par des agents guidés par des agents guidés par des ontologies et des modèlesontologies et des modèles : “agents Corese” : “agents Corese”
• Possibilité de Possibilité de distribution de la mémoire :distribution de la mémoire :distribution des distribution des annotationsannotations et distribution des et distribution des requêtesrequêtes
Modélisation des connaissances et Web sémantique
19
Mémoire de projet véhicule Mémoire de projet véhicule (RENAULT)(RENAULT)
• Objectif : Capitaliser les connaissances sur Objectif : Capitaliser les connaissances sur les les problèmes d’un projet véhiculeproblèmes d’un projet véhicule..
• Approche SAMOVAR :Approche SAMOVAR :– Exploiter un Exploiter un outil de traitement linguistiqueoutil de traitement linguistique sur les sur les
champs textuelschamps textuels du Système de Gestion de Pbs du Système de Gestion de Pbs
– Construire une Construire une ontologieontologie ((ProblèmeProblème, , PiècePièce...)...)
– AnnoterAnnoter les descriptions de pb avec cette ontologie les descriptions de pb avec cette ontologie
– Exploiter le moteur de recherche Exploiter le moteur de recherche CORESECORESE pour la rech. pour la rech. d’infosd’infos
Modélisation des connaissances et Web sémantique
20
Construction de l’Ontologie Construction de l’Ontologie ProblèmeProblème
Ontologie Pièce
Base règles heuristiques
terminol.
Champs textuels de la base SGP
Sorties Nomino UCN(A), N, ...
Extraction Nomino
Enrichiss. ontologie
Problèmes Candidats
à insérer dans l’onto Problème
Ontologie Problème
Validation
Interviews
Bootstrap de l’ontologieProblèmeInitialisation
ontologie
Modélisation des connaissances et Web sémantique
21
SAMOVAR
II
HH
MM
Organisation de SAMOVAROrganisation de SAMOVAR
Je cherche
toutes les pièces
sur lesquelles
des problèmes
de claquement
ont été observés
Ontologie RDFS
Base annotée
RDF
Moteur de
recherche
CORESE
Modélisation des connaissances et Web sémantique
22
Recherche guidée par l’ontologieRecherche guidée par l’ontologie
Zone
Poste deConduite Latéral
Climatisation InstrumentationPlanchede Bord
Climatiseur
Traverses Poste de Conduite
Vide Poche
Levier devitesse
Evacuation decondensation
Volant dedirection
Tableaude bord
ARCHITECTEARCHITECTE
G F E G F E
PIECESPIECES
Extrait de l’ontologie Pièce
Problème
Montage Géométrie
Fixation CentrageMEP
Vissage
Clipsage
Agrafage
Accostage
Chaussage
Extrait de l’ontologie Problème
Modélisation des connaissances et Web sémantique
23
SAMOVAR : ConclusionsSAMOVAR : Conclusions• Ontologie dans une véritable Ontologie dans une véritable application application
industrielleindustrielle• Méthode de construction d’une ontologie Méthode de construction d’une ontologie à à
partir de textespartir de textes : :Exploitation d’outils de TALN + Exploitation d’outils de TALN + validation humainevalidation humaine
• Méthode de construction d’une Méthode de construction d’une mémoire de mémoire de projetprojet
Modélisation des connaissances et Web sémantique
24
Projet RNRT « KMP »Projet RNRT « KMP »KMP = KMP = KKnowledge nowledge MManagement anagement PPlatformlatform• Objectifs Objectifs :: Concevoir unConcevoir un prototype prototype d’und’un ServeServeuurr WebWeb
SSéémantimantiqueque dede compcompéétencestences ppoouur r le le partparteennaaririat at inter-inter-firmfirmeses dadannss lle domaine domaine dese des t téélléécommunicationcommunicationss && Analy Analyserser lesles us usagages collecties collectifsfs dudu prototype prototypeExExeemple mple dede rereququêêtete visviséée e ::
I am seeking for an industrial partner knowing how to I am seeking for an industrial partner knowing how to design integrated circuits within the GSM field for design integrated circuits within the GSM field for cellular/mobile phone manufacturerscellular/mobile phone manufacturers
• Zone Zone :: Telecom Valley (Sophia Antipolis) Telecom Valley (Sophia Antipolis)
• Equipe mEquipe multi-disciplinaulti-disciplinaiirree• Conception centrConception centréée utilisateur et participativee utilisateur et participative
Modélisation des connaissances et Web sémantique
25
ConclusionsConclusions• Approche « Web sémantique d’entreprise » :Approche « Web sémantique d’entreprise » : recherche recherche
d’info guidée par des ontologies et des annotationsd’info guidée par des ontologies et des annotations• Comparable Comparable àà d’autres projets : d’autres projets : C-WEB, C-WEB, DECOR, DECOR,
FRODO, MESMUSES, OntoKnowledge,...FRODO, MESMUSES, OntoKnowledge,...• DiffDifféérents rrents rôôles de l’ontologieles de l’ontologie• ApplicationsApplications : accidentologie, bâtiment, automobile, : accidentologie, bâtiment, automobile,
télécommunications, santétélécommunications, santé, biologie, biologie • Scénarios :Scénarios : mémoire de projet, veille techno, cartographie mémoire de projet, veille techno, cartographie
des compétences...des compétences...• Perspectives : Perspectives : « Web sémantique inter-entreprises / « Web sémantique inter-entreprises /
inter-communautés »inter-communautés »Passage Passage àà l’ l’ééchelle + hchelle + hééttéérogrogéénnééititéé + dynamique + + dynamique + servicesservices web s web séémantiquemantique Knowledge Web Knowledge Web