Post on 25-May-2015
“Sur quelques aspects du Web sémantique”
Assises du GDR I3Nancy – 4-6 décembre 2002
Ph. Laublet (LaLICC, CNRS-Univ. Paris-Sorbonne)
Ch. Reynaud (Univ. Paris X &
L.R.I. CNRS-Univ. Paris XI & INRIA-Futurs)
J. Charlet (STIM/AP–HP, CHU Pitié-Salpêtrière)
La vision du Web sémantique
Différents langages pour décrire, exploiter et raisonner sur les contenus des ressourcesDes connaissances qui s'appuient sur des ontologies Utilisation de métadonnéesIntégration automatique d'informations provenant de sources hétérogènesUtilisation et combinaison automatique de services Web
Le Web de demain
Un immense espace d'échanges de ressources entre machines permettent à des utilisateurs d'accéder à de grands volumes d'informations et à des services variés (répondre à des requêtes, global computing, etc.)
http://www.lalic.paris4.sorbonne.fr/stic/
Tim Berners-Lee (W3C)
3Assises du GDR I3 - Nancy, 4-6 décembre 2002
Vers des réponses plus pertinentes
Articles de Chantal Reynaud
Les articles seront mis en ligne sur le site Web des assises ..... Exposé de CR, ...
AS2WPublication des articles acceptés se fera ...Porteurs de l'action : ..., CR, ...
JFT 2003Soumission : articles, démonstrations, .. ...Membres du CP: ... CR, ...
Revue I3.. Gestion des articles soumis ...Membres du comité de rédaction : ..,CR, ..
CR CD GDRI3
Web
Vers l'intégration de données et de services hétérogènes
Organisation d'un séjour
Web
Les langages pour le Web sémantique
Les langages du W3C
Tim Berners-Lee:“Axioms, Architecture and Aspirations”W3C all-working group plenary Meeting28 February 2001
http://www.w3.org/2001/Talks/0228-tbl/slides5-0.html
7Assises du GDR I3 - Nancy, 4-6 décembre 2002
RDF (Resource description framework)
D’abord standard de description de métadonnées (97-99)
Utilisation de graphes étiquetés orientés (RDF Model) triplets sujet - propriété - objet ou ressource - propriété - valeur (ressource ou chaîne)
Utilise les URIs (Universal Resources Identifiers) utilisables pour les pages (et parties de pages) mais aussi pour tout objet qui dispose d’un schéma URI
(documents, …)
Dispose d'une syntaxe XML et des espaces de nom XML
RDF Schema (98-2000) modèle de classes … sur RDF
8Assises du GDR I3 - Nancy, 4-6 décembre 2002
Le modèle de base de RDF
Les triplets (« statement ») une propriété d’une certaine ressource a telle valeur
http://www.lalic.paris4.sorbonne.fr/laublet/tutorielWS2002
http://www.lalic.paris4.sorbonne.fr/annuaire/p.laublet
Philippe Laublet Philippe.Laublet@paris4.sorbonne.fr
refAuteur
nome-mail
9Assises du GDR I3 - Nancy, 4-6 décembre 2002
La syntaxe de base XML de RDF
<?xml version="1.0"?>
<rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#" xmlns:s="http:// www.lalic.paris4.sorbonne.fr/schema">
<rdf:Description about="http://www.lalic.paris4.sorbonne.fr/laublet/tutorielWS2002" >
<s:refAuteur resource="http://www.lalic.paris4.sorbonne.fr/annuaire/p.laublet" />
</rdf:Description>
<rdf:Description about ="http://www.lalic.paris4.sorbonne.fr/annuaire/p.laublet" > <s:nom>Philippe Laublet> </s:nom>
<s:e-mail>Philippe.Laublet@paris4.sorbonne.fr> </s:e-mail> </rdf:Description>
</rdf:RDF>
Des syntaxes abrégées existent dans certains cas
10Assises du GDR I3 - Nancy, 4-6 décembre 2002
Ex. Métadonnées avec le Dublin Core
<html><head><title>Résultat de la recherche Logique sur Doc ’CISMeF</title><meta name=DC.Creator contentéquipe CISMeF : Stéfan Darmoni, Magaly
Douyère, Jean-Philippe Leroy, Josette Piot, Benoit Thirion ; cismef@chu-rouen.fr>
<meta name=DC.Format scheme=IMT content=text/html><meta name=DC.Language scheme=RFC1766 content=fr><meta name=DC.Publisher content=Rouen University Hospital ; Centre
hospitalier universitaire de Rouen ><meta name=DC.Rights content=Copyright CHU de Rouen. Toute utilisation
partielle ou totale de ce document doit mentionner la source><link rel=schema.RFC1766 href='http://www.ietf.org/rfc/rfc1766.txt'>
<link rel='StyleSheet' href='/stylesheetreq.css' type='text/css'></head><body class=doccismefgeneral><…>
http://doccismef.chu-rouen.fr/
11Assises du GDR I3 - Nancy, 4-6 décembre 2002
RDF Schema
À chaque domaine applicatif peut être associé un schéma identifié par un préfixe particulier et correspondant à une URI Un schéma définit les termes qui seront utilisés par les
descriptions RDF
RDF(S) propose des constructeurs très généraux permettant de construire ces schémas spécialisés Ensemble de déclarations de classes et de propriétés
contraintes par les classes Peut être défini par raffinement du schéma du noyau RDFS Les données instances sont ensuite décrites en utilisant ce
nouveau vocabulaire
Représentation d'ontologies simples Pas de capacités de raisonnement intégrées dans le modèle
12Assises du GDR I3 - Nancy, 4-6 décembre 2002 http://www.topicmaps.org/
Les Topic Maps
Paradigme remonte à 1993Développé dans un cadre documentaireDonne naissance à la norme XTM 1.0 en février 2001
Contient les sujets (topics) dont les ressources « parlent », et les relations (associations) entre ces sujetsLes associations peuvent être elles-même des topicsLe scope, une notion de contexte
Un formalisme pour : index, table des matières, thésaurus, glossaire… réseaux sémantiquesPas de hiérarchies
13Assises du GDR I3 - Nancy, 4-6 décembre 2002
Ex. de Topic map (1)
“Certification SUN”
“Certification FAFIEC”
Label
“Programmer en Java”
“développer en java pour le Web”
Projet
“Enterprise Java Beans”
Projet WEB
Projet IHM
Stage
Interface Homme MachineInterface Personne Machine
Document audiooccurrence
Page Web Site Web
occurrence occurrence
Subject Indicator
Développer en Java Pour
le Web Enterprise Java Beans
Formation Programme de Certification
www.orgaform.comwww.orgaform.com www.sun.fr/formation/certifications/index.html
www.orgaform.com/demo
WWW
Guide Certification
FAFIEC
PSI
WWW
D’après J. Caussanel, M. Zacklad et al.
14Assises du GDR I3 - Nancy, 4-6 décembre 2002
Ex. de Topic map (2)
“Enterprise Java Beans”
“Programmer en Java”
“développer en java pour le
Web”
“Certification SUN”
“Certification FAFIEC”
Développer en Java Pour
le Web Enterprise Java Beans
www.sun.fr/partenaire/certifications/index.html
www.sun.fr/formation/certifications/index.htm
StageLabel
Certification d’organisme
scope1
Cursus certifié avec pré-requis
Certificat du stage
occurrence
Nom : Certification d’organisme
Occurrences :
Rôles : certificat du stagewww.sun.fr/partenaires/certifications/index.html
Certification SUN (scope1)
www.sun.fr/formation/certifications/index.html
Certification SUN (scope1)
Nom : Certification développeur
Occurrences :
Rôles : certificat du stage
occurrence
Organisme “Orgaform”
Qualification de personnescope2
agrément
Certifie
WWW
D’après J. Caussanel, M. Zacklad et al.
Ontologies
16Assises du GDR I3 - Nancy, 4-6 décembre 2002
OWL = DAML + OIL ?
Standardiser les moyens de définir des ontologies qui peuvent être utilisées sur le Web
À partir de RDF Schema classes, propriétés, relations de sous-classes et de sous-
propriétés
Étendre ces constructions pour permettre des relations plus complexes entre entités
Découle de nombreux travaux en KR : frames et surtout les logiques de description
XML RDF RDFS DAML+OIL : langage de représentation d’ontologies
http://www.daml.orghttp://www.ontoknowledge.org/oil/
17Assises du GDR I3 - Nancy, 4-6 décembre 2002
Quels choix pour l'OWL ?
Quel niveau de complexité est nécessaire ? complexité algorithmique des mécanismes d'inférences complexité technique pour les constructeurs d'outils complexité conceptuelle pour l'utilisateur moyen
Qu'est-ce qui est vraiment utilisé pour la construction d'ontologies (Constatations) ? seulement une partie des constructions de DAML+OIL pas ou peu de raisonnement de subsomption automatique
Fonder l'OWL sur une LD pour disposer d'une sémantique formelle nécessaire pour vérifier la consistance des ontologies nécessité ou non de mécanismes inférentiels ?
Réduction de la complexité conceptuelle réduction des nombreuses constructions du langage DAML-
OIL ?
18Assises du GDR I3 - Nancy, 4-6 décembre 2002
Les ontologies : différents besoins
Vocabulaire conceptuel pour étiqueter ou indexer des documents
Publier et échanger de l'information type base de données
Intégration semi-automatique d'information entre agents logiciels...
Ontologies de petite taille disponibles partout versus grandes ontologies
Les deux rôles des ontologies
Définir / fournir une sémantique formelle pour l’information permettant son exploitation par un ordinateur
Définir / fournir une sémantique d'un domaine du monde réel fondée sur un consensus et permettant de lier le contenu exploitable par la machine avec sa signification pour les humains
Savoir-faire et outils nécessaires pour les ontologies
Construire des ontologies À partir de corpus (outils de TAL), dans des domaines s’y
prêtant bien, avec des méthodologies qui demandent encore à être affinées
À la recherche d’une certaine réutilisabilité ou généricité (le haut d’une ontologie ? – SUO)
Gérer l’évolution, la fusion des ontologies
Assurer l’interopérabilité syntaxique via les langages
Gérer l’accès aux ontologies En liant thésaurus et ontologies (thésaurus sémantique,
serveur de terminologie en médecine) Avec des outils de navigation / visualisation
Assurer l’interopérabilité sémantiquehttp://www.suo.orghttp://www.biomath.jussieu.fr/TIA
Métadonnées &annotations
Méta-données et annotations
W3C Semantic Web Activity Marja-Riita Koivunen and Eric Miller, Nov. 2001
Le Web aujourd'hui Le Web Sémantique
23Assises du GDR I3 - Nancy, 4-6 décembre 2002
Exemple : le système Annotea (W3C)
Ressources annotées sémantiquementSystème d’annotation collaboratifServeurs d’annotations sous forme de métadonnéesClient HTTP capable d’interagir avec ces serveurs d'interpréter ces méta-données de les utiliser pour la présentation d'informations et de
services au client
Base de futures applications revue d'articles bookmarks collaboratifs recommandations de produits ou de services …
24Assises du GDR I3 - Nancy, 4-6 décembre 2002
Métadonnées et annotations
Métadonnées : utiliser des marqueurs exploitables par les logiciels
Principalement, pour la recherche d’information
Ex : la normalisation des balises du Dublin Core, LOM (Learning Object Metadata) pour l’apprentissage
Marquage externe (Topic Maps) versus marquage interne (RDF)
Données objectives (Dublin Core) versus subjectives (annotations personnelles – points de vues différents sur une ressource)
L'intégration de sources d'informations
hétérogènes
L'intégration de sources d'information
L'approche médiation centralisée(PICSEL : http://www.lri.fr/~picsel)
Desc. domaine du cinéma
Desc. Movie
DB
plans de requêtes
…. ….….….…. …. ….Movie DB Pariscope AirFrance DegriftourLe Monde
tourismecinéma
Moteur de requêtes
Desc. Pariscop
e
Desc. domaine du tourisme
Desc. AirFranc
e
Desc. Degriftour
L'intégration de sources d'information et Web sémantique
L'approche médiation décentralisée
SI1
SI2
SI3
SI4
SI5
SIn
28Assises du GDR I3 - Nancy, 4-6 décembre 2002
Nouveaux challenges
La connexion des systèmes mis en relation
Comment trouver et définir, le plus automatiquement possible, les correspondances sémantiques entre les ontologies manipulées ?
Comment raisonner sur des correspondances entre ontologies de différentes sortes : égalité, inclusion, recouvrement ?
Services Web et Web sémantique
30Assises du GDR I3 - Nancy, 4-6 décembre 2002
Les services Web
Une application accessible sous forme électronique
Un service permet à un utilisateur, non seulement d'obtenir de l'information, mais aussi d'effectuer des changements sur l'état du monde
Infrastructure : UDDI, WSDL, SOAP
Situation actuelle Des services “simples” et prédéfinis Information destinée à être interprétée et exploitée par les humains Le rôle du programmeur prédominant
Infrastructure très utile mais insuffisante, nécessité d'automatisation
31Assises du GDR I3 - Nancy, 4-6 décembre 2002
Vers un Web sémantique pour les services
Description des services Description détaillée de l'offre Description de l'activité Interface WSDL Description du comportement Description des propriétés transactionnelles Contraintes temporelles Sécurité ...
Mécanismes de raisonnement Découverte et comparaison des offres Composition des services Qualité de service
Nécessité de tendre vers des services intelligibles pour des machines (WSMF, SWWS, DAML-S, MKBEEM)
32Assises du GDR I3 - Nancy, 4-6 décembre 2002
Conclusion (1)
Des apports réciproques
Le gros problème : le passage à l'échelle
Nécessite de gérer l'hétérogénéité des langages, des ontologies, des différents systèmes de médiation, des descriptions des ressources, ...
Quel avenir ?
WS généralisé / communautaire
Des représentations munies de sémantiques formelles et de mécanismes inférentiels puissants / semi-formelles reposant plus sur l'utilisateur pour leur exploitation opérationnelle
33Assises du GDR I3 - Nancy, 4-6 décembre 2002
Conclusion (2)
"Les usages ne précèdent pas la technologie mais la technologie autorise de nouveaux usages"
La vaste question des usages
Obstacles
La diversité et la complexité des langages proposés par le W3C
L'ajout de métadonnées n'est pas une activité naturelle !
34Assises du GDR I3 - Nancy, 4-6 décembre 2002
Des liens...
http://www.lalic.paris4.sorbonne.fr/stic/ http://www.SemanticWeb.org
http://www.w3.org/2001.sw
http://doccismef.chu-rouen.fr/
http://www.topicmaps.org/
http://www.daml.org
http://www.ontoknowledge.org/oil/
http://www.suo.org
http://www.biomath.jussieu.fr/TIA
http://www.lri.fr/~picsel