03 Web Semantique

34
“Sur quelques aspects du Web sémantique” Assises du GDR I3 Nancy – 4-6 décembre 2002 Ph. Laublet (LaLICC, CNRS-Univ. Paris-Sorbonne) Ch. Reynaud (Univ. Paris X & L.R.I. CNRS-Univ. Paris XI & INRIA-Futurs) J. Charlet (STIM/AP–HP, CHU Pitié-Salpêtrière)

Transcript of 03 Web Semantique

Page 1: 03  Web Semantique

“Sur quelques aspects du Web sémantique”

Assises du GDR I3Nancy – 4-6 décembre 2002

Ph. Laublet (LaLICC, CNRS-Univ. Paris-Sorbonne)

Ch. Reynaud (Univ. Paris X &

L.R.I. CNRS-Univ. Paris XI & INRIA-Futurs)

J. Charlet (STIM/AP–HP, CHU Pitié-Salpêtrière)

Page 2: 03  Web Semantique

La vision du Web sémantique

Différents langages pour décrire, exploiter et raisonner sur les contenus des ressourcesDes connaissances qui s'appuient sur des ontologies Utilisation de métadonnéesIntégration automatique d'informations provenant de sources hétérogènesUtilisation et combinaison automatique de services Web

Le Web de demain

Un immense espace d'échanges de ressources entre machines permettent à des utilisateurs d'accéder à de grands volumes d'informations et à des services variés (répondre à des requêtes, global computing, etc.)

http://www.lalic.paris4.sorbonne.fr/stic/

Tim Berners-Lee (W3C)

Page 3: 03  Web Semantique

3Assises du GDR I3 - Nancy, 4-6 décembre 2002

Vers des réponses plus pertinentes

Articles de Chantal Reynaud

Les articles seront mis en ligne sur le site Web des assises ..... Exposé de CR, ...

AS2WPublication des articles acceptés se fera ...Porteurs de l'action : ..., CR, ...

JFT 2003Soumission : articles, démonstrations, .. ...Membres du CP: ... CR, ...

Revue I3.. Gestion des articles soumis ...Membres du comité de rédaction : ..,CR, ..

CR CD GDRI3

Web

Page 4: 03  Web Semantique

Vers l'intégration de données et de services hétérogènes

Organisation d'un séjour

Web

Page 5: 03  Web Semantique

Les langages pour le Web sémantique

Page 6: 03  Web Semantique

Les langages du W3C

Tim Berners-Lee:“Axioms, Architecture and Aspirations”W3C all-working group plenary Meeting28 February 2001

http://www.w3.org/2001/Talks/0228-tbl/slides5-0.html

Page 7: 03  Web Semantique

7Assises du GDR I3 - Nancy, 4-6 décembre 2002

RDF (Resource description framework)

D’abord standard de description de métadonnées (97-99)

Utilisation de graphes étiquetés orientés (RDF Model) triplets sujet - propriété - objet ou ressource - propriété - valeur (ressource ou chaîne)

Utilise les URIs (Universal Resources Identifiers) utilisables pour les pages (et parties de pages) mais aussi pour tout objet qui dispose d’un schéma URI

(documents, …)

Dispose d'une syntaxe XML et des espaces de nom XML

RDF Schema (98-2000) modèle de classes … sur RDF

Page 8: 03  Web Semantique

8Assises du GDR I3 - Nancy, 4-6 décembre 2002

Le modèle de base de RDF

Les triplets (« statement ») une propriété d’une certaine ressource a telle valeur

http://www.lalic.paris4.sorbonne.fr/laublet/tutorielWS2002

http://www.lalic.paris4.sorbonne.fr/annuaire/p.laublet

Philippe Laublet [email protected]

refAuteur

nome-mail

Page 9: 03  Web Semantique

9Assises du GDR I3 - Nancy, 4-6 décembre 2002

La syntaxe de base XML de RDF

<?xml version="1.0"?>

<rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#" xmlns:s="http:// www.lalic.paris4.sorbonne.fr/schema">

<rdf:Description about="http://www.lalic.paris4.sorbonne.fr/laublet/tutorielWS2002" >

<s:refAuteur resource="http://www.lalic.paris4.sorbonne.fr/annuaire/p.laublet" />

</rdf:Description>

<rdf:Description about ="http://www.lalic.paris4.sorbonne.fr/annuaire/p.laublet" > <s:nom>Philippe Laublet> </s:nom>

<s:e-mail>[email protected]> </s:e-mail> </rdf:Description>

</rdf:RDF>

Des syntaxes abrégées existent dans certains cas

Page 10: 03  Web Semantique

10Assises du GDR I3 - Nancy, 4-6 décembre 2002

Ex. Métadonnées avec le Dublin Core

<html><head><title>Résultat de la recherche Logique sur Doc ’CISMeF</title><meta name=DC.Creator contentéquipe CISMeF : Stéfan Darmoni, Magaly

Douyère, Jean-Philippe Leroy, Josette Piot, Benoit Thirion ; [email protected]>

<meta name=DC.Format scheme=IMT content=text/html><meta name=DC.Language scheme=RFC1766 content=fr><meta name=DC.Publisher content=Rouen University Hospital ; Centre

hospitalier universitaire de Rouen ><meta name=DC.Rights content=Copyright CHU de Rouen. Toute utilisation

partielle ou totale de ce document doit mentionner la source><link rel=schema.RFC1766 href='http://www.ietf.org/rfc/rfc1766.txt'>

<link rel='StyleSheet' href='/stylesheetreq.css' type='text/css'></head><body class=doccismefgeneral><…>

http://doccismef.chu-rouen.fr/

Page 11: 03  Web Semantique

11Assises du GDR I3 - Nancy, 4-6 décembre 2002

RDF Schema

À chaque domaine applicatif peut être associé un schéma identifié par un préfixe particulier et correspondant à une URI Un schéma définit les termes qui seront utilisés par les

descriptions RDF

RDF(S) propose des constructeurs très généraux permettant de construire ces schémas spécialisés Ensemble de déclarations de classes et de propriétés

contraintes par les classes Peut être défini par raffinement du schéma du noyau RDFS Les données instances sont ensuite décrites en utilisant ce

nouveau vocabulaire

Représentation d'ontologies simples Pas de capacités de raisonnement intégrées dans le modèle

Page 12: 03  Web Semantique

12Assises du GDR I3 - Nancy, 4-6 décembre 2002 http://www.topicmaps.org/

Les Topic Maps

Paradigme remonte à 1993Développé dans un cadre documentaireDonne naissance à la norme XTM 1.0 en février 2001

Contient les sujets (topics) dont les ressources « parlent », et les relations (associations) entre ces sujetsLes associations peuvent être elles-même des topicsLe scope, une notion de contexte

Un formalisme pour : index, table des matières, thésaurus, glossaire… réseaux sémantiquesPas de hiérarchies

Page 13: 03  Web Semantique

13Assises du GDR I3 - Nancy, 4-6 décembre 2002

Ex. de Topic map (1)

“Certification SUN”

“Certification FAFIEC”

Label

“Programmer en Java”

“développer en java pour le Web”

Projet

“Enterprise Java Beans”

Projet WEB

Projet IHM

Stage

Interface Homme MachineInterface Personne Machine

Document audiooccurrence

Page Web Site Web

occurrence occurrence

Subject Indicator

Développer en Java Pour

le Web Enterprise Java Beans

Formation Programme de Certification

www.orgaform.comwww.orgaform.com www.sun.fr/formation/certifications/index.html

www.orgaform.com/demo

WWW

Guide Certification

FAFIEC

PSI

WWW

D’après J. Caussanel, M. Zacklad et al.

Page 14: 03  Web Semantique

14Assises du GDR I3 - Nancy, 4-6 décembre 2002

Ex. de Topic map (2)

“Enterprise Java Beans”

“Programmer en Java”

“développer en java pour le

Web”

“Certification SUN”

“Certification FAFIEC”

Développer en Java Pour

le Web Enterprise Java Beans

www.sun.fr/partenaire/certifications/index.html

www.sun.fr/formation/certifications/index.htm

StageLabel

Certification d’organisme

scope1

Cursus certifié avec pré-requis

Certificat du stage

occurrence

Nom : Certification d’organisme

Occurrences :

Rôles : certificat du stagewww.sun.fr/partenaires/certifications/index.html

Certification SUN (scope1)

www.sun.fr/formation/certifications/index.html

Certification SUN (scope1)

Nom : Certification développeur

Occurrences :

Rôles : certificat du stage

occurrence

Organisme “Orgaform”

Qualification de personnescope2

agrément

Certifie

WWW

D’après J. Caussanel, M. Zacklad et al.

Page 15: 03  Web Semantique

Ontologies

Page 16: 03  Web Semantique

16Assises du GDR I3 - Nancy, 4-6 décembre 2002

OWL = DAML + OIL ?

Standardiser les moyens de définir des ontologies qui peuvent être utilisées sur le Web

À partir de RDF Schema classes, propriétés, relations de sous-classes et de sous-

propriétés

Étendre ces constructions pour permettre des relations plus complexes entre entités

Découle de nombreux travaux en KR : frames et surtout les logiques de description

XML RDF RDFS DAML+OIL : langage de représentation d’ontologies

http://www.daml.orghttp://www.ontoknowledge.org/oil/

Page 17: 03  Web Semantique

17Assises du GDR I3 - Nancy, 4-6 décembre 2002

Quels choix pour l'OWL ?

Quel niveau de complexité est nécessaire ? complexité algorithmique des mécanismes d'inférences complexité technique pour les constructeurs d'outils complexité conceptuelle pour l'utilisateur moyen

Qu'est-ce qui est vraiment utilisé pour la construction d'ontologies (Constatations) ? seulement une partie des constructions de DAML+OIL pas ou peu de raisonnement de subsomption automatique

Fonder l'OWL sur une LD pour disposer d'une sémantique formelle nécessaire pour vérifier la consistance des ontologies nécessité ou non de mécanismes inférentiels ?

Réduction de la complexité conceptuelle réduction des nombreuses constructions du langage DAML-

OIL ?

Page 18: 03  Web Semantique

18Assises du GDR I3 - Nancy, 4-6 décembre 2002

Les ontologies : différents besoins

Vocabulaire conceptuel pour étiqueter ou indexer des documents

Publier et échanger de l'information type base de données

Intégration semi-automatique d'information entre agents logiciels...

Ontologies de petite taille disponibles partout versus grandes ontologies

Page 19: 03  Web Semantique

Les deux rôles des ontologies

Définir / fournir une sémantique formelle pour l’information permettant son exploitation par un ordinateur

Définir / fournir une sémantique d'un domaine du monde réel fondée sur un consensus et permettant de lier le contenu exploitable par la machine avec sa signification pour les humains

Page 20: 03  Web Semantique

Savoir-faire et outils nécessaires pour les ontologies

Construire des ontologies À partir de corpus (outils de TAL), dans des domaines s’y

prêtant bien, avec des méthodologies qui demandent encore à être affinées

À la recherche d’une certaine réutilisabilité ou généricité (le haut d’une ontologie ? – SUO)

Gérer l’évolution, la fusion des ontologies

Assurer l’interopérabilité syntaxique via les langages

Gérer l’accès aux ontologies En liant thésaurus et ontologies (thésaurus sémantique,

serveur de terminologie en médecine) Avec des outils de navigation / visualisation

Assurer l’interopérabilité sémantiquehttp://www.suo.orghttp://www.biomath.jussieu.fr/TIA

Page 21: 03  Web Semantique

Métadonnées &annotations

Page 22: 03  Web Semantique

Méta-données et annotations

W3C Semantic Web Activity Marja-Riita Koivunen and Eric Miller, Nov. 2001

Le Web aujourd'hui Le Web Sémantique

Page 23: 03  Web Semantique

23Assises du GDR I3 - Nancy, 4-6 décembre 2002

Exemple : le système Annotea (W3C)

Ressources annotées sémantiquementSystème d’annotation collaboratifServeurs d’annotations sous forme de métadonnéesClient HTTP capable d’interagir avec ces serveurs d'interpréter ces méta-données de les utiliser pour la présentation d'informations et de

services au client

Base de futures applications revue d'articles bookmarks collaboratifs recommandations de produits ou de services …

Page 24: 03  Web Semantique

24Assises du GDR I3 - Nancy, 4-6 décembre 2002

Métadonnées et annotations

Métadonnées : utiliser des marqueurs exploitables par les logiciels

Principalement, pour la recherche d’information

Ex : la normalisation des balises du Dublin Core, LOM (Learning Object Metadata) pour l’apprentissage

Marquage externe (Topic Maps) versus marquage interne (RDF)

Données objectives (Dublin Core) versus subjectives (annotations personnelles – points de vues différents sur une ressource)

Page 25: 03  Web Semantique

L'intégration de sources d'informations

hétérogènes

Page 26: 03  Web Semantique

L'intégration de sources d'information

L'approche médiation centralisée(PICSEL : http://www.lri.fr/~picsel)

Desc. domaine du cinéma

Desc. Movie

DB

plans de requêtes

…. ….….….…. …. ….Movie DB Pariscope AirFrance DegriftourLe Monde

tourismecinéma

Moteur de requêtes

Desc. Pariscop

e

Desc. domaine du tourisme

Desc. AirFranc

e

Desc. Degriftour

Page 28: 03  Web Semantique

28Assises du GDR I3 - Nancy, 4-6 décembre 2002

Nouveaux challenges

La connexion des systèmes mis en relation

Comment trouver et définir, le plus automatiquement possible, les correspondances sémantiques entre les ontologies manipulées ?

Comment raisonner sur des correspondances entre ontologies de différentes sortes : égalité, inclusion, recouvrement ?

Page 29: 03  Web Semantique

Services Web et Web sémantique

Page 30: 03  Web Semantique

30Assises du GDR I3 - Nancy, 4-6 décembre 2002

Les services Web

Une application accessible sous forme électronique

Un service permet à un utilisateur, non seulement d'obtenir de l'information, mais aussi d'effectuer des changements sur l'état du monde

Infrastructure : UDDI, WSDL, SOAP

Situation actuelle Des services “simples” et prédéfinis Information destinée à être interprétée et exploitée par les humains Le rôle du programmeur prédominant

Infrastructure très utile mais insuffisante, nécessité d'automatisation

Page 31: 03  Web Semantique

31Assises du GDR I3 - Nancy, 4-6 décembre 2002

Vers un Web sémantique pour les services

Description des services Description détaillée de l'offre Description de l'activité Interface WSDL Description du comportement Description des propriétés transactionnelles Contraintes temporelles Sécurité ...

Mécanismes de raisonnement Découverte et comparaison des offres Composition des services Qualité de service

Nécessité de tendre vers des services intelligibles pour des machines (WSMF, SWWS, DAML-S, MKBEEM)

Page 32: 03  Web Semantique

32Assises du GDR I3 - Nancy, 4-6 décembre 2002

Conclusion (1)

Des apports réciproques

Le gros problème : le passage à l'échelle

Nécessite de gérer l'hétérogénéité des langages, des ontologies, des différents systèmes de médiation, des descriptions des ressources, ...

Quel avenir ?

WS généralisé / communautaire

Des représentations munies de sémantiques formelles et de mécanismes inférentiels puissants / semi-formelles reposant plus sur l'utilisateur pour leur exploitation opérationnelle

Page 33: 03  Web Semantique

33Assises du GDR I3 - Nancy, 4-6 décembre 2002

Conclusion (2)

"Les usages ne précèdent pas la technologie mais la technologie autorise de nouveaux usages"

La vaste question des usages

Obstacles

La diversité et la complexité des langages proposés par le W3C

L'ajout de métadonnées n'est pas une activité naturelle !

Page 34: 03  Web Semantique

34Assises du GDR I3 - Nancy, 4-6 décembre 2002

Des liens...

http://www.lalic.paris4.sorbonne.fr/stic/ http://www.SemanticWeb.org

http://www.w3.org/2001.sw

http://doccismef.chu-rouen.fr/

http://www.topicmaps.org/

http://www.daml.org

http://www.ontoknowledge.org/oil/

http://www.suo.org

http://www.biomath.jussieu.fr/TIA

http://www.lri.fr/~picsel