Projet ANR e-WOK_HUB ( Environmental Web Ontology Knowledge Hub)

42
Projet ANR Projet ANR e-WOK_HUB (Environmental Web Ontology Knowledge Hub) Partenaires : Partenaires : BRGM, EADS, ENSMP, IFP, INRIA, LISI/ENSMA/CRITT Colloque STIC 2007

description

Projet ANR e-WOK_HUB ( Environmental Web Ontology Knowledge Hub). Partenaires : BRGM, EADS, ENSMP, IFP, INRIA, LISI/ENSMA/CRITT Colloque STIC 2007. Projet ANR E-WoK_HUB. Objectifs scientifiques. Mettre en place un ensemble de portails communicants (les Hubs e-WOK), proposant à la fois : - PowerPoint PPT Presentation

Transcript of Projet ANR e-WOK_HUB ( Environmental Web Ontology Knowledge Hub)

Page 1: Projet ANR e-WOK_HUB ( Environmental Web Ontology Knowledge Hub)

Projet ANRProjet ANR

e-WOK_HUB (Environmental Web Ontology Knowledge Hub)

Partenaires :Partenaires : BRGM, EADS, ENSMP, IFP, INRIA,

LISI/ENSMA/CRITT

Colloque STIC 2007

Page 2: Projet ANR e-WOK_HUB ( Environmental Web Ontology Knowledge Hub)

2

Objectifs scientifiques

Projet ANR E-WoK_HUB

Mettre en place un ensemble de portails communicants (les Hubs e-WOK), proposant à la fois :

• des applications web accessibles aux utilisateurs finaux à travers des IHM en ligne

• et des services webs accessibles aux applications à travers des interfaces programmatiques

Page 3: Projet ANR e-WOK_HUB ( Environmental Web Ontology Knowledge Hub)

3

Objectifs applicatifs

Projet ANR E-WoK_HUB

• Gestion de la mémoire de plusieurs projets sur la capture et le stockage du CO2, avec exploitation des résultats de la veille technologique sur le domaine

• Intégration d’informations issues de bases différentes et de logiciels métiers

Page 4: Projet ANR e-WOK_HUB ( Environmental Web Ontology Knowledge Hub)

4

Les Hubs e-WOK

Projet ANR E-WoK_HUB

Hub e-WOK = serveur web sémantique et portail offrant un accès sémantique à des ressources documentaires, des données métiers et des services (génériques ou métiers) en utilisant des ontologies adéquatesIndexation des contenus textuels des documents et des donnéesBoîte à outils pour générer les annotations des ressources et les interfaces programmatiques des services utiles pour le domaine considéréAccès aux entités sémantiques et gestion de leur persistance•Fonctionnalités de mise en réseau des portails pour accéder les uns aux autres et mutualiser leurs ressources

•Intégration d’interfaces homme machine pour gérer les échanges entre utilisateurs et le réseau de portails

Page 5: Projet ANR e-WOK_HUB ( Environmental Web Ontology Knowledge Hub)

5

Résultats attendus du projet

Projet ANR E-WoK_HUB

Au niveau scientifique :• Éditeurs coopératifs et contextuels,• Connexion entre les standards :

– RDF(S)/OWL et EXPRESS/PLIB,– SPARQL et OntoQL

• Prise en compte de multiples points de vue dans les annotations et lors de la recherche d’information,

• Exploitation de techniques linguistiques et probabilistes pour la création / enrichissement des annotations à partir de textes,

• Prise en compte de l’influence de l’évolution de l’ontologie sur les annotations,

• Géolocalisation associée à la sémantique,• Lien entre la gestion de la mémoire de projet et les résultats de la veille

technologique.

Page 6: Projet ANR e-WOK_HUB ( Environmental Web Ontology Knowledge Hub)

6

Résultats attendus du projet

Projet ANR E-WoK_HUB

• Au niveau applicatif :– Veille technologique sur la caractérisation des sites de stockage

du CO2 – Application à d’autres domaines thématiques dans le

domaine des géosciences (risques naturels, eau souterraine…) ou dans des domaines en ingénierie nécessitant mémoire inter-projets ou veille technologique

• Au niveau exploitation :– CRITT : outils développés autour de PLIB– IFP et BRGM : exploitation des résultats

Page 7: Projet ANR e-WOK_HUB ( Environmental Web Ontology Knowledge Hub)

7

Résultats scientifiques et industrielsRésultats scientifiques et industriels

Projet ANR E-WoK_HUB

Page 8: Projet ANR e-WOK_HUB ( Environmental Web Ontology Knowledge Hub)

8

BESOINS & SPECIFICATION

LOT 1 (1/2)

MISE EN PLACE DU E-WOK_HUB

LOT 4PERSISTANCE

DES ONTOLOGIES ET DES REGLES

LOT 3

EVALUATION

LOT 1 (2/2)

OUTILS ET METHODES GENERIQUESLOT 2

Expériences& background

Applicationsexistantes

Besoins (cas d’utilisation)

Démos & analyse des résultatsOutils spécifiques

à la persistance

Outils génériquesOutils génériques

K-repository et applications

Leader BRGM

Leader EADS

Leader LISI

Leader INRIA

Leader BRGM

Besoins & Specs

Vision globale du projetProjet ANR E-WOK_HUB

Page 9: Projet ANR e-WOK_HUB ( Environmental Web Ontology Knowledge Hub)

9

une annotation automatique• Pas de charge de travail supplémentaire, succès de l’utilisation

un moteur de recherche performant une amélioration dans le principe de recherche : sémantique + géo-localisation un outil central pour la démarche de recherche élargir le périmètre des ressources actuelles (ressources du centre de

documentation) en incluant des images, des services cartographiques, services web , des références de base de données

collaboration entre organismes pour les données

l’amélioration de la connaissance une collaboration de ses agents pour parfaire la définition de la connaissance un outil de gestion des ressources, des requêtes et de leurs résultats, des

différents projets une capitalisation des démarches intellectuelles un outil d’aide dans le suivi d’un projet de consultation des référentiels de

ressources.

Use cases - Besoins

Projet ANR E-WoK_HUB Résultats industriels – Lot 1

Page 10: Projet ANR e-WOK_HUB ( Environmental Web Ontology Knowledge Hub)

10

Use cases

On porte une attention particulière aux aspects géologiques et géographiques et on l’applique sur le projet PICOREF.

• Use case amont (BRGM) :– Mémoire des projets CO2– Annotations– Edition d’ontologies– Exemples de requêtes dans le projet PICOREF

• Use case aval (IFP) :– Cas d’étude IFP

Projet ANR E-WoK_HUB Résultats industriels – Lot 1

Page 11: Projet ANR e-WOK_HUB ( Environmental Web Ontology Knowledge Hub)

11

• 1/ Retrouver les infos de localisation géographiques "globales" de chaque document.

• 2/ Retrouver les entités géologiques citées dans chaque document.• 3/ Dater les entités géologiques repérées dans les documents.• 4/ Localiser les entités géologiques repérées dans les documents • 5/ Etendre la recherche des entités géologiques aux publications

référencées dans le corpus de documents.• 6/ Extraire des documents les "sections" " segments" et "fragments"

qui décrivent les hypothèses chrono stratigraphiques associées aux entités géologiques et les présenter à l'utilisateur lors de la phase d'interprétation pour annoter ces interprétations ( Geological Knowledge Editor).

Use Case amont : à partir du corpus de documents "BRGM/PICOREF"

Projet ANR E-WoK_HUB Résultats industriels – Lot 1

Page 12: Projet ANR e-WOK_HUB ( Environmental Web Ontology Knowledge Hub)

12

Use-cases et ontologies obtenues – Exemples de questions

Projet ANR E-WoK_HUB Résultats industriels – Lot 1

Question d’opérateur: Je recherche les lignes sismiques qui ont été étudiées dans le cadre du projet PICOREF

Question d’expert: Le Callovo-Oxfordien est-il une bonne couverture ?

Question d’usager: Existe-t-il des sites potentiels de stockage de CO2 à moins de 25 km de mon usine ?

Dans un premier temps, les réponses seront fournies sous forme d’une liste de documents permettant à l’usager de répondre à la question posée.

Plus d’une centaine de questions identifiées

Page 13: Projet ANR e-WOK_HUB ( Environmental Web Ontology Knowledge Hub)

13

Use-cases et ontologies obtenues – Analyse du contenu d’un document

Projet ANR E-WoK_HUB Résultats industriels – Lot 1

On vise à mettre en œuvre une méthodologie plus performante que la recherche habituelle par mots-clés.

La méthode repose sur l’analyse du contenu de documents entiers sans définition préalable de mots-clés.

• Extraction automatique de mots ou groupes de mots signifiants (plate-forme linguistique(plate-forme linguistique, INRIA))

• Annotation Annotation des termes extraits en référence à des ontologies de domaine définies préalablement.

• Traitement statistique éventuel des termes annotés en vue de déterminer les éléments-clés du document considéré

Page 14: Projet ANR e-WOK_HUB ( Environmental Web Ontology Knowledge Hub)

14

Use-cases et ontologies obtenues

Projet ANR E-WoK_HUB Résultats industriels – Lot 1

• On part d’un corpus de textes de référence (une dizaine de documents: articles, rapports, thèse etc.) que les experts annotent à la main.

• Ce travail de départ permet de définir les diverses ontologies de domaine qui devront être construites et de leur associer une première liste de concepts et de propriétés.

• On a défini:– une ontologie des termes géographiques (INSEE, BRGM)– une ontologie de la chronologie géologique (ENSMP)– 5 ontologies relatives aux différentes sous-disciplines

géologiques à prendre en compte (ENSMP)

Page 15: Projet ANR e-WOK_HUB ( Environmental Web Ontology Knowledge Hub)

15

Use-cases et ontologies obtenues – Ontologies définies pour la géologie

Projet ANR E-WoK_HUB Résultats industriels – Lot 1

Page 16: Projet ANR e-WOK_HUB ( Environmental Web Ontology Knowledge Hub)

16

Use-cases et ontologies obtenues – Chronologie géologique

Projet ANR E-WoK_HUB Résultats industriels – Lot 1

Page 17: Projet ANR e-WOK_HUB ( Environmental Web Ontology Knowledge Hub)

17

Use Case AVAL " IFP" : Schéma simplifié

La Vue Utilisateur

Archives Numériques

(ex : fichiers RESCUE)Extraire les

données

Stockage des données

serveur IFP/BRGM

mise à jour de données

ou de connaissanc

e

geo modelisation

Création d'une

nouvelle archive

numérique

MISE A JOUR

INCOMPLETE

SYSTEMES D'INFORMATION des

COMPAGNIES

Rapports /textes /ppt Extraire la connaissance

Stockage de la connaissance

serveur e-wok_HUB

RESULTS

COMPLETED

Compléter la connaissance

Reconstitution d'une archive

numérique

EXPERTISE

du GEOLOGUE

Projet ANR E-WoK_HUB Résultats industriels – Lot 1

Page 18: Projet ANR e-WOK_HUB ( Environmental Web Ontology Knowledge Hub)

18

BESOINS & SPECIFICATION

LOT 1 (1/2)

MISE EN PLACE DU E-WOK_HUB

LOT 4PERSISTANCE

DES ONTOLOGIES ET DES REGLES

LOT 3

EVALUATION

LOT 1 (2/2)

OUTILS ET METHODES GENERIQUESLOT 2

Expériences& background

Applicationsexistantes

Besoins (cas d’utilisation)

Démos & analyse des résultatsOutils spécifiques

à la persistance

Outils génériquesOutils génériques

K-repository et applications

Leader BRGM

Leader EADS

Leader LISI

Leader INRIA

Leader BRGM

Besoins & Specs

Vision globale du projetProjet ANR E-WOK_HUB

Page 19: Projet ANR e-WOK_HUB ( Environmental Web Ontology Knowledge Hub)

19

Architecture des hubs : Approche de conception

• Les tâches des utilisateurs d’e_Wok_Hub sont organisées en projets

• Les connaissances « métier » constituent des ressources pour les projets

• Les partenaires « techniques » fournissent des services qui exploitent les ressources disponibles et produisent de nouvelles ressources

• Les applications opérationnelles sont construites par composition de services

• Les portails e-Wok donnent accès aux ressources et aux services disponibles pour conduire les projets

⇒ ARCHITECTURE ORIENTEE SERVICES

Projet ANR E-WoK_HUB Résultats scientifiques – Lot 4

Page 20: Projet ANR e-WOK_HUB ( Environmental Web Ontology Knowledge Hub)

20

Architecture proposée

Applications

Distribution et messaging

Génériques Spécifiques

PortailInterface utilisateur

données sémantiquesdocuments

Conception de Work-Flow

Orchestration

Services "Métier"

Monitoring Configuration administration

Supervision

Sécurité

Web Service

•XML

•WSDL

•WS-BPEL

•SOAP

SPARQL

OWL/RDFS

RDF

PLIB Services Techniques

données techniques

Analyse linguistique

eWok Client

Éditeur d’ontologies

Annotation Sémantique Formatage de

données

Persistance d’ontologies

ESB Petals

Projet ANR E-WoK_HUB Résultats scientifiques – Lot 4

Page 21: Projet ANR e-WOK_HUB ( Environmental Web Ontology Knowledge Hub)

21

Architecture des hubs : l’infrastructure d’intégration

Projet ANR E-WoK_HUB Résultats scientifiques – Lot 4

ESB = infrastructure conçue pour exposer, accéder, orchestrer, administrer les services

Enterprise Service Bus

WebServices

Publication/Abonnement

Échange de fichiers

Messagerieasynchrone

XMLACORD PostgreSQL

Oracle

RPCsynchrone

112

23

4567

8910

11

Plates-formes hétérogènes Multiples langages de

programmation

Modèles et Formats de données

disparates

Word/ExcelPDF ODT

HTMLtxt

⇒ Évaluation des ESB disponibles en open source : Petals

Orchestrationde services

Page 22: Projet ANR e-WOK_HUB ( Environmental Web Ontology Knowledge Hub)

22

Réseau de Hubs

Projet ANR E-WoK_HUB Résultats scientifiques – Lot 4

ESB ESB

ESB

Réseau e-WokHub 1 Hub 2

Hub 3

Page 23: Projet ANR e-WOK_HUB ( Environmental Web Ontology Knowledge Hub)

23

BESOINS & SPECIFICATION

LOT 1 (1/2)

MISE EN PLACE DU E-WOK_HUB

LOT 4PERSISTANCE

DES ONTOLOGIES ET DES REGLES

LOT 3

EVALUATION

LOT 1 (2/2)

OUTILS ET METHODES GENERIQUESLOT 2

Expériences& background

Applicationsexistantes

Besoins (cas d’utilisation)

Démos & analyse des résultatsOutils spécifiques

à la persistance

Outils génériquesOutils génériques

K-repository et applications

Leader BRGM

Leader EADS

Leader LISI

Leader INRIA

Leader BRGM

Besoins & Specs

Vision globale du projetProjet ANR E-WOK_HUB

Page 24: Projet ANR e-WOK_HUB ( Environmental Web Ontology Knowledge Hub)

24

Rapport sur les services pour les ontologies

• Editeur contextuel et collaboratif ECCO• Approche d’analyse de corpus et de techniques

linguistiques• Spécifications de techniques d’enrichissement

sémantique semi-automatique à partir de textes en reposant sur la « kernelisation » de champs aléatoires conditionnels

• Techniques basées sur des règles de détection d’incohérence et restauration de cohérence pour traiter l’influence de l’évolution d’ontologies

• Transformation entre le modèle d’ontologies RDF(S) / OWL Lite et le modèle PLIB

Projet ANR E-WoK_HUB Résultats scientifiques – Lot 2

Page 25: Projet ANR e-WOK_HUB ( Environmental Web Ontology Knowledge Hub)

25

Service d’ontologies – ECCO

Projet ANR E-WoK_HUB Résultats scientifiques – Lot 2

ECCO (Editeur Collaboratif et Contextuel d’Ontologies)

Méthodologie:

suivre les phases de conception d’une ontologie

•À partir de l’extraction de termes dans des sources de données

•…

• Jusqu’à l’édition fine de l’ontologie

Page 26: Projet ANR e-WOK_HUB ( Environmental Web Ontology Knowledge Hub)

26

Service d’ontologies – ECCO (2)

Projet ANR E-WoK_HUB Résultats scientifiques – Lot 2

ECCO (Editeur Collaboratif et Contextuel d’Ontologies)

Extraction collaborative de termes : chaque utilisateur visualise ses propres termes + ceux extraits par les autres utilisateurs.

Extraction contextuelle: le contexte du terme extrait est attaché à celui-ci.

Page 27: Projet ANR e-WOK_HUB ( Environmental Web Ontology Knowledge Hub)

27

Service d’ontologies – ECCO (3)

Projet ANR E-WoK_HUB Résultats scientifiques – Lot 2

ECCO (Editeur Collaboratif et Contextuel d’Ontologies)

(Méta) annotation des termes : représenter le statut de chacun des termes.

Page 28: Projet ANR e-WOK_HUB ( Environmental Web Ontology Knowledge Hub)

28

Service d’ontologies – ECCO (4)

Projet ANR E-WoK_HUB Résultats scientifiques – Lot 2

ECCO (Editeur Collaboratif et Contextuel d’Ontologies)

(Méta) annotation des termes : permettre aux utilisateurs d’avoir un historique des discussions sur un terme donné.

Page 29: Projet ANR e-WOK_HUB ( Environmental Web Ontology Knowledge Hub)

29

Service d’ontologies – ECCO (6)

Projet ANR E-WoK_HUB Résultats scientifiques – Lot 2

ECCO (Editeur Collaboratif et Contextuel d’Ontologies)

Technos utilisées: J2EE / Web 2.0 / Web sémantique

Dépendances:

pour les aspects web sémantique : • Corese• Semtags

pour les aspects web :• JSTL (Java Standard Tag Lib)

pour les aspects graphiques:• Yahoo UI, Extjs (future version)

Page 30: Projet ANR e-WOK_HUB ( Environmental Web Ontology Knowledge Hub)

30

• Processus d’évolution– Avec trace d’évolution des ontologies

Service d’ontologies – Evolution des ontologies

Projet ANR E-WoK_HUB Résultats scientifiques – Lot 2

ontologie O1Représentation des

changementsdans trace (O1, O2)

trace (O1, O2)

ontologie O2

Base d’annotations

concernée

Application des Stratégies d’évolution

Base d’annotations

mise à jour

ontologie O1Détection des annotations

inconsistantesRègles de détection

ontologie O2

Base d’annotations

concernée

Correction des annotationsinconsistantes

Règles de correction

Base d’annotations

mise à jour

Gestion des annotations inconsistantes après évolution de l’ontologie.

Approche suivie:

– Sans trace d’évolution des ontologies

Page 31: Projet ANR e-WOK_HUB ( Environmental Web Ontology Knowledge Hub)

31

Service d’ontologies – Evolution des ontologies (3)

Projet ANR E-WoK_HUB Résultats scientifiques – Lot 2

1er cas : Evolution des ontologies avec traces existantes

Générateur de traces d’évolution: ECCO

Résolution à l’aide des stratégies: COSWEM

Page 32: Projet ANR e-WOK_HUB ( Environmental Web Ontology Knowledge Hub)

32

BESOINS & SPECIFICATION

LOT 1 (1/2)

MISE EN PLACE DU E-WOK_HUB

LOT 4PERSISTANCE

DES ONTOLOGIES ET DES REGLES

LOT 3

EVALUATION

LOT 1 (2/2)

OUTILS ET METHODES GENERIQUESLOT 2

Expériences& background

Applicationsexistantes

Besoins (cas d’utilisation)

Démos & analyse des résultatsOutils spécifiques

à la persistance

Outils génériquesOutils génériques

K-repository et applications

Leader BRGM

Leader EADS

Leader LISI

Leader INRIA

Leader BRGM

Besoins & Specs

Vision globale du projetProjet ANR E-WOK_HUB

Page 33: Projet ANR e-WOK_HUB ( Environmental Web Ontology Knowledge Hub)

33

• Proposition d’un modèle de persistance autour de la plate-forme OntoDB

• Modélisation d’ontologies de domaine

• Connexion à l’architecture E-Wok-HUB

Service de persistance – Introduction

Projet ANR E-WoK_HUB Résultats scientifiques – Lot 3

Page 34: Projet ANR e-WOK_HUB ( Environmental Web Ontology Knowledge Hub)

34

• ONTODB• Base de données à base ontologique pour PLIB

» Structure de persistance pour les ontologies et leurs instances

» Extension d’une classe = une relation (une vue)

Modèle de persistance (1)

Projet ANR E-WoK_HUB Résultats scientifiques – Lot 3

Ontology

Meta-Schema System Catalog

Logical model

Page 35: Projet ANR e-WOK_HUB ( Environmental Web Ontology Knowledge Hub)

35

– ONTODB pour E-Wok-Hub• Extension proposées

» Représentation des données, ontologies et raisonnements spatiaux

» Prise en compte des modèles, langages et formats du web sémantique

» Représentation XML des données natives de ONTODB (OntoML)

• Mise en œuvre » Définition d’un noyau commun des langages et des modèles

d’ontologies» Expressions d’équivalences : vues et opérateurs de logique

de description» Caractéristiques de symétrie, inverse, contraintes, etc...

Modèle de persistance (2)

Projet ANR E-WoK_HUB Résultats scientifiques – Lot 3

Page 36: Projet ANR e-WOK_HUB ( Environmental Web Ontology Knowledge Hub)

36

– Construction de nouvelles ontologies et de bases de données à base ontologique

– Représentation des données spatiales– Validation avec ONTODB– EarthModel, GeoTimeScale, Petrographer

– Indexation de bases de données existantes– Rétro-conception de bases de données– Approche d’annotation sémantique de bases de données

existantes» Application aux données fournies par le BRGM avec

prise en compte de données géographiques

Service de persistance – Modélisation à base ontologique

Projet ANR E-WoK_HUB Résultats scientifiques – Lot 3

Page 37: Projet ANR e-WOK_HUB ( Environmental Web Ontology Knowledge Hub)

37

• Connexion au Hub– Utilisation de SPARQL comme langage d’accès à la BDBO

» Interprétateur OntoQL– Spécification des modules d’import/export ONTOML/RDF-S

Service de persistance – Intégration dans l ’architecture E-Wok-Hub

Projet ANR E-WoK_HUB Résultats scientifiques – Lot 3

Ontologie RDF-S

SPARQL OntoQLOntology

Meta-Schema System Catalog

Logical model

Page 38: Projet ANR e-WOK_HUB ( Environmental Web Ontology Knowledge Hub)

38

Travail en cours : Prototype

Projet ANR E-WoK_HUB Plan de travail

1er prototype sur le scénario 1 établi par IFP-BRGM

format e-wok.doc, .pdf Filtrage sur la langue

Processus d’annotation géographiqueProcessus d’annotation géographique

linguistique

SIG

KCRF géométriqueXML

Phase 2: consultation

Phase 1: annotation

Page 39: Projet ANR e-WOK_HUB ( Environmental Web Ontology Knowledge Hub)

39

• Scénario opérationnel et annotation manuelle du corpus (ENSMP)

• Socle technique (EADS)• Services métiers

– Acquisition de documents Ewok Hub (IFP)– Analyse linguistiques (INRIA)– Annotation géographique par apprentissage

(EADS)– Annotation toponymique et géométrique (IFP,

BRGM, INRIA)– Stockage & Indexation dans un entrepôt

sémantique (LISI)• Interfaces Homme-Machine (BRGM):

– E-Wok Client

Prototype : Recherche sur critères géographiques

Projet ANR E-WoK_HUB Plan de travail

Page 40: Projet ANR e-WOK_HUB ( Environmental Web Ontology Knowledge Hub)

40

Prototype : EWC - Ewok Client

Projet ANR E-WoK_HUB Plan de travail

Techno: Web 2.0

Page 41: Projet ANR e-WOK_HUB ( Environmental Web Ontology Knowledge Hub)

41

Prototype : EWC - Ewok Client

Projet ANR E-WoK_HUB Plan de travail

Page 42: Projet ANR e-WOK_HUB ( Environmental Web Ontology Knowledge Hub)

42

Prototype : Recherche sur critères géographiques

Projet ANR E-WoK_HUB Plan de travail

E-WOK_HUB : projet pluridisciplinaire informatique et géosciences

http://www-sop.inria.fr/edelweiss/projects/ewok

Questions?