Une plateforme ouverte et flexible pour l'exploitation des

37
Une plateforme ouverte et flexible Une plateforme ouverte et flexible pour l'exploitation des contenus pour l'exploitation des contenus http://www.webcontent-project.org http://www.webcontent-project.org Gaël de Chalendar Gaël de Chalendar CEA LIST / LIC2M CEA LIST / LIC2M Fontenay-aux-Roses - France Fontenay-aux-Roses - France

Transcript of Une plateforme ouverte et flexible pour l'exploitation des

Une plateforme ouverte et flexible Une plateforme ouverte et flexible pour l'exploitation des contenuspour l'exploitation des contenus

http://www.webcontent-project.orghttp://www.webcontent-project.org

Gaël de ChalendarGaël de Chalendar

CEA LIST / LIC2MCEA LIST / LIC2M

Fontenay-aux-Roses - FranceFontenay-aux-Roses - France

22

Objectifs du ProjetObjectifs du Projet

Fournir à partir d'une plateforme centrale : Modules Technologiques dédiés au traitement et au stockage des

contenus multimédia Outils et tutoriels pour l‘intégration et la construction d'applications

Identifier et intégrer des modules existants, mais « épars »

Développer et intégrer certains modules allant au-delà de l’Etat de l’Art:

TAL MultilingueGestion de gros volumes de données en P2PEnrichissement Sémantique (automatique ou semi-automatique)Déploiement de services Web

Proposer la plateforme à d’autres partenaires et d’autres projets Français ou Européens

33

Problèmes et BesoinsProblèmes et Besoins

Les données accessibles sontLes données accessibles sontPrincipalement non-structurées (80% de l’information disponible)Principalement non-structurées (80% de l’information disponible)Hétérogènes dans leurs contenus et leurs formatsHétérogènes dans leurs contenus et leurs formatsToujours plus nombreuses et volumineusesToujours plus nombreuses et volumineuses

Leur utilisation implique des difficultés fonctionnelles pour leurLeur utilisation implique des difficultés fonctionnelles pour leur

Collecte, Acquisition, Collecte, Acquisition,

Stockage, Indexation,Stockage, Indexation,Transformation, Normalisation,Transformation, Normalisation,Description, Annotation, Description, Annotation, Visualisation, Présentation,Visualisation, Présentation,Structuration, Ordonnancement,Structuration, Ordonnancement,Dissémination, Partage,Dissémination, Partage,……

44

PartenairesPartenaires

AcadémiquesCEA LISTINRA Mét@riskINRIA - GEMOINRIA - MostrareINRIA - InSituINRIA - ExmoLIP6PriSMLIGLIMSI-CNRSGrimmPSY.CO

IndustrielsEADS DCSThales R&TExalead

UtilisateursADRIASoredab (Bongrain)CEA DAM

55

Aspects AbordésAspects Abordés

Gestion des DonnéesGestion des DonnéesGestion des DonnéesGestion des Données

Recherche &Recherche &PrésentationPrésentation

de l’Informationde l’Information

Gestion et Gestion et Interrogation de Interrogation de gros Volumes gros Volumes

en P2Pen P2P

Gestion et Gestion et Visualisation Visualisation Niveaux des Niveaux des

Données XML Données XML

Stockage P2PStockage P2P

Web services Web services dans les dans les

Réseaux P2PRéseaux P2P

Partage en Partage en P2P des P2P des

Ressources Ressources SémantiquesSémantiques

Acquisition & Analyse Acquisition & Analyse Acquisition & Analyse Acquisition & Analyse

ExtractionExtractiondu Contenudu Contenu

AnalyseAnalyseSemantiqueSemantique

Entités NomméesEntités Nommées

Structure desStructure desDocumentsDocuments

ConstructionConstruction,,

EnrichissemEnrichissementent& &

Alignement Alignement d’ontologiesd’ontologies

Annotation Annotation SémantiqueSémantique

Indexation Indexation Sémantique Sémantique & Requêtes & Requêtes MultilinguesMultilingues

Construction et UtilisationConstruction et UtilisationDe la PlateformeDe la Plateforme

Construction et UtilisationConstruction et UtilisationDe la PlateformeDe la Plateforme

ArchitectureArchitecturede la Plateformede la Plateforme

Construction desConstruction desApplicationsApplications

ArchitecturArchitecture e

Modulaire Modulaire & &

ExtensibleExtensible

Déploiement Déploiement & utilisation & utilisation

à Echelle à Echelle IndustrielleIndustrielle

TAL MultilingueTAL Multilingue

66

Cas d'Utilisation Cas d'Utilisation

4 Applications de « Test » :4 Applications de « Test » :

Veille économique et technologique dans l’aéronautique ↔ EADS / AIRBUS

Veille Stratégique ↔ THALES

Risques Microbiologique et chimique dans l’alimentation ↔ SOREDAB (groupe

Bongrain)

Veille événementielle (Sismique) ↔ CEA DAM

77

Approche AdoptéeApproche Adoptée

1)1) Elaboration d’une carte FonctionnelleElaboration d’une carte Fonctionnelle

2)2) Listage des modules logiciels utilisablesListage des modules logiciels utilisables

3)3) Evaluation de la couverture fonctionnelle Evaluation de la couverture fonctionnelle

4)4) Choix technologique pour intégrer/fédérer les modulesChoix technologique pour intégrer/fédérer les modules

5)5) Définition d’architecture d’intégrationDéfinition d’architecture d’intégration

6)6) Spécification des divers composants de la plateforme Spécification des divers composants de la plateforme

7)7) Codage/intégration des composantsCodage/intégration des composants

8)8) Construction des applications opérationnellesConstruction des applications opérationnelles

88

Carte FonctionnelleCarte Fonctionnelle

Semantic analysisWP 3

Semantic annotation3A

Relations extraction3B

Thematic segmentation3F

Semantic disambiguation3C

Ontologies aligning3E

Ontologies building & enrichment3D

Crawling2A

Site watch2B

Document normalization2C

Document segmentation2D

Named entities extraction2E

Structured information extraction2F

Filtering2G

Lemmatization2H

Morpho-syntactic analysis2I

Indexing4A

NLP query analysis4B

Full-text search4C

Structured data search4C

Semantic search4D

Query expansion4E

Information display4F

Summary / Synthesis4G

Classification4HClustering4I

P2P content storing & indexing5A

P2P content interrogation5B

P2P communications security5C

Information searchWP 4

Content extractionWP 2

P2PWP 5

Sources selection & Crawler

Configuration

<<service>>WebCrawler

Monitoring

<<Orchestration>>Data Processing

<<service>>Normalisation<<service>>

Language Identification

<<service>>NE extraction<<service>>

Relations extraction<<service>>

Structure extraction

<<service>>Knowledge Repository

<<service>>Full Text Search

<<service>>Semantic Search

Search

Topic subscription

Watcher

<< Orchestration >>Query recording & Exec. scheduling

<<service>>Scheduler

Portal Orchestrator Services

Exploitation

Application AirbusApplication Airbus

1010

Méthode de ConceptionMéthode de Conception

La plateforme WebContent doit offrir des La plateforme WebContent doit offrir des servicesservices permettant de construire des permettant de construire des applicationsapplications..

Les services sont offerts par des Les services sont offerts par des composantscomposants amenés par amenés par divers fournisseursdivers fournisseurs

La plateforme présente une La plateforme présente une infrastructureinfrastructure d’ d’intégrationintégration de services de services

Diverses Diverses chaînes de traitementchaînes de traitement peuvent être élabores par peuvent être élabores par composition de servicescomposition de services

Un Un portailportail donne accès à l’interface graphique des donne accès à l’interface graphique des applications et aux ressources disponiblesapplications et aux ressources disponibles

⇒ ⇒ ARCHITECTURE ARCHITECTURE

ORIENTEE SERVICEORIENTEE SERVICE(Service Oriented Architecture, SOA)(Service Oriented Architecture, SOA)

1111

Fonctionnalités des ServicesFonctionnalités des Services

Chaque service est Chaque service est Indépendant (du point de vue de l’utilisateur)Indépendant (du point de vue de l’utilisateur)

Défini par un contrat (interface + conditions Défini par un contrat (interface + conditions d’utilisation)d’utilisation)

Normalisé (spécification de l’interface)Normalisé (spécification de l’interface)

Possiblement implémenté de plusieurs manièresPossiblement implémenté de plusieurs manières

Services « Métier »:Services « Métier »: réalisent les fonctions identifiées dans la carte réalisent les fonctions identifiées dans la carte fonctionnellefonctionnelle

Services Techniques:Services Techniques: sont une base commune pour le sont une base commune pour le développement d’applicationsdéveloppement d’applications

1212

Les services « Métier » Les services « Métier » de WebContent de WebContent

Crawling<<interface>>

WebSiteWatching<<interface>>

DocumentAnalysis<<interface>>

SemanticAnnotation<<interface>>

MultilingualReformulation<<interface>>

NamedEntitiesExtraction<<interface>>

Formating<<interface>>

BusinessService<<interface>>

FreeTextQueryTranslation<<interface>>

OntologyEnrichment<<interface>>

OntologiesAlignment<<interface>>

Classification<<interface>>

Clustering<<interface>>

DocumentSegmentation<<interface>>

ThematicSegmentation<<interface>>

SemanticSearch<<interface>>

Search<<interface>>

StructuredSearch<<interface>>

ResultsReporting<<interface>>

Summarizing<<interface>>

FullTextSearch<<interface>>

FilteringSegmentation<<interface>>

Stemming<<interface>>

StructuredInformationExtraction<<interface>>

RelationsExtraction<<interface>>

Indexing<<interface>>

WordSenseDisambiguisation<<interface>>

RequestTranslation<<interface>>

1313

Implémentation des ServicesImplémentation des Services

Plusieurs implémentations d’un même service

Plusieurs services remplis par un même composant

Indexing FullTextSearch

Exalead::OneSearch<<component>>

CEA::LISA<<component>>

Thales::SEM+<<component>>

INAPG::XTAB2SML<<component>>

RelationsExtraction

1414

Bus de Services (ESB)Bus de Services (ESB)

Intégration et Intégration et réduction du couplage du couplageExposition et appel des services (médiateur entre le consommateur et le Exposition et appel des services (médiateur entre le consommateur et le fournisseur)fournisseur)Connecteurs, agrégation de services, etc.Connecteurs, agrégation de services, etc.

Distribution et routageDistribution et routageAppels de services routés vers le bon fournisseurAppels de services routés vers le bon fournisseurRoutage par tables ou dépendant du contenu XML (CBR)Routage par tables ou dépendant du contenu XML (CBR)Choix du protocole de transport (http, JMS, SMTP, etc.)Choix du protocole de transport (http, JMS, SMTP, etc.)Quality of Service (garantie de transport des messages)Quality of Service (garantie de transport des messages)

TransformationTransformationTransformation des formats de données d’une application à une autreTransformation des formats de données d’une application à une autre

Orchestration de servicesOrchestration de servicesAssemblage de services pour créer des services plus puissantsAssemblage de services pour créer des services plus puissants

Gestion technique des activitésGestion technique des activitésTraçabilité des échangesTraçabilité des échangesGestion du cycle de vie des servicesGestion du cycle de vie des servicesTraitement d’erreursTraitement d’erreurs

1515

L’ESB PEtALSL’ESB PEtALS

WS-BPEL

Component development

kit

PetALS node

Portal

PetALS node

TechnicalServices

BusinessServices

BusinessServices

BusinessServices

BusinessServices

JMS connector SOAP connector

XSLT Engine

PetALS node

Centralizedadministration

andmonitoring

Schéma EBM Websourcing

1616

Orchestration de ServicesOrchestration de Services

Pour réaliser un cas d’utilisation, divers services doivent en général être Pour réaliser un cas d’utilisation, divers services doivent en général être appelésappelés

Il faut définir le processus en spécifiant l’ordre exact d’invocation des Il faut définir le processus en spécifiant l’ordre exact d’invocation des services, les séquences, les alternatives, les itérations, etc. services, les séquences, les alternatives, les itérations, etc.

Langage BPELLangage BPEL

Orchestra (BULL/OW2)Orchestra (BULL/OW2)

Approche alternative : P2P, Chorégraphie de services (INRIA Gemo)Approche alternative : P2P, Chorégraphie de services (INRIA Gemo)

Client

Service 2

Service 1

Service 3

invoke

invoke

invoke

reply

invoke

1717

Exemple de ChaineExemple de Chaine(Prétraitement et indexation)(Prétraitement et indexation)

for each docloop

: Supervisor/Administrator

: Orchestration

: Formating

: Classification : Indexing : MultilingualReformulation

: FilteringSegmentation : Stemming : DocumentRepository

: SemanticEntityRepository

1 : defineProcess()

2 : getOntology()

3 : setOntology()

4 : setModel()

5 : runProcess()6 : getDocuments()

7 : getDocument()

8 : process()

9 : process()

10 : process()

11 : classify()

12 : process()

13 : classify()

14 : index()

15 : saveDocument()

1818

Service d’Accès aux DonnéesService d’Accès aux Données

Stockage des ressourcesDescriptions des documents (XML)

Descriptions des services (WSDL)

Annotations (RDF/XML), stockables aussi dans un entrepôt RDF dédié

Ontologies (RDFS-OWL/XML)

Documents dans leurs formats natifs

Interrogation en XQueryInterface Web Service

Implémentations Standard et P2P (INRIA Gemo)

Implémentation d’un entrepôt XML

Search<<interface>>

+search(req: Query): ResourceCollection

DocumentRepository<<interface>>

+saveResource(res: Resource): URI+storeResourceContent(uri: URI, content: Bynary)+getResource(id: URI): Resource+loadResourceContent(uri: URI): Bynary

XML Repository<<component>>

1919

Accès aux servicesAccès aux services

Les interfaces graphiques des applications WebContent sont Les interfaces graphiques des applications WebContent sont préférentiellement réalisées à l’aide d’un portail Web préférentiellement réalisées à l’aide d’un portail Web

Organise et contrôle les composants IHM (portlets)Organise et contrôle les composants IHM (portlets)Présente les données d’une manière organisée et unifiéePrésente les données d’une manière organisée et unifiéeOffre un accès unique à toutes les ressources disponiblesOffre un accès unique à toutes les ressources disponiblesContrôle les accès et gère les utilisateursContrôle les accès et gère les utilisateursPermet de personnaliser les espaces de travails selonPermet de personnaliser les espaces de travails selon

Les applications Les applications Les profils utilisateursLes profils utilisateurs

2020

Technical architectureTechnical architecture

Messaging & Distribution

X<<component>>

Y<<component>>

A<<component>>

Orchestration Engine

B<<component>>

External Businessapplication

Portal Business Process Design

Technical Management

Security & QoS

XML Repository

Technical Service A Technical Service BBusiness Service X Business Service Y

2121

Interopérabilité des ServicesInteropérabilité des Services

Pour être utilisés facilement dans une Pour être utilisés facilement dans une orchestration, les services doivent orchestration, les services doivent être être interopérablesinteropérables::

TechniquementTechniquementNormalisation des protocolesNormalisation des protocolesNormalisation des formats de donnéesNormalisation des formats de donnéesNormalisation des interfacesNormalisation des interfaces

SémantiquementSémantiquementNormalisation des concepts et des relations Normalisation des concepts et des relations caractérisant les données échangéescaractérisant les données échangéesNormalisation des références sémantiques utiliséesNormalisation des références sémantiques utilisées

2222

Description d’unDescription d’unContrat de ServiceContrat de Service

DescriptionDescription:: Service mission & responsibilitiesService mission & responsibilities

CatégorieCatégorie:: Reference(s) to the fonctional mapReference(s) to the fonctional map

Interface offerteInterface offerte::

Description de chaque opération …Description de chaque opération …

Exemple:Exemple:

processprocess

description:description: Detects the named entities in the input media unit...Detects the named entities in the input media unit.....

input:input: media unit in the pivot format. media unit in the pivot format.

output:output: media unit in which are defined text fragments for the extracted entities...media unit in which are defined text fragments for the extracted entities...

pre-condition:pre-condition: the input media unit is in the exchange format. the input media unit is in the exchange format.

post-condition:post-condition: none none

Ressources utiliséesRessources utilisées:: données de configuration, paramètres, etc.données de configuration, paramètres, etc.

Autres besoinsAutres besoins:: performances, limites de qualité, etc.performances, limites de qualité, etc.

Implémentation:Implémentation: identification des composants offrant le serviceidentification des composants offrant le service

NamedEntitiesExtraction<<interface>>

+setDictionnary(dico: Ontology)

BusinessService<<interface>>

DocumentAnalysis<<interface>>

+process(doc: DocumentElement): DocumentElement

2323

Traduction des Traduction des Spécifications UMLSpécifications UML

model

service::Analyzer

+process(doc: DocumentElement): DocumentElement

model::DocumentElement

model::Resource

Analyzer<<wsdl_portType>>

+process(doc: DocumentElement): DocumentElement

DocumentElement<<xs:complexType>>

+uri: String

implementation

import

implementation

Produit du WSDL et du XSDProduit du WSDL et du XSD

2424

Interopérabilité SémantiqueInteropérabilité Sémantique

Pour assurer l’interopérabilité des services, il n’est pas Pour assurer l’interopérabilité des services, il n’est pas suffisant de normaliser les protocoles et les interfacessuffisant de normaliser les protocoles et les interfaces

Il faut aussi définir l’organisation et la sémantique des Il faut aussi définir l’organisation et la sémantique des données échangéesdonnées échangées

Modèle d’échange de donnéesModèle d’échange de données

Chaque document WebContent peut être décrit par ce modèleChaque document WebContent peut être décrit par ce modèle

Chaque document source est « placé en cache permanent » et reste Chaque document source est « placé en cache permanent » et reste accessibleaccessible

Le modèle est formalisé en UML (diagramme de classes) pour aider la Le modèle est formalisé en UML (diagramme de classes) pour aider la transcription des concepts vers un langage de programmationtranscription des concepts vers un langage de programmation

2525

Fonctionnalités Nécessaires Fonctionnalités Nécessaires pour le Modèlepour le Modèle

Le modèle doit permettre de définirLe modèle doit permettre de définir

Une référence commune pour tous les utilisateurUne référence commune pour tous les utilisateur

Le contenu des messages échangés entre les servicesLe contenu des messages échangés entre les services

Un format pivot fondé sur XMLUn format pivot fondé sur XML

Le modèle doit fournir des mécanismes pourLe modèle doit fournir des mécanismes pour

identifier chaque documentidentifier chaque document

annoter globalement un document non-structuréannoter globalement un document non-structuré

identifier les éléments extrais des contenusidentifier les éléments extrais des contenus

annoter chaque élément extrait annoter chaque élément extrait

annoter les autres ressources dans la plateformeannoter les autres ressources dans la plateforme

Le Modèle d’Echange WebContentLe Modèle d’Echange WebContent

Resource

+uri: URI

MediaUnit

Service

+interface: WSDL

Document

ComposedUnit

+synchronised: boolean

1

1..*

Text

<<optional>>+content: String

Segment

1

*

VideoAudio Image

Ontology

+data: OWL-RDFS/XML

Query

ResourceCollection *

BinaryMediaUnit

<<optional>>+content: Binary

HumanResource

Annotation

+data: RDF/XML

0..*

LinearSegment

+start: int+end: int

Table Line*

Cell

*

SpatialSegment

+shape: ShapeType

Coordinate

+x: int+y: int

1..*LowLevelDescripto

r+key: String

TemporalSegment

+start: int+end: int

BinaryContent

+data: Binary

TextContent

+data: String

Content

+offset: int+size: int 1

UsageContext

0..*

Attribute

+name: String+value: String

ComposedQuery

+booleanOperator: {AND,OR,NOT}

1..*

UniversalQuery0..*

SimilarityQuery

1

0..*

SemanticQuery

+request: SPARQL

StructuredQuery

+request: XQuery

FullTextQuery

+request: String0..*

Feature

+key: String1..*

La RessourceLa Ressource

Resource

+uri: URI

MediaUnit

Service

+interface: WSDL

Document

ComposedUnit

+synchronised: boolean

1

1..*

Text

<<optional>>+content: String

Segment

1

*

VideoAudio Image

Ontology

+data: OWL-RDFS/XML

Query

ResourceCollection *

BinaryMediaUnit

<<optional>>+content: Binary

HumanResource

Annotation

+data: RDF/XML

0..*

LinearSegment

+start: int+end: int

Table Line*

Cell

*

SpatialSegment

+shape: ShapeType

Coordinate

+x: int+y: int

1..*LowLevelDescripto

r+key: String

TemporalSegment

+start: int+end: int

BinaryContent

+data: Binary

TextContent

+data: String

Content

+offset: int+size: int 1

UsageContext

0..*

Attribute

+name: String+value: String

ComposedQuery

+booleanOperator: {AND,OR,NOT}

1..*

UniversalQuery0..*

SimilarityQuery

1

0..*

SemanticQuery

+request: SPARQL

StructuredQuery

+request: XQuery

FullTextQuery

+request: String0..*

Feature

+key: String1..*

Structure de DocumentStructure de Document

Resource

+uri: URI

MediaUnit

Service

+interface: WSDL

Document

ComposedUnit

+synchronised: boolean

1

1..*

Text

<<optional>>+content: String

Segment

1

*

VideoAudio Image

Ontology

+data: OWL-RDFS/XML

Query

ResourceCollection *

BinaryMediaUnit

<<optional>>+content: Binary

HumanResource

Annotation

+data: RDF/XML

0..*

LinearSegment

+start: int+end: int

Table Line*

Cell

*

SpatialSegment

+shape: ShapeType

Coordinate

+x: int+y: int

1..*LowLevelDescripto

r+key: String

TemporalSegment

+start: int+end: int

BinaryContent

+data: Binary

TextContent

+data: String

Content

+offset: int+size: int 1

UsageContext

0..*

Attribute

+name: String+value: String

ComposedQuery

+booleanOperator: {AND,OR,NOT}

1..*

UniversalQuery0..*

SimilarityQuery

1

0..*

SemanticQuery

+request: SPARQL

StructuredQuery

+request: XQuery

FullTextQuery

+request: String0..*

Feature

+key: String1..*

AnnotationsAnnotations

Resource

+uri: URI

MediaUnit

Service

+interface: WSDL

Document

ComposedUnit

+synchronised: boolean

1

1..*

Text

<<optional>>+content: String

Segment

1

*

VideoAudio Image

Ontology

+data: OWL-RDFS/XML

Query

ResourceCollection *

BinaryMediaUnit

<<optional>>+content: Binary

HumanResource

Annotation

+data: RDF/XML

0..*

LinearSegment

+start: int+end: int

Table Line*

Cell

*

SpatialSegment

+shape: ShapeType

Coordinate

+x: int+y: int

1..*LowLevelDescripto

r+key: String

TemporalSegment

+start: int+end: int

BinaryContent

+data: Binary

TextContent

+data: String

Content

+offset: int+size: int 1

UsageContext

0..*

Attribute

+name: String+value: String

ComposedQuery

+booleanOperator: {AND,OR,NOT}

1..*

UniversalQuery0..*

SimilarityQuery

1

0..*

SemanticQuery

+request: SPARQL

StructuredQuery

+request: XQuery

FullTextQuery

+request: String0..*

Feature

+key: String1..*

Autres AspectsAutres Aspects

Resource

+uri: URI

MediaUnit

Service

+interface: WSDL

Document

ComposedUnit

+synchronised: boolean

1

1..*

Text

<<optional>>+content: String

Segment

1

*

VideoAudio Image

Ontology

+data: OWL-RDFS/XML

Query

ResourceCollection *

BinaryMediaUnit

<<optional>>+content: Binary

HumanResource

Annotation

+data: RDF/XML

0..*

LinearSegment

+start: int+end: int

Table Line*

Cell

*

SpatialSegment

+shape: ShapeType

Coordinate

+x: int+y: int

1..*LowLevelDescripto

r+key: String

TemporalSegment

+start: int+end: int

BinaryContent

+data: Binary

TextContent

+data: String

Content

+offset: int+size: int 1

UsageContext

0..*

Attribute

+name: String+value: String

ComposedQuery

+booleanOperator: {AND,OR,NOT}

1..*

UniversalQuery0..*

SimilarityQuery

1

0..*

SemanticQuery

+request: SPARQL

StructuredQuery

+request: XQuery

FullTextQuery

+request: String0..*

Feature

+key: String1..*

3131

Exemple d’Instance de Exemple d’Instance de DocumentDocument

Ceci est l‘introduction.Chapitre 1Voici un tableau...

321

cba

ConclusionCet exemple est très simple

myWS/myDocument myDoc : Document

uri=« webcontent://myWS/myDocument"

sect1 : Text

content = "ceci est l'intoduction"

sect2 : ComposedUnit

sect2 : Text

content="Voici un tableau ..."

sect3 : Table

line1 : Line line2 : Line

sect3_ : ComposedUnit

sect1_ : Text

content = "Chapitre 1"

cell2 : Cellcell1 : Cell cell3 : Cell cell1_ : Cellcell2_ : Cell cell3_ : Cell

sect1__ : Text

content="Conclusion"

sect2_ : Text

content="Cet exemple est très simple."

: Text

content="a"

: Text

content="b"

: Text

content="c"

: Text

content="1"

: Text

content="2"

: Text

content="3"

p2 : LinearSegment

start=22end=27

p1 : LinearSegment

start=5end=12

3232

Importance des StandardsImportance des Standards

URI UTF-8

XML Namespaces

XML SchemaXPath XQuery RDF

RDF SchemaWSDL

SOAP

OWLBPEL

Services WebContent Modèle d’Echange WebContent

Plateforme WebContent

3333

Résultats DisponibleRésultats Disponible

Accessibles depuis Accessibles depuis http://www.webcontent-project.orghttp://www.webcontent-project.orgSpécifications de services (XX)Spécifications de services (XX)

DescriptionsDescriptionsAPIsAPIs

Modèle de donnéesModèle de donnéesSpécificationsSpécificationsSchémas XMLSchémas XML

Tutoriels Java pour réaliser, intégrer, Tutoriels Java pour réaliser, intégrer, déployer, orchestrer, tester, … les services.déployer, orchestrer, tester, … les services.Bibliothèques et tutoriels C++ pour réaliser Bibliothèques et tutoriels C++ pour réaliser et déployer des services (LGPL)et déployer des services (LGPL)

3434

Services en LigneServices en LigneService / Portlet Implémenté par

Named entities CEA LIST, EADS, Exalead

Crawling CEA LIST, Exalead

Formating/Normalisation CEA LIST, INRA, Exalead

SyntacticAnalysis CEA LIST

Indexing CEA LIST, EADS, Exalead, LIP6

Full text search CEA LIST, EADS, Exalead, LIP6

Semantic search (SPARQL) GEMO

Structured search (xQuery) GEMO

Semantic annotation CEA LIST, INRA, Exalead

Ontology enrichment CEA LIST

Ontology alignment EXMO

Language identification EADS

Summarization CEA LIST

Storage & Indexing in P2P GEMO

Generic visualizations portlets In Situ

Semantic Web data presentation In Situ

Open source persistent storage PRISM

Service Catalog LIP6

Classification LIP6

Applications en cours de Applications en cours de FinalisationFinalisation

@Web de l’INRA pour Bongrain

EADS pour Airbus

3636

Actualité et Futur de la Actualité et Futur de la Plateforme WebContentPlateforme WebContent

Support du cœur par EADS au travers de son offre WebLabSupport du cœur par EADS au travers de son offre WebLabDéveloppement collaboratif des bibliothèques C++ (sur Développement collaboratif des bibliothèques C++ (sur gna.org)gna.org)Interopérabilité WebContent/UIMAInteropérabilité WebContent/UIMAUtilisation dans de nombreux projets français ou européens : Utilisation dans de nombreux projets français ou européens : Vitalas , Virtuoso, VIGIEs, Scribo,...Vitalas , Virtuoso, VIGIEs, Scribo,... A finaliser encore:A finaliser encore:

mode collaboratif de développement et de support du cœurmode collaboratif de développement et de support du cœur rapprochement avec un organisme tel que Oasis, W3C ou OW2rapprochement avec un organisme tel que Oasis, W3C ou OW2 standardisation des spécificationsstandardisation des spécifications

A l’automne: workshopA l’automne: workshop

3737

Conclusion Conclusion

La plateforme permet de développer des applicationsTraitant de gros volumes de données hétérogènes et non-structurées

Dans des domaines variésVeilles technique ou stratégiqueVeilles technique ou stratégique

Veille économiqueVeille économique

Open Source Intelligence (OSINT)Open Source Intelligence (OSINT)

Entreprise Information Portals (EIP)Entreprise Information Portals (EIP)

Content Management Systems (CMS) Content Management Systems (CMS)

Indexation d’archives multimédiaIndexation d’archives multimédia

Gestion de connaissances « Métier »Gestion de connaissances « Métier »

etc.etc.

Fondé sur les Fondé sur les technologies du Web Sémantiquetechnologies du Web Sémantique