Une plateforme ouverte et flexible pour l'exploitation des
Transcript of Une plateforme ouverte et flexible pour l'exploitation des
Une plateforme ouverte et flexible Une plateforme ouverte et flexible pour l'exploitation des contenuspour l'exploitation des contenus
http://www.webcontent-project.orghttp://www.webcontent-project.org
Gaël de ChalendarGaël de Chalendar
CEA LIST / LIC2MCEA LIST / LIC2M
Fontenay-aux-Roses - FranceFontenay-aux-Roses - France
22
Objectifs du ProjetObjectifs du Projet
Fournir à partir d'une plateforme centrale : Modules Technologiques dédiés au traitement et au stockage des
contenus multimédia Outils et tutoriels pour l‘intégration et la construction d'applications
Identifier et intégrer des modules existants, mais « épars »
Développer et intégrer certains modules allant au-delà de l’Etat de l’Art:
TAL MultilingueGestion de gros volumes de données en P2PEnrichissement Sémantique (automatique ou semi-automatique)Déploiement de services Web
Proposer la plateforme à d’autres partenaires et d’autres projets Français ou Européens
33
Problèmes et BesoinsProblèmes et Besoins
Les données accessibles sontLes données accessibles sontPrincipalement non-structurées (80% de l’information disponible)Principalement non-structurées (80% de l’information disponible)Hétérogènes dans leurs contenus et leurs formatsHétérogènes dans leurs contenus et leurs formatsToujours plus nombreuses et volumineusesToujours plus nombreuses et volumineuses
Leur utilisation implique des difficultés fonctionnelles pour leurLeur utilisation implique des difficultés fonctionnelles pour leur
Collecte, Acquisition, Collecte, Acquisition,
Stockage, Indexation,Stockage, Indexation,Transformation, Normalisation,Transformation, Normalisation,Description, Annotation, Description, Annotation, Visualisation, Présentation,Visualisation, Présentation,Structuration, Ordonnancement,Structuration, Ordonnancement,Dissémination, Partage,Dissémination, Partage,……
44
PartenairesPartenaires
AcadémiquesCEA LISTINRA Mét@riskINRIA - GEMOINRIA - MostrareINRIA - InSituINRIA - ExmoLIP6PriSMLIGLIMSI-CNRSGrimmPSY.CO
IndustrielsEADS DCSThales R&TExalead
UtilisateursADRIASoredab (Bongrain)CEA DAM
55
Aspects AbordésAspects Abordés
Gestion des DonnéesGestion des DonnéesGestion des DonnéesGestion des Données
Recherche &Recherche &PrésentationPrésentation
de l’Informationde l’Information
Gestion et Gestion et Interrogation de Interrogation de gros Volumes gros Volumes
en P2Pen P2P
Gestion et Gestion et Visualisation Visualisation Niveaux des Niveaux des
Données XML Données XML
Stockage P2PStockage P2P
Web services Web services dans les dans les
Réseaux P2PRéseaux P2P
Partage en Partage en P2P des P2P des
Ressources Ressources SémantiquesSémantiques
Acquisition & Analyse Acquisition & Analyse Acquisition & Analyse Acquisition & Analyse
ExtractionExtractiondu Contenudu Contenu
AnalyseAnalyseSemantiqueSemantique
Entités NomméesEntités Nommées
Structure desStructure desDocumentsDocuments
ConstructionConstruction,,
EnrichissemEnrichissementent& &
Alignement Alignement d’ontologiesd’ontologies
Annotation Annotation SémantiqueSémantique
Indexation Indexation Sémantique Sémantique & Requêtes & Requêtes MultilinguesMultilingues
Construction et UtilisationConstruction et UtilisationDe la PlateformeDe la Plateforme
Construction et UtilisationConstruction et UtilisationDe la PlateformeDe la Plateforme
ArchitectureArchitecturede la Plateformede la Plateforme
Construction desConstruction desApplicationsApplications
ArchitecturArchitecture e
Modulaire Modulaire & &
ExtensibleExtensible
Déploiement Déploiement & utilisation & utilisation
à Echelle à Echelle IndustrielleIndustrielle
TAL MultilingueTAL Multilingue
66
Cas d'Utilisation Cas d'Utilisation
4 Applications de « Test » :4 Applications de « Test » :
Veille économique et technologique dans l’aéronautique ↔ EADS / AIRBUS
Veille Stratégique ↔ THALES
Risques Microbiologique et chimique dans l’alimentation ↔ SOREDAB (groupe
Bongrain)
Veille événementielle (Sismique) ↔ CEA DAM
77
Approche AdoptéeApproche Adoptée
1)1) Elaboration d’une carte FonctionnelleElaboration d’une carte Fonctionnelle
2)2) Listage des modules logiciels utilisablesListage des modules logiciels utilisables
3)3) Evaluation de la couverture fonctionnelle Evaluation de la couverture fonctionnelle
4)4) Choix technologique pour intégrer/fédérer les modulesChoix technologique pour intégrer/fédérer les modules
5)5) Définition d’architecture d’intégrationDéfinition d’architecture d’intégration
6)6) Spécification des divers composants de la plateforme Spécification des divers composants de la plateforme
7)7) Codage/intégration des composantsCodage/intégration des composants
8)8) Construction des applications opérationnellesConstruction des applications opérationnelles
88
Carte FonctionnelleCarte Fonctionnelle
Semantic analysisWP 3
Semantic annotation3A
Relations extraction3B
Thematic segmentation3F
Semantic disambiguation3C
Ontologies aligning3E
Ontologies building & enrichment3D
Crawling2A
Site watch2B
Document normalization2C
Document segmentation2D
Named entities extraction2E
Structured information extraction2F
Filtering2G
Lemmatization2H
Morpho-syntactic analysis2I
Indexing4A
NLP query analysis4B
Full-text search4C
Structured data search4C
Semantic search4D
Query expansion4E
Information display4F
Summary / Synthesis4G
Classification4HClustering4I
P2P content storing & indexing5A
P2P content interrogation5B
P2P communications security5C
Information searchWP 4
Content extractionWP 2
P2PWP 5
Sources selection & Crawler
Configuration
<<service>>WebCrawler
Monitoring
<<Orchestration>>Data Processing
<<service>>Normalisation<<service>>
Language Identification
<<service>>NE extraction<<service>>
Relations extraction<<service>>
Structure extraction
<<service>>Knowledge Repository
<<service>>Full Text Search
<<service>>Semantic Search
Search
Topic subscription
Watcher
<< Orchestration >>Query recording & Exec. scheduling
<<service>>Scheduler
Portal Orchestrator Services
Exploitation
Application AirbusApplication Airbus
1010
Méthode de ConceptionMéthode de Conception
La plateforme WebContent doit offrir des La plateforme WebContent doit offrir des servicesservices permettant de construire des permettant de construire des applicationsapplications..
Les services sont offerts par des Les services sont offerts par des composantscomposants amenés par amenés par divers fournisseursdivers fournisseurs
La plateforme présente une La plateforme présente une infrastructureinfrastructure d’ d’intégrationintégration de services de services
Diverses Diverses chaînes de traitementchaînes de traitement peuvent être élabores par peuvent être élabores par composition de servicescomposition de services
Un Un portailportail donne accès à l’interface graphique des donne accès à l’interface graphique des applications et aux ressources disponiblesapplications et aux ressources disponibles
⇒ ⇒ ARCHITECTURE ARCHITECTURE
ORIENTEE SERVICEORIENTEE SERVICE(Service Oriented Architecture, SOA)(Service Oriented Architecture, SOA)
1111
Fonctionnalités des ServicesFonctionnalités des Services
Chaque service est Chaque service est Indépendant (du point de vue de l’utilisateur)Indépendant (du point de vue de l’utilisateur)
Défini par un contrat (interface + conditions Défini par un contrat (interface + conditions d’utilisation)d’utilisation)
Normalisé (spécification de l’interface)Normalisé (spécification de l’interface)
Possiblement implémenté de plusieurs manièresPossiblement implémenté de plusieurs manières
Services « Métier »:Services « Métier »: réalisent les fonctions identifiées dans la carte réalisent les fonctions identifiées dans la carte fonctionnellefonctionnelle
Services Techniques:Services Techniques: sont une base commune pour le sont une base commune pour le développement d’applicationsdéveloppement d’applications
1212
Les services « Métier » Les services « Métier » de WebContent de WebContent
Crawling<<interface>>
WebSiteWatching<<interface>>
DocumentAnalysis<<interface>>
SemanticAnnotation<<interface>>
MultilingualReformulation<<interface>>
NamedEntitiesExtraction<<interface>>
Formating<<interface>>
BusinessService<<interface>>
FreeTextQueryTranslation<<interface>>
OntologyEnrichment<<interface>>
OntologiesAlignment<<interface>>
Classification<<interface>>
Clustering<<interface>>
DocumentSegmentation<<interface>>
ThematicSegmentation<<interface>>
SemanticSearch<<interface>>
Search<<interface>>
StructuredSearch<<interface>>
ResultsReporting<<interface>>
Summarizing<<interface>>
FullTextSearch<<interface>>
FilteringSegmentation<<interface>>
Stemming<<interface>>
StructuredInformationExtraction<<interface>>
RelationsExtraction<<interface>>
Indexing<<interface>>
WordSenseDisambiguisation<<interface>>
RequestTranslation<<interface>>
1313
Implémentation des ServicesImplémentation des Services
Plusieurs implémentations d’un même service
Plusieurs services remplis par un même composant
Indexing FullTextSearch
Exalead::OneSearch<<component>>
CEA::LISA<<component>>
Thales::SEM+<<component>>
INAPG::XTAB2SML<<component>>
RelationsExtraction
1414
Bus de Services (ESB)Bus de Services (ESB)
Intégration et Intégration et réduction du couplage du couplageExposition et appel des services (médiateur entre le consommateur et le Exposition et appel des services (médiateur entre le consommateur et le fournisseur)fournisseur)Connecteurs, agrégation de services, etc.Connecteurs, agrégation de services, etc.
Distribution et routageDistribution et routageAppels de services routés vers le bon fournisseurAppels de services routés vers le bon fournisseurRoutage par tables ou dépendant du contenu XML (CBR)Routage par tables ou dépendant du contenu XML (CBR)Choix du protocole de transport (http, JMS, SMTP, etc.)Choix du protocole de transport (http, JMS, SMTP, etc.)Quality of Service (garantie de transport des messages)Quality of Service (garantie de transport des messages)
TransformationTransformationTransformation des formats de données d’une application à une autreTransformation des formats de données d’une application à une autre
Orchestration de servicesOrchestration de servicesAssemblage de services pour créer des services plus puissantsAssemblage de services pour créer des services plus puissants
Gestion technique des activitésGestion technique des activitésTraçabilité des échangesTraçabilité des échangesGestion du cycle de vie des servicesGestion du cycle de vie des servicesTraitement d’erreursTraitement d’erreurs
1515
L’ESB PEtALSL’ESB PEtALS
WS-BPEL
Component development
kit
PetALS node
Portal
PetALS node
TechnicalServices
BusinessServices
BusinessServices
BusinessServices
BusinessServices
JMS connector SOAP connector
XSLT Engine
PetALS node
Centralizedadministration
andmonitoring
Schéma EBM Websourcing
1616
Orchestration de ServicesOrchestration de Services
Pour réaliser un cas d’utilisation, divers services doivent en général être Pour réaliser un cas d’utilisation, divers services doivent en général être appelésappelés
Il faut définir le processus en spécifiant l’ordre exact d’invocation des Il faut définir le processus en spécifiant l’ordre exact d’invocation des services, les séquences, les alternatives, les itérations, etc. services, les séquences, les alternatives, les itérations, etc.
Langage BPELLangage BPEL
Orchestra (BULL/OW2)Orchestra (BULL/OW2)
Approche alternative : P2P, Chorégraphie de services (INRIA Gemo)Approche alternative : P2P, Chorégraphie de services (INRIA Gemo)
Client
Service 2
Service 1
Service 3
invoke
invoke
invoke
reply
invoke
1717
Exemple de ChaineExemple de Chaine(Prétraitement et indexation)(Prétraitement et indexation)
for each docloop
: Supervisor/Administrator
: Orchestration
: Formating
: Classification : Indexing : MultilingualReformulation
: FilteringSegmentation : Stemming : DocumentRepository
: SemanticEntityRepository
1 : defineProcess()
2 : getOntology()
3 : setOntology()
4 : setModel()
5 : runProcess()6 : getDocuments()
7 : getDocument()
8 : process()
9 : process()
10 : process()
11 : classify()
12 : process()
13 : classify()
14 : index()
15 : saveDocument()
1818
Service d’Accès aux DonnéesService d’Accès aux Données
Stockage des ressourcesDescriptions des documents (XML)
Descriptions des services (WSDL)
Annotations (RDF/XML), stockables aussi dans un entrepôt RDF dédié
Ontologies (RDFS-OWL/XML)
Documents dans leurs formats natifs
Interrogation en XQueryInterface Web Service
Implémentations Standard et P2P (INRIA Gemo)
Implémentation d’un entrepôt XML
Search<<interface>>
+search(req: Query): ResourceCollection
DocumentRepository<<interface>>
+saveResource(res: Resource): URI+storeResourceContent(uri: URI, content: Bynary)+getResource(id: URI): Resource+loadResourceContent(uri: URI): Bynary
XML Repository<<component>>
1919
Accès aux servicesAccès aux services
Les interfaces graphiques des applications WebContent sont Les interfaces graphiques des applications WebContent sont préférentiellement réalisées à l’aide d’un portail Web préférentiellement réalisées à l’aide d’un portail Web
Organise et contrôle les composants IHM (portlets)Organise et contrôle les composants IHM (portlets)Présente les données d’une manière organisée et unifiéePrésente les données d’une manière organisée et unifiéeOffre un accès unique à toutes les ressources disponiblesOffre un accès unique à toutes les ressources disponiblesContrôle les accès et gère les utilisateursContrôle les accès et gère les utilisateursPermet de personnaliser les espaces de travails selonPermet de personnaliser les espaces de travails selon
Les applications Les applications Les profils utilisateursLes profils utilisateurs
2020
Technical architectureTechnical architecture
Messaging & Distribution
X<<component>>
Y<<component>>
A<<component>>
Orchestration Engine
B<<component>>
External Businessapplication
Portal Business Process Design
Technical Management
Security & QoS
XML Repository
Technical Service A Technical Service BBusiness Service X Business Service Y
2121
Interopérabilité des ServicesInteropérabilité des Services
Pour être utilisés facilement dans une Pour être utilisés facilement dans une orchestration, les services doivent orchestration, les services doivent être être interopérablesinteropérables::
TechniquementTechniquementNormalisation des protocolesNormalisation des protocolesNormalisation des formats de donnéesNormalisation des formats de donnéesNormalisation des interfacesNormalisation des interfaces
SémantiquementSémantiquementNormalisation des concepts et des relations Normalisation des concepts et des relations caractérisant les données échangéescaractérisant les données échangéesNormalisation des références sémantiques utiliséesNormalisation des références sémantiques utilisées
2222
Description d’unDescription d’unContrat de ServiceContrat de Service
DescriptionDescription:: Service mission & responsibilitiesService mission & responsibilities
CatégorieCatégorie:: Reference(s) to the fonctional mapReference(s) to the fonctional map
Interface offerteInterface offerte::
Description de chaque opération …Description de chaque opération …
Exemple:Exemple:
processprocess
description:description: Detects the named entities in the input media unit...Detects the named entities in the input media unit.....
input:input: media unit in the pivot format. media unit in the pivot format.
output:output: media unit in which are defined text fragments for the extracted entities...media unit in which are defined text fragments for the extracted entities...
pre-condition:pre-condition: the input media unit is in the exchange format. the input media unit is in the exchange format.
post-condition:post-condition: none none
Ressources utiliséesRessources utilisées:: données de configuration, paramètres, etc.données de configuration, paramètres, etc.
Autres besoinsAutres besoins:: performances, limites de qualité, etc.performances, limites de qualité, etc.
Implémentation:Implémentation: identification des composants offrant le serviceidentification des composants offrant le service
NamedEntitiesExtraction<<interface>>
+setDictionnary(dico: Ontology)
BusinessService<<interface>>
DocumentAnalysis<<interface>>
+process(doc: DocumentElement): DocumentElement
2323
Traduction des Traduction des Spécifications UMLSpécifications UML
model
service::Analyzer
+process(doc: DocumentElement): DocumentElement
model::DocumentElement
model::Resource
Analyzer<<wsdl_portType>>
+process(doc: DocumentElement): DocumentElement
DocumentElement<<xs:complexType>>
+uri: String
implementation
import
implementation
Produit du WSDL et du XSDProduit du WSDL et du XSD
2424
Interopérabilité SémantiqueInteropérabilité Sémantique
Pour assurer l’interopérabilité des services, il n’est pas Pour assurer l’interopérabilité des services, il n’est pas suffisant de normaliser les protocoles et les interfacessuffisant de normaliser les protocoles et les interfaces
Il faut aussi définir l’organisation et la sémantique des Il faut aussi définir l’organisation et la sémantique des données échangéesdonnées échangées
Modèle d’échange de donnéesModèle d’échange de données
Chaque document WebContent peut être décrit par ce modèleChaque document WebContent peut être décrit par ce modèle
Chaque document source est « placé en cache permanent » et reste Chaque document source est « placé en cache permanent » et reste accessibleaccessible
Le modèle est formalisé en UML (diagramme de classes) pour aider la Le modèle est formalisé en UML (diagramme de classes) pour aider la transcription des concepts vers un langage de programmationtranscription des concepts vers un langage de programmation
2525
Fonctionnalités Nécessaires Fonctionnalités Nécessaires pour le Modèlepour le Modèle
Le modèle doit permettre de définirLe modèle doit permettre de définir
Une référence commune pour tous les utilisateurUne référence commune pour tous les utilisateur
Le contenu des messages échangés entre les servicesLe contenu des messages échangés entre les services
Un format pivot fondé sur XMLUn format pivot fondé sur XML
Le modèle doit fournir des mécanismes pourLe modèle doit fournir des mécanismes pour
identifier chaque documentidentifier chaque document
annoter globalement un document non-structuréannoter globalement un document non-structuré
identifier les éléments extrais des contenusidentifier les éléments extrais des contenus
annoter chaque élément extrait annoter chaque élément extrait
annoter les autres ressources dans la plateformeannoter les autres ressources dans la plateforme
Le Modèle d’Echange WebContentLe Modèle d’Echange WebContent
Resource
+uri: URI
MediaUnit
Service
+interface: WSDL
Document
ComposedUnit
+synchronised: boolean
1
1..*
Text
<<optional>>+content: String
Segment
1
*
VideoAudio Image
Ontology
+data: OWL-RDFS/XML
Query
ResourceCollection *
BinaryMediaUnit
<<optional>>+content: Binary
HumanResource
Annotation
+data: RDF/XML
0..*
LinearSegment
+start: int+end: int
Table Line*
Cell
*
SpatialSegment
+shape: ShapeType
Coordinate
+x: int+y: int
1..*LowLevelDescripto
r+key: String
TemporalSegment
+start: int+end: int
BinaryContent
+data: Binary
TextContent
+data: String
Content
+offset: int+size: int 1
UsageContext
0..*
Attribute
+name: String+value: String
ComposedQuery
+booleanOperator: {AND,OR,NOT}
1..*
UniversalQuery0..*
SimilarityQuery
1
0..*
SemanticQuery
+request: SPARQL
StructuredQuery
+request: XQuery
FullTextQuery
+request: String0..*
Feature
+key: String1..*
La RessourceLa Ressource
Resource
+uri: URI
MediaUnit
Service
+interface: WSDL
Document
ComposedUnit
+synchronised: boolean
1
1..*
Text
<<optional>>+content: String
Segment
1
*
VideoAudio Image
Ontology
+data: OWL-RDFS/XML
Query
ResourceCollection *
BinaryMediaUnit
<<optional>>+content: Binary
HumanResource
Annotation
+data: RDF/XML
0..*
LinearSegment
+start: int+end: int
Table Line*
Cell
*
SpatialSegment
+shape: ShapeType
Coordinate
+x: int+y: int
1..*LowLevelDescripto
r+key: String
TemporalSegment
+start: int+end: int
BinaryContent
+data: Binary
TextContent
+data: String
Content
+offset: int+size: int 1
UsageContext
0..*
Attribute
+name: String+value: String
ComposedQuery
+booleanOperator: {AND,OR,NOT}
1..*
UniversalQuery0..*
SimilarityQuery
1
0..*
SemanticQuery
+request: SPARQL
StructuredQuery
+request: XQuery
FullTextQuery
+request: String0..*
Feature
+key: String1..*
Structure de DocumentStructure de Document
Resource
+uri: URI
MediaUnit
Service
+interface: WSDL
Document
ComposedUnit
+synchronised: boolean
1
1..*
Text
<<optional>>+content: String
Segment
1
*
VideoAudio Image
Ontology
+data: OWL-RDFS/XML
Query
ResourceCollection *
BinaryMediaUnit
<<optional>>+content: Binary
HumanResource
Annotation
+data: RDF/XML
0..*
LinearSegment
+start: int+end: int
Table Line*
Cell
*
SpatialSegment
+shape: ShapeType
Coordinate
+x: int+y: int
1..*LowLevelDescripto
r+key: String
TemporalSegment
+start: int+end: int
BinaryContent
+data: Binary
TextContent
+data: String
Content
+offset: int+size: int 1
UsageContext
0..*
Attribute
+name: String+value: String
ComposedQuery
+booleanOperator: {AND,OR,NOT}
1..*
UniversalQuery0..*
SimilarityQuery
1
0..*
SemanticQuery
+request: SPARQL
StructuredQuery
+request: XQuery
FullTextQuery
+request: String0..*
Feature
+key: String1..*
AnnotationsAnnotations
Resource
+uri: URI
MediaUnit
Service
+interface: WSDL
Document
ComposedUnit
+synchronised: boolean
1
1..*
Text
<<optional>>+content: String
Segment
1
*
VideoAudio Image
Ontology
+data: OWL-RDFS/XML
Query
ResourceCollection *
BinaryMediaUnit
<<optional>>+content: Binary
HumanResource
Annotation
+data: RDF/XML
0..*
LinearSegment
+start: int+end: int
Table Line*
Cell
*
SpatialSegment
+shape: ShapeType
Coordinate
+x: int+y: int
1..*LowLevelDescripto
r+key: String
TemporalSegment
+start: int+end: int
BinaryContent
+data: Binary
TextContent
+data: String
Content
+offset: int+size: int 1
UsageContext
0..*
Attribute
+name: String+value: String
ComposedQuery
+booleanOperator: {AND,OR,NOT}
1..*
UniversalQuery0..*
SimilarityQuery
1
0..*
SemanticQuery
+request: SPARQL
StructuredQuery
+request: XQuery
FullTextQuery
+request: String0..*
Feature
+key: String1..*
Autres AspectsAutres Aspects
Resource
+uri: URI
MediaUnit
Service
+interface: WSDL
Document
ComposedUnit
+synchronised: boolean
1
1..*
Text
<<optional>>+content: String
Segment
1
*
VideoAudio Image
Ontology
+data: OWL-RDFS/XML
Query
ResourceCollection *
BinaryMediaUnit
<<optional>>+content: Binary
HumanResource
Annotation
+data: RDF/XML
0..*
LinearSegment
+start: int+end: int
Table Line*
Cell
*
SpatialSegment
+shape: ShapeType
Coordinate
+x: int+y: int
1..*LowLevelDescripto
r+key: String
TemporalSegment
+start: int+end: int
BinaryContent
+data: Binary
TextContent
+data: String
Content
+offset: int+size: int 1
UsageContext
0..*
Attribute
+name: String+value: String
ComposedQuery
+booleanOperator: {AND,OR,NOT}
1..*
UniversalQuery0..*
SimilarityQuery
1
0..*
SemanticQuery
+request: SPARQL
StructuredQuery
+request: XQuery
FullTextQuery
+request: String0..*
Feature
+key: String1..*
3131
Exemple d’Instance de Exemple d’Instance de DocumentDocument
Ceci est l‘introduction.Chapitre 1Voici un tableau...
321
cba
ConclusionCet exemple est très simple
myWS/myDocument myDoc : Document
uri=« webcontent://myWS/myDocument"
sect1 : Text
content = "ceci est l'intoduction"
sect2 : ComposedUnit
sect2 : Text
content="Voici un tableau ..."
sect3 : Table
line1 : Line line2 : Line
sect3_ : ComposedUnit
sect1_ : Text
content = "Chapitre 1"
cell2 : Cellcell1 : Cell cell3 : Cell cell1_ : Cellcell2_ : Cell cell3_ : Cell
sect1__ : Text
content="Conclusion"
sect2_ : Text
content="Cet exemple est très simple."
: Text
content="a"
: Text
content="b"
: Text
content="c"
: Text
content="1"
: Text
content="2"
: Text
content="3"
p2 : LinearSegment
start=22end=27
p1 : LinearSegment
start=5end=12
3232
Importance des StandardsImportance des Standards
URI UTF-8
XML Namespaces
XML SchemaXPath XQuery RDF
RDF SchemaWSDL
SOAP
OWLBPEL
Services WebContent Modèle d’Echange WebContent
Plateforme WebContent
3333
Résultats DisponibleRésultats Disponible
Accessibles depuis Accessibles depuis http://www.webcontent-project.orghttp://www.webcontent-project.orgSpécifications de services (XX)Spécifications de services (XX)
DescriptionsDescriptionsAPIsAPIs
Modèle de donnéesModèle de donnéesSpécificationsSpécificationsSchémas XMLSchémas XML
Tutoriels Java pour réaliser, intégrer, Tutoriels Java pour réaliser, intégrer, déployer, orchestrer, tester, … les services.déployer, orchestrer, tester, … les services.Bibliothèques et tutoriels C++ pour réaliser Bibliothèques et tutoriels C++ pour réaliser et déployer des services (LGPL)et déployer des services (LGPL)
3434
Services en LigneServices en LigneService / Portlet Implémenté par
Named entities CEA LIST, EADS, Exalead
Crawling CEA LIST, Exalead
Formating/Normalisation CEA LIST, INRA, Exalead
SyntacticAnalysis CEA LIST
Indexing CEA LIST, EADS, Exalead, LIP6
Full text search CEA LIST, EADS, Exalead, LIP6
Semantic search (SPARQL) GEMO
Structured search (xQuery) GEMO
Semantic annotation CEA LIST, INRA, Exalead
Ontology enrichment CEA LIST
Ontology alignment EXMO
Language identification EADS
Summarization CEA LIST
Storage & Indexing in P2P GEMO
Generic visualizations portlets In Situ
Semantic Web data presentation In Situ
Open source persistent storage PRISM
Service Catalog LIP6
Classification LIP6
Applications en cours de Applications en cours de FinalisationFinalisation
@Web de l’INRA pour Bongrain
EADS pour Airbus
3636
Actualité et Futur de la Actualité et Futur de la Plateforme WebContentPlateforme WebContent
Support du cœur par EADS au travers de son offre WebLabSupport du cœur par EADS au travers de son offre WebLabDéveloppement collaboratif des bibliothèques C++ (sur Développement collaboratif des bibliothèques C++ (sur gna.org)gna.org)Interopérabilité WebContent/UIMAInteropérabilité WebContent/UIMAUtilisation dans de nombreux projets français ou européens : Utilisation dans de nombreux projets français ou européens : Vitalas , Virtuoso, VIGIEs, Scribo,...Vitalas , Virtuoso, VIGIEs, Scribo,... A finaliser encore:A finaliser encore:
mode collaboratif de développement et de support du cœurmode collaboratif de développement et de support du cœur rapprochement avec un organisme tel que Oasis, W3C ou OW2rapprochement avec un organisme tel que Oasis, W3C ou OW2 standardisation des spécificationsstandardisation des spécifications
A l’automne: workshopA l’automne: workshop
3737
Conclusion Conclusion
La plateforme permet de développer des applicationsTraitant de gros volumes de données hétérogènes et non-structurées
Dans des domaines variésVeilles technique ou stratégiqueVeilles technique ou stratégique
Veille économiqueVeille économique
Open Source Intelligence (OSINT)Open Source Intelligence (OSINT)
Entreprise Information Portals (EIP)Entreprise Information Portals (EIP)
Content Management Systems (CMS) Content Management Systems (CMS)
Indexation d’archives multimédiaIndexation d’archives multimédia
Gestion de connaissances « Métier »Gestion de connaissances « Métier »
etc.etc.
Fondé sur les Fondé sur les technologies du Web Sémantiquetechnologies du Web Sémantique