Tentative de cartographie des besoins, solutions et sujets de recherche ouverts dans le domaine du...

33
Tentatives de cartographies des besoins, solutions et sujets de recherche ouverts dans le domaine de l’ingénierie des connaissances et du web sémantique

description

En partant de cas de projets réels dans des domaines aussi variés que la santé, l'industrie, l'édition, la défense, les médias... nous tenterons de dresser une cartographie des besoins exprimés, des technologies et des méthodes mises en œuvre. A partir des cas sélectionnés, nous ferons un retour à la communauté scientifique sur des problématiques ouvertes en terme de recherche.Présentation invitée de Jean Delahousse (CEO, Mondeca) à IC 2009

Transcript of Tentative de cartographie des besoins, solutions et sujets de recherche ouverts dans le domaine du...

Page 1: Tentative de cartographie des besoins, solutions et sujets de recherche ouverts dans le domaine du web sémantique, des ontologies et de la gestion des connaissances.

Tentatives de cartographies des besoins, solutions et sujets de recherche ouverts dans le domaine de l’ingénierie des connaissances

et du web sémantique

Page 2: Tentative de cartographie des besoins, solutions et sujets de recherche ouverts dans le domaine du web sémantique, des ontologies et de la gestion des connaissances.

• 2000-2009 : une chronologie

• Une cartographie par fonctions

• Une cartographie par domaines d’utilisation

• Conclusion

Page 3: Tentative de cartographie des besoins, solutions et sujets de recherche ouverts dans le domaine du web sémantique, des ontologies et de la gestion des connaissances.

DMOZ

Grand Ancêtre Wikipedia

Projets gestion des connaissances Usinor

Page 4: Tentative de cartographie des besoins, solutions et sujets de recherche ouverts dans le domaine du web sémantique, des ontologies et de la gestion des connaissances.

2000

• Topic Maps – participation à la norme

Page 5: Tentative de cartographie des besoins, solutions et sujets de recherche ouverts dans le domaine du web sémantique, des ontologies et de la gestion des connaissances.

2001

• Collaboration Labri (Université Bordeaux) et Cams (Ehess) – Thèse de Pascal Auillans sur la théorie des graphes et réseaux sémantiques

• 1er version logiciel gestion de base de connaissance

• Tentative de modélisation d’une base de connaissance sur la musique classique

Page 6: Tentative de cartographie des besoins, solutions et sujets de recherche ouverts dans le domaine du web sémantique, des ontologies et de la gestion des connaissances.

2003

• Editeur Juridique : Wolters Kluwer Belgium

• OWL : participation de Bernard Vatant à la norme

• Projet européen Strabon: culture, tourisme, multilinguisme

Page 7: Tentative de cartographie des besoins, solutions et sujets de recherche ouverts dans le domaine du web sémantique, des ontologies et de la gestion des connaissances.

2004

• Collaboration avec Temis (text mining)

• Collaboration Lalicc Paris IV – Thèse Florence Amardeilh sur l’acquisition automatique de connaissances et annotations des contenus

• Contrat Hachette

Page 8: Tentative de cartographie des besoins, solutions et sujets de recherche ouverts dans le domaine du web sémantique, des ontologies et de la gestion des connaissances.

2005• Collaboration Lirmm (Université Montpellier)

Thèse Olivier Carloni sur le raisonnement à partir de graphes conceptuels

• Collaboration Leden (Paris 8) Thèse Laurence Noël sur la publication multimédia de contenus et connaissances

• Contrat avec Lexis Nexis France

• Partenariat avec moteur de recherche Antidot – projet Eiffel

Page 9: Tentative de cartographie des besoins, solutions et sujets de recherche ouverts dans le domaine du web sémantique, des ontologies et de la gestion des connaissances.

2006

• SKOS – participation à la norme

• Projet européen TAO – Transitionning Application to Ontology - SOA

Page 10: Tentative de cartographie des besoins, solutions et sujets de recherche ouverts dans le domaine du web sémantique, des ontologies et de la gestion des connaissances.

2007

• Travail avec GeoNames

• LOD (Linking Open Data) project

• Projet SMTS Serveur Multiterminologies de santé

Page 11: Tentative de cartographie des besoins, solutions et sujets de recherche ouverts dans le domaine du web sémantique, des ontologies et de la gestion des connaissances.

2008• Collaboration Inserm Thèse Pierre Yves

Vandenbusche : modélisation d’ontologie pour des serveurs de terminologies médicales

• Normes CTS2 (Web service pour la gestion des référentiels)

• Contrat pour la gestion de 3 thésaurus de la commission européenne (26 langues)

• Utilisation de Triple Stores pour des services avancées de recherche / suggestion

Page 12: Tentative de cartographie des besoins, solutions et sujets de recherche ouverts dans le domaine du web sémantique, des ontologies et de la gestion des connaissances.

2009• Contrat AP-HP : serveur de terminologies médicales

• Contrat BNF / TenPlus - Europeana : recherche sémantique multilingue – alignement

• Collaboration Modyco Paris X – thèse de Charles Tesseire sur la gestion de la temporalité

• Projet Voyages-sncf : fusion de ressources hétérogènes – ontologie tourisme – enrichissement par inférence

• Travail avec Knowledge consult pour construire une méthodologie

Page 13: Tentative de cartographie des besoins, solutions et sujets de recherche ouverts dans le domaine du web sémantique, des ontologies et de la gestion des connaissances.

Une confrontation continue entre les standards, la recherche et les demandes de l’industrie

L’exigence de répondre à des besoins opérationnels présents ou anticipés

Page 14: Tentative de cartographie des besoins, solutions et sujets de recherche ouverts dans le domaine du web sémantique, des ontologies et de la gestion des connaissances.

Bases de connaissances

Portails sémantiques

Référentiels Terminologies

ThésaurusTaxonomies

Linking Open Data

Annotation sémantique

des contenus

Page 15: Tentative de cartographie des besoins, solutions et sujets de recherche ouverts dans le domaine du web sémantique, des ontologies et de la gestion des connaissances.

Référentiels Terminologies

ThésaurusTaxonomies

• Modélisation ontologie pour supporter plusieurs référentiels aux modélisations hétérogènes

• Alignements – Intersection de référentiels– Recouvrement multilingues

• Serveurs d’alignements

• Mise à jour partielle et incrémentale des serveurs multi-terminologies

• Multilinguisme : Gestion des concepts et des vocabulaires multilingues

• SKOS, CTS2, End-Point SparQL

• Construction de référentiels/ontologies à partir de ressources hétérogènes

Page 16: Tentative de cartographie des besoins, solutions et sujets de recherche ouverts dans le domaine du web sémantique, des ontologies et de la gestion des connaissances.

• Classification • Text mining• Annotation par ontologie interne et ressources externes (LOD)• Enrichissement de l’ontologie / enrichissement des annotations

• RDF / MicroFormats / RDF-A• Schemas d’annotation complexes (Event ML, NewsML)

• Annotation multilingue• Annotation images• Semantic mashup

Annotation sémantique

des contenus

Page 17: Tentative de cartographie des besoins, solutions et sujets de recherche ouverts dans le domaine du web sémantique, des ontologies et de la gestion des connaissances.

• Alignement d’URI

• Multilinguisme

• Serveurs d’alignement entre référentiels

• Création de services basés sur les contenus ouverts et les contenus propriétaires

Linking Open Data

Page 18: Tentative de cartographie des besoins, solutions et sujets de recherche ouverts dans le domaine du web sémantique, des ontologies et de la gestion des connaissances.

• Modélisation d’ontologie de domaines• Réutilisation de modélisations• Evolution des modélisations

• Acquisition automatique des connaissances• Contrôle automatique à base de règles

• Interface utilisateurs de contribution et consultation (simplicité des interfaces versus complexité de la modélisation)

• Web 2.0

• Moteur de recherche texte, métadonnées, relations sémantiques• Inférence – suggestion par raisonnement• Semantic mashup

• Méthodologie

Bases de connaissances

Portails sémantiques

Page 19: Tentative de cartographie des besoins, solutions et sujets de recherche ouverts dans le domaine du web sémantique, des ontologies et de la gestion des connaissances.

•Juridique•Administration publique

•Santé•Médical

•Culture

•Médias•Organisations collaboratives

•Tourisme

Page 20: Tentative de cartographie des besoins, solutions et sujets de recherche ouverts dans le domaine du web sémantique, des ontologies et de la gestion des connaissances.

• Exigence de mise à disposition des données publiques : rôle des pouvoirs publics nationaux et européens

• Exigence d’information des citoyens

• Compétitions pour des services avancés d’accès aux contenus et connaissances : – grands groupes internationaux– administrations publiques

• Juridique• Administration

publique

Page 21: Tentative de cartographie des besoins, solutions et sujets de recherche ouverts dans le domaine du web sémantique, des ontologies et de la gestion des connaissances.

• Science Sociale• Formalisme et traditions historiques• Culture nationale• Plusieurs domaines du droit avec des traditions

différentes• -> difficulté de modélisation, difficulté de réutilisation• Droit comparé -> Alignement de modélisations

d’ontologies

• Construction européenne – Multilinguisme– Multiculturalisme

• Accès personnalisé à l’information – Professionnels– Citoyens engagés– Citoyens

• Juridique• Administration

publique

Page 22: Tentative de cartographie des besoins, solutions et sujets de recherche ouverts dans le domaine du web sémantique, des ontologies et de la gestion des connaissances.

• Enjeux économiques sur la gestion du dossier patient– Codage– Interopérabilité, transportabilité– Meilleurs soins

• Enjeux politiques– Accès à l’information

• médecins, • assurances sociales, • patients…

• Un projet mondial (Projet devenu prioritaire aux USA)

• Santé• Médical

Page 23: Tentative de cartographie des besoins, solutions et sujets de recherche ouverts dans le domaine du web sémantique, des ontologies et de la gestion des connaissances.

• Des modélisations d’ontologies, des organisations de terminologies partageables au niveau international

• Des besoins de traduction et multilinguisme• Un travail international et collaboratif de mise à jour des

ontologies / terminologies de référence

• Santé• Médical

Page 24: Tentative de cartographie des besoins, solutions et sujets de recherche ouverts dans le domaine du web sémantique, des ontologies et de la gestion des connaissances.

• Des besoins d’alignement• Granularité différente des descriptions de concepts dans les

différentes terminologies• Ponts entre différents type de codage

– Économique, clinique, gestion

• Simplicité du codage vs complexité des référentiels

• Des accès simples et uniformisés aux ontologies/terminologies par les applications utilisatrices

• Santé• Médical

Page 25: Tentative de cartographie des besoins, solutions et sujets de recherche ouverts dans le domaine du web sémantique, des ontologies et de la gestion des connaissances.

• Temps réel

• Ontologies / terminologies pour décrire des domaines très hétérogènes

• Mélanger des ontologies très souples et des ontologies très détaillées

• Temporalité• Localisation

• Vers une annotation à partir de bases d’événements (EventML)

• Du local au global• Du global au local

• Interopérabilité / échanges

• Semantic mashup de ressources internes et externes

• Médias

Page 26: Tentative de cartographie des besoins, solutions et sujets de recherche ouverts dans le domaine du web sémantique, des ontologies et de la gestion des connaissances.

• Spécialisation des tâches– Modélisation– Edition, enrichissement

d’ontologies/terminologies– Annotation– Utilisation des contenus et connaissances

• Juridique• Administration

publique

• Santé• Médical

• Médias

Page 27: Tentative de cartographie des besoins, solutions et sujets de recherche ouverts dans le domaine du web sémantique, des ontologies et de la gestion des connaissances.

• Lafarge• Fédération Nationale des Parcs Régionaux• INRA• Directions de la SNCF – conduite du changement• Fédération des centres de gestion des collectivités

territoriales• Groupe ADEO / Leroy Merlin• PSA : conception véhicules• DGA : renseignement• Analyse Images satellitaires

• Organisations collaboratives

Page 28: Tentative de cartographie des besoins, solutions et sujets de recherche ouverts dans le domaine du web sémantique, des ontologies et de la gestion des connaissances.

• Capitaliser et partager des connaissances• Portail sémantique• Formaliser des connaissances• Partager des concepts métiers (éventuellement dans différentes

langues)

• Travail collaboratif sur la modélisation, l’enrichissement, l’accès, les retours

• Modélisation de domaines très spécifiques - coût• Terminologies métiers spécifiques et locales - coût

• Organisations collaboratives

Page 29: Tentative de cartographie des besoins, solutions et sujets de recherche ouverts dans le domaine du web sémantique, des ontologies et de la gestion des connaissances.
Page 30: Tentative de cartographie des besoins, solutions et sujets de recherche ouverts dans le domaine du web sémantique, des ontologies et de la gestion des connaissances.

Vers une industrialisation

Une insertion en cours des outils de l’ingénierie des connaissances dans les systèmes d’information en s’appuyant

sur les standards développés dans le cadre du web sémantique

Page 31: Tentative de cartographie des besoins, solutions et sujets de recherche ouverts dans le domaine du web sémantique, des ontologies et de la gestion des connaissances.

acquisition

modélisation

représentation

acquisition

modélisation

représentation

acquisition

modélisation

représentation

Temporalité

Espace

Evénements

Domaine X

acquisition

modélisation

représentation

Page 32: Tentative de cartographie des besoins, solutions et sujets de recherche ouverts dans le domaine du web sémantique, des ontologies et de la gestion des connaissances.

Merci

Page 33: Tentative de cartographie des besoins, solutions et sujets de recherche ouverts dans le domaine du web sémantique, des ontologies et de la gestion des connaissances.