Tentative de cartographie des besoins, solutions et sujets de recherche ouverts dans le domaine du...

Post on 05-Dec-2014

3.981 views 3 download

description

En partant de cas de projets réels dans des domaines aussi variés que la santé, l'industrie, l'édition, la défense, les médias... nous tenterons de dresser une cartographie des besoins exprimés, des technologies et des méthodes mises en œuvre. A partir des cas sélectionnés, nous ferons un retour à la communauté scientifique sur des problématiques ouvertes en terme de recherche.Présentation invitée de Jean Delahousse (CEO, Mondeca) à IC 2009

Transcript of Tentative de cartographie des besoins, solutions et sujets de recherche ouverts dans le domaine du...

Tentatives de cartographies des besoins, solutions et sujets de recherche ouverts dans le domaine de l’ingénierie des connaissances

et du web sémantique

• 2000-2009 : une chronologie

• Une cartographie par fonctions

• Une cartographie par domaines d’utilisation

• Conclusion

DMOZ

Grand Ancêtre Wikipedia

Projets gestion des connaissances Usinor

2000

• Topic Maps – participation à la norme

2001

• Collaboration Labri (Université Bordeaux) et Cams (Ehess) – Thèse de Pascal Auillans sur la théorie des graphes et réseaux sémantiques

• 1er version logiciel gestion de base de connaissance

• Tentative de modélisation d’une base de connaissance sur la musique classique

2003

• Editeur Juridique : Wolters Kluwer Belgium

• OWL : participation de Bernard Vatant à la norme

• Projet européen Strabon: culture, tourisme, multilinguisme

2004

• Collaboration avec Temis (text mining)

• Collaboration Lalicc Paris IV – Thèse Florence Amardeilh sur l’acquisition automatique de connaissances et annotations des contenus

• Contrat Hachette

2005• Collaboration Lirmm (Université Montpellier)

Thèse Olivier Carloni sur le raisonnement à partir de graphes conceptuels

• Collaboration Leden (Paris 8) Thèse Laurence Noël sur la publication multimédia de contenus et connaissances

• Contrat avec Lexis Nexis France

• Partenariat avec moteur de recherche Antidot – projet Eiffel

2006

• SKOS – participation à la norme

• Projet européen TAO – Transitionning Application to Ontology - SOA

2007

• Travail avec GeoNames

• LOD (Linking Open Data) project

• Projet SMTS Serveur Multiterminologies de santé

2008• Collaboration Inserm Thèse Pierre Yves

Vandenbusche : modélisation d’ontologie pour des serveurs de terminologies médicales

• Normes CTS2 (Web service pour la gestion des référentiels)

• Contrat pour la gestion de 3 thésaurus de la commission européenne (26 langues)

• Utilisation de Triple Stores pour des services avancées de recherche / suggestion

2009• Contrat AP-HP : serveur de terminologies médicales

• Contrat BNF / TenPlus - Europeana : recherche sémantique multilingue – alignement

• Collaboration Modyco Paris X – thèse de Charles Tesseire sur la gestion de la temporalité

• Projet Voyages-sncf : fusion de ressources hétérogènes – ontologie tourisme – enrichissement par inférence

• Travail avec Knowledge consult pour construire une méthodologie

Une confrontation continue entre les standards, la recherche et les demandes de l’industrie

L’exigence de répondre à des besoins opérationnels présents ou anticipés

Bases de connaissances

Portails sémantiques

Référentiels Terminologies

ThésaurusTaxonomies

Linking Open Data

Annotation sémantique

des contenus

Référentiels Terminologies

ThésaurusTaxonomies

• Modélisation ontologie pour supporter plusieurs référentiels aux modélisations hétérogènes

• Alignements – Intersection de référentiels– Recouvrement multilingues

• Serveurs d’alignements

• Mise à jour partielle et incrémentale des serveurs multi-terminologies

• Multilinguisme : Gestion des concepts et des vocabulaires multilingues

• SKOS, CTS2, End-Point SparQL

• Construction de référentiels/ontologies à partir de ressources hétérogènes

• Classification • Text mining• Annotation par ontologie interne et ressources externes (LOD)• Enrichissement de l’ontologie / enrichissement des annotations

• RDF / MicroFormats / RDF-A• Schemas d’annotation complexes (Event ML, NewsML)

• Annotation multilingue• Annotation images• Semantic mashup

Annotation sémantique

des contenus

• Alignement d’URI

• Multilinguisme

• Serveurs d’alignement entre référentiels

• Création de services basés sur les contenus ouverts et les contenus propriétaires

Linking Open Data

• Modélisation d’ontologie de domaines• Réutilisation de modélisations• Evolution des modélisations

• Acquisition automatique des connaissances• Contrôle automatique à base de règles

• Interface utilisateurs de contribution et consultation (simplicité des interfaces versus complexité de la modélisation)

• Web 2.0

• Moteur de recherche texte, métadonnées, relations sémantiques• Inférence – suggestion par raisonnement• Semantic mashup

• Méthodologie

Bases de connaissances

Portails sémantiques

•Juridique•Administration publique

•Santé•Médical

•Culture

•Médias•Organisations collaboratives

•Tourisme

• Exigence de mise à disposition des données publiques : rôle des pouvoirs publics nationaux et européens

• Exigence d’information des citoyens

• Compétitions pour des services avancés d’accès aux contenus et connaissances : – grands groupes internationaux– administrations publiques

• Juridique• Administration

publique

• Science Sociale• Formalisme et traditions historiques• Culture nationale• Plusieurs domaines du droit avec des traditions

différentes• -> difficulté de modélisation, difficulté de réutilisation• Droit comparé -> Alignement de modélisations

d’ontologies

• Construction européenne – Multilinguisme– Multiculturalisme

• Accès personnalisé à l’information – Professionnels– Citoyens engagés– Citoyens

• Juridique• Administration

publique

• Enjeux économiques sur la gestion du dossier patient– Codage– Interopérabilité, transportabilité– Meilleurs soins

• Enjeux politiques– Accès à l’information

• médecins, • assurances sociales, • patients…

• Un projet mondial (Projet devenu prioritaire aux USA)

• Santé• Médical

• Des modélisations d’ontologies, des organisations de terminologies partageables au niveau international

• Des besoins de traduction et multilinguisme• Un travail international et collaboratif de mise à jour des

ontologies / terminologies de référence

• Santé• Médical

• Des besoins d’alignement• Granularité différente des descriptions de concepts dans les

différentes terminologies• Ponts entre différents type de codage

– Économique, clinique, gestion

• Simplicité du codage vs complexité des référentiels

• Des accès simples et uniformisés aux ontologies/terminologies par les applications utilisatrices

• Santé• Médical

• Temps réel

• Ontologies / terminologies pour décrire des domaines très hétérogènes

• Mélanger des ontologies très souples et des ontologies très détaillées

• Temporalité• Localisation

• Vers une annotation à partir de bases d’événements (EventML)

• Du local au global• Du global au local

• Interopérabilité / échanges

• Semantic mashup de ressources internes et externes

• Médias

• Spécialisation des tâches– Modélisation– Edition, enrichissement

d’ontologies/terminologies– Annotation– Utilisation des contenus et connaissances

• Juridique• Administration

publique

• Santé• Médical

• Médias

• Lafarge• Fédération Nationale des Parcs Régionaux• INRA• Directions de la SNCF – conduite du changement• Fédération des centres de gestion des collectivités

territoriales• Groupe ADEO / Leroy Merlin• PSA : conception véhicules• DGA : renseignement• Analyse Images satellitaires

• Organisations collaboratives

• Capitaliser et partager des connaissances• Portail sémantique• Formaliser des connaissances• Partager des concepts métiers (éventuellement dans différentes

langues)

• Travail collaboratif sur la modélisation, l’enrichissement, l’accès, les retours

• Modélisation de domaines très spécifiques - coût• Terminologies métiers spécifiques et locales - coût

• Organisations collaboratives

Vers une industrialisation

Une insertion en cours des outils de l’ingénierie des connaissances dans les systèmes d’information en s’appuyant

sur les standards développés dans le cadre du web sémantique

acquisition

modélisation

représentation

acquisition

modélisation

représentation

acquisition

modélisation

représentation

Temporalité

Espace

Evénements

Domaine X

acquisition

modélisation

représentation

Merci