Ontologies et Web 2.0 : une Expérimentation en Entreprise

20
2 Juillet 2007 Ontologies et Gestion de l’Hétérogénéité Sémantique @ IC2007 1 Ontologies et Web 2.0 : Une expérimentation en entreprise Alexandre Passant : EDF R&D / LaLIC – Paris-Sorbonne Philippe Laublet : LaLIC – Paris-Sorbonne

description

Journee OHGS @ IC2007 - http://apassant.net/publications/ontologies-et-web-20-une-expérimentation-en-entreprise

Transcript of Ontologies et Web 2.0 : une Expérimentation en Entreprise

Page 1: Ontologies et Web 2.0 : une Expérimentation en Entreprise

2 Juillet 2007 Ontologies et Gestion de l’Hétérogénéité Sémantique @ IC20071

Ontologies et Web 2.0 : Une expérimentation en entreprise

Alexandre Passant : EDF R&D / LaLIC – Paris-SorbonnePhilippe Laublet : LaLIC – Paris-Sorbonne

Page 2: Ontologies et Web 2.0 : une Expérimentation en Entreprise

2 Juillet 2007 Ontologies et Gestion de l’Hétérogénéité Sémantique @ AFIA-20072

Web 2.0 …

• Remettre l’utilisateur comme producteur au centre des outils

• Faciliter la publication et les échanges d’information• Blogs, wikis …• Systèmes de partage d’information et de documents• Popularisation de RSS comme format d’échange• « Tagging » pour la catégorisation de l’information

• Taggage collaboratif largement répandu comme activité sociale• Folksonomies (Vander Wal 2004)• Etude des phénomènes de convergence …

Page 3: Ontologies et Web 2.0 : une Expérimentation en Entreprise

2 Juillet 2007 Ontologies et Gestion de l’Hétérogénéité Sémantique @ AFIA-20073

« Logiciels sociaux » : quelques exemples …

• Plateforme de blogs (Blogger)

• Partage de photos (Flickr)

• Partage de vidéos (YouTube)

• Bookmarking collaboratif (Delicious)

• Encyclopédie ouverte (Wikipédia)

• Réseaux sociaux (LinkedIn)

• Agrégateur RSS (FeedBurner)

• Homepage personnelle (Netvibes)

• …

Page 4: Ontologies et Web 2.0 : une Expérimentation en Entreprise

2 Juillet 2007 Ontologies et Gestion de l’Hétérogénéité Sémantique @ AFIA-20074

Le Web 2.0 en Entreprise

• Objectifs du projet

• Faciliter• La consultation d’information externe (flux RSS)• Le partage d’informations internes (blogs personnels)• La mise en place de connaissances pérennes (wikis thématiques)

• Remettre en cause l’asymétrie de l’information • Limiter l’adhérence au mail et à la diffusion restreinte d’informations

• Migration des systèmes classiques vers des intranets «2.0»

• Contraintes organisationnelles

• Quel intérêt à partager ses connaissances ?• Peur de l’ouverture des wikis

Page 5: Ontologies et Web 2.0 : une Expérimentation en Entreprise

2 Juillet 2007 Ontologies et Gestion de l’Hétérogénéité Sémantique @ AFIA-20075

Le projet Athena (EDF R&D)

• Une plateforme Web 2.0 pour l’intelligence collective

Page 6: Ontologies et Web 2.0 : une Expérimentation en Entreprise

2 Juillet 2007 Ontologies et Gestion de l’Hétérogénéité Sémantique @ AFIA-20076

Web 2.0 et Web Sémantique au sein d’Athena

• Bénéficier des qualités des deux approches• Facilité d’utilisation et forte acceptabilité des outils et des concepts

sociaux (Web 2.0)• Formalisation, consensus, Inférences, requêtes (WS)

• Eviter les inconvénients des deux approches• Résultats de recherche dépendants des tags (Web 2.0)• Obliger tous les utilisateurs à accéder à l’ontologie et à modéliser la

connaissance de façon formelle (WS)

Page 7: Ontologies et Web 2.0 : une Expérimentation en Entreprise

2 Juillet 2007 Ontologies et Gestion de l’Hétérogénéité Sémantique @ AFIA-20077

Problèmes d’hétérogénéité

• Dans les textes (appellations, …)

• Des tags

• Des outils• Blogs• Wikis• Flux RSS

Page 8: Ontologies et Web 2.0 : une Expérimentation en Entreprise

2 Juillet 2007 Ontologies et Gestion de l’Hétérogénéité Sémantique @ AFIA-20078

Problèmes d’hétérogénéité dans les textes

• Problématiques des documents « Web 2.0 »:• Une majorité d’outils non structurés (blogs, wikis …) et en texte libre

• Abbréviations, acronymes • Synonymes …• Variations morphologiques, typographiques

• Recherche d’information « plein texte »• Nécessité d’élargir manuellement la recherche d’information aux

différentes normalisations d’une même notion … et donc de les connaître à priori !

Page 9: Ontologies et Web 2.0 : une Expérimentation en Entreprise

2 Juillet 2007 Ontologies et Gestion de l’Hétérogénéité Sémantique @ AFIA-20079

Problèmes d’hétérogénéité des tags

• Utilisation partagée de mots-clés libres ou tags• Flickr, del.icio.us• Association libre (en nombre et en type) de mots-clés aux documents pour

les catégoriser et regrouper• Composante sociale : émergence de folksonomies

• Différents problèmes• Les mêmes …• Un mot-clé pour plusieurs notions (peu fréquent dans notre cas)

• « Apple » … ?• Une notion pour plusieurs mots-clés

• « Semantic Web », « SemWeb » …• Dépend fortement de la pratique et de l’expérience de tagging de chacun

Page 10: Ontologies et Web 2.0 : une Expérimentation en Entreprise

2 Juillet 2007 Ontologies et Gestion de l’Hétérogénéité Sémantique @ AFIA-200710

Une seule notion … une multitude de tags

Page 11: Ontologies et Web 2.0 : une Expérimentation en Entreprise

2 Juillet 2007 Ontologies et Gestion de l’Hétérogénéité Sémantique @ AFIA-200711

Combinaison des 2 hétérogénéités

• Billets de blogs taggés: • Hétérogénéité au niveau des textes et des tags• Nécessité d’une indexation unique pour retrouver l’information

Page 12: Ontologies et Web 2.0 : une Expérimentation en Entreprise

2 Juillet 2007 Ontologies et Gestion de l’Hétérogénéité Sémantique @ AFIA-200712

Utilisation d’ontologies pour gérer l’hétérogénéité

• Solution ?

• Etablir un lien entre documents et classes / instances d’une ontologie du domaine afin de palier aux problèmes de recherche d’information

• Moyens

• Une notion, plusieurs formalisations• Un concept de l’ontologie est associé à un certain nombre de marques qui

peuvent être des labels (rdfs:label) ou des tags (tag:hasTag)• Marque (C) = {Label(C)} U {Tag(C)}• Marque (EDF) = {EDF, Electricité de France, …}

U {company_EDF, elec-edf, …}• Distinction nécessaire entre label - admis par tous - et tag – vision

personnelle.

Page 13: Ontologies et Web 2.0 : une Expérimentation en Entreprise

2 Juillet 2007 Ontologies et Gestion de l’Hétérogénéité Sémantique @ AFIA-200713

Représentation

• Lien entre concept (classe ou instance) et un ensemble de tags et labels associés

Page 14: Ontologies et Web 2.0 : une Expérimentation en Entreprise

2 Juillet 2007 Ontologies et Gestion de l’Hétérogénéité Sémantique @ AFIA-200714

Du document à l’ontologie

• Propriété sioc:topic pour établir le lien entre données sources (billet de blog, page wiki …) et ontologie

• Interface de validation pour éviter et résoudre l’ambiguïté• Création contrôlée de nouvelles instances

Page 15: Ontologies et Web 2.0 : une Expérimentation en Entreprise

2 Juillet 2007 Ontologies et Gestion de l’Hétérogénéité Sémantique @ AFIA-200715

Mise en place de la solution

• Modélisation de l’ontologie• Analyse des tags pour définir les instances nécessaires• Extension d’ontologies existantes (FOAF, DOAP, geonames …)• Adaptation et création d’ontologies du domaine• Mélange d’approche Top-down et Bottom-up

• Intégration des billets• SIOC (Breslin et al. 05)• Interface d’association entre tags et ontologie

• Stockage et interrogation des données• Entrepôt RDF pour centraliser les données produites• Plug-ins de navigation et de recherche greffés sur l’interface SPARQL

(Parsia 06)

Page 16: Ontologies et Web 2.0 : une Expérimentation en Entreprise

2 Juillet 2007 Ontologies et Gestion de l’Hétérogénéité Sémantique @ AFIA-200716

Vers une recherche sémantique d’information (1/2)

•Deux grandes étapes• 1) Proposition des concepts de l’ontologie incluant dans leur label

ou tag le terme de recherche• Permet d’affiner et désambiguïser la recherche• « EDF » => « EDF », « EDF R&D », « EDF Energy » ?

• 2) Recherche des documents en fonction du concept déterminé et non plus du mot-clé (et des propriétés des concepts)

• Identifie l’ensemble des documents quelque soit le tag ou label d’origine

Page 17: Ontologies et Web 2.0 : une Expérimentation en Entreprise

2 Juillet 2007 Ontologies et Gestion de l’Hétérogénéité Sémantique @ AFIA-200717

Vers une recherche sémantique d’information (2/2)

• 1) Validation du terme recherché

• 2) Récupération des billets concernés• Gestion de l’hétérogénéité des mots-clés d’origine

Page 18: Ontologies et Web 2.0 : une Expérimentation en Entreprise

2 Juillet 2007 Ontologies et Gestion de l’Hétérogénéité Sémantique @ AFIA-200718

Extension des possibilités de recherche

• Utilisation de l’ontologie, des instances, et des relations pour aller plus loin dans la recherche d’information

• Instances de la même classes, propriétés communes …

Page 19: Ontologies et Web 2.0 : une Expérimentation en Entreprise

2 Juillet 2007 Ontologies et Gestion de l’Hétérogénéité Sémantique @ AFIA-200719

Conclusion

• L’ontologie permet de résoudre une partie des problèmes d’hétérogénéitéposés par les applications Web 2.0

• Approche utilisant des technologies standard et ouvertes (RDF, SPARQL, FOAF …)

• Travaux à développer :• Indexation semi-automatique et sémantique des flux RSS• Extension des possibilités de suggestion d’information• Amélioration de nouveaux outils (wikis …) pour le peuplement d’ontologie

• Médiateur pour les différents outils du Web 2.0• Pour l’accès à l’information …

Alexandre PASSANT, Jean-David STA, Philippe LAUBLET, Folksonomies, Ontologies andcorporate blogging, in Blogtalk reloaded – Social Software, Research and Cases, T.N.Burg, J.Schmidt (eds), Herstellung : Books on Demand GmbH 2007.

Page 20: Ontologies et Web 2.0 : une Expérimentation en Entreprise

2 Juillet 2007 Ontologies et Gestion de l’Hétérogénéité Sémantique @ AFIA-200720

Web 2.0 et WS : d’autres questions

• Dériver une sémantique émergente des interactions collaboratives du Web 2.0 ?

• Entre autres du marquage collaboratif (folksonomie)

• Modéliser cette sémantique émergente dans des ontologies ?

• Gérer les évolutions des documents et des … tags ?

• Faire bénéficier les applications collaboratives des ontologies et des technologies du WS