Clarifier le sens de vos données publiques avec le Web de données

22
Clarifier le sens de vos données publiques avec le Web de données Christophe Guéret (@cgueret) Webinar LOD@AIMS, January 22, 2013 Data Archiving and Networked Services DANS is een instituut van KNAW en NWO

description

Slides de la présentation donnée au Linked Open Data @ AIMS Webinars de la FAO. Cette présentation a pour but de mettre en avant les avantages du LOD pour la publication de données. Pour plus d'information, voir http://aims.fao.org/linked-open-data-webinars-at-aims , http://aims.fao.org/linked-open-data-webinars-at-aims/christophe-guedet et http://www.slideshare.net/faoaims/clarifier-le-sens-de-vos-donnes-publiques-avec-le-web-de-donnes

Transcript of Clarifier le sens de vos données publiques avec le Web de données

Page 1: Clarifier le sens de vos données publiques avec le Web de données

Clarifier le sens de vos données publiques avec

le Web de donnéesChristophe Guéret (@cgueret)

Webinar LOD@AIMS, January 22, 2013

Data Archiving and Networked Services

DANS is een instituut van KNAW en NWO

Page 2: Clarifier le sens de vos données publiques avec le Web de données

Le Web de données

● Publier des données sur le Web

● Publication selon des principes simples:○ Décrire des ressources identifiées par des URI

(addresses Web)○ Connecter les ressources avec des liens typés

● Quel est l'avantage? Pourquoi publier les données de cette façon?

Page 3: Clarifier le sens de vos données publiques avec le Web de données

Prenons un exemple...

● Implantation d'un projet immobilier dans la commune de "Vouvray" (Indre et Loire, France)

● Des informations sont nécessaires sur○ Les conditions météo de la zone○ L'utilisation faite des sols dans les environs○ La faune et la flore locale○ Les données liées à la propriété○ ...

Page 4: Clarifier le sens de vos données publiques avec le Web de données

La recherche de données

● De nombreuses données gouvernementales sont qualifiées d' "Open Data" et par conséquent libres d'accès

● Processus d'intégration de données○ Chercher des sources de données○ Acquérir et intégrer les données○ Publier un document de synthèse

Page 5: Clarifier le sens de vos données publiques avec le Web de données

Les données (fictives) récupérées

Area City Land use

Indre et Loire Vouvray Vineyard

Parcelle Feuille Superficie

1388 000G02 1664 m2

Ville Ensoleillement

Vouvray 3000h / an

Page 6: Clarifier le sens de vos données publiques avec le Web de données

L'intégration s'avère difficile...

● Problèmes○ Langue : "Area" = "Département" ?○ Terminologie : "Parcelle", "Feuille" ?○ Ambiguïté : "Vouvray" = "Vouvray" ?

Area City Land use

Indre et Loire Vouvray Vineyard

Parcelle Feuille Superficie

1388 000G02 1664 m2

Ville Ensoleillement

Vouvray 3000h / an

Ville Zone ?

Vouvray ? ?+

Page 7: Clarifier le sens de vos données publiques avec le Web de données

Quel est le problème exactement?

● Toutes les sources de données publient des données ouvertes et facilement utilisables

● Mais...○ La signification (sémantique) des données n'est pas

claire○ Des noms ambigus sont utilisés

● Besoin de clarifier les concepts utilisés et les entités auxquelles il est fait référence

Page 8: Clarifier le sens de vos données publiques avec le Web de données

Une solution : uniformiser

● Créer un système d'information uniforme○ Les sources d'information saisissent leurs données○ Les concepts employés sont identiques○ Les entités référencées sont contrôlées

● De nombreux exemples

● Solution dédiée et générique

...

Page 9: Clarifier le sens de vos données publiques avec le Web de données

Une autre solution : le Web

● Le Web de données (WoD) permet la publication décentralisée de données

● Chaque jeu de données publié utilise○ Un modèle basé sur des relations entre ressources○ Des identifiants uniques à la place des mots○ Un vocabulaire commun pour exprimer les relations

● Les identifiants des ressources sont des URI

Page 10: Clarifier le sens de vos données publiques avec le Web de données

Triplets RDF - la grammaire du WoD

● Connection entre deux ressources

● Description associée à une ressource

http://dbpedia.org/resource/Vouvray

http://dbpedia.org/resource/Indre-et-Loire

http://dbpedia.org/ontology/department

http://dbpedia.org/resource/Vouvray

Vouvray

http://xmlns.com/foaf/0.1/name

Page 11: Clarifier le sens de vos données publiques avec le Web de données

Triplets RDF - la grammaire du WoD

● Connection entre deux ressources

● Description associée à une ressource

dbpedia:Vouvray dbpedia:Indre-et-Loiredbpedia-owl:department

dbpedia:Vouvray Vouvrayfoaf:name

Page 12: Clarifier le sens de vos données publiques avec le Web de données

Triplets RDF - la grammaire du WoD

● Connection entre deux ressources

● Description associée à une ressource

dbpedia:Vouvray dbpedia:Indre-et-Loiredbpedia-owl:department

dbpedia:Vouvray Vouvrayfoaf:name

sujet

predicat

objet

Page 13: Clarifier le sens de vos données publiques avec le Web de données

Triplets connectés = WoD

Le Web de données

r3

r4r1

r2

p1p1 p1

p3

p2

Le Web de documents

Page 17: Clarifier le sens de vos données publiques avec le Web de données

Revenons à notre exemple...

● Le travail du consommateur est simplifié○ Les différent jeux de données sont interconnectés○ Parcourir le WoD en partant du noeud "Vouvray" permet

de trouver les informations nécessaires○ Nul besoin de télécharger des jeux de données entiers !

■ Approche remplacée par des requêtes ciblées

● Les données publiées sont enrichies○ Chaque contributeur apporte ses informations

Page 18: Clarifier le sens de vos données publiques avec le Web de données

Quelques exemples d'utilisation

Page 19: Clarifier le sens de vos données publiques avec le Web de données

Dévelopement et e-Gouvernance

● Interconnection de différents jeux de données permettant d'obtenir une vue globale:

Page 20: Clarifier le sens de vos données publiques avec le Web de données

SemanticXO et WikiReg

● Au lieu d'envoyer les données vers un serveur central, chaque XO est son propre serveur

Page 21: Clarifier le sens de vos données publiques avec le Web de données

RadioMarché

● Partage d'information relative au prix des produits agricoles (avec Agrovoc)

Page 22: Clarifier le sens de vos données publiques avec le Web de données

Participez!

● Publiez vos données sur le Web et connectez-les aux autres ressources

● En quelque étapes○ Identifiez les ressources décrites par vos données

(Villes, Personnes, Lieux, ...)○ Assignez des URI aux ressources décrites○ Choisissez des vocabulaires (DC, FOAF, Agrovoc,

...)○ Décrivez vos ressources en RDF