Clarifier le sens de vos données publiques avec le Web de données

Post on 20-Jan-2015

884 views 0 download

description

Slides de la présentation donnée au Linked Open Data @ AIMS Webinars de la FAO. Cette présentation a pour but de mettre en avant les avantages du LOD pour la publication de données. Pour plus d'information, voir http://aims.fao.org/linked-open-data-webinars-at-aims , http://aims.fao.org/linked-open-data-webinars-at-aims/christophe-guedet et http://www.slideshare.net/faoaims/clarifier-le-sens-de-vos-donnes-publiques-avec-le-web-de-donnes

Transcript of Clarifier le sens de vos données publiques avec le Web de données

Clarifier le sens de vos données publiques avec

le Web de donnéesChristophe Guéret (@cgueret)

Webinar LOD@AIMS, January 22, 2013

Data Archiving and Networked Services

DANS is een instituut van KNAW en NWO

Le Web de données

● Publier des données sur le Web

● Publication selon des principes simples:○ Décrire des ressources identifiées par des URI

(addresses Web)○ Connecter les ressources avec des liens typés

● Quel est l'avantage? Pourquoi publier les données de cette façon?

Prenons un exemple...

● Implantation d'un projet immobilier dans la commune de "Vouvray" (Indre et Loire, France)

● Des informations sont nécessaires sur○ Les conditions météo de la zone○ L'utilisation faite des sols dans les environs○ La faune et la flore locale○ Les données liées à la propriété○ ...

La recherche de données

● De nombreuses données gouvernementales sont qualifiées d' "Open Data" et par conséquent libres d'accès

● Processus d'intégration de données○ Chercher des sources de données○ Acquérir et intégrer les données○ Publier un document de synthèse

Les données (fictives) récupérées

Area City Land use

Indre et Loire Vouvray Vineyard

Parcelle Feuille Superficie

1388 000G02 1664 m2

Ville Ensoleillement

Vouvray 3000h / an

L'intégration s'avère difficile...

● Problèmes○ Langue : "Area" = "Département" ?○ Terminologie : "Parcelle", "Feuille" ?○ Ambiguïté : "Vouvray" = "Vouvray" ?

Area City Land use

Indre et Loire Vouvray Vineyard

Parcelle Feuille Superficie

1388 000G02 1664 m2

Ville Ensoleillement

Vouvray 3000h / an

Ville Zone ?

Vouvray ? ?+

Quel est le problème exactement?

● Toutes les sources de données publient des données ouvertes et facilement utilisables

● Mais...○ La signification (sémantique) des données n'est pas

claire○ Des noms ambigus sont utilisés

● Besoin de clarifier les concepts utilisés et les entités auxquelles il est fait référence

Une solution : uniformiser

● Créer un système d'information uniforme○ Les sources d'information saisissent leurs données○ Les concepts employés sont identiques○ Les entités référencées sont contrôlées

● De nombreux exemples

● Solution dédiée et générique

...

Une autre solution : le Web

● Le Web de données (WoD) permet la publication décentralisée de données

● Chaque jeu de données publié utilise○ Un modèle basé sur des relations entre ressources○ Des identifiants uniques à la place des mots○ Un vocabulaire commun pour exprimer les relations

● Les identifiants des ressources sont des URI

Triplets RDF - la grammaire du WoD

● Connection entre deux ressources

● Description associée à une ressource

http://dbpedia.org/resource/Vouvray

http://dbpedia.org/resource/Indre-et-Loire

http://dbpedia.org/ontology/department

http://dbpedia.org/resource/Vouvray

Vouvray

http://xmlns.com/foaf/0.1/name

Triplets RDF - la grammaire du WoD

● Connection entre deux ressources

● Description associée à une ressource

dbpedia:Vouvray dbpedia:Indre-et-Loiredbpedia-owl:department

dbpedia:Vouvray Vouvrayfoaf:name

Triplets RDF - la grammaire du WoD

● Connection entre deux ressources

● Description associée à une ressource

dbpedia:Vouvray dbpedia:Indre-et-Loiredbpedia-owl:department

dbpedia:Vouvray Vouvrayfoaf:name

sujet

predicat

objet

Triplets connectés = WoD

Le Web de données

r3

r4r1

r2

p1p1 p1

p3

p2

Le Web de documents

Revenons à notre exemple...

● Le travail du consommateur est simplifié○ Les différent jeux de données sont interconnectés○ Parcourir le WoD en partant du noeud "Vouvray" permet

de trouver les informations nécessaires○ Nul besoin de télécharger des jeux de données entiers !

■ Approche remplacée par des requêtes ciblées

● Les données publiées sont enrichies○ Chaque contributeur apporte ses informations

Quelques exemples d'utilisation

Dévelopement et e-Gouvernance

● Interconnection de différents jeux de données permettant d'obtenir une vue globale:

SemanticXO et WikiReg

● Au lieu d'envoyer les données vers un serveur central, chaque XO est son propre serveur

RadioMarché

● Partage d'information relative au prix des produits agricoles (avec Agrovoc)

Participez!

● Publiez vos données sur le Web et connectez-les aux autres ressources

● En quelque étapes○ Identifiez les ressources décrites par vos données

(Villes, Personnes, Lieux, ...)○ Assignez des URI aux ressources décrites○ Choisissez des vocabulaires (DC, FOAF, Agrovoc,

...)○ Décrivez vos ressources en RDF