Let's talk about policy! Politiques publiques pour l’ouverture des données scientifiques
Clarifier le sens de vos données publiques avec le Web de données
-
Upload
christophe-gueret -
Category
Technology
-
view
884 -
download
0
description
Transcript of Clarifier le sens de vos données publiques avec le Web de données
Clarifier le sens de vos données publiques avec
le Web de donnéesChristophe Guéret (@cgueret)
Webinar LOD@AIMS, January 22, 2013
Data Archiving and Networked Services
DANS is een instituut van KNAW en NWO
Le Web de données
● Publier des données sur le Web
● Publication selon des principes simples:○ Décrire des ressources identifiées par des URI
(addresses Web)○ Connecter les ressources avec des liens typés
● Quel est l'avantage? Pourquoi publier les données de cette façon?
Prenons un exemple...
● Implantation d'un projet immobilier dans la commune de "Vouvray" (Indre et Loire, France)
● Des informations sont nécessaires sur○ Les conditions météo de la zone○ L'utilisation faite des sols dans les environs○ La faune et la flore locale○ Les données liées à la propriété○ ...
La recherche de données
● De nombreuses données gouvernementales sont qualifiées d' "Open Data" et par conséquent libres d'accès
● Processus d'intégration de données○ Chercher des sources de données○ Acquérir et intégrer les données○ Publier un document de synthèse
Les données (fictives) récupérées
Area City Land use
Indre et Loire Vouvray Vineyard
Parcelle Feuille Superficie
1388 000G02 1664 m2
Ville Ensoleillement
Vouvray 3000h / an
L'intégration s'avère difficile...
● Problèmes○ Langue : "Area" = "Département" ?○ Terminologie : "Parcelle", "Feuille" ?○ Ambiguïté : "Vouvray" = "Vouvray" ?
Area City Land use
Indre et Loire Vouvray Vineyard
Parcelle Feuille Superficie
1388 000G02 1664 m2
Ville Ensoleillement
Vouvray 3000h / an
Ville Zone ?
Vouvray ? ?+
Quel est le problème exactement?
● Toutes les sources de données publient des données ouvertes et facilement utilisables
● Mais...○ La signification (sémantique) des données n'est pas
claire○ Des noms ambigus sont utilisés
● Besoin de clarifier les concepts utilisés et les entités auxquelles il est fait référence
Une solution : uniformiser
● Créer un système d'information uniforme○ Les sources d'information saisissent leurs données○ Les concepts employés sont identiques○ Les entités référencées sont contrôlées
● De nombreux exemples
● Solution dédiée et générique
...
Une autre solution : le Web
● Le Web de données (WoD) permet la publication décentralisée de données
● Chaque jeu de données publié utilise○ Un modèle basé sur des relations entre ressources○ Des identifiants uniques à la place des mots○ Un vocabulaire commun pour exprimer les relations
● Les identifiants des ressources sont des URI
Triplets RDF - la grammaire du WoD
● Connection entre deux ressources
● Description associée à une ressource
http://dbpedia.org/resource/Vouvray
http://dbpedia.org/resource/Indre-et-Loire
http://dbpedia.org/ontology/department
http://dbpedia.org/resource/Vouvray
Vouvray
http://xmlns.com/foaf/0.1/name
Triplets RDF - la grammaire du WoD
● Connection entre deux ressources
● Description associée à une ressource
dbpedia:Vouvray dbpedia:Indre-et-Loiredbpedia-owl:department
dbpedia:Vouvray Vouvrayfoaf:name
Triplets RDF - la grammaire du WoD
● Connection entre deux ressources
● Description associée à une ressource
dbpedia:Vouvray dbpedia:Indre-et-Loiredbpedia-owl:department
dbpedia:Vouvray Vouvrayfoaf:name
sujet
predicat
objet
Triplets connectés = WoD
Le Web de données
r3
r4r1
r2
p1p1 p1
p3
p2
Le Web de documents
Chacun contribue au WoD
dbpedia:Vouvray
dbpedia:Indre-et-Loire
dbpedia-owl:department
wgs84_pos:lat
wgs84_pos:long 47.41088
0.79892
geonames:8292345
gn:nearby
Données de DBpedia
dbpedia:Vouvray
dbpedia:Indre-et-Loire
dbpedia-owl:department
wgs84_pos:lat
wgs84_pos:long 47.41088
0.79892
geonames:8292345
gn:nearby
Données de Geonames
dbpedia:Vouvray
dbpedia:Indre-et-Loire
dbpedia-owl:department
wgs84_pos:lat
wgs84_pos:long 47.41088
0.79892
geonames:8292345
gn:nearby
Revenons à notre exemple...
● Le travail du consommateur est simplifié○ Les différent jeux de données sont interconnectés○ Parcourir le WoD en partant du noeud "Vouvray" permet
de trouver les informations nécessaires○ Nul besoin de télécharger des jeux de données entiers !
■ Approche remplacée par des requêtes ciblées
● Les données publiées sont enrichies○ Chaque contributeur apporte ses informations
Quelques exemples d'utilisation
Dévelopement et e-Gouvernance
● Interconnection de différents jeux de données permettant d'obtenir une vue globale:
SemanticXO et WikiReg
● Au lieu d'envoyer les données vers un serveur central, chaque XO est son propre serveur
RadioMarché
● Partage d'information relative au prix des produits agricoles (avec Agrovoc)
Participez!
● Publiez vos données sur le Web et connectez-les aux autres ressources
● En quelque étapes○ Identifiez les ressources décrites par vos données
(Villes, Personnes, Lieux, ...)○ Assignez des URI aux ressources décrites○ Choisissez des vocabulaires (DC, FOAF, Agrovoc,
...)○ Décrivez vos ressources en RDF