5 pascal romain - conseil régional de la gironde
-
Upload
data-tuesday -
Category
Documents
-
view
639 -
download
1
Transcript of 5 pascal romain - conseil régional de la gironde
La fiche collège Les données locales dans l’écosystème du web
Data Tuesday
25 juin 2013
Ouverture de données publiques sur le Web : juillet 2011
Contexte
• un catalogue basé sur un modèle normalisé : CKAN et DCAT • des jeux de données sur des thématiques variées :
• transport, équipement • horaires, effectifs, sport pratiqué
• des éléments de contexte fournis par des identifiants (code UAI du ministère de l’éducation nationale) ou des localisations administrative (code INSEE)
Problème Comment interroger ces données de manière croisée ?
Avec l’aide de la société Mondeca, nous avons décidé d’expérimenter la modélisation d’une
ontologie permettant de naviguer dans plusieurs jeux de données émanant de sources
différentes :
- La liste des équipements sportifs du département de la Gironde
- La liste des collèges de la Gironde
- La liste des communes et cantons de la Gironde
- La liste des trajets, points d’arrêts et horaires du réseau d’autocar transGironde
De manière à pouvoir répondre plus facilement aux questions transversales sur l’objet collège
Exemples :
Quels sont les équipements sportifs du collège Aliénor d’aquitaine?
Quels sont les collèges équipements sportifs, lignes et points d’arrêts d’autocar de Libourne ?
Quels sont les collèges du canton de Libourne ?
• Étape 1 Identifier le sens de chaque entité d’information : nom, identifiant,
pourcentage, valeur numérique, localisation, etc…
• Étape 2 Identifier les concepts qui me servent à préciser la nature de mes
objets : établissement scolaire, entité administrative, trajet
• Étape 3 : Identifier les concepts existants sur le web qui peuvent être
réutilisés pour définir mes objets
• Étape 4 : mise en place de la chaîne de transformation : xsl
• Étape 5 : mise en place de l’ontologie définissant les types de relation qui
existent entre mes objets
• Étape 6 : chargement des données dans un entrepôt stockant les
informations sous forme de graphe
• Étape 7 : interrogation de l’entrepôt
Méthodologie du projet
Modélisation par ontologie
Objet 1 : établissement scolaire
• Type collège public
• Classe : équipement
• Propriétés : adresse, personnes responsables, effectifs, etc…
Objet 2 : équipement sportif
• Type équipement public
• Classe : équipement
• Propriétés : composant de, sports pratiqués, localisation
Objet 3 : autocar
• Type : transport public
• Classe : transport
• Propriétés : lignes, trajets, points d’arrêts, horaires
Objet 4 : découpage administratif
• Type : entité publique
• Classe : administration territoriale
• Propriétés : identifiant, nom, territoire
Quelles sont les caractéristiques des mes objets?
Modélisation par ontologie
• Une ontologie basée sur la base permanente des équipements de l’INSEE
• Un démonstrateur permettant aux utilisateurs finaux de naviguer dans les donnes liées
Les résultats
Modélisation par ontologie
• Un entrepôt RDF permettant d’exécuter des requêtes sur les données liées
Les résultats
Modélisation par ontologie
Les résultats
Modélisation par ontologie
• Un bilan des apports et des connaissances nécessaires liés à l’utilisation des technologies du web de données
• L’approche par ontologie permet de mettre en relation différents acteurs d’un même domaine de manière assez souple
• Les utilisateurs producteurs de données sont nécessaires pour concevoir l’ontologie en fonction d’usages réels
• Il y a encore pas mal de travail à réaliser pour qualifier les données sources pour permettre au croisement d’avoir toute la pertinence attendue
Merci de votre attention Les données fiche collège :
http://github.com/datalocale/rdf-data
@datalocale
Mondeca