5 pascal romain - conseil régional de la gironde

9
La fiche collège Les données locales dans l’écosystème du web Data Tuesday 25 juin 2013

Transcript of 5 pascal romain - conseil régional de la gironde

Page 1: 5   pascal romain - conseil régional de la gironde

La fiche collège Les données locales dans l’écosystème du web

Data Tuesday

25 juin 2013

Page 2: 5   pascal romain - conseil régional de la gironde

Ouverture de données publiques sur le Web : juillet 2011

Contexte

• un catalogue basé sur un modèle normalisé : CKAN et DCAT • des jeux de données sur des thématiques variées :

• transport, équipement • horaires, effectifs, sport pratiqué

• des éléments de contexte fournis par des identifiants (code UAI du ministère de l’éducation nationale) ou des localisations administrative (code INSEE)

Page 3: 5   pascal romain - conseil régional de la gironde

Problème Comment interroger ces données de manière croisée ?

Avec l’aide de la société Mondeca, nous avons décidé d’expérimenter la modélisation d’une

ontologie permettant de naviguer dans plusieurs jeux de données émanant de sources

différentes :

- La liste des équipements sportifs du département de la Gironde

- La liste des collèges de la Gironde

- La liste des communes et cantons de la Gironde

- La liste des trajets, points d’arrêts et horaires du réseau d’autocar transGironde

De manière à pouvoir répondre plus facilement aux questions transversales sur l’objet collège

Exemples :

Quels sont les équipements sportifs du collège Aliénor d’aquitaine?

Quels sont les collèges équipements sportifs, lignes et points d’arrêts d’autocar de Libourne ?

Quels sont les collèges du canton de Libourne ?

Page 4: 5   pascal romain - conseil régional de la gironde

• Étape 1 Identifier le sens de chaque entité d’information : nom, identifiant,

pourcentage, valeur numérique, localisation, etc…

• Étape 2 Identifier les concepts qui me servent à préciser la nature de mes

objets : établissement scolaire, entité administrative, trajet

• Étape 3 : Identifier les concepts existants sur le web qui peuvent être

réutilisés pour définir mes objets

• Étape 4 : mise en place de la chaîne de transformation : xsl

• Étape 5 : mise en place de l’ontologie définissant les types de relation qui

existent entre mes objets

• Étape 6 : chargement des données dans un entrepôt stockant les

informations sous forme de graphe

• Étape 7 : interrogation de l’entrepôt

Méthodologie du projet

Modélisation par ontologie

Page 5: 5   pascal romain - conseil régional de la gironde

Objet 1 : établissement scolaire

• Type collège public

• Classe : équipement

• Propriétés : adresse, personnes responsables, effectifs, etc…

Objet 2 : équipement sportif

• Type équipement public

• Classe : équipement

• Propriétés : composant de, sports pratiqués, localisation

Objet 3 : autocar

• Type : transport public

• Classe : transport

• Propriétés : lignes, trajets, points d’arrêts, horaires

Objet 4 : découpage administratif

• Type : entité publique

• Classe : administration territoriale

• Propriétés : identifiant, nom, territoire

Quelles sont les caractéristiques des mes objets?

Modélisation par ontologie

Page 6: 5   pascal romain - conseil régional de la gironde

• Une ontologie basée sur la base permanente des équipements de l’INSEE

• Un démonstrateur permettant aux utilisateurs finaux de naviguer dans les donnes liées

Les résultats

Modélisation par ontologie

Page 7: 5   pascal romain - conseil régional de la gironde

• Un entrepôt RDF permettant d’exécuter des requêtes sur les données liées

Les résultats

Modélisation par ontologie

Page 8: 5   pascal romain - conseil régional de la gironde

Les résultats

Modélisation par ontologie

• Un bilan des apports et des connaissances nécessaires liés à l’utilisation des technologies du web de données

• L’approche par ontologie permet de mettre en relation différents acteurs d’un même domaine de manière assez souple

• Les utilisateurs producteurs de données sont nécessaires pour concevoir l’ontologie en fonction d’usages réels

• Il y a encore pas mal de travail à réaliser pour qualifier les données sources pour permettre au croisement d’avoir toute la pertinence attendue

Page 9: 5   pascal romain - conseil régional de la gironde

Merci de votre attention Les données fiche collège :

http://github.com/datalocale/rdf-data

@datalocale

Mondeca