Intervention à l'INRIA : "L’ouverture des données au niveau national (Etalab)"

19
Charles RUELLE – @charlesruelle Directeur technique Etalab (data.gouv.fr) – @etalab L'ouverture des données au niveau national Séminaire IN’Tech INRIA Grenoble 5 Juin 2012

Transcript of Intervention à l'INRIA : "L’ouverture des données au niveau national (Etalab)"

Page 1: Intervention à l'INRIA : "L’ouverture des données au niveau national (Etalab)"

Charles RUELLE – @charlesruelleDirecteur technique

Etalab (data.gouv.fr) – @etalab

L'ouverture des données au niveau

national

Séminaire IN’TechINRIA Grenoble5 Juin 2012

Page 2: Intervention à l'INRIA : "L’ouverture des données au niveau national (Etalab)"

2

Les missions

• Coordonner l’action des administrations de l’Etat et de ses établissements publics administratifs pour faciliter la réutilisation la plus large possible de leurs informations publiques

• Création d’une plateforme destinée à rassembler et à mettre à disposition librement et le plus largement possible les informations publiques de l’Etat, de ses établissements publics administratifs, et si elles le souhaitent, des collectivités territoriales.

Page 3: Intervention à l'INRIA : "L’ouverture des données au niveau national (Etalab)"

3

Animer et coordonner le travail des producteurs

•13 coordinateurs « Open Data » ministériels•+ de 200 contributeurs réguliers sur data.gouv.fr•+ de 105 administrations impliquées à ce jour

•Ateliers de travail (« Workshop ») avec la communauté « Open data » et les producteurs de données

•Plusieurs collectivités territoriales (Longjumeau, Saint Quentin, Conseil Général du Loir et Cher…)•Des autorités administratives indépendantes, entreprises publiques, etc. (SNCF, la Poste, CSA, ARCEP…)

Page 4: Intervention à l'INRIA : "L’ouverture des données au niveau national (Etalab)"

4

Permettre la réutilisation la plus large

• Libre et gratuite • Autorise la reproduction, la redistribution, l’adaptation et

l’exploitation commerciale des données• Compatible avec les autres grands standards internationaux (ODC-

BY, CC-BY 2.0) et les standards développées à l’étranger (Open Government Licence – data.gov.uk)

Page 5: Intervention à l'INRIA : "L’ouverture des données au niveau national (Etalab)"

5

Objectifs :

1. Proposer un catalogue interopérable, 2. De données structurées et qualifiées,3. En libre téléchargement,4. Accessibles à tous, à un même endroit,5. Depuis un moteur de recherche,6. Qui fournit des réponses pertinentes (liste de résultats)7. Et des capacités de recherche structurée (facettes contextuelles et

dynamique…)8. Et offre une navigation sémantique entre concepts (producteur,

licence, ressources, échanges de la communauté…)

Data.gouv.fr : la plateforme de diffusion des données

Page 6: Intervention à l'INRIA : "L’ouverture des données au niveau national (Etalab)"

6

Data.gouv.fr : la plateforme de diffusion des données

Le catalyseur des données publiques de l’Etat

»Back office dédié aux producteurs de données, supportant le processus et les fonctionnalités de la publication en équipe des jeux de données»Intégration de technologies sémantiques, de thésaurus et modélisation de l’ontologie»Une qualification harmonisée (syntaxique et sémantique) des jeux de données publiques»Extraction et publication de données issues des bases de données de l’Etat

Page 7: Intervention à l'INRIA : "L’ouverture des données au niveau national (Etalab)"

7

Data.gouv.fr : la plateforme de diffusion des données

Le point d’accès aux données publiques de l’Etat

»Présentation de l’Open Data, des producteurs de données, des réutilisations de données publiques»Recherche et navigation dans l’inventaire des jeux de données publiés»Téléchargement des jeux de données publiques»Base de connaissance collaborative sur l’open data : échanges et discussions sur son actualité, ses acteurs, ses perspectives, les jeux de données et leurs réutilisations…

Page 8: Intervention à l'INRIA : "L’ouverture des données au niveau national (Etalab)"

8

Data.gouv.fr : la plateforme de diffusion des données

Démonstration

Page 9: Intervention à l'INRIA : "L’ouverture des données au niveau national (Etalab)"

9

Data.gouv.fr : la plateforme de diffusion des données

Les travaux en cours pour faciliter la réutilisation des données

»Amélioration de la recherche•Multiplication des facettes•Suggestions de recherches•Hiérarchisation des facettes•Recherche multicritères (ciblage sur les propriétés)•Recherche spécialisée (géographique…)

»Suivre les évolutions du modèle DCAT (Data Catalog Vocabulary)•Format standardisé (W3C) de publication de catalogues de données gouvernementales•Publier le catalogue sémantique (Linked Open Data)

Page 10: Intervention à l'INRIA : "L’ouverture des données au niveau national (Etalab)"

10

Data.gouv.fr : la plateforme de diffusion des données

Les travaux en cours pour faciliter la réutilisation des données

»Travaux d’harmonisation des donnéesTim Berners Lee (W3C) a établi une notation qualitative sur 5 étoiles pour la mise en ligne des données :

★ Données accessibles sur le web (sans conditions de formats)

★★ Données accessibles structurées (exemple: Excel au lieu de l’image d’un tableau)

★★★ Formats non-propriétaires (exemple: csv au lieu d’Excel) ★★★★ Usage d’URL pour identifier les données

★★★★★ Données liées sémantiquement

Page 11: Intervention à l'INRIA : "L’ouverture des données au niveau national (Etalab)"

11

Encourager l’émergence d’un écosystème

Page 12: Intervention à l'INRIA : "L’ouverture des données au niveau national (Etalab)"

12

Encourager l’émergence d’un écosystème

• 33 grands acteurs de l’innovation

• 4 concours

• 4 rencontres

• 1 plateforme collaborative dédiée

• 100+ projets d’Open Data

Page 13: Intervention à l'INRIA : "L’ouverture des données au niveau national (Etalab)"

13

Encourager l’émergence d’un écosystème

Page 14: Intervention à l'INRIA : "L’ouverture des données au niveau national (Etalab)"

14

Encourager l’émergence d’un écosystème

Page 15: Intervention à l'INRIA : "L’ouverture des données au niveau national (Etalab)"

15Les félicitations du jury :

Les lauréats du 1er concours Dataconnexions

Page 16: Intervention à l'INRIA : "L’ouverture des données au niveau national (Etalab)"

16

Merci ! Questions ?

Charles Ruelle : @charlesruelle

Etalab : @Etalab

Page 17: Intervention à l'INRIA : "L’ouverture des données au niveau national (Etalab)"

17

Page 18: Intervention à l'INRIA : "L’ouverture des données au niveau national (Etalab)"

18

Producteur Annuaire de l’administration (Alimenté à partir de Service-Public.fr )

Découpage administratif Code Officiel Géographique (http://rdf.insee.fr/geo/)

ThématiquesEurovoc 4.3 : Thématiques (http://eurovoc.europa.eu/drupal/?q=fr)

Pays et Territoires

Pays et TerritoiresPays et Territoires

Pays et TerritoiresPays et Territoires

Pays et TerritoiresMatière et

Thème

Matière et Thème

Pays et Territoires

Pays et TerritoiresPays et Territoires

Pays et TerritoiresPays et Territoires

Pays et TerritoiresPays et territoires

Pays et territoires

Des mots clé libres s'appliquent à tous les vocabulaires contrôlés.

Ils servent à accueillir l'indexation correspondante dans la source et permettre l'ajout de mots clé non présents dans les vocabulaires proposés.

Data.gouv.fr : précisions sur l’ontologie

Page 19: Intervention à l'INRIA : "L’ouverture des données au niveau national (Etalab)"

19

Inventaire[Général]

Inventaire[Général]

ProducteurProducteurProducteurProducteurProducteurProducteurProducteurProducteurFormat de

données

Format de données

LicenseLicenseLicenseLicenseLicenseLicense

DistributionDistribution

Distribution interactive

Distribution interactive

Distribution fichier

Distribution fichier

Distribution service

Distribution service

Distribution flux

Distribution flux

Autorité Indépendante

Autorité Indépendante

Personne physique

Personne physique

Administration centrale

Administration centrale

Collectivité territoriale

Collectivité territoriale

Pays et Territoires

Pays et TerritoiresPays et Territoires

Pays et TerritoiresPays et Territoires

Pays et TerritoiresMatière et

Thème

Matière et Thème