Présentation thèse "Les coulisses de l'open data. Sociologie de la production et de la libération...

1
Contact Site web Les coulisses de l’open data. Sociologie de la production et de la libération de données publiques. ETUDIER LA FABRIQUE DES DONNEES OUVERTES Partout dans le monde, au niveau local comme global, les gouvernements et institutions publiques se saisissent des « promesses vertigineuses » de l’open data pour l’innovation, la transparence et la transformation des administrations. Près de 300 portails dans le monde diffusent des données publiques ouvertes de manière volontaire par des administrations. Les données sont ouvertes pour permettre la création de services et d’applications qui visent à accroitre le contrôle de l’action publique, faciliter la vie quotidienne ou visualiser des phénomènes (visualisations de données) UNE SOCIOLOGIE DE L’OUVERTURE DES DONNEES La thèse s’appuie sur des entretiens avec les acteurs qui ouvrent concrètement les données (chefs de projet, producteurs de données, administrateurs de bases de données, ), l’observation de réunions et l’analyse de documents (notes internes, rapports, législation et règlements,) Les terrains : collectivités locales (municipalités et régions), administrations centrales, une entreprise, une organisation internationale. Considérer l’ouverture des données de ces organisations au regard des travaux en sociologie de la statistique et en sociologie et histoire des sciences. PREMIERS RESULTATS En coulisses de l’open data, la donnée dite « métier » qui sert le travail de l’administration est transformée en une donnée « brute », quasi statistique. Sa réutilisation servira à étudier, représenter et surveiller le réel. Les données ouvertes ne sont pas brutes au sens de « non retravaillées (primaires). De nombreux acteurs manipulent les données tout au long de leur ouverture afin de faciliter ou d’éviter certains usages. L’ouverture des données implique au moins trois grandes étapes qui nécessite un travail important traversant les composantes et les acteurs des organisations : l’identification des données, leur extraction des bases de données gérées par des logiciels qui restreignent l’ouverture et leur « brutification », qui assure qu’elle puissent être réutilisées hors de l’organisation. Pour les acteurs qui ouvrent les données, leur mise à disposition n’est qu’une première étape qui se réalise dans la création de services et d’applications qui « rendent concret » l’open data. Les concours de services et actions temporaires (hackathons) ne suffisent pas à créer les « communautés de réutilisateurs » qui fondent les politiques d’ouverture de données. Auteur Partenaires Samuel Goëta Doctorant, Télécom Paris, département SES Thèse dirigée par Jérôme Denis et débutée en octobre 2012 [email protected] www.coulisses-opendata.com Janvier 2014 Jounrée Futurs et Ruptures Les critères d’une donnée 100% ouverte selon l’ONG Open Knowledge Foundation Quelles étapes sont nécessaires à la transformation d’une donnée dite métier, ancrée dans le travail d’une administration, à une donnée ouverte et réutilisable par n’importe qui ? Comment les formats, les standards et les pratiques de l’open data font évoluer les données publiques ? Autant de questions essentielles pour comprendre les enjeux politiques, sociaux et économiques de l’open data qui nécessitent d’aller explorer ce qui se passe en coulisses, en amont de la mise à disposition de données ouvertes sur des portails open data. Il s’agit aussi d’éviter le néopositivisme qui considère les données comme accessibles et disponibles, un allant de soi qui ne poserait pas de problèmes, en étudiant au plus près la fabrique des données ouvertes. Un angle particulier : plutôt qu’étudier ce qui en est fait, comprendre comment les données sont faites. A paraître Jérôme Denis et Samuel Goëta, « La fabrique des données brutes. Le travail en coulisses de l’open data » in Penser l’Ecosystème des données. Les enjeux scientifiques et politiques des données numériques., dir. Mabi Plantin Monnoyer- Smith, éditions FMSH, Paris, 2014.

Transcript of Présentation thèse "Les coulisses de l'open data. Sociologie de la production et de la libération...

Page 1: Présentation thèse "Les coulisses de l'open data. Sociologie de la production et de la libération de données publiques"

Contact Site web

Les coulisses de l’open data. Sociologie de la production et de la libération de données publiques.

ETUDIER LA FABRIQUE DES DONNEES OUVERTES

n Partout dans le monde, au niveau local comme global, les gouvernements et institutions publiques se saisissent des « promesses vertigineuses » de l’open data pour l’innovation, la transparence et la transformation des administrations.

n Près de 300 portails dans le monde diffusent des données publiques ouvertes de manière volontaire par des administrations.

n  Les données sont ouvertes pour permettre la création de services et d’applications qui visent à accroitre le contrôle de l’action publique, faciliter la vie quotidienne ou visualiser des phénomènes (visualisations de données)

UNE SOCIOLOGIE DE L’OUVERTURE DES DONNEES n  La thèse s’appuie sur des entretiens avec les acteurs qui ouvrent concrètement les

données (chefs de projet, producteurs de données, administrateurs de bases de données, …), l’observation de réunions et l’analyse de documents (notes internes, rapports, législation et règlements,…)

n  Les terrains : collectivités locales (municipalités et régions), administrations centrales, une entreprise, une organisation internationale.

n  Considérer l’ouverture des données de ces organisations au regard des travaux en sociologie de la statistique et en sociologie et histoire des sciences.

PREMIERS RESULTATS n  En coulisses de l’open data, la donnée dite « métier » qui sert le travail de

l’administration est transformée en une donnée « brute », quasi statistique. Sa réutilisation servira à étudier, représenter et surveiller le réel.

n  Les données ouvertes ne sont pas brutes au sens de « non retravaillées (primaires). De nombreux acteurs manipulent les données tout au long de leur ouverture afin de faciliter ou d’éviter certains usages.

n  L’ouverture des données implique au moins trois grandes étapes qui nécessite un travail important traversant les composantes et les acteurs des organisations : l’identification des données, leur extraction des bases de données gérées par des logiciels qui restreignent l’ouverture et leur « brutification », qui assure qu’elle puissent être réutilisées hors de l’organisation.

n  Pour les acteurs qui ouvrent les données, leur mise à disposition n’est qu’une première étape qui se réalise dans la création de services et d’applications qui « rendent concret » l’open data. Les concours de services et actions temporaires (hackathons) ne suffisent pas à créer les « communautés de réutilisateurs » qui fondent les politiques d’ouverture de données.

Auteur

Partenaires

Samuel Goëta Doctorant, Télécom Paris, département SES Thèse dirigée par Jérôme Denis et débutée en octobre 2012

[email protected] www.coulisses-opendata.com

Janv

ier 2

014

Joun

rée

Futu

rs e

t Rup

ture

s

Les critères d’une donnée 100% ouverte selon l’ONG Open Knowledge Foundation

n  Quelles étapes sont nécessaires à la transformation d’une donnée dite métier, ancrée dans le travail d’une

administration, à une donnée ouverte et réutilisable par n’importe qui ? Comment les formats, les standards et les pratiques de l’open data font évoluer les données publiques ? Autant de questions essentielles pour comprendre les enjeux politiques, sociaux et économiques de l’open data qui nécessitent d’aller explorer ce qui se passe en coulisses, en amont de la mise à disposition de données ouvertes sur des portails open data.

n  Il s’agit aussi d’éviter le néopositivisme qui considère les données comme accessibles et disponibles, un allant de soi qui ne poserait pas de problèmes, en étudiant au plus près la fabrique des données ouvertes.

n  Un angle particulier : plutôt qu’étudier ce qui en est fait, comprendre comment les données sont faites.

A paraître

Jérôme Denis et Samuel Goëta, « La fabrique des données brutes. Le travail en coulisses de l’open data » in Penser l’Ecosystème des données. Les enjeux scientifiques et politiques des données numériques., dir. Mabi Plantin Monnoyer-Smith, éditions FMSH, Paris, 2014.