Tribune Denis berthault 01 net mars 2012

1
38 01BUSINESS & TECHNO I 8/03/2012 I 01net-entreprises.fr OPINIONS CARTE BLANCHE À… administrations dans le monde, mais peut-être plus encore à cause d’une orga- nisation hiérarchique et d’un fort souci deconfidentialité,l’Administrationfran- çaise n’est ni préparée, ni organisée, ni, a fortiori, équipée pour diffuser et/ou rendre réutilisables ses informations. Cela n’entre pas dans la mission pour laquelle elle a été créée. Il y a donc un abîme entre la réalité et les désirs des acteurspolitiqueseuropéensoufrançais, relayés par de nombreuses associations en France, de disposer de données dans un « format lisible par la machine et accompagnées de métadonnées » . Comment, alors, permettre aux admi- nistrations de diffuser – rapidement, dans un format réutilisable et au plus juste coût – leurs informations? Pour résorbercegouletd’étranglementconsti- tué par la question du format, nous proposons la création d’une structure technique centralisée, sorte de « data factorymutualisée »,chargéedecollecter les données en l’état, c’est-à-dire sans imposeràl’Administrationunquelcon- que changement ou investissement, puis Comment exploiter la mine d’or des données publiques «Nousproposonsuneusine interministérielled’extraction etdeconversiondesdonnées» DR DENIS BERTHAULT, coanimateur du groupe « données publiques » au Groupement fran- çaisdesindustriesdel’information,s’interroge sur les moyens d’améliorer, au moindre coût, la qualité des données sans attendre que l’Administration ait les outils nécessaires. Avec la création d’Etalab, la tarification des données publiques devient un sujet tabou. Certes, les textes encadrant la réutilisationdesinformationspubliques, qu’ils soient actuels (directive de 2003, loi de 1978, décret de mai 2011) ou à venir (projet de révision de la Commission européenne), autorisent explicitement cette tarification. Toutefois, nombreux sont ceux qui pensent que, l’impôt ayant déjà payé la production des données, il est anormal que la réutilisation des in- formations publiques soit tarifée. Hélas,sil’impôtabienfinancélaproduc- tion, il n’a que très rarement subventionné la diffusion et encore moins les moyens de rendre réutilisables ces données. Pour comprendre le problème, il suffit de re- garderlessitespublics(ministères,établis- sements publics, autorités administra- tives...): les informations textuelles sont restituéesenPDF,unformatpropriétaire qui interdit toute réutilisation, les don- nées tabulaires, en format propriétaire (Excel). Cette tendance se retrouve, bien sûr, sur Data.gouv.fr où moins de 1 % des données est en format ouvert. Une structure centralisée pour résoudre le problème du format Ce constat souffre, évidemment, d’ex- ceptions: des administrations dont la diffusionatoujoursfaitpartieintégrante de la mission (Dila, IGN, Inpi, Insee, Météo France…) se sont depuis une vingtaine d’années organisées pour re- diffuser leurs données. Quelques administrations traditionnelles s’y sont récemmentessayées(Finances,Intérieur, Justice…), avec des bonheurs divers et après des investissements trop impor- tants. Comme l’immense majorité des de les convertir, à moindre coût, dans des formats correspondant aux besoins des réutilisateurs. Cette usine de conver- siondedonnéesseraitinterministérielle, permettantàlafoisauxadministrations, qu’elles soient centrales ou décentrali- sées, riches ou pauvres, de développer de nouvelles applications répondant à leurs besoins propres, tout en favorisant la réutilisation de leurs informations. Pour traiter et élever le niveau de service sur les données – qu’elles soient ou non déjà diffusées –, cette structure devrait en priorité s’interfacer avec les sites publics existants à l’échelon national (dont Data.gouv.fr), voire à l’échelon local. La « data factory » proposerait des fonctionnalités « à la demande » de transformation de format, d’ajout de métadonnées,voired’anonymisationou de nettoyage d’informations. Elle serait aussi en mesure de proposer des services destockage,d’intégrationetd’accèsaux données (API, services web…). Le financement par la taxe ? Ainsi, cette « data factory » permettrait à la sphère publique de disposer d’une structure habilitée à stocker, améliorer et diffuser les données publiques ou- vertes françaises. Comment financer une telle structure? Très simplement! En prélevant une taxe (25 %?) sur le chiffre d’affaires perçu par les adminis- trations qui vendent leurs informations. Il est en effet paradoxal que seules les administrations disposant de données vendables retirent 100 % des revenus alors qu’une vraie politique d’open data consiste justement à mettre à disposition un maximum d’informations, en lais- sant au marché (entreprises, associa- tions, développeurs…) le soin de déve- lopper des services autour. LaFranceauraitalorsl’opportunitédese doter de modalités d’accès communes à toutes les données libérées dans l’Hexa- gone, gage d’efficacité et d’économies d’échelle pour tous les réutilisateurs. M DENIS BERTHAULT 01H_2120_038_Op4.indd 38 01/03/12 10:52

Transcript of Tribune Denis berthault 01 net mars 2012

Page 1: Tribune Denis berthault 01 net mars 2012

38

01B

US

INE

SS

&T

EC

HN

OI8

/03

/20

12I0

1ne

t-e

ntr

ep

rise

s.fr

OPINIONS

CARTE BLANCHE À…

administrations dans le monde, maispeut-être plus encore à cause d’une orga-nisation hiérarchique et d’un fort soucide con$dentialité, l’Administration fran-çaise n’est ni préparée, ni organisée, ni,a fortiori, équipée pour di&user et/ourendre réutilisables ses informations.Cela n’entre pas dans la mission pourlaquelle elle a été créée. Il y a donc unabîme entre la réalité et les désirs desacteurs politiques européens ou français,relayés par de nombreuses associationsen France, de disposer de données dansun « format lisible par la machine etaccompagnées de métadonnées ».Comment, alors, permettre aux admi-nistrations de diffuser – rapidement,dans un format réutilisable et au plusjuste coût – leurs informations? Pourrésorber ce goulet d’étranglement consti-tué par la question du format, nousproposons la création d’une structuretechnique centralisée, sorte de « datafactorymutualisée », chargée de collecterles données en l’état, c’est-à-dire sansimposer à l’Administration un quelcon-que changement ou investissement, puis

Comment exploiter lamined’ordesdonnéespubliques

«Nousproposonsuneusineinterministérielled’extractionetdeconversiondesdonnées»

DR

DENIS BERTHAULT, coanimateur du groupe« donnéespubliques »auGroupementfran-çaisdesindustriesdel’information,s’interrogesur les moyens d’améliorer, au moindre coût,la qualité des données sans attendre quel’Administration ait les outils nécessaires.

Avec la création d’Etalab, la tari$cationdes données publiques devient un sujettabou. Certes, les textes encadrant laréutilisation des informations publiques,qu’ils soient actuels (directive de 2003,loi de 1978, décret demai 2011) ou à venir(projet de révision de la Commissioneuropéenne), autorisent explicitementcette tari$cation. Toutefois, nombreuxsont ceux qui pensent que, l’impôt ayantdéjà payé la production des données, ilest anormal que la réutilisation des in-formations publiques soit tarifée.Hélas, si l’impôt a bien$nancé la produc-tion, il n’a que très rarement subventionnéla di&usion et encore moins les moyensde rendre réutilisables ces données. Pourcomprendre le problème, il su6t de re-garder les sitespublics (ministères, établis-sements publics, autorités administra-tives...) : les informations textuelles sontrestituées enPDF, un format propriétairequi interdit toute réutilisation, les don-nées tabulaires, en format propriétaire(Excel). Cette tendance se retrouve, biensûr, surData.gouv.fr oùmoins de 1 %desdonnées est en format ouvert.

Une structure centralisée pourrésoudre le problème du formatCe constat sou&re, évidemment, d’ex-ceptions : des administrations dont ladi&usion a toujours fait partie intégrantede la mission (Dila, IGN, Inpi, Insee,Météo France…) se sont depuis unevingtaine d’années organisées pour re-diffuser leurs données. Quelquesadministrations traditionnelles s’y sontrécemment essayées (Finances, Intérieur,Justice…), avec des bonheurs divers etaprès des investissements trop impor-tants. Comme l’immense majorité des

de les convertir, à moindre coût, dansdes formats correspondant aux besoinsdes réutilisateurs. Cette usine de conver-sion de données serait interministérielle,permettant à la fois aux administrations,qu’elles soient centrales ou décentrali-sées, riches ou pauvres, de développer denouvelles applications répondant à leursbesoins propres, tout en favorisant laréutilisation de leurs informations.Pour traiter et élever le niveau de servicesur les données – qu’elles soient ou nondéjà di&usées –, cette structure devraiten priorité s’interfacer avec les sitespublics existants à l’échelon national(dont Data.gouv.fr), voire à l’échelonlocal. La « data factory » proposerait desfonctionnalités « à la demande » detransformation de format, d’ajout demétadonnées, voire d’anonymisation oude nettoyage d’informations. Elle seraitaussi enmesure de proposer des servicesde stockage, d’intégration et d’accès auxdonnées (API, services web…).

Le financement par la taxe ?Ainsi, cette « data factory » permettraità la sphère publique de disposer d’unestructure habilitée à stocker, amélioreret di&user les données publiques ou-vertes françaises. Comment $nancerune telle structure? Très simplement !En prélevant une taxe (25 %?) sur lechi&re d’a&aires perçu par les adminis-trations qui vendent leurs informations.Il est en e&et paradoxal que seules lesadministrations disposant de donnéesvendables retirent 100 % des revenusalors qu’une vraie politique d’open dataconsiste justement àmettre à dispositionun maximum d’informations, en lais-sant au marché (entreprises, associa-tions, développeurs…) le soin de déve-lopper des services autour.La France aurait alors l’opportunité de sedoter de modalités d’accès communes àtoutes les données libérées dans l’Hexa-gone, gage d’e6cacité et d’économiesd’échelle pour tous les réutilisateurs. M

DENIS BERTHAULT

01H_2120_038_Op4.indd 38 01/03/12 10:52