open data et crowdsourcing

24
RENCONTRES DE 2014 V.T.I.F L’info-mobilité 1 # Data, share data ! Comment le partage de données peut-il améliorer la mobilité en Ile-de-France ? Le 03 avril 2014

Transcript of open data et crowdsourcing

Page 1: open data et crowdsourcing

RENCONTRESDE

2014V.T.I.F L’info-mobilité

1

# Data, share data !Comment le partage de données peut-il améliorer la mobilité en Ile-de-France ?

Le 03 avril 2014

Page 2: open data et crowdsourcing
Page 3: open data et crowdsourcing

3

# Data, share data ...Faciliter les déplacements de tous les Franciliens et fluidifier la mobilité en maîtrisant à la fois l’emprunte écologique et la dépense

publique est un défi que les nouvelles technologies sont invitées à relever. Quels sont les leviers d’action qui sont entre les mains

des acteurs pour encourager un mouvement vertueux ? Alors que la loi organise l’ouverture des données publiques, et que le

partage d’information entre institutions privées, publiques et individus s’intensifie, quel gain pourrait en tirer la mobilité urbaine ?

améliorer la lisibilité de l’offre de mobilité existanteUn effort de lisibilité de l’offre, de rassurance et de facilité à l’information parait essentiel

pour que le système de déplacements existant soit utilisé de façon optimale. Le numérique

peut être un outil facilitateur de fluidité. Il offre la capacité de centraliser des données et peut

devenir un système d’information puissant par le biais d’une plateforme multimodale bien

conçue intégrant des données pour chaque mode de transport en temps réel et proposant

aux usagers de façon personnalisée, un champ des possibles en matière de déplacement

pour un trajet donné.

intensifier l’usage de l’archipel des services innovantsCes dernières années, plusieurs initiatives « innovantes » publiques et privées sont venues compléter l’offre de TC (autopartage,

covoiturage, coworking, subventions de VAE, prêt de vélo...). Ces nouveaux services voient le jour de façon indépendante et sont

rarement intégrés au système de mobilité, ce qui freine leur démocratisation et implique un effort d’organisation pour l’utilisateur.

L’objectif est que la mobilité alternative à l’autosolisme soit plus facile d’accès, mieux connectée, et que l’on puisse facilement

passer d’un mode à un autre, avec fluidité, y compris dans les territoires éloignés du réseau de TC.

augmenter les compétences des usagersGrâce aux interfaces inovantes, l’usager peut devenir expert de ses propres

déplacements, voire s’impliquer personnellement, via le crowdsourcing, dans la

création de données nécessaires à la régulation de la mobilité. Les usagers réguliers

de lignes peu robustes ou saturées pourraient ainsi avoir la possibilité d’adapter

leurs horaires en fonction des conditions de circulation, voire de contribuer réviser les

grilles horaires des lignes.

Page 4: open data et crowdsourcing

4

Page 5: open data et crowdsourcing

5

Echange # 01

Open Data : Pour une mobilité plus fluide ?

Source : Ile-de-France-2030

Page 6: open data et crowdsourcing

6

Echange # 01Open Data : Pour une mobilité plus fluide ?L’ouverture des données est un phénomène très récent dont l’exploitation reste balbutiante, y compris dans le domaine des

mobilités. Il existe cependant des expérimentations intéressantes qui permettent de montrer que le traitement et la diffusion

des données ouvertes est un levier puissant pour faciliter et fluidifier la mobilité, à offre de transport constante. L’ouverture et

l’interopérabilité des données constituent ainsi un enjeu que les transporteurs et collectivités doivent prendre en compte pour

offrir une information lisible et fiable aux usagers et pour optimiser l’offre existante.

Dans cette première table ronde, il s’agira de rappeler ce qu’est l’Open data et de dresser un état des lieux des initiatives à

l’œuvre en Ile-de-France, des développements possibles et de l’impact envisageable sur les déplacements des franciliens. La

question du développement de plateformes numériques d’information multimodale sera également au coeur du débat, ainsi que

les questions d’interopérabilité, de partenariat public-privé pour de telles mise en oeuvre. Comment tendre vers une meilleure

lisibilité de l’ensemble des offres qui se développent sur le territoire francilien par le biais de l’outil numérique ? Comment d’autres

collectivités ont-elles réussi cette mise en œuvre ?

Mots clés : Open Data, Big Data, interopérabilité, le rôle et l’implication des acteurs

Page 7: open data et crowdsourcing

7

Les intervenants

Quatre expertsLaurent BRIANT (Cityway)Diplômé de l’université de Nice-Sophia Antipolis en sciences informatiques, Laurent Briant est Directeur

général de Cityway, filiale de Veolia Transdev spécialisée dans le domaine des TIC adaptées aux transport

de voyageurs : supports web et mobile, centrale de mobilité, aide à l’exploitation, billétique. Cityway

travaille notamment auprès des collectivités, dont la Communauté urbaine du Grand Lyon dans le cadre

du projet Optimod’Lyon pour lequel, il réalise SmartMoov’, une application GPS multimodale innovante.

Antoine COURMONT (Grand Lyon)Diplômé de Science Po Paris, Antoine Courmont est chargé de mission Open data au sein de la Communauté

urbaine de Lyon qui met en oeuvre le projet Optimod, une plateforme intégrée d’innovation sur la mobilité

urbaine et de coopération public-privé sur les systèmes de transports intelligents en milieu urbain. Antoine

Courmont réalise actuellement une thèse en contrat CIFRE : Gouverner les données, gouverner par les

données. L’ouverture des données et la régulation du territoire urbain : le cas du Grand Lyon.

Bernard DUPRÉ (RATP)Diplômé de l’école TelecomSudParis et de l’Institut Supérieur du Marketing (ISM), actuellement Chef de

projet développement de produits et services innovants à la RATP. Bernard Dupré a développé au cours

de sa carrière une connaissance approfondie des différents marchés et des technologies du secteur

nouvelles technologies. Son parcours mixte, côté fournisseur et côté client, lui permet de porter un

regard original sur la relation client dans ce secteur.

Jean-Luc PRAT (STIF)Diplômé de l’Ecole Supérieure des Géomètres Topographes. Après avoir travaillé chez IDF Conseils

comme Chargé de projets transport et chez OPTILE comme Responsable informatique, Jean-Luc

PRAT est actuellement en charge de la diffusion de l’Information Multimodale au STIF et travaille plus

particulièrement sur la plateforme web et mobile Vianavigo.

Une discutanteJulie RIEG (Chronos)Sociologue diplômée des universités Paris Sorbonne (Paris IV) et Denis Diderot (Paris VII). Après différentes

expériences en tant que chargée d’enquêtes et d’études, Julie RIEG occupe actuellement le poste de

Directrice des études et du développement chez Chronos où elle travaille plus particulièrement sur les

thématiques de la donnée et du travail. Elle est également professeur de veille chez WebSchoolFactory

et intervient dans le Master professionnel de sociologie de la Sorbonne sur le management de projets.

Page 8: open data et crowdsourcing

8

L’Open DataQu’est-ce que l’Open Data ?« L’open data est à la fois un mouvement, une philosophie d’accès à l’information et une pratique de publication de données

publique ou privée, librement accessibles et exploitables. » (Wikipédia)

Simon Chignard (consultant et expert Data, Association Bug et Cantine numérique rennaise) précise que le terme « Open Data »

en anglais exprime 3 idées :

- donnée ouverte (un matériau)

- ouverture des données (une démarche)

- ouvrez les données ! (une injonction)

Les 10 critèresÉnoncés par la Sunlight Foundation, les 10 critères à réunir pour être « données ouvertes » sont les suivants :

1. complètes 6. accessibles sans discrimination

2. primaires 7. respectant les standards ouverts

3. fraîches 8. disponibles sous une licence claire

4. accessibles électroniquement 9. accessibles de façon pérenne

5. lisibles par une machine 10. libres.

L’open data pour les collectivitésPour les collectivités, l’open data consiste à mettre à disposition leurs données publiques brutes sur internet et ainsi en faciliter

l’accès et la réutilisation par les citoyens, chercheurs, étudiants, journalistes, développeurs et les entreprises.

Qu’est-ce qu’une donnée publique ?Une donnée publique est une information produite ou reçue « dans le cadre de leur mission de service public, par l’État, les

collectivités territoriales ainsi que par les autres personnes de droit public ou les personnes de droit privé chargées d’une telle

mission » [article 1 de la loi CADA de 1978]. Il s’agit de données statistiques, cartographiques, horaires...

En France, la mission interministérielle Etalab, désormais service du Premier ministre, est chargée de créer et alimenter le portail

de données publiques ouvertes data.gouv.fr, en ligne depuis le 5 décembre 2011.

Quel cadre légal pour la diffusion des informations publiques ?La mise à disposition des données publiques est une obligation légale définie par la loi CADA (Commission d’accès aux documents

administratifs), du 17 juillet 1978. Les données doivent être non-nominatives, ne pas relever de la vie privée ni de la sécurité. Elles

peuvent être réutilisées à des fins commerciales. Il s’agit d’un droit opposable, une administration ne peut refuser de transmettre

une donnée ni de la voir réutilisée ; en cas de refus, le demandeur peut saisir la CADA.

Quel est l’intérêt de l’Open data pour une collectivité ?Les données mises à disposition permettent l’émergence de nouveaux services numériques, ouvrant la voie à la création

d’applications pratiques. En diffusant leurs données publiques, les collectivités font un pas de plus vers la modernisation des

services publics et témoignent de leur volonté de rendre plus lisible l’action publique, d’y apporter plus de transparence, de

nourrir l’innovation et de valoriser leur territoire.

Page 9: open data et crowdsourcing

9

Page 10: open data et crowdsourcing

10

L’exemple d’Optimod’LyonLe projet Optimod’LyonOptimod’Lyon est un projet de recherche et

développement coordonné par le Grand Lyon associant 2

collectivités, 8 entreprises et 3 organismes de recherche.

D’une durée de 3 ans, il est soutenu par l’ADEME dans le

cadre des Investissements d’Avenir. Ses objectifs :

• améliorer la mobilité des personnes et du fret dans un environnement urbain en développant des services de très haut niveau

d’information et de régulation de trafic utilisant les TIC (les ITS)

• inciter au report modal par le changement (objectif de report modal de 8% d’ici 2020)

• soutenir les entreprises du territoire et nationale dans le secteur de la mobilité intelligente (les ITS).

SmartData : la plateforme Open Data du Grand LyonCette initiative est accompagnée d’une démarche Open

Data, via la plateforme SmartData. Certaines données sont

accessibles sans condition, d’autres avec authentification,

et certaines font l’objet d’une redevance visant à garantir un

écosystème concurrentiel équitable, en évitant les monopoles.

Le Grand Lyon se positionne comme un agrégateur de

données et laisse la place aux initiatives privées pour enrichir

l’offre de services, via les applications mobiles notamment.

SmartMoov’ : une application GPS multimodale innovanteLe Grand Lyon a choisi Cityway pour développer l’application SmartMoov’

(fin 2014). Cette application permettra de consulter des informations

cartographiées en temps réel (parkings, vélo, TC, trafic routier et autres

services de mobilité : Velov, BlueLy, etc.) Elle sera également dotée d’un

calcul d’itinéraires multimodaux intégrant les coûts, un suivi GPS (tracking)

et les info en temps réel sur chaque mode (trafic, horaires, disponibilité

des velov...). En cas d’incident sur le trajet en cours, une alerte préviendra

l’usager de se reporter sur un autre trajet. Une enquête révèle que 8% des

utilisateurs aujourd’hui automobilistes sont prêts à changer de comportement de mobilité suite à l’usage de cette application.

OnlyMoov’: service d’information multimodaleLe Grand Lyon propose également le service Onlymoov qui communique

des informations, via un site web et une application mobile, sur les prévisions

de circulation, les chantiers et événements, et donne des informations

en temps réel sur les conditions de circulation de l’agglomération pour

chaque mode de transport, avec la possibilité de s’abonner à différents

système d’alerte (SMS, RSS...).

Page 11: open data et crowdsourcing

11

Les applications mobiles en Ile-de-FranceLes applications officielles par opérateurIl existe en Ile-de-France plusieurs calculateurs d’itinéraires proposés par chaque acteur de la mobilité : RATP, SNCF, STIF, Vélib,

Autolib, etc ... Mais ces plateformes d’information fonctionnent indépendamment les unes des autres, il est donc très difficile d’avoir

une vision d’ensemble sur l’ensemble des possibilités offertes pour aller d’un point A à un point B.

RATP SNCF Transilien ViaNavigo (STIF) Vélib Autolib

Les autres applications multimodales en Ile-de-FrancePlusieurs acteurs se sont ainsi positionnés pour créer des plateformes intégrant l’ensemble de ces modes.

Paris Moov’ est le projet lauréat du grand prix open data lancé par la Ville de Paris et la Fonderie IDF. Il s’agit pour le moment

uniquement de la version beta, et les bus hors RATP ne sont pour le moment pas intégrés, pour des raisons d’accès aux données.

Paris Moov’ propose un accès sans connexion aux fonctionnalités de l’application.

Grâce à l’open data, Moov’ dans Paris en prenant en compte TOUS les moyens pour te déplacer : Métro, marche à pied, vélib,

Autolib, RER et Bus ...

Effectue des recherches au moment où tu en as le plus besoin : le calcul d’itinéraire hors

ligne, la fonctionnalité indispensable pour les couloirs du métro ou les zones de mauvaise

réception.

Une des lignes de ton itinéraire est hors service ? Il n’y a plus de vélib disponible ?

Très pratique au quotidien, Paris Moov’ propose les autres itinéraires pour arriver à destination

Page 12: open data et crowdsourcing

12

Citymapper, Moovit, Multicity de Citroën, Mappy, GoogleMaps ... sont autant d’applications multimodales qui se développent

sur l’Ile-de-France. Thalès vient également de présenter son prototype qu’il proposera à l’échelle du Grand Paris, l’application

Instant Mobility, pour répondre au projet annoncé en février par le ministre des Transports de disposer d’un calculateur d’itinéraire

multimodal national à l’horizon 2015.

L’application Moovit : un pas vers le crowdsourcingL’application Moovit intègre les opportunités du crowdsourcing, à l’image de l’application Waze rachetée par Google, en se

positionnant non pas sur le trafic automobile, mais sur les transports publics. Ainsi, via les informations des opérateurs auxquels

l’application y agrège les données des utilisateurs, on peut consulter en temps réel l’état des réseaux de transport public.

Sont inclus dans l’appli : une carte interactive des stations et lignes avec horaires des prochains bus et métro, un planificateur de

trajet comparatif, une info trafic en temps réel. Moovit souhaite également proposer un service de recharge de la carte de transport.

Citymapper Mappy Multicity

Page 13: open data et crowdsourcing

13

Echange # 02

Crowdsourcing, mobilité 3.0 : le retour des usagers

Page 14: open data et crowdsourcing

14

Echange # 02Crowdsourcing, mobilité 3.0 : le retour des usagersLa deuxième table ronde explorera les raisons et les différentes manières d’impliquer les usagers eux-mêmes dans la création

de données, ce qu’on appelle le crowdsourcing, et qui est rendu possible grâce au déploiement des nouvelles technologies et

à l’émergence de l’économie collaborative. Ce double phénomène pourrait constituer une richesse pour les transporteurs et

collectivités à la fois pour comprendre les usages et les besoins, mais également pour offrir la possibilité aux usagers d’autoréguler

le trafic par le biais notamment d’applications intelligentes. Comment inciter les usagers à participer, comment collecter, traiter,

fiabiliser ces données nouvelles, comment les rediffuser et quels effets en attendre ? Quelle « expertise » collective peut émaner

de cette foule interconnectée ? Voilà les principales questions qui seront abordées dans cette deuxième partie de matinée.

Page 15: open data et crowdsourcing

15

Les intervenants

Trois expertsGaël MUSQUET (La Fonderie - OSM)Gaël Musquet est un «hacktiviste» du logiciel et des données libres. Président d’OpenStreetMap France il

est un des leaders de la communauté OpenStreetMap en France. Il est actuellement chargé de mission

données et carte libre au sein de La Fonderie l’agence Numérique d’Île de France. Il accompagne les

acteurs économiques et institutionnels franciliens dans la diffusion, la production et l’utilisation des

données libres.

Gabriel PLASSAT (ADEME)Ingénieur diplômé de l’Institut national des Sciences appliquées de Strasbourg et de l’Ecole du Pétrole et

des Moteurs, Gabriel Plassat travaille depuis 2002 à l’ADEME en tant qu’ingénieur Energies et Prospectives

dans le domaine des transports et des mobilités. Il intervient en tant qu’expert sur les systèmes de

transports innovants auprès de diverses structures. Il enseigne également à l’ESTACA, à l’ENPC, à l’école

de commerce SKEMA et à l’Ecole Nationale Supérieure du Pétrole et des Moteurs. Il pilote l’appel à projet

de l’ADEME «connaître pour mieux agir», qui a notamment sélectionné le projet Mobi-lise sur le traçage

des déplacements de personnes. L’expertise, l’implication et les réflexions de Gabriel Plassat se lisent et

se diffusent à travers son blog Les Transports du Futur.

Bénédicte TILLOY (SNCF Transilien)Diplômée de l’ESSEC, Bénédicte Tilloy est membre du Comité Exécutif du groupe SNCF et assure depuis

2011 la direction Transilien, après avoir été à la direction régionale SNCF de Paris Rive Gauche et conduit

la 1ère étape nationale de transformation managériale de la SNCF. Bénédicte Tilloy a été à l’initiative du

premier Hackathon de la SNCF qui a donné lieu à l’application innovante Tranquilien.

Un discutantZbigniew SMOREDA (Orange Labs) Diplômé de l’Université de Warsaw en sciences, de l’EHESS en psychologie sociale. Docteur en

sociologie de Université de Marne-la-Vallée, Zbigniew SMOREDA travaille en tant que chercheur au sein du

laboratoire SENSE (Sociology and Economics of Networks and Services) d’Orange et maître conférencier

en sociologie de l’internet à l’Université Paris-Est. Il fait partie du comité de direction de la revue Mobile

Media & Communication et des comités scientifiques de conférences comme NetMob, WIDS, PURBA,

Nokia Mobile Data Challenge.

Page 16: open data et crowdsourcing

16

Qu’est-ce que le crowdsourcing ?L’émergence de l’économie du partage« Le partage est à la révolution technologique ce que la propriété était au siècle des Lumières : un droit, un pacte social et un

modèle économique. Avec Internet, la civilisation des réseaux invente la multitude. Ma position dans la société dépend de ma

position sur un axe horizontal, auto-organisé. Je partage donc je suis. C’est la vie share. » Pierre Cattan, Usbek et Rica, mai 2012.

Extrait de « La vie share mode d’emploi », Anne-Sophie Novel.

Le crowdsourcing (littéralement « approvisionnement par la foule ») s’inscrit dans ce mouvement à l’oeuvre de l’économie

du partage. Il s’agit d’une pratique faisant appel à la connaissance, l’intelligence, la créativité et le savoir-faire des internautes

et mobinautes pour proposer, créer ou alimenter des contenus. On peut distinguer le crowdsourcing actif (démarche volontaire

de collaboration) et passif (via les données émises par les téléphones mobiles ou les requêtes saisies sur le web par exemple).

Quelques exemples de crowdsourcing :

- Wikipédia (encyclopédie collective mondiale libre alimentée par les internautes).

- Open Street Map (cartographie mondiale en ligne, également libre et alimentée par les internautes).

- Google Trend, qui donne les tendances des recherches sur Google en s’appuyant sur le crowdsourcing passif.

Exemples de dataviz via des données «crowdsourcées»Les données utilisateurs «crowdsourcées» et extraites des big data de chaque acteurs (tels que Google, Facebook, les opérateurs

de téléphonie mobile, les gestionnaires d’applications mobiles, du supports GPS, etc...) sont une manne d’informations de

plus en plus exploitées par ces acteurs. La datavisualisation (ou «dataviz»), les web services, les plateformes de cartographie

interactives permettent d’exploiter ces flux colossaux d’informations et les rendent lisibles, visibles et accessibles.

Trajets suivis par les joggers utilisant l’application RunkeeperCarte des amitiés Facebook

Réseau de distribution des livreurs de pizzas à NY - Données GPS (vidéo)Urban Mobs - Activité mobile Orange dans le métro le 21/06/2008 (vidéo)

Page 17: open data et crowdsourcing

17

L’application Tranquilien SNCFL’application Tranquilien fait partie des projets sélectionnés lors du

premier hackaton de la SNCF «Hack Days Transilien» lancé en juin

2012, dont la démarche se positionne clairement sur le segment du

retour usagers.

Développée en partenariat avec la start-up Snips, cette application

utilise les données open data de la SNCF, mais également d’autres

données ouvertes comme les cartographies d’Open Street Maps

pour informer les utilisateurs en temps réel du taux de remplissage des

trains par voiture heure par heure, ligne par ligne. Les informations

peuvent être enrichies par les usagers qui indiquent une évaluation

de l’affluence du train sur leur trajet wagon par wagon.

Tranquilien participe ainsi à fluidifier le trafic voyageur, à lisser les

pics de fréquentation aux heures de pointe, en incitant les usagers à

décaler leur horaires pour voyager plus confortablement.

Le projet Mobi-LiseComment impliquer les individus ?Le projet Mobi-Lise a été retenu par l’ADEME pour expérimenter, sur le

territoire de Champagne-Ardenne :

• un partage de données de mobilité

• issues d’acteurs pluriels (acteurs publics, entreprises, individus)

• et captées via des canaux divers (enquêtes, traces issues des

smartphones, outils développés par l’Ademe,…).

Ce projet de recherche expérimentale vise à proposer des méthodologies et des outils nouveaux pour étudier les mobilités sur un

territoire. Il s’agit notamment de démontrer que les données captées auprès des individus complètent la gamme des études réalisées

classiquement dans le domaine (du type Enquête Ménage Déplacement). Ces expérimentations permettront de développer :

• Un outil d’aide à la décision en termes d’aménagement du territoire, mais aussi d’amélioration et de développement d’offres de

mobilité à l’attention des décideurs territoriaux,

• Un outil d’aide à la décision pour les individus, habitants et visiteurs du territoire, concernant leurs déplacements,

• Une plateforme d’ouverture des données de mobilité,

• Une plateforme d’ouverture des données et des algorithmes à une communauté de chercheurs.

Piloté par Chronos et réunit six autres partenaires : Edenway, Ludovic Bu, SEM Numerica, Phoenix SI, MobiGIS et Smartengy.

Page 18: open data et crowdsourcing

18

A savoir avant d’ouvrir...Ne pas fétichiser les données. Les données donnent des informations

qui ne sont qu’une représentation de la réalité, que l’on peut avoir tendance à sur-

interpreter ou qui peuvent cacher d’autres réalités. Les données et modèles ne

savent pas non plus toujours bien anticiper les changements de comportements qui

s’opèrent à l’issue de la mise en place d’un nouveau service par exemple. Enfin, il

peut y avoir un biais sociologique à prendre en compte, notamment dans le cadre

des données crowdsourcées, envoyées par des populations spécifiques, équipées

et formées à ces usages.

Ne pas ignorer l’empreinte environnementale de la donnée. Apparemment virtuelles, les données qui transitent sur le web sont

stockées sur des serveurs dans des datacenters qui consomment beaucoup

d’espace et d’énergie pour fonctionner et être refroidis. Les acteurs du numérique

prennent en compte ces problématiques en envisageant des solutions telles que le refroidissement des serveurs par l’eau de

mer, par l’air extérieur (grilles d’aération, constructions en Finlande...) et la récupération de la chaleur (en Seine-et-Marne, un data

center alimente en chaleur le centre aquatique de Val d’Europe et une pépinière d’entreprises de 1400 m²).

Ne pas se tromper de modèle de «smart city» : Une ville intelligente est en effet souhaitable pour optimiser

les flux et les dépenses énergétiques. Mais l’intelligence ne doit pas se placer dans une logique productiviste, avec une politique

de l’offre croissante, l’intelligence doit être dans l’optimisation de l’existant, dans l’observation et la compréhension des pratiques

(enquêtes, crowdsourcing...), afin d’agir sur les causes plutôt que sur les symptômes. Cette optimisation peut passer par l’usage

des données via des applications permettant aux individus à la fois de maîtriser leurs déplacements et d’utiliser le plein potentiel

de l’offre de transport, tout en transmettant des informations en retour. Cette optimisation passe également par la prise de

conscience que les marges de manoeuvres se trouvent avant tout dans les voitures et le monde du travail, avec comme réponses

le déploiement de l’autopartage, du covoiturage et des espaces de coworking.

Ceci n’est pas un centre commercial ...

Data center Google

Page 19: open data et crowdsourcing

19

A faire avant d’ouvrir...Définir des objectifs, des normes et une stratégie d’ouverture : Pourquoi

ouvrir ? A qui s’adresse ces jeux de données ? De

quelles données ont besoin ces différents acteurs ?

Sous quels formats ? Quels droits et quels devoirs

pour l’usage de ces données ? Faut-il développer

un système de licences ? Faut-il empêcher les

situations de monopoles (Google) ? Comment ne

pas tomber dans l’exces du Big Brother ?

Mettre en place des démarches d’Open Innovation et de co-création : L’Open Innovation est une démarche

basée sur la coopération entre acteurs privés,

publics et citoyens, et sur le partage de données,

d’idées, de savoirs et savoir-faire dans l’esprit

dit «ODOSOS» (Open Data, Open Source, Open

Standards). Hackathons, Hackerspaces, Datashaker

... ces initiatives foisonnent dans des espaces

d’un nouveau genre (Numa, la Cantine...) et sont

la preuve que certains acteurs publics ont pris

conscience de cette nécessaire coopération. Ces

démarches de cocréation sont les nouvelles formes

de gouvernance dans cette nouvelle économie de

la multitude où chaque individu est producteur de

valeur. Elles doivent être également accompagnées

d’une diffusion de la culture de la donnée auprès de

l’ensemble des acteurs.

Hackcess Transilien

Page 20: open data et crowdsourcing

20

LexiqueOpen Data, Big Data, Crowdsourcing ... de quoi parle-t-on ?Les définitions ci-dessous sont en partie extraites du livre blanc Le grand lexique des données réalisé par la start-up DATA PUBLICA.

APIApplication Programming Interface. Interface de programmation permettant d’accéder à une application ou à un programme.

Des jeux de données peuvent être rendus accessibles ainsi, soit par téléchargement (pour les jeux de données raisonnablement

stables dans le temps), soit par API (pour les jeux de données très volumineux ou très volatiles).

BIG DATALe terme de Big Data est utilisé lorsque la quantité de données qu’une organisation doit gérer atteint une taille critique qui

nécessite de nouvelles approches technologiques pour leur stockage, leur traitement et leur utilisation. Volume, vitesse et variété

sont souvent les trois critères qui permettent de qualifier une base de données de “Big Data”.

CLOUD COMPUTINGLittéralement “l’informatique dans les nuages”, le cloud computing désigne l’utilisation de serveurs distants (en général

accessibles par Internet) pour traiter ou stocker l’information. Accessible depuis un navigateur web ou directement depuis un

logiciel, les données peuvent-être aussi déportées sur un ordinateur distant.

CNILLa CNIL, Commission Nationale Informatique et Liberté, est une autorité publique chargée de veiller à la protection des données

personnelles. Elle dispose d’un pouvoir de contrôle et peut également sanctionner les entreprises, organisations ou individus,

collectant des informations personnelles qui ne respectent pas la loi informatique et liberté.

CROWDSOURCINGPratique qui correspond à faire appel à des internautes volontaires pour proposer ou créer des contenus, répondre aux questions

d’autres visiteurs. Il s’agit ainsi d’une mutualisation des ressources et des compétences (par exemple Open Street Map ou Open

Food Facts).

DATA CENTERCentre qui concentre un nombre important de serveurs stockant des données informatiques. Un data center est essentiellement

utilisé dans le cas de l’hébergement d’un site web, sur des serveurs et regroupe une multitude de machines. Il existerait près de

3 000 data centers dans le monde répertoriés sur le site datacentermap.com.

DATA.GOUV.FRSite officiel servant de répertoire pour les données publiques du gouvernement français, qui a été mis en ligne le lundi 5 décembre

2011 par la Mission Etalab. En décembre 2013, data.gouv.fr a subi une profonde transformation, en changeant sa structure et la

philosophie de son site. Elle est en effet devenue une plateforme collaborative orientée vers la communauté, au bénéfice d’une

meilleure réutilisation des données publiques. Découvrir le site officiel.

Page 21: open data et crowdsourcing

21

DATA SHAKERDispositif thématique mis en place par le Numa (voir plus bas) qui connecte les porteurs de projets à un écosystème (business,

institutionnel, associatif, etc.) afin de faire émerger de nouveaux produits et services. Découvrir ce dispositif thématique.

ETALABMission initialement rattachée au Premier Ministre, proposée initialement dans le rapport Riester de novembre 2010, mise en

place en 2011, chargée de mettre en oeuvre la politique d’ouverture des données de l’administration française, et de mettre

en place un annuaire des données publiques françaises, data.gouv.fr. Elle a défini en octobre 2011 la Licence Ouverte. Etalab,

aujourd’hui dirigée par Henri Verdier, a été rattachée en novembre 2012 au Secrétariat Général pour la Modernisation de l’Etat.

DSPLDataSet Publishing Language. Langage de description de jeux de données, défini par Google, structurant un jeu de données

en des données CSV et un descripteur XML et permettant de visualiser les données grâce à Google Public Data Explorer. Data

Publica utilise par exemple ce langage pour les 4300 jeux de données visualisables dans son annuaire.

FINGFondation Internet Nouvelle Génération. Créée en 2000, par une équipe d’entrepreneurs et d’experts, la FING est un Think Tank

français traitant l’ensemble des problèmes numériques et société. Actif sur le sujet de l’Open Data et à l’origine du projet Mes

Infos, la FING articule ses activités autour de 4 pôles d’activités : la prospective opérationnelle, l’exploration innovante, les projets

déclencheurs ainsi que l’accélération d’innovateurs. Découvrir le site de la fondation.

GTFSGeneral Transit Feed Specification. Format informatique standardisé pour communiquer des horaires de transports en commun

et les informations géographiques associées (topographie d’un réseau : emplacement des arrêts, tracé des lignes).

HACKATHONRéunion de développeurs, designers, graphistes et autres professionnels, qui dure en général un week-end durant lequel des

équipes programment et réalisent des applications sur des thèmes variés. Un certain nombre de hackathons sont organisés à

partir de jeux de données qui fournissent le thème du hackathon.

KMLKeyhole Markup Language. Il s’agit d’un fichier qui contient des informations d’un lieu que l’on va retrouver sur le navigateur

“terrestre” Google Earth et son système de cartographie Google Maps. Dans ce fichier, on peut retrouver toutes sortes de

descriptions, comme des images, des vidéos, des polygones, des périmètres, des dessins, des modèles 3D, du texte, etc.

LA CANTINELa Cantine est à la fois un lieu de travail et un projet collaboratif dédiés aux nouvelles technologies. Ouverte à tous, elle propose

aux acteurs de l’écosystème numérique un environnement propice à leur rencontre et leur collaboration. Outre son espace, elle

met à disposition un ensemble de services (logistique, conseil, communication) pour propulser les coopérations entre porteurs

de projets, accélérer l’innovation et ainsi favoriser la croissance de ce secteur en plein essor. (source : http://siliconsentier.org/

la-cantine/)

Page 22: open data et crowdsourcing

22

NUMAPépinière parisienne dédiée aux startups et à l’innovation, au sein de la Silicon Sentier. “Numa” fait référence au numérique car

elle est à la fois une plateforme de lancement des innovations numériques et une structure d’accompagnement à chaque étape

des projets, depuis leur élaboration jusqu’à leur phase de déploiement.

MES INFOSProjet français, initié par la FING, de réappropriation par les individus de leurs données personnelles pour les partager

éventuellement avec des offreurs de services. Cette expérimentation est directement inspirée de l’expérience britannique Mydata.

Avec le projet Mesinfos, chacun des 300 volontaires participants ont ainsi accès à leurs données personnelles restituées par les

organisations partenaires du projet via une plate-forme personnelle sécurisée. Ce projet se rattache au concept du VRM (Vendor

Relationship Management) où le consommateur gère son interaction avec ses fournisseurs.

SCORINGTechnique de hiérarchisation des données qui, dans le cadre d’une campagne de marketing direct, permet d’évaluer par une

note ou un score la probabilité qu’un individu réponde à une sollicitation ou appartienne à la cible recherchée.

SCRAPINGProcessus d’aspiration des données d’un site par un robot qui connait et utilise la structure du site pour en extraire les données.

SMALL DATAEn opposition au concept de Big Data, le Small Data désigne les petites quantités de données créées et utilisées par les individus:

traces laissées en surfant sur le web, données collectées par les objets connectés du quotidien, consommation d’énergie d’un

ménage, horaires de bus etc… Le concept de Small Data met en valeur ces petites quantités d’informations qui peuvent suffire,

contrairement au Big Data, pour optimiser des systèmes, faciliter la prise de décisions et ce sans infrastructure trop lourde.

SQLStructured Query Language. Langage de requête pour base de données, défini par Ted Codd d’IBM dans les années 70 pour

interroger les bases de données relationnelles, puis normalisé par l’ANSI (American National Standards Institute).

SILICON SENTIER Silicon Sentier est une association d’entreprises innovantes qui incarne l’identité numérique parisienne. Créée pour promouvoir les

start-up et mutualiser des ressources, aujourd’hui l’association diffuse largement la culture du numérique et favorise l’émergence

de projets individuels ou collectifs en Ile-de-France.

XMLExtensible Markup Language. Language informatique qui sert à enregistrer des données textuelles. Considéré comme un langage

similaire à HTML, sa structure de données et davantage personnalisable.

Page 23: open data et crowdsourcing
Page 24: open data et crowdsourcing

28 rue Pascal - 75005 PARIS01 45 87 72 50 - [email protected]

www.villetransports.fr

Cette rencontre est présidée par

Bénédicte TilloyDirectrice de SNCF Transilien

Elle est imaginée, coordonnée et produite par

L’équipe de Ville & Transports en Ile-de-FranceMarc Thiberville (Président)

Jacques-Jo Brac de la Perrière (Délégué général)

Maryam Benzebiba

Mélina Durand

Thomas Fourquet

Eric Hudault

Basile Pfeiffer

Ingrid de Rio Campo

Grégoire Robida

Claire Roullet Sureau

Avec le soutien de

SNCF Transilienadhérent de VTIF

pour la mise à disposition de la salle