AGMQ 2011 : Les données libres et le territoire

69
|| 1 || COLLOQUE DE L’AGMQ Les données libres et le territoire Concepts et Enjeux Matthieu Noucher PhD Ecole Polytechnique Fédérale de Lausanne (CH) Chargé de cours Universités de Bordeaux, Orléans, St Etienne, Besançon (FR) Consultant en Géomatique, IETI Consultants (FR) Université Laval, Québec 3 mai 2011

description

Colloque annuel de l'Association de Géomatique Municipale du Québec (AGMQ) sur le thème "Les données libres et le territoire" organisé à l'Université Laval, Québec, le 3 mai 2011. Conférence introductive de Matthieu Noucher (France).

Transcript of AGMQ 2011 : Les données libres et le territoire

Page 1: AGMQ 2011 : Les données libres et le territoire

|| 1 ||

COLLOQUE DE L’AGMQ

Les données libres et le territoireConcepts et Enjeux

Matthieu Noucher

PhD Ecole Polytechnique Fédérale de Lausanne (CH)Chargé de cours Universités de Bordeaux, Orléans, St Etienne, Besançon (FR)

Consultant en Géomatique, IETI Consultants (FR)

Université Laval, Québec 3 mai 2011

Page 2: AGMQ 2011 : Les données libres et le territoire

|| 2 ||

Feuille de route

Contextes : Pourquoi ? C’est quoi ? Pour qui ? Comment ?

Exemples : Effet de mode ou tendance de fond ?

Enjeux : Quels impacts et leviers pour les géomaticiens ?

Mise en perspectives : Est-ce vraiment nouveau et massif ?

Recherches : Des données ouvertes à l’innovation distribuée ?

Page 3: AGMQ 2011 : Les données libres et le territoire

|| 3 ||

Contextes

Page 4: AGMQ 2011 : Les données libres et le territoire

|| 4 ||

Les données libres, pourquoi ?

Page 5: AGMQ 2011 : Les données libres et le territoire

|| 5 ||

Les données libres, pourquoi ?

Passer des sites web fonctionnellement riches… Mais dont les données sont encapsulées

dans des environnements pré-paramétrés, … à des infrastructures simples, fiables et

accessibles qui mettent à disposition les données publiques brutes.

« Informer, c’est bien. Informer et donner ses documents sources,

c’est mieux ! »

Page 6: AGMQ 2011 : Les données libres et le territoire

|| 6 ||

Les données libres, pourquoi ?

Page 7: AGMQ 2011 : Les données libres et le territoire

|| 7 ||

Les données libres, c’est quoi ?

Des définitions souvent différentes d’un organisme à l’autre (volet juridique).

Un cadre adapté des logiciels libres et de la FSF : Liberté 1 : utiliser les données, pour tous les usages Liberté 2 : étudier les données, les adapter à ses besoins.

Accès requis aux données et aux métadonnées. Liberté 3 : redistribuer des copies. Liberté 4 : améliorer les données, publier les améliorations.

Accès requis aux données et aux métadonnées.

Page 8: AGMQ 2011 : Les données libres et le territoire

|| 8 ||

Les données ouvertes, c’est quoi ?

Des données qui doivent être des données sources : Un matériau brut, non interprété et réutilisable. La valeur qualitative ou quantitative d’une variable.

La multiplication des jeux de données variés. Les données étant réutilisables, l’ouverture des données

encourage le partage de jeux de données variés : Pour rendre possible des croisements de toute sorte Pour augmenter le potentiel de création de nouveaux usages.

Page 9: AGMQ 2011 : Les données libres et le territoire

|| 9 ||

Les données libres, pour qui ?

Pour les entreprises : qui peuvent utiliser ces données pour enrichir

leurs offres. Pour les développeurs :

qui peuvent utiliser ces données pour créer de nouvelles applications sur votre smartphone, de nouveaux sites web, de nouveaux services informatiques

Pour les journalistes : qui peuvent utiliser ces données pour les analyser en

profondeur et enrichir leurs enquêtes. Pour les citoyens :

qui peuvent y trouver une source d’information sur le fonctionnement des institutions publiques.

Page 10: AGMQ 2011 : Les données libres et le territoire

|| 10 ||

Les données libres, comment ?

Portail de téléchargement : Accès aux données brutes = fichiers à plat.

Plate-forme de services web : Flux normés, interopérables = W*S de l’OGC

Services web de type WMS, WFS, CSW-2… Mais aussi TJS (labellisé OGC depuis décembre 2010).

Application de consultation des données : Interface de programmation = API.

Page 11: AGMQ 2011 : Les données libres et le territoire

|| 11 ||

Les données libres, comment ?

Des points de convergences avec le Web 2.0 Au niveau technique :

Rechercher les données (Tags) Visualiser les dynamiquement (RIA), Communiquer les mises à disposition (RSS), Croiser les données (mashup)

Au niveau des usages : Potentiel collaboratif important. Partager des données, des flux, des services pour co-

construire des représentations. Importance de la dimension géographique

Page 12: AGMQ 2011 : Les données libres et le territoire

|| 12 ||

Et le territoire dans tout ça !?

80 % des données géolocalisées

Page 13: AGMQ 2011 : Les données libres et le territoire

|| 13 ||

Et le territoire dans tout ça !?

La carte « reine des mashups »

Page 14: AGMQ 2011 : Les données libres et le territoire

|| 14 ||

Et le territoire dans tout ça !?

La montée en puissance du géo-crowdsourcing

Page 15: AGMQ 2011 : Les données libres et le territoire

|| 15 ||

Et le territoire dans tout ça !?

80 % des données géolocalisées

+

carte « reine des mashups »

+montée en puissance du géo-crowdsourcing

=données géographiques

au cœur des dynamiques d’ouverture des données.

Page 16: AGMQ 2011 : Les données libres et le territoire

|| 16 ||

Exemples

Page 17: AGMQ 2011 : Les données libres et le territoire

|| 17 ||

Exemple : Ville de Paris

Fin janvier, la capitale a mis en ligne une série de données variées : Statistiques des prêts dans les bibliothèques, Fréquence des prénoms relevés dans les

registres d’état civil, Implantation des arbres d’alignement…

Un premier test… pour voir. Un concours à venir… pour stimuler.

Page 18: AGMQ 2011 : Les données libres et le territoire

|| 18 ||

Exemple : Ville de Paris

Page 19: AGMQ 2011 : Les données libres et le territoire

|| 19 ||

Exemple : Ville de Paris

Page 20: AGMQ 2011 : Les données libres et le territoire

|| 20 ||

Valorisation des données de Paris

Page 21: AGMQ 2011 : Les données libres et le territoire

|| 21 ||

Valorisation des données de Paris

Page 22: AGMQ 2011 : Les données libres et le territoire

|| 22 ||

Valorisation des données de Paris

Page 23: AGMQ 2011 : Les données libres et le territoire

|| 23 ||

Exemple : Rennes, la pionnière

Une démarche volontariste de la Ville et de la Communauté Urbaine, depuis 1er oct. 2010. Un portail : data.rennes-metropole.fr

Mise à disposition de données sur la vie quotidienne, l’urbanisme, les transports. Une quinzaine d’applications créées.

Un concours doté de 50.000 € 43 applications proposées.

Page 24: AGMQ 2011 : Les données libres et le territoire

|| 24 ||

Rennes Open Data

Page 25: AGMQ 2011 : Les données libres et le territoire

|| 25 ||

Site Web Metropolis, Business Geographic

Page 26: AGMQ 2011 : Les données libres et le territoire

|| 26 ||

Vue « 3D » Metropolis, Business Geographic

Page 27: AGMQ 2011 : Les données libres et le territoire

|| 27 ||

App. Metropolis, Business Geographic

Page 28: AGMQ 2011 : Les données libres et le territoire

|| 28 ||

Modèle de flux de Metropolis

Page 29: AGMQ 2011 : Les données libres et le territoire

|| 29 ||

Valorisation des données : Isokron

Source : http://blog.isokron.com/monday-in-rennes

Page 30: AGMQ 2011 : Les données libres et le territoire

|| 30 ||

Valorisation des données : Handimap

Page 31: AGMQ 2011 : Les données libres et le territoire

|| 31 ||

Itinéraire accessible : késako ?

Les critères pris en compte aujourd’hui : Stationnement réservés aux personnes handicapées. Passages piétons avec bordure de trottoir est surbaissée.

Les critères pris en compte demain : Pente du terrain, Obstacles sur le trottoir (mobilier urbain, végétation...) Type de revêtement du trottoir.

Comment récupérer ces critères : data.rennes-metropole.fr + plate-forme de crowdsourcing à venir.

Page 32: AGMQ 2011 : Les données libres et le territoire

|| 32 ||

La Région Auvergne

CRAIG : Centre Régional Auvergnat de l’Information Géographique.

Plate-forme de mutualisation pour l’ensemble des acteurs de la sphère publique.

Acquisition en 2010 d’une série d’orthophotos. Communiqué de presse en août pour l’ouverture

d’un flux WMS pour une utilisation des données dans les outils d'édition OSM (josm, merkaartor..) à l’adresse http://wms.craig.fr/osm

Départements : Allier/Puy de Dôme à 30cm (~16000 km²) Montluçon : agglomération de Montluçon à 15cm (~180 km²) Moulins : agglomération de Moulins à 15cm (~760 km²) Vichy : agglomération de Vichy à 15cm (~ 330 km²)

Page 33: AGMQ 2011 : Les données libres et le territoire

|| 33 ||

La Région Auvergne

Bilan 9 mois après : Impact positif auprès de la communauté :

http://wiki.openstreetmap.org/wiki/WikiProject_France/CRAIG

30.000 objets avec le tag « craig » Environ 200.000 requêtes WMS / mois

Page 34: AGMQ 2011 : Les données libres et le territoire

|| 34 ||

Exemple : Bordeaux

Regroupement : Communauté Urbaine de Bordeaux Conseil Général de Gironde Conseil Régional Aquitaine

Lancement prévu en juin 2011. En attendant…

Un concours pour lancer la dynamique. Des ateliers pour réfléchir à la démarche.

Page 35: AGMQ 2011 : Les données libres et le territoire

|| 35 ||

Exemple de démarche en cours : Bordeaux

Les questions qui se posent : Qui est le commanditaire ?

Les thématiciens ? Les géomaticiens ? Les informaticiens ? Les élus ? La communication ?

Quelles données publier ? Question paradoxale !

Quelles licences choisir ? Réutilisation commerciale possible ou pas ?

Comment publier les données ? Téléchargement ? Quels formats ? Consultation ? Quels API ? Flux ? Quels W*S ?

Où héberger les données ? En interne ou sur le nuage ?

Quelle organisation interne ? Qui fait quoi ? Qui décide ? Qui qualifie ? Qui maintient ?

Quelle organisation externe ? Quel mutualisation possible entre les partenaires ?

Quel niveau d’interaction avec les utilisateurs ? Quelle dispositif de remontée d’information et quelle réactivité ?

Page 36: AGMQ 2011 : Les données libres et le territoire

|| 36 ||

Certains n’ont pas attendu… : iBordeaux.fr

Page 37: AGMQ 2011 : Les données libres et le territoire

|| 37 ||

Enjeux

Page 38: AGMQ 2011 : Les données libres et le territoire

|| 38 ||

Des enjeux (vraiment) nouveaux ?

Des sollicitations nouvelles pour les géomaticiens… … qui font resurgir

des problèmes parfois très anciens !

Quelle politique de diffusion des données ? Comment qualifier les données ? Comment maintenir la cohérence des données ? Comment faire dialoguer amateurs et professionnels ? Comment satisfaire besoins collectifs - usages individuels ? Etc.

Page 39: AGMQ 2011 : Les données libres et le territoire

|| 39 ||

Les tensions… à équilibrer

Amateur Expert

Qualitéinterne

Qualitéexterne

Grand Public Professionnel

Autonomie Coordination

StandardisationPersonnalisation

Page 40: AGMQ 2011 : Les données libres et le territoire

|| 40 ||

Les données

Constat sur les usages liés à l’observation des usages : La principale difficulté de la production dite « traditionnelle » est liée

à la déconnexion entre le producteur (institutions ou sociétés privées) et l’utilisateur puisque ce dernier ne participe pas à la conception des données, souvent produites « sur étagère ».

Dans le cas de la production collaborative dite « crowdsourcing » la difficulté réside dans la dispersion des producteurs / utilisateurs qui parfois ne sont même pas authentifiés.

Tension mise en évidence :

Qualité interneQualité externe

Page 41: AGMQ 2011 : Les données libres et le territoire

|| 41 ||

Les données : tension

Qualité interne versus qualité externe : Qualité interne = niveau d’adéquation entre la

donnée et ce qu’elle aurait dû être si elle était parfaite. Qualité externe = niveau d’adéquation entre la

donnée et les besoins de son utilisateur (« fitness for use »).

Beaucoup de travaux des producteurs institutionnels sur la qualité interne mais peu de travaux se sont intéressés à la mesure de la qualité externe : Besoin de mieux comprendre les besoins des

utilisateurs, le lien entre qualité interne et usage, etc.

Page 42: AGMQ 2011 : Les données libres et le territoire

|| 42 ||

Les données : leviers

Les métadonnées… oui, mais… Norme en vigueur trop complexe pour les amateurs.

La gestion par tags… oui mais… Mots clés trop simples pour les professionnels.

Piste possible : Une évaluation collaborative pour un usage collaboratif ? Mettre à contribution les utilisateurs eux-mêmes. Développer des moteurs de confiance

Modèle d’e-bay.

Page 43: AGMQ 2011 : Les données libres et le territoire

|| 43 ||

Les outils

Constat sur les usages observés : Des utilisateurs désormais habitués à voir des cartes et à utiliser

des outils grand public. Des acteurs nouveaux (Google, Microsoft) dont les outils

deviennent la norme. Des géomaticiens centré sur le potentiel fonctionnel plutôt que sur

l’utilisabilité du système : « Degré selon lequel un produit peut être utilisé, par des utilisateurs

identifiés, pour atteindre des buts définis avec efficacité, efficience et satisfaction, dans un contexte d’utilisation spécifié » Norme 9241.

Tension mise en évidence :

Grand PublicProfessionnel

Page 44: AGMQ 2011 : Les données libres et le territoire

|| 44 ||

Les outils : tension

Comment valoriser les données géographiques de l’organisation dans des interfaces aussi simples et efficaces que Google Maps ?

Comment ne pas « ringardiser » le SIG ?

?

Page 45: AGMQ 2011 : Les données libres et le territoire

|| 45 ||

Les outils : leviers d’action

Pistes actuellement proposées par les éditeurs : Les Applications Internet Riches (RIA)

Flex pour l’essentiel. Silverlight de plus en plus.

Des géotags dérivés des métadonnées pour faciliter les recherches.

La gestion des données sous la forme de POI. La simplification des interfaces / fonctions.

Page 46: AGMQ 2011 : Les données libres et le territoire

|| 46 ||

Les acteurs

Constat sur les usages observés : L’externalisation de la production vers les

consommateurs pose la question de la relation entre : la sphère professionnelle (qui réutilise et même dans certains

cas alimente en fond de plan ces systèmes) et la sphère des amateurs (qui crée, corrige et actualise ces

systèmes). Difficulté de filtrer l’information pertinente et utile pour un besoin

donné. Risque d’infobésité : Comment retrouver l’information

géographique nécessaire et suffisante qui répondra à mon besoin ?

Tension mise en évidence :Amateur

Expert

Page 47: AGMQ 2011 : Les données libres et le territoire

|| 47 ||

Les acteurs : tension

Le profil du néophyte : N’y connaît à priori rien en géomatique, en production de données et en

cartographie, Peut connaître parfaitement bien la zone qu’il cartographie. Probabilité forte qu’il produise des données fausses et non conformes

aux spécifications en termes de structuration. Le profil de l’amateur insouciant :

Peu soucieux de la responsabilité exercée automatiquement par son action de production de données.

« D’autres corrigeront mes erreurs » Le profil du vandale :

Rare, mais actif et potentiellement dévastateur, Contributeur anonyme détruisant la BD pour diverses motivations :

Jeu, terrorisme, idéologie, concurrence déloyale, vengeance personnelle, etc.

Ce paragraphe est extrait d’un dossier de la revue Signature du CERTU (Mang, 2010) :http://www.certu.fr/download.php?file_url=IMG/pdf/signature_n_42.pdf

Page 48: AGMQ 2011 : Les données libres et le territoire

|| 48 ||

Les acteurs : leviers d’action

Pour intégrer le néophyte : Wiki, listes de diffusion, forums, documents d’aide et de

spécifications clair et incontournable Ergonomie assistée (par ex., contrôle à la volée de la topologie) Métadonnées obligatoires

Pour aider l’amateur insouciant : Sensibilisation, formation.

Pour contrer le vandale : Prévention des robots : demande de saisie manuelle anti-spam Détection des modifications « denses » :

Nombre important de modifications d’objets existants dans un temps relativement court et/ou sur une zone relativement concentrée.

Moteur de confiance (modèle eBay)

Ce paragraphe est extrait d’un dossier de la revue Signature du CERTU (Mang, 2010) :http://www.certu.fr/download.php?file_url=IMG/pdf/signature_n_42.pdf

Page 49: AGMQ 2011 : Les données libres et le territoire

|| 49 ||

Les organisations

Constat sur les usages observés : Difficulté de mettre à disposition un service

suffisamment standard pour intéresser le maximum d’utilisateurs et suffisamment personnalisable pour que chacun se l’approprie ?

Risque d’éparpillement : Comment veiller au maintien de la cohérence des productions ?

Tension mise en évidence :

AutonomieCoordination

Page 50: AGMQ 2011 : Les données libres et le territoire

|| 50 ||

Les organisations : tension

Page 51: AGMQ 2011 : Les données libres et le territoire

|| 51 ||

Les organisations : leviers d’action

Levier sur les données : S’appuyer sur des référentiels

qui serviront de dénominateurs communs entre les auto-productions.

Levier sur les processus organisationnels : Mettre en place des dispositifs

participatifs de remontée d’information qui facilitent la confrontation entre auto-producteurs.

Comité d’OrientationStratégique

Comité de Suivi

Technique

GroupeThématique

GroupeThématique

Utilisateurs des Différents Services

Présentation

Orientation Orientation

Animation

Participation

Page 52: AGMQ 2011 : Les données libres et le territoire

|| 52 ||

Les représentations

Constat sur les usages observés : Distribution de la production vers les communautés de pratique.

Production générée par la confrontation des points de vue d’experts sur une thématique donnée.

Bien souvent la thématique est à la frontière entre plusieurs domaines de compétences d’organisations différentes (enjeux stratégiques) et à la frontière entre différents métiers du territoire (enjeux cognitifs).

Tension mise en évidence :

StandardisationPersonnalisation

Page 53: AGMQ 2011 : Les données libres et le territoire

|| 53 ||

Les représentations : tension

Adapté de Maurel (2001)

ESPACEPHYSIQUE

REPRESENTATIONSSPATIALESEXTERNES

RAISONNEMENT SPATIAL

REPRESENTATIONSSPATIALESINTERNES

Interprétation

Médiatisation

COMMUNICATION

Références individuelles et socialeset pratique de l’espace

Outils d’acquisition (capteurs)

De l’individuel…

… au collectif

Les

enje

uxde

la c

o-pr

oduc

tion

Page 54: AGMQ 2011 : Les données libres et le territoire

|| 54 ||

Les représentations : leviers d’action

Des logiques de compromis (PPDC)… …au consensus différencié.

Partir d’un porter à connaissance des # pour découvrir les typages cognitifs des acteurs.

Affirmer et affiner progressivement les visions métier. Comprendre et légitimer les actions de ses partenaires mais aussi

ses propres actions. Concevoir la coproduction de données géographiques comme un

processus d’apprentissage et de créativité qui permet de :

Confirmer les points communs

Affirmer définitivement les différences

Rapprocher des points # seulement en apparence

Faire émerger des solutions alternatives

« La nomenclature doit faire

apparaître les usages »

VERSUS« La nomenclature doit révéler ce qui se voit sur une photo »

Page 55: AGMQ 2011 : Les données libres et le territoire

|| 55 ||

Nouveaux enjeux : conclusion

Nécessité de réfléchir aux usages qui découlent des nouveaux modes de production de données géographiques pour envisager les dispositifs adéquats qui doivent nécessairement les accompagner.

Impacts sur les données : Des référentiels davantage documentés (métadonnées)…

Impacts sur les outils : Des IHM + interactives, + dynamiques, + immersives…

Impacts sur les méthodes d’animation : Des logiques d’action à plus forte valeur ajoutée…

Impacts sur les processus organisationnels : Des dispositifs plus participatifs…

Page 56: AGMQ 2011 : Les données libres et le territoire

|| 56 ||

Mise en perspectives

Page 57: AGMQ 2011 : Les données libres et le territoire

|| 57 ||

Est-ce vraiment nouveau ?

Page 58: AGMQ 2011 : Les données libres et le territoire

|| 58 ||

Est-ce vraiment nouveau ?

Page 59: AGMQ 2011 : Les données libres et le territoire

|| 59 ||

Est-ce vraiment un phénomène de masse ?

Page 60: AGMQ 2011 : Les données libres et le territoire

|| 60 ||

Est-ce vraiment un phénomène de masse ?

Page 61: AGMQ 2011 : Les données libres et le territoire

|| 61 ||

Recherches

Page 62: AGMQ 2011 : Les données libres et le territoire

|| 62 ||

Des SIG en silos… à l’information géographique en réseaux

Les SIG : catalyseurs de l’ouverture inter-organisationnelle. Développement des Infrastructures de

Données Géographiques (IDG).

Les données SIG libres : catalyseurs de l’ouverture inter-individuelle. Développement des Communautés de

Pratique (CoP).

Page 63: AGMQ 2011 : Les données libres et le territoire

|| 63 ||

Des Données Ouvertes à l’Innovation Ouverte

L’innovation ouverte (ou innovation distribuée) a été théorisée par Chesborough et se définit comme un mode d'innovation basé sur le partage, la collaboration et la sérendipité.

L’ouverture des données publiques peut conduire les utilisateurs à se placer dans une logique de coproduction de services d’où peuvent émerger des innovations.

En balayant les travaux de chercheurs (comme Flichy ou von Hippel), on peut plus particulièrement à mettre en évidence le potentiel collaboratif de ces innovations.

Page 64: AGMQ 2011 : Les données libres et le territoire

|| 64 ||

La sérendipité (1/2)

La sérendipité est le fait de réaliser une découverte inattendue au cours d'une recherche dirigée initialement vers un objet différent de cette découverte.

Concept qui traduit également la transformation de nos usages du Web : De la recherche… à la découverte.

Page 65: AGMQ 2011 : Les données libres et le territoire

|| 65 ||

La sérendipité (2/2)

Quatre constructions possibles de la sérendipité (selon Nothaft, 2010) : Sérendipité éditoriale : combinaison suscitée par

une personne extérieur qui présupposent des connexions thématiques possibles.

Sérendipité sociale : combinaison suscitée par les réseaux sociaux (recommandations).

Sérendipité crowdsourcée : combinaison suscitée par la popularité du contenu (hits).

Sérendipité algorithmique : combinaison suscitée par du croisement de base de données externes et personnelles.

Page 66: AGMQ 2011 : Les données libres et le territoire

|| 66 ||

Perspectives de recherche (1/3)

De l’innovation distribuée…

… à la cognition distribuée

Pour une recherche sur l’usage des données libres.

Page 67: AGMQ 2011 : Les données libres et le territoire

|| 67 ||

Perspectives de recherche (2/3)

De développeurs…

… aux facilitateurs

Pour une recherche sur les nouvelles compétences à développer.

Page 68: AGMQ 2011 : Les données libres et le territoire

|| 68 ||

Perspectives de recherche (3/3)

Des plates-formes de diffusion…

… aux outils de négociation

Pour une recherche sur les interfaces de production

collaborative et argumentée

Page 69: AGMQ 2011 : Les données libres et le territoire

|| 69 ||

Mardi 3 mai 2011

Colloque AGMQ - Université de Laval, Québec.

Matthieu NOUCHER

[email protected]

https://sites.google.com/site/matthieunoucher/

Merci de votre attention !