AGMQ 2011 : Les données libres et le territoire

Post on 18-May-2015

1.199 views 2 download

description

Colloque annuel de l'Association de Géomatique Municipale du Québec (AGMQ) sur le thème "Les données libres et le territoire" organisé à l'Université Laval, Québec, le 3 mai 2011. Conférence introductive de Matthieu Noucher (France).

Transcript of AGMQ 2011 : Les données libres et le territoire

|| 1 ||

COLLOQUE DE L’AGMQ

Les données libres et le territoireConcepts et Enjeux

Matthieu Noucher

PhD Ecole Polytechnique Fédérale de Lausanne (CH)Chargé de cours Universités de Bordeaux, Orléans, St Etienne, Besançon (FR)

Consultant en Géomatique, IETI Consultants (FR)

Université Laval, Québec 3 mai 2011

|| 2 ||

Feuille de route

Contextes : Pourquoi ? C’est quoi ? Pour qui ? Comment ?

Exemples : Effet de mode ou tendance de fond ?

Enjeux : Quels impacts et leviers pour les géomaticiens ?

Mise en perspectives : Est-ce vraiment nouveau et massif ?

Recherches : Des données ouvertes à l’innovation distribuée ?

|| 3 ||

Contextes

|| 4 ||

Les données libres, pourquoi ?

|| 5 ||

Les données libres, pourquoi ?

Passer des sites web fonctionnellement riches… Mais dont les données sont encapsulées

dans des environnements pré-paramétrés, … à des infrastructures simples, fiables et

accessibles qui mettent à disposition les données publiques brutes.

« Informer, c’est bien. Informer et donner ses documents sources,

c’est mieux ! »

|| 6 ||

Les données libres, pourquoi ?

|| 7 ||

Les données libres, c’est quoi ?

Des définitions souvent différentes d’un organisme à l’autre (volet juridique).

Un cadre adapté des logiciels libres et de la FSF : Liberté 1 : utiliser les données, pour tous les usages Liberté 2 : étudier les données, les adapter à ses besoins.

Accès requis aux données et aux métadonnées. Liberté 3 : redistribuer des copies. Liberté 4 : améliorer les données, publier les améliorations.

Accès requis aux données et aux métadonnées.

|| 8 ||

Les données ouvertes, c’est quoi ?

Des données qui doivent être des données sources : Un matériau brut, non interprété et réutilisable. La valeur qualitative ou quantitative d’une variable.

La multiplication des jeux de données variés. Les données étant réutilisables, l’ouverture des données

encourage le partage de jeux de données variés : Pour rendre possible des croisements de toute sorte Pour augmenter le potentiel de création de nouveaux usages.

|| 9 ||

Les données libres, pour qui ?

Pour les entreprises : qui peuvent utiliser ces données pour enrichir

leurs offres. Pour les développeurs :

qui peuvent utiliser ces données pour créer de nouvelles applications sur votre smartphone, de nouveaux sites web, de nouveaux services informatiques

Pour les journalistes : qui peuvent utiliser ces données pour les analyser en

profondeur et enrichir leurs enquêtes. Pour les citoyens :

qui peuvent y trouver une source d’information sur le fonctionnement des institutions publiques.

|| 10 ||

Les données libres, comment ?

Portail de téléchargement : Accès aux données brutes = fichiers à plat.

Plate-forme de services web : Flux normés, interopérables = W*S de l’OGC

Services web de type WMS, WFS, CSW-2… Mais aussi TJS (labellisé OGC depuis décembre 2010).

Application de consultation des données : Interface de programmation = API.

|| 11 ||

Les données libres, comment ?

Des points de convergences avec le Web 2.0 Au niveau technique :

Rechercher les données (Tags) Visualiser les dynamiquement (RIA), Communiquer les mises à disposition (RSS), Croiser les données (mashup)

Au niveau des usages : Potentiel collaboratif important. Partager des données, des flux, des services pour co-

construire des représentations. Importance de la dimension géographique

|| 12 ||

Et le territoire dans tout ça !?

80 % des données géolocalisées

|| 13 ||

Et le territoire dans tout ça !?

La carte « reine des mashups »

|| 14 ||

Et le territoire dans tout ça !?

La montée en puissance du géo-crowdsourcing

|| 15 ||

Et le territoire dans tout ça !?

80 % des données géolocalisées

+

carte « reine des mashups »

+montée en puissance du géo-crowdsourcing

=données géographiques

au cœur des dynamiques d’ouverture des données.

|| 16 ||

Exemples

|| 17 ||

Exemple : Ville de Paris

Fin janvier, la capitale a mis en ligne une série de données variées : Statistiques des prêts dans les bibliothèques, Fréquence des prénoms relevés dans les

registres d’état civil, Implantation des arbres d’alignement…

Un premier test… pour voir. Un concours à venir… pour stimuler.

|| 18 ||

Exemple : Ville de Paris

|| 19 ||

Exemple : Ville de Paris

|| 20 ||

Valorisation des données de Paris

|| 21 ||

Valorisation des données de Paris

|| 22 ||

Valorisation des données de Paris

|| 23 ||

Exemple : Rennes, la pionnière

Une démarche volontariste de la Ville et de la Communauté Urbaine, depuis 1er oct. 2010. Un portail : data.rennes-metropole.fr

Mise à disposition de données sur la vie quotidienne, l’urbanisme, les transports. Une quinzaine d’applications créées.

Un concours doté de 50.000 € 43 applications proposées.

|| 24 ||

Rennes Open Data

|| 25 ||

Site Web Metropolis, Business Geographic

|| 26 ||

Vue « 3D » Metropolis, Business Geographic

|| 27 ||

App. Metropolis, Business Geographic

|| 28 ||

Modèle de flux de Metropolis

|| 29 ||

Valorisation des données : Isokron

Source : http://blog.isokron.com/monday-in-rennes

|| 30 ||

Valorisation des données : Handimap

|| 31 ||

Itinéraire accessible : késako ?

Les critères pris en compte aujourd’hui : Stationnement réservés aux personnes handicapées. Passages piétons avec bordure de trottoir est surbaissée.

Les critères pris en compte demain : Pente du terrain, Obstacles sur le trottoir (mobilier urbain, végétation...) Type de revêtement du trottoir.

Comment récupérer ces critères : data.rennes-metropole.fr + plate-forme de crowdsourcing à venir.

|| 32 ||

La Région Auvergne

CRAIG : Centre Régional Auvergnat de l’Information Géographique.

Plate-forme de mutualisation pour l’ensemble des acteurs de la sphère publique.

Acquisition en 2010 d’une série d’orthophotos. Communiqué de presse en août pour l’ouverture

d’un flux WMS pour une utilisation des données dans les outils d'édition OSM (josm, merkaartor..) à l’adresse http://wms.craig.fr/osm

Départements : Allier/Puy de Dôme à 30cm (~16000 km²) Montluçon : agglomération de Montluçon à 15cm (~180 km²) Moulins : agglomération de Moulins à 15cm (~760 km²) Vichy : agglomération de Vichy à 15cm (~ 330 km²)

|| 33 ||

La Région Auvergne

Bilan 9 mois après : Impact positif auprès de la communauté :

http://wiki.openstreetmap.org/wiki/WikiProject_France/CRAIG

30.000 objets avec le tag « craig » Environ 200.000 requêtes WMS / mois

|| 34 ||

Exemple : Bordeaux

Regroupement : Communauté Urbaine de Bordeaux Conseil Général de Gironde Conseil Régional Aquitaine

Lancement prévu en juin 2011. En attendant…

Un concours pour lancer la dynamique. Des ateliers pour réfléchir à la démarche.

|| 35 ||

Exemple de démarche en cours : Bordeaux

Les questions qui se posent : Qui est le commanditaire ?

Les thématiciens ? Les géomaticiens ? Les informaticiens ? Les élus ? La communication ?

Quelles données publier ? Question paradoxale !

Quelles licences choisir ? Réutilisation commerciale possible ou pas ?

Comment publier les données ? Téléchargement ? Quels formats ? Consultation ? Quels API ? Flux ? Quels W*S ?

Où héberger les données ? En interne ou sur le nuage ?

Quelle organisation interne ? Qui fait quoi ? Qui décide ? Qui qualifie ? Qui maintient ?

Quelle organisation externe ? Quel mutualisation possible entre les partenaires ?

Quel niveau d’interaction avec les utilisateurs ? Quelle dispositif de remontée d’information et quelle réactivité ?

|| 36 ||

Certains n’ont pas attendu… : iBordeaux.fr

|| 37 ||

Enjeux

|| 38 ||

Des enjeux (vraiment) nouveaux ?

Des sollicitations nouvelles pour les géomaticiens… … qui font resurgir

des problèmes parfois très anciens !

Quelle politique de diffusion des données ? Comment qualifier les données ? Comment maintenir la cohérence des données ? Comment faire dialoguer amateurs et professionnels ? Comment satisfaire besoins collectifs - usages individuels ? Etc.

|| 39 ||

Les tensions… à équilibrer

Amateur Expert

Qualitéinterne

Qualitéexterne

Grand Public Professionnel

Autonomie Coordination

StandardisationPersonnalisation

|| 40 ||

Les données

Constat sur les usages liés à l’observation des usages : La principale difficulté de la production dite « traditionnelle » est liée

à la déconnexion entre le producteur (institutions ou sociétés privées) et l’utilisateur puisque ce dernier ne participe pas à la conception des données, souvent produites « sur étagère ».

Dans le cas de la production collaborative dite « crowdsourcing » la difficulté réside dans la dispersion des producteurs / utilisateurs qui parfois ne sont même pas authentifiés.

Tension mise en évidence :

Qualité interneQualité externe

|| 41 ||

Les données : tension

Qualité interne versus qualité externe : Qualité interne = niveau d’adéquation entre la

donnée et ce qu’elle aurait dû être si elle était parfaite. Qualité externe = niveau d’adéquation entre la

donnée et les besoins de son utilisateur (« fitness for use »).

Beaucoup de travaux des producteurs institutionnels sur la qualité interne mais peu de travaux se sont intéressés à la mesure de la qualité externe : Besoin de mieux comprendre les besoins des

utilisateurs, le lien entre qualité interne et usage, etc.

|| 42 ||

Les données : leviers

Les métadonnées… oui, mais… Norme en vigueur trop complexe pour les amateurs.

La gestion par tags… oui mais… Mots clés trop simples pour les professionnels.

Piste possible : Une évaluation collaborative pour un usage collaboratif ? Mettre à contribution les utilisateurs eux-mêmes. Développer des moteurs de confiance

Modèle d’e-bay.

|| 43 ||

Les outils

Constat sur les usages observés : Des utilisateurs désormais habitués à voir des cartes et à utiliser

des outils grand public. Des acteurs nouveaux (Google, Microsoft) dont les outils

deviennent la norme. Des géomaticiens centré sur le potentiel fonctionnel plutôt que sur

l’utilisabilité du système : « Degré selon lequel un produit peut être utilisé, par des utilisateurs

identifiés, pour atteindre des buts définis avec efficacité, efficience et satisfaction, dans un contexte d’utilisation spécifié » Norme 9241.

Tension mise en évidence :

Grand PublicProfessionnel

|| 44 ||

Les outils : tension

Comment valoriser les données géographiques de l’organisation dans des interfaces aussi simples et efficaces que Google Maps ?

Comment ne pas « ringardiser » le SIG ?

?

|| 45 ||

Les outils : leviers d’action

Pistes actuellement proposées par les éditeurs : Les Applications Internet Riches (RIA)

Flex pour l’essentiel. Silverlight de plus en plus.

Des géotags dérivés des métadonnées pour faciliter les recherches.

La gestion des données sous la forme de POI. La simplification des interfaces / fonctions.

|| 46 ||

Les acteurs

Constat sur les usages observés : L’externalisation de la production vers les

consommateurs pose la question de la relation entre : la sphère professionnelle (qui réutilise et même dans certains

cas alimente en fond de plan ces systèmes) et la sphère des amateurs (qui crée, corrige et actualise ces

systèmes). Difficulté de filtrer l’information pertinente et utile pour un besoin

donné. Risque d’infobésité : Comment retrouver l’information

géographique nécessaire et suffisante qui répondra à mon besoin ?

Tension mise en évidence :Amateur

Expert

|| 47 ||

Les acteurs : tension

Le profil du néophyte : N’y connaît à priori rien en géomatique, en production de données et en

cartographie, Peut connaître parfaitement bien la zone qu’il cartographie. Probabilité forte qu’il produise des données fausses et non conformes

aux spécifications en termes de structuration. Le profil de l’amateur insouciant :

Peu soucieux de la responsabilité exercée automatiquement par son action de production de données.

« D’autres corrigeront mes erreurs » Le profil du vandale :

Rare, mais actif et potentiellement dévastateur, Contributeur anonyme détruisant la BD pour diverses motivations :

Jeu, terrorisme, idéologie, concurrence déloyale, vengeance personnelle, etc.

Ce paragraphe est extrait d’un dossier de la revue Signature du CERTU (Mang, 2010) :http://www.certu.fr/download.php?file_url=IMG/pdf/signature_n_42.pdf

|| 48 ||

Les acteurs : leviers d’action

Pour intégrer le néophyte : Wiki, listes de diffusion, forums, documents d’aide et de

spécifications clair et incontournable Ergonomie assistée (par ex., contrôle à la volée de la topologie) Métadonnées obligatoires

Pour aider l’amateur insouciant : Sensibilisation, formation.

Pour contrer le vandale : Prévention des robots : demande de saisie manuelle anti-spam Détection des modifications « denses » :

Nombre important de modifications d’objets existants dans un temps relativement court et/ou sur une zone relativement concentrée.

Moteur de confiance (modèle eBay)

Ce paragraphe est extrait d’un dossier de la revue Signature du CERTU (Mang, 2010) :http://www.certu.fr/download.php?file_url=IMG/pdf/signature_n_42.pdf

|| 49 ||

Les organisations

Constat sur les usages observés : Difficulté de mettre à disposition un service

suffisamment standard pour intéresser le maximum d’utilisateurs et suffisamment personnalisable pour que chacun se l’approprie ?

Risque d’éparpillement : Comment veiller au maintien de la cohérence des productions ?

Tension mise en évidence :

AutonomieCoordination

|| 50 ||

Les organisations : tension

|| 51 ||

Les organisations : leviers d’action

Levier sur les données : S’appuyer sur des référentiels

qui serviront de dénominateurs communs entre les auto-productions.

Levier sur les processus organisationnels : Mettre en place des dispositifs

participatifs de remontée d’information qui facilitent la confrontation entre auto-producteurs.

Comité d’OrientationStratégique

Comité de Suivi

Technique

GroupeThématique

GroupeThématique

Utilisateurs des Différents Services

Présentation

Orientation Orientation

Animation

Participation

|| 52 ||

Les représentations

Constat sur les usages observés : Distribution de la production vers les communautés de pratique.

Production générée par la confrontation des points de vue d’experts sur une thématique donnée.

Bien souvent la thématique est à la frontière entre plusieurs domaines de compétences d’organisations différentes (enjeux stratégiques) et à la frontière entre différents métiers du territoire (enjeux cognitifs).

Tension mise en évidence :

StandardisationPersonnalisation

|| 53 ||

Les représentations : tension

Adapté de Maurel (2001)

ESPACEPHYSIQUE

REPRESENTATIONSSPATIALESEXTERNES

RAISONNEMENT SPATIAL

REPRESENTATIONSSPATIALESINTERNES

Interprétation

Médiatisation

COMMUNICATION

Références individuelles et socialeset pratique de l’espace

Outils d’acquisition (capteurs)

De l’individuel…

… au collectif

Les

enje

uxde

la c

o-pr

oduc

tion

|| 54 ||

Les représentations : leviers d’action

Des logiques de compromis (PPDC)… …au consensus différencié.

Partir d’un porter à connaissance des # pour découvrir les typages cognitifs des acteurs.

Affirmer et affiner progressivement les visions métier. Comprendre et légitimer les actions de ses partenaires mais aussi

ses propres actions. Concevoir la coproduction de données géographiques comme un

processus d’apprentissage et de créativité qui permet de :

Confirmer les points communs

Affirmer définitivement les différences

Rapprocher des points # seulement en apparence

Faire émerger des solutions alternatives

« La nomenclature doit faire

apparaître les usages »

VERSUS« La nomenclature doit révéler ce qui se voit sur une photo »

|| 55 ||

Nouveaux enjeux : conclusion

Nécessité de réfléchir aux usages qui découlent des nouveaux modes de production de données géographiques pour envisager les dispositifs adéquats qui doivent nécessairement les accompagner.

Impacts sur les données : Des référentiels davantage documentés (métadonnées)…

Impacts sur les outils : Des IHM + interactives, + dynamiques, + immersives…

Impacts sur les méthodes d’animation : Des logiques d’action à plus forte valeur ajoutée…

Impacts sur les processus organisationnels : Des dispositifs plus participatifs…

|| 56 ||

Mise en perspectives

|| 57 ||

Est-ce vraiment nouveau ?

|| 58 ||

Est-ce vraiment nouveau ?

|| 59 ||

Est-ce vraiment un phénomène de masse ?

|| 60 ||

Est-ce vraiment un phénomène de masse ?

|| 61 ||

Recherches

|| 62 ||

Des SIG en silos… à l’information géographique en réseaux

Les SIG : catalyseurs de l’ouverture inter-organisationnelle. Développement des Infrastructures de

Données Géographiques (IDG).

Les données SIG libres : catalyseurs de l’ouverture inter-individuelle. Développement des Communautés de

Pratique (CoP).

|| 63 ||

Des Données Ouvertes à l’Innovation Ouverte

L’innovation ouverte (ou innovation distribuée) a été théorisée par Chesborough et se définit comme un mode d'innovation basé sur le partage, la collaboration et la sérendipité.

L’ouverture des données publiques peut conduire les utilisateurs à se placer dans une logique de coproduction de services d’où peuvent émerger des innovations.

En balayant les travaux de chercheurs (comme Flichy ou von Hippel), on peut plus particulièrement à mettre en évidence le potentiel collaboratif de ces innovations.

|| 64 ||

La sérendipité (1/2)

La sérendipité est le fait de réaliser une découverte inattendue au cours d'une recherche dirigée initialement vers un objet différent de cette découverte.

Concept qui traduit également la transformation de nos usages du Web : De la recherche… à la découverte.

|| 65 ||

La sérendipité (2/2)

Quatre constructions possibles de la sérendipité (selon Nothaft, 2010) : Sérendipité éditoriale : combinaison suscitée par

une personne extérieur qui présupposent des connexions thématiques possibles.

Sérendipité sociale : combinaison suscitée par les réseaux sociaux (recommandations).

Sérendipité crowdsourcée : combinaison suscitée par la popularité du contenu (hits).

Sérendipité algorithmique : combinaison suscitée par du croisement de base de données externes et personnelles.

|| 66 ||

Perspectives de recherche (1/3)

De l’innovation distribuée…

… à la cognition distribuée

Pour une recherche sur l’usage des données libres.

|| 67 ||

Perspectives de recherche (2/3)

De développeurs…

… aux facilitateurs

Pour une recherche sur les nouvelles compétences à développer.

|| 68 ||

Perspectives de recherche (3/3)

Des plates-formes de diffusion…

… aux outils de négociation

Pour une recherche sur les interfaces de production

collaborative et argumentée

|| 69 ||

Mardi 3 mai 2011

Colloque AGMQ - Université de Laval, Québec.

Matthieu NOUCHER

matthieu.noucher@a3.epfl.ch

https://sites.google.com/site/matthieunoucher/

Merci de votre attention !