AGMQ 2011 : Les données libres et le territoire
-
Upload
noucher -
Category
Technology
-
view
1.199 -
download
2
description
Transcript of AGMQ 2011 : Les données libres et le territoire
|| 1 ||
COLLOQUE DE L’AGMQ
Les données libres et le territoireConcepts et Enjeux
Matthieu Noucher
PhD Ecole Polytechnique Fédérale de Lausanne (CH)Chargé de cours Universités de Bordeaux, Orléans, St Etienne, Besançon (FR)
Consultant en Géomatique, IETI Consultants (FR)
Université Laval, Québec 3 mai 2011
|| 2 ||
Feuille de route
Contextes : Pourquoi ? C’est quoi ? Pour qui ? Comment ?
Exemples : Effet de mode ou tendance de fond ?
Enjeux : Quels impacts et leviers pour les géomaticiens ?
Mise en perspectives : Est-ce vraiment nouveau et massif ?
Recherches : Des données ouvertes à l’innovation distribuée ?
|| 3 ||
Contextes
|| 4 ||
Les données libres, pourquoi ?
|| 5 ||
Les données libres, pourquoi ?
Passer des sites web fonctionnellement riches… Mais dont les données sont encapsulées
dans des environnements pré-paramétrés, … à des infrastructures simples, fiables et
accessibles qui mettent à disposition les données publiques brutes.
« Informer, c’est bien. Informer et donner ses documents sources,
c’est mieux ! »
|| 6 ||
Les données libres, pourquoi ?
|| 7 ||
Les données libres, c’est quoi ?
Des définitions souvent différentes d’un organisme à l’autre (volet juridique).
Un cadre adapté des logiciels libres et de la FSF : Liberté 1 : utiliser les données, pour tous les usages Liberté 2 : étudier les données, les adapter à ses besoins.
Accès requis aux données et aux métadonnées. Liberté 3 : redistribuer des copies. Liberté 4 : améliorer les données, publier les améliorations.
Accès requis aux données et aux métadonnées.
|| 8 ||
Les données ouvertes, c’est quoi ?
Des données qui doivent être des données sources : Un matériau brut, non interprété et réutilisable. La valeur qualitative ou quantitative d’une variable.
La multiplication des jeux de données variés. Les données étant réutilisables, l’ouverture des données
encourage le partage de jeux de données variés : Pour rendre possible des croisements de toute sorte Pour augmenter le potentiel de création de nouveaux usages.
|| 9 ||
Les données libres, pour qui ?
Pour les entreprises : qui peuvent utiliser ces données pour enrichir
leurs offres. Pour les développeurs :
qui peuvent utiliser ces données pour créer de nouvelles applications sur votre smartphone, de nouveaux sites web, de nouveaux services informatiques
Pour les journalistes : qui peuvent utiliser ces données pour les analyser en
profondeur et enrichir leurs enquêtes. Pour les citoyens :
qui peuvent y trouver une source d’information sur le fonctionnement des institutions publiques.
|| 10 ||
Les données libres, comment ?
Portail de téléchargement : Accès aux données brutes = fichiers à plat.
Plate-forme de services web : Flux normés, interopérables = W*S de l’OGC
Services web de type WMS, WFS, CSW-2… Mais aussi TJS (labellisé OGC depuis décembre 2010).
Application de consultation des données : Interface de programmation = API.
|| 11 ||
Les données libres, comment ?
Des points de convergences avec le Web 2.0 Au niveau technique :
Rechercher les données (Tags) Visualiser les dynamiquement (RIA), Communiquer les mises à disposition (RSS), Croiser les données (mashup)
Au niveau des usages : Potentiel collaboratif important. Partager des données, des flux, des services pour co-
construire des représentations. Importance de la dimension géographique
|| 12 ||
Et le territoire dans tout ça !?
80 % des données géolocalisées
|| 13 ||
Et le territoire dans tout ça !?
La carte « reine des mashups »
|| 14 ||
Et le territoire dans tout ça !?
La montée en puissance du géo-crowdsourcing
|| 15 ||
Et le territoire dans tout ça !?
80 % des données géolocalisées
+
carte « reine des mashups »
+montée en puissance du géo-crowdsourcing
=données géographiques
au cœur des dynamiques d’ouverture des données.
|| 16 ||
Exemples
|| 17 ||
Exemple : Ville de Paris
Fin janvier, la capitale a mis en ligne une série de données variées : Statistiques des prêts dans les bibliothèques, Fréquence des prénoms relevés dans les
registres d’état civil, Implantation des arbres d’alignement…
Un premier test… pour voir. Un concours à venir… pour stimuler.
|| 18 ||
Exemple : Ville de Paris
|| 19 ||
Exemple : Ville de Paris
|| 20 ||
Valorisation des données de Paris
|| 21 ||
Valorisation des données de Paris
|| 22 ||
Valorisation des données de Paris
|| 23 ||
Exemple : Rennes, la pionnière
Une démarche volontariste de la Ville et de la Communauté Urbaine, depuis 1er oct. 2010. Un portail : data.rennes-metropole.fr
Mise à disposition de données sur la vie quotidienne, l’urbanisme, les transports. Une quinzaine d’applications créées.
Un concours doté de 50.000 € 43 applications proposées.
|| 24 ||
Rennes Open Data
|| 25 ||
Site Web Metropolis, Business Geographic
|| 26 ||
Vue « 3D » Metropolis, Business Geographic
|| 27 ||
App. Metropolis, Business Geographic
|| 28 ||
Modèle de flux de Metropolis
|| 29 ||
Valorisation des données : Isokron
Source : http://blog.isokron.com/monday-in-rennes
|| 30 ||
Valorisation des données : Handimap
|| 31 ||
Itinéraire accessible : késako ?
Les critères pris en compte aujourd’hui : Stationnement réservés aux personnes handicapées. Passages piétons avec bordure de trottoir est surbaissée.
Les critères pris en compte demain : Pente du terrain, Obstacles sur le trottoir (mobilier urbain, végétation...) Type de revêtement du trottoir.
Comment récupérer ces critères : data.rennes-metropole.fr + plate-forme de crowdsourcing à venir.
|| 32 ||
La Région Auvergne
CRAIG : Centre Régional Auvergnat de l’Information Géographique.
Plate-forme de mutualisation pour l’ensemble des acteurs de la sphère publique.
Acquisition en 2010 d’une série d’orthophotos. Communiqué de presse en août pour l’ouverture
d’un flux WMS pour une utilisation des données dans les outils d'édition OSM (josm, merkaartor..) à l’adresse http://wms.craig.fr/osm
Départements : Allier/Puy de Dôme à 30cm (~16000 km²) Montluçon : agglomération de Montluçon à 15cm (~180 km²) Moulins : agglomération de Moulins à 15cm (~760 km²) Vichy : agglomération de Vichy à 15cm (~ 330 km²)
|| 33 ||
La Région Auvergne
Bilan 9 mois après : Impact positif auprès de la communauté :
http://wiki.openstreetmap.org/wiki/WikiProject_France/CRAIG
30.000 objets avec le tag « craig » Environ 200.000 requêtes WMS / mois
|| 34 ||
Exemple : Bordeaux
Regroupement : Communauté Urbaine de Bordeaux Conseil Général de Gironde Conseil Régional Aquitaine
Lancement prévu en juin 2011. En attendant…
Un concours pour lancer la dynamique. Des ateliers pour réfléchir à la démarche.
|| 35 ||
Exemple de démarche en cours : Bordeaux
Les questions qui se posent : Qui est le commanditaire ?
Les thématiciens ? Les géomaticiens ? Les informaticiens ? Les élus ? La communication ?
Quelles données publier ? Question paradoxale !
Quelles licences choisir ? Réutilisation commerciale possible ou pas ?
Comment publier les données ? Téléchargement ? Quels formats ? Consultation ? Quels API ? Flux ? Quels W*S ?
Où héberger les données ? En interne ou sur le nuage ?
Quelle organisation interne ? Qui fait quoi ? Qui décide ? Qui qualifie ? Qui maintient ?
Quelle organisation externe ? Quel mutualisation possible entre les partenaires ?
Quel niveau d’interaction avec les utilisateurs ? Quelle dispositif de remontée d’information et quelle réactivité ?
|| 36 ||
Certains n’ont pas attendu… : iBordeaux.fr
|| 37 ||
Enjeux
|| 38 ||
Des enjeux (vraiment) nouveaux ?
Des sollicitations nouvelles pour les géomaticiens… … qui font resurgir
des problèmes parfois très anciens !
Quelle politique de diffusion des données ? Comment qualifier les données ? Comment maintenir la cohérence des données ? Comment faire dialoguer amateurs et professionnels ? Comment satisfaire besoins collectifs - usages individuels ? Etc.
|| 39 ||
Les tensions… à équilibrer
Amateur Expert
Qualitéinterne
Qualitéexterne
Grand Public Professionnel
Autonomie Coordination
StandardisationPersonnalisation
|| 40 ||
Les données
Constat sur les usages liés à l’observation des usages : La principale difficulté de la production dite « traditionnelle » est liée
à la déconnexion entre le producteur (institutions ou sociétés privées) et l’utilisateur puisque ce dernier ne participe pas à la conception des données, souvent produites « sur étagère ».
Dans le cas de la production collaborative dite « crowdsourcing » la difficulté réside dans la dispersion des producteurs / utilisateurs qui parfois ne sont même pas authentifiés.
Tension mise en évidence :
Qualité interneQualité externe
|| 41 ||
Les données : tension
Qualité interne versus qualité externe : Qualité interne = niveau d’adéquation entre la
donnée et ce qu’elle aurait dû être si elle était parfaite. Qualité externe = niveau d’adéquation entre la
donnée et les besoins de son utilisateur (« fitness for use »).
Beaucoup de travaux des producteurs institutionnels sur la qualité interne mais peu de travaux se sont intéressés à la mesure de la qualité externe : Besoin de mieux comprendre les besoins des
utilisateurs, le lien entre qualité interne et usage, etc.
|| 42 ||
Les données : leviers
Les métadonnées… oui, mais… Norme en vigueur trop complexe pour les amateurs.
La gestion par tags… oui mais… Mots clés trop simples pour les professionnels.
Piste possible : Une évaluation collaborative pour un usage collaboratif ? Mettre à contribution les utilisateurs eux-mêmes. Développer des moteurs de confiance
Modèle d’e-bay.
|| 43 ||
Les outils
Constat sur les usages observés : Des utilisateurs désormais habitués à voir des cartes et à utiliser
des outils grand public. Des acteurs nouveaux (Google, Microsoft) dont les outils
deviennent la norme. Des géomaticiens centré sur le potentiel fonctionnel plutôt que sur
l’utilisabilité du système : « Degré selon lequel un produit peut être utilisé, par des utilisateurs
identifiés, pour atteindre des buts définis avec efficacité, efficience et satisfaction, dans un contexte d’utilisation spécifié » Norme 9241.
Tension mise en évidence :
Grand PublicProfessionnel
|| 44 ||
Les outils : tension
Comment valoriser les données géographiques de l’organisation dans des interfaces aussi simples et efficaces que Google Maps ?
Comment ne pas « ringardiser » le SIG ?
?
|| 45 ||
Les outils : leviers d’action
Pistes actuellement proposées par les éditeurs : Les Applications Internet Riches (RIA)
Flex pour l’essentiel. Silverlight de plus en plus.
Des géotags dérivés des métadonnées pour faciliter les recherches.
La gestion des données sous la forme de POI. La simplification des interfaces / fonctions.
|| 46 ||
Les acteurs
Constat sur les usages observés : L’externalisation de la production vers les
consommateurs pose la question de la relation entre : la sphère professionnelle (qui réutilise et même dans certains
cas alimente en fond de plan ces systèmes) et la sphère des amateurs (qui crée, corrige et actualise ces
systèmes). Difficulté de filtrer l’information pertinente et utile pour un besoin
donné. Risque d’infobésité : Comment retrouver l’information
géographique nécessaire et suffisante qui répondra à mon besoin ?
Tension mise en évidence :Amateur
Expert
|| 47 ||
Les acteurs : tension
Le profil du néophyte : N’y connaît à priori rien en géomatique, en production de données et en
cartographie, Peut connaître parfaitement bien la zone qu’il cartographie. Probabilité forte qu’il produise des données fausses et non conformes
aux spécifications en termes de structuration. Le profil de l’amateur insouciant :
Peu soucieux de la responsabilité exercée automatiquement par son action de production de données.
« D’autres corrigeront mes erreurs » Le profil du vandale :
Rare, mais actif et potentiellement dévastateur, Contributeur anonyme détruisant la BD pour diverses motivations :
Jeu, terrorisme, idéologie, concurrence déloyale, vengeance personnelle, etc.
Ce paragraphe est extrait d’un dossier de la revue Signature du CERTU (Mang, 2010) :http://www.certu.fr/download.php?file_url=IMG/pdf/signature_n_42.pdf
|| 48 ||
Les acteurs : leviers d’action
Pour intégrer le néophyte : Wiki, listes de diffusion, forums, documents d’aide et de
spécifications clair et incontournable Ergonomie assistée (par ex., contrôle à la volée de la topologie) Métadonnées obligatoires
Pour aider l’amateur insouciant : Sensibilisation, formation.
Pour contrer le vandale : Prévention des robots : demande de saisie manuelle anti-spam Détection des modifications « denses » :
Nombre important de modifications d’objets existants dans un temps relativement court et/ou sur une zone relativement concentrée.
Moteur de confiance (modèle eBay)
Ce paragraphe est extrait d’un dossier de la revue Signature du CERTU (Mang, 2010) :http://www.certu.fr/download.php?file_url=IMG/pdf/signature_n_42.pdf
|| 49 ||
Les organisations
Constat sur les usages observés : Difficulté de mettre à disposition un service
suffisamment standard pour intéresser le maximum d’utilisateurs et suffisamment personnalisable pour que chacun se l’approprie ?
Risque d’éparpillement : Comment veiller au maintien de la cohérence des productions ?
Tension mise en évidence :
AutonomieCoordination
|| 50 ||
Les organisations : tension
|| 51 ||
Les organisations : leviers d’action
Levier sur les données : S’appuyer sur des référentiels
qui serviront de dénominateurs communs entre les auto-productions.
Levier sur les processus organisationnels : Mettre en place des dispositifs
participatifs de remontée d’information qui facilitent la confrontation entre auto-producteurs.
Comité d’OrientationStratégique
Comité de Suivi
Technique
GroupeThématique
GroupeThématique
Utilisateurs des Différents Services
Présentation
Orientation Orientation
Animation
Participation
|| 52 ||
Les représentations
Constat sur les usages observés : Distribution de la production vers les communautés de pratique.
Production générée par la confrontation des points de vue d’experts sur une thématique donnée.
Bien souvent la thématique est à la frontière entre plusieurs domaines de compétences d’organisations différentes (enjeux stratégiques) et à la frontière entre différents métiers du territoire (enjeux cognitifs).
Tension mise en évidence :
StandardisationPersonnalisation
|| 53 ||
Les représentations : tension
Adapté de Maurel (2001)
ESPACEPHYSIQUE
REPRESENTATIONSSPATIALESEXTERNES
RAISONNEMENT SPATIAL
REPRESENTATIONSSPATIALESINTERNES
Interprétation
Médiatisation
COMMUNICATION
Références individuelles et socialeset pratique de l’espace
Outils d’acquisition (capteurs)
De l’individuel…
… au collectif
Les
enje
uxde
la c
o-pr
oduc
tion
|| 54 ||
Les représentations : leviers d’action
Des logiques de compromis (PPDC)… …au consensus différencié.
Partir d’un porter à connaissance des # pour découvrir les typages cognitifs des acteurs.
Affirmer et affiner progressivement les visions métier. Comprendre et légitimer les actions de ses partenaires mais aussi
ses propres actions. Concevoir la coproduction de données géographiques comme un
processus d’apprentissage et de créativité qui permet de :
Confirmer les points communs
Affirmer définitivement les différences
Rapprocher des points # seulement en apparence
Faire émerger des solutions alternatives
« La nomenclature doit faire
apparaître les usages »
VERSUS« La nomenclature doit révéler ce qui se voit sur une photo »
|| 55 ||
Nouveaux enjeux : conclusion
Nécessité de réfléchir aux usages qui découlent des nouveaux modes de production de données géographiques pour envisager les dispositifs adéquats qui doivent nécessairement les accompagner.
Impacts sur les données : Des référentiels davantage documentés (métadonnées)…
Impacts sur les outils : Des IHM + interactives, + dynamiques, + immersives…
Impacts sur les méthodes d’animation : Des logiques d’action à plus forte valeur ajoutée…
Impacts sur les processus organisationnels : Des dispositifs plus participatifs…
|| 56 ||
Mise en perspectives
|| 57 ||
Est-ce vraiment nouveau ?
|| 58 ||
Est-ce vraiment nouveau ?
|| 59 ||
Est-ce vraiment un phénomène de masse ?
|| 60 ||
Est-ce vraiment un phénomène de masse ?
|| 61 ||
Recherches
|| 62 ||
Des SIG en silos… à l’information géographique en réseaux
Les SIG : catalyseurs de l’ouverture inter-organisationnelle. Développement des Infrastructures de
Données Géographiques (IDG).
Les données SIG libres : catalyseurs de l’ouverture inter-individuelle. Développement des Communautés de
Pratique (CoP).
|| 63 ||
Des Données Ouvertes à l’Innovation Ouverte
L’innovation ouverte (ou innovation distribuée) a été théorisée par Chesborough et se définit comme un mode d'innovation basé sur le partage, la collaboration et la sérendipité.
L’ouverture des données publiques peut conduire les utilisateurs à se placer dans une logique de coproduction de services d’où peuvent émerger des innovations.
En balayant les travaux de chercheurs (comme Flichy ou von Hippel), on peut plus particulièrement à mettre en évidence le potentiel collaboratif de ces innovations.
|| 64 ||
La sérendipité (1/2)
La sérendipité est le fait de réaliser une découverte inattendue au cours d'une recherche dirigée initialement vers un objet différent de cette découverte.
Concept qui traduit également la transformation de nos usages du Web : De la recherche… à la découverte.
|| 65 ||
La sérendipité (2/2)
Quatre constructions possibles de la sérendipité (selon Nothaft, 2010) : Sérendipité éditoriale : combinaison suscitée par
une personne extérieur qui présupposent des connexions thématiques possibles.
Sérendipité sociale : combinaison suscitée par les réseaux sociaux (recommandations).
Sérendipité crowdsourcée : combinaison suscitée par la popularité du contenu (hits).
Sérendipité algorithmique : combinaison suscitée par du croisement de base de données externes et personnelles.
|| 66 ||
Perspectives de recherche (1/3)
De l’innovation distribuée…
… à la cognition distribuée
Pour une recherche sur l’usage des données libres.
|| 67 ||
Perspectives de recherche (2/3)
De développeurs…
… aux facilitateurs
Pour une recherche sur les nouvelles compétences à développer.
|| 68 ||
Perspectives de recherche (3/3)
Des plates-formes de diffusion…
… aux outils de négociation
Pour une recherche sur les interfaces de production
collaborative et argumentée
|| 69 ||
Mardi 3 mai 2011
Colloque AGMQ - Université de Laval, Québec.
Matthieu NOUCHER
https://sites.google.com/site/matthieunoucher/
Merci de votre attention !