Cours production donnees geographiques participatives
-
Upload
carmen-brando -
Category
Education
-
view
1.552 -
download
1
description
Transcript of Cours production donnees geographiques participatives
Production de données géographiques participatives
Master 2 IG - SIAWCarmen Brando
Laboratoire COGIT - IGN7 décembre
Institut Géographique National (IGN)Laboratoire COGIT
1
(O’Reilly, 2007)Contenu généré par les utilisateurs
Contenu généré par les utilisateurs
•User Generated Content (UGC)•Principale caractéristique : le contenu est produit par les utilisateurs des sites Web–Le contenu traditionnellement était généré par les compagnies privées ou les organismes gouvernementaux
Volunteered Geographic Information (VGI) : (Michael Goodchild, 2007)
« C’est 'exploitation des outils pour créer, assembler et diffuser des données géographiques fournies volontairement par des individus »
Aussi connu comme contenu spatial généré par les utilisateurs
Quelques termes importants
•(Turner, 2006) propose le terme neogéographie pour définir l’utilisation de techniques et des outils pour traiter l’information géographique, par des communautés et utilisateurs non-experts•Le crowdsourcing est le fait d’utiliser la créativité, l'intelligence et le savoir-faire d'un grand nombre de personnes en sous-traitance, pour réaliser certaines tâches traditionnellement effectuées par un employé ou un entrepreneur (source: Wikipédia)
VGI
* Contenu produit par les communautés sans aucune expertise
* Ils ne reçoivent aucune rétribution pour contribuer
* Production de VGI : approche bottom-up* Pas d'autorité sur les données* Pas de garantie sur la certitude des données* La loi de Linus : « with enough eyes all bugs
(spatial errors) become trivial » (densité !)
8
Types de données spatiales
Données « formelles »IGN, OS, USGS, Navteq, TeleAtlas
VGIOSM, Flickr, etc
Données hybrides (données formelles et VGI)Bing, Google, Yahoo, TomTom (GPS traces)
blog.telemapics.com
Flickr
Géolocalisation
Wikipédia
Géolocalisation
OpenStreetMap (OSM) : La carte coopérative libre
Edition d’instances géographiques : géométrie et tags
Wikimapia : Nous allons décrire le monde
Edition d’instances géographiques: géométrie et tags
Richesse sémantique :Étiquetage et descriptions des features géographiques
Google Map Maker (GMM) : Cartographiez le monde
DémocratieDémocratie
Technologies Technologies WikiWiki
Image: (Antoniou, Haklay et MorleyAntoniou, Haklay et Morley, 2010)
Wikis
•Le meilleur exemple d’UGC : Wikipédia•MediaWiki : logiciel Wiki qui gère l’encyclopédie en ligne Wikipédia•L’édition de contenu est facile et rapide•Fonction pour la modération du contenu•Historiques des éditions•Démocratie : on a tous les mêmes opportunités de publier de l’information
Tremblement de terre Haïti (avant)
http://wiki.openstreetmap.org/wiki/Talk:WikiProject_Haiti#Before_and_After_Quake
Tremblement de terre Haïti (après)
http://wiki.openstreetmap.org/wiki/Talk:WikiProject_Haiti#Before_and_After_Quake
Réseaux Sociaux
•Les réseaux sociaux ont été un facteur indispensable pour exécuter cette tâche•Les plus connus : Facebook et Twitter•Mais aussi des sites plus spécialises comme Crisis Mapping
(Goodchild's NSF presentation, 2010)
Exemple application VGI
Application Web qui utilise des données du Géoportail : New ClicGPX
Exemple application VGI
Application pour l’Iphone : Geomiam
Plus d’applis sur: http://www.ign.fr/institut/documentArticle.do?idDoc=6403661&indexRoot=4&inde
23
blog.telemapics.com
Quelques critiques
* Absence de spécifications formelles sur les données
* Donc, les données ne sont pas très utilisable
* Certaine expertise est requise aux contributeurs, il y a certaines situations d'erreurs assez complexes pour être comprises
* Beaucoup de mécanismes de validations a posteriori, automatiques et manuels
* Peut-on vraiment faire confiance aux contributeurs ? Problème d'autorité des données...
OpenStreetMap
Modèle de données OSM
(Waters, Waters, 2009)
Données OSM
<node id="82344312" lat="46.174" lon="3.87028" version="4" changeset="3203604" user="EtienneChoveBot" uid="183561" visible="true" timestamp="2009-11-24T12:05:35Z">
<tag k="name" v="La Pacaudière"/>
<tag k="place" v="village"/>
<tag k="postal_code" v="42310"/>
<tag k="population" v="1200"/>
<tag k="code_departement" v="42"/>
<tag k="ref:INSEE" v="42163"/>
<tag k="is_in" v="Europe,France,Loire"/>
</node> Format simple en XML
Données OSMGazetteer : indexes des toponymes (ex : GeoNames)
Éditeurs OSM
MerkaartorMerkaartor
PotlatchPotlatch
JOSMJOSM
(Antoniou, Haklay et MorleyAntoniou, Haklay et Morley, 2010)© IGN - 2010
Comment contribuer ?
Assister aux mapping parties !(Waters, Waters, 2009)
Comment contribuer ?
(Waters, Waters, 2009)
Comment contribuer ?
(Waters, Waters, 2009)
Comment contribuer ?
Application IGN pour l’iPhone : iPhiGéNie
Comment contribuer ?
Comment contribuer ?
Comment contribuer ?
Brouillon
Bd. Louis Guibert
Bd. Du clos st. george
Bd. Des cents arpents
Vidéos
• Chargement de traces GPS dans OpenStreetMap en utilisant l'éditeur Java OSM– http://www.youtube.com/watch?v=tZw38Xy_Ew0
• Contribution d'une nouvelle boulevard dans OpenStreeMap en utilisant l'éditeur Java OSM– http://www.youtube.com/watch?v=rv3a_HnMtBw
Comment contribuer ?
Comment contribuer ?
Pas encore sur OSM !
Comment contribuer ?
Déjà sur OSM !
40blog.telemapics.com
Quelques critiques
* Absence de spécifications formelles sur les données
* Donc, les données ne sont pas très utilisable
* Certaine expertise est requise aux contributeurs, il y a certaines situations d'erreurs assez complexes pour être comprises
* Beaucoup de mécanismes de validations a posteriori, automatiques et manuels
* Peut-on vraiment faire confiance aux contributeurs ? Problème d'autorité des données...
Spécifications des fournisseurs de données géographiques
BD TOPO ® - IGN
La connaissance associée à comment le monde est observé et comment il est modélisé dans la base de données (Abadie, 2009) 41
« Spécifications » pour VGI ?Charte de directives
Documentation
Usage standard des étiquettes (tags)
42
44
blog.telemapics.com
Quelques critiques
* Absence de spécifications formelles sur les données
* Donc, les données ne sont pas très utilisable
* Certaine expertise est requise aux contributeurs, il y a certaines situations d'erreurs assez complexes pour être comprises
* Beaucoup de mécanismes de validations a posteriori, automatiques et manuels
* Peut-on vraiment faire confiance aux contributeurs ? Problème d'autorité des données...
Keep Right!un outil de correction d’erreurs
Des contraintes d’intégrité prédéfinies sont vérifiées sur des données OSM45
Source: http://keepright.ipax.at
Intersections sans nœuds de jonctions
Avant
Après
•Editeur Web OSM : Potlatch
46
Superposition des routes
Avant
Après
47
•Éditeur Web OSM : Potlatch
Mécanismes plus complexes ?
•Manque de cohérence géométrique entre le réseau hydrographique et les limites administratives•Une contrainte d’intégrité indiquant la relation entre les deux les deux types pour assurer le partage de la géométrie•Possible réparation: placer la limite administrative au milieu du fleuve
Données OpenStreetMap autour de Grenoble (Decembre 2009)
48(Brando et Bucher, 2010)
49
blog.telemapics.com
Quelques critiques
* Absence de spécifications formelles sur les données
* Donc, les données ne sont pas très utilisable
* Certaine expertise est requise aux contributeurs, il y a certaines situations d'erreurs assez complexes pour être comprises
* Beaucoup de mécanismes de validations a posteriori, automatiques et manuels
* Peut-on vraiment faire confiance aux contributeurs ? Problème d'autorité des données...
Qualification de contributeurs et contributions
•Classification des contributeurs basée sur•leur besoin (Coleman et al., 2009)•leur localisation géographique (Goodchild, 2009)•Leur relation de confiance avec des autres utilisateurs (Bishr et al., 2007)•Distinguer entre les bonnes et les mauvaises contributions•Systèmes de classement (Rating) (Elwood, 2008)•Signaler les régions avec des erreurs (Maué et al., 2008)•Comparaison avec une source référentielle (Haklay, 2009)
50
Qui sont-ils ?
•Neophytes•L'amateur intéressé•L'amateur expert•L'amateur professionnel•Une autorité experte
(Coleman, 2009)
Qui sont-ils ?
52
Un étude (Budhathoki, 2010) plutôt empirique en faisant des questionnaires aux contributeurs
Quelles sont-elles leurs motivations ?
•Altruisme•Intérêt professionnel ou personnel•Stimulation intellectuelle•Protection ou amélioration d'un investissement personnel•Rétribution sociale•Amélioration de la réputation personnelle•Fierté de l'endroit•Créativité de l'individu•Intent criminels
(Coleman, 2009)
Quelles sont-elles leurs motivations ?
54
L’étude (Budhathoki, 2010) plutôt empirique en faisant des questionnaires aux contributeurs
Quelles sont-elles leurs motivations ?
55
L’étude (Budhathoki, 2010) plutôt empirique en faisant des questionnaires aux contributeurs
Modèle Spatio-temporel de confiance
(Bishr et Kuhn, 2007)
Bob
Anne
Jeff
Rating des contributions et relations entre les individus, et le temps aussi !
Études d’évaluation de qualité par rapport aux données de
référence
Similaire à l'étude fait pour évaluer la qualité de Wikipédia
•En 2005, la revue scientifique Nature a fait un étude comparative entre le contenu de Wikipédia et celui de l'encyclopédie Britannique
58
Évaluation de la qualité du VGI
(Girres et Touya, 2009)
Géométrie
ExhaustivitéExhaustivitéPrécision GéométriquePrécision Géométrique
(Antoniou, Haklay et MorleyAntoniou, Haklay et Morley, 2010)
Tags
Combien de tags par feature géographique ?Combien de tags par feature géographique ?
(Antoniou, Haklay et MorleyAntoniou, Haklay et Morley, 2010)
Tags
(Antoniou, Haklay et MorleyAntoniou, Haklay et Morley, 2010)Il y a seulement une petite quantité de tags qui couvrent la plus part des features géographique
Évaluation de la qualité du VGI
(Girres et Touya, 2009)
Évaluation de la qualité du VGI
(Girres et Touya, 2009)
Intérêt de VGI•VGI pour actualiser les bases de données des fournisseurs de données géographiques au travers d’alertes•OpenStreetMap, influence importante sur comment le contenu spatial est produit et actualisé•VGI pour compléter et enrichir les bases de données des fournisseurs de données géographique en permettant l’édition de contenu (en plus des alertes)
(Budhathoki, 2008) (Elwood, 2008) (Antoniou, 2009)65
Intérêt de VGI
Groupes d’intérêts spéciaux ont•des besoins plus forts sur la qualité des données•des limitations de budget pour collecter, rédiger et actualiser les spécifications•Un manque d’expertise sur des techniques de modélisation pour assurer la cohérence de ces données•un intérêt d’accepter quelques règles pendant la contribution
66(Coote, 2008)
Intérêt de VGI
* Mashups* Site Web qui groupe du contenu géographique
récupéré de plusieurs sources d'information dans une seule carte
* En général, un API pour accéder aux données doit être disponible pour récupérer l'information requise (ex : API geoportail)
Formats de données* KML : format simple crée par Google
standardisé récemment<?xml version="1.0" encoding="UTF-8"?>
<kml xmlns="http://www.opengis.net/kml/2.2">
<Placemark>
<name>Simple placemark</name>
<description>Attached to the ground. Intelligently places itself
at the height of the underlying terrain.</description>
<Point>
<coordinates>-122.0822035425683,37.42228990140251,0</coordinates>
</Point>
</Placemark>
</kml>
Mashup tour de France 2010
Mashup articles Wikipédia