Cours production donnees geographiques participatives

70
Production de données géographiques participatives Master 2 IG - SIAW Carmen Brando Laboratoire COGIT - IGN 7 décembre Institut Géographique National (IGN) Laboratoire COGIT 1

description

Master's course about Volunteered Geographic Information included in the SIG and Internet module for M2 IG and M2 SIAW at Ecole Nationale des Sciences Géographiques (ENSG)

Transcript of Cours production donnees geographiques participatives

Page 1: Cours production donnees geographiques participatives

Production de données géographiques participatives

Master 2 IG - SIAWCarmen Brando

Laboratoire COGIT - IGN7 décembre

Institut Géographique National (IGN)Laboratoire COGIT

1

Page 2: Cours production donnees geographiques participatives

(O’Reilly, 2007)Contenu généré par les utilisateurs

Page 3: Cours production donnees geographiques participatives

Contenu généré par les utilisateurs

•User Generated Content (UGC)•Principale caractéristique : le contenu est produit par les utilisateurs des sites Web–Le contenu traditionnellement était généré par les compagnies privées ou les organismes gouvernementaux

Page 4: Cours production donnees geographiques participatives
Page 5: Cours production donnees geographiques participatives

Volunteered Geographic Information (VGI) : (Michael Goodchild, 2007)

« C’est 'exploitation des outils pour créer, assembler et diffuser des données géographiques fournies volontairement par des individus »

Aussi connu comme contenu spatial généré par les utilisateurs

Page 6: Cours production donnees geographiques participatives

Quelques termes importants

•(Turner, 2006) propose le terme neogéographie pour définir l’utilisation de techniques et des outils pour traiter l’information géographique, par des communautés et utilisateurs non-experts•Le crowdsourcing est le fait d’utiliser la créativité, l'intelligence et le savoir-faire d'un grand nombre de personnes en sous-traitance, pour réaliser certaines tâches traditionnellement effectuées par un employé ou un entrepreneur (source: Wikipédia)

Page 7: Cours production donnees geographiques participatives

VGI

* Contenu produit par les communautés sans aucune expertise

* Ils ne reçoivent aucune rétribution pour contribuer

* Production de VGI : approche bottom-up* Pas d'autorité sur les données* Pas de garantie sur la certitude des données* La loi de Linus : « with enough eyes all bugs

(spatial errors) become trivial » (densité !)

Page 8: Cours production donnees geographiques participatives

8

Types de données spatiales

Données « formelles »IGN, OS, USGS, Navteq, TeleAtlas

VGIOSM, Flickr, etc

Données hybrides (données formelles et VGI)Bing, Google, Yahoo, TomTom (GPS traces)

blog.telemapics.com

Page 9: Cours production donnees geographiques participatives

Flickr

Géolocalisation

Page 10: Cours production donnees geographiques participatives

Wikipédia

Géolocalisation

Page 11: Cours production donnees geographiques participatives

OpenStreetMap (OSM) : La carte coopérative libre

Page 12: Cours production donnees geographiques participatives

Edition d’instances géographiques : géométrie et tags

Page 13: Cours production donnees geographiques participatives

Wikimapia : Nous allons décrire le monde

Page 14: Cours production donnees geographiques participatives

Edition d’instances géographiques: géométrie et tags

Richesse sémantique :Étiquetage et descriptions des features géographiques

Page 15: Cours production donnees geographiques participatives

Google Map Maker (GMM) : Cartographiez le monde

Page 16: Cours production donnees geographiques participatives

DémocratieDémocratie

Technologies Technologies WikiWiki

Image: (Antoniou, Haklay et MorleyAntoniou, Haklay et Morley, 2010)

Page 17: Cours production donnees geographiques participatives

Wikis

•Le meilleur exemple d’UGC : Wikipédia•MediaWiki : logiciel Wiki qui gère l’encyclopédie en ligne Wikipédia•L’édition de contenu est facile et rapide•Fonction pour la modération du contenu•Historiques des éditions•Démocratie : on a tous les mêmes opportunités de publier de l’information

Page 18: Cours production donnees geographiques participatives

Tremblement de terre Haïti (avant)

http://wiki.openstreetmap.org/wiki/Talk:WikiProject_Haiti#Before_and_After_Quake

Page 19: Cours production donnees geographiques participatives

Tremblement de terre Haïti (après)

http://wiki.openstreetmap.org/wiki/Talk:WikiProject_Haiti#Before_and_After_Quake

Page 20: Cours production donnees geographiques participatives

Réseaux Sociaux

•Les réseaux sociaux ont été un facteur indispensable pour exécuter cette tâche•Les plus connus : Facebook et Twitter•Mais aussi des sites plus spécialises comme Crisis Mapping

(Goodchild's NSF presentation, 2010)

Page 21: Cours production donnees geographiques participatives

Exemple application VGI

Application Web qui utilise des données du Géoportail : New ClicGPX

Page 22: Cours production donnees geographiques participatives

Exemple application VGI

Application pour l’Iphone : Geomiam

Plus d’applis sur: http://www.ign.fr/institut/documentArticle.do?idDoc=6403661&indexRoot=4&inde

Page 23: Cours production donnees geographiques participatives

23

blog.telemapics.com

Quelques critiques

* Absence de spécifications formelles sur les données

* Donc, les données ne sont pas très utilisable

* Certaine expertise est requise aux contributeurs, il y a certaines situations d'erreurs assez complexes pour être comprises

* Beaucoup de mécanismes de validations a posteriori, automatiques et manuels

* Peut-on vraiment faire confiance aux contributeurs ? Problème d'autorité des données...

Page 24: Cours production donnees geographiques participatives

OpenStreetMap

Page 25: Cours production donnees geographiques participatives

Modèle de données OSM

(Waters, Waters, 2009)

Page 26: Cours production donnees geographiques participatives

Données OSM

<node id="82344312" lat="46.174" lon="3.87028" version="4" changeset="3203604" user="EtienneChoveBot" uid="183561" visible="true" timestamp="2009-11-24T12:05:35Z">

<tag k="name" v="La Pacaudière"/>

<tag k="place" v="village"/>

<tag k="postal_code" v="42310"/>

<tag k="population" v="1200"/>

<tag k="code_departement" v="42"/>

<tag k="ref:INSEE" v="42163"/>

<tag k="is_in" v="Europe,France,Loire"/>

</node> Format simple en XML

Page 27: Cours production donnees geographiques participatives

Données OSMGazetteer : indexes des toponymes (ex : GeoNames)

Page 28: Cours production donnees geographiques participatives

Éditeurs OSM

MerkaartorMerkaartor

PotlatchPotlatch

JOSMJOSM

(Antoniou, Haklay et MorleyAntoniou, Haklay et Morley, 2010)© IGN - 2010

Page 29: Cours production donnees geographiques participatives

Comment contribuer ?

Assister aux mapping parties !(Waters, Waters, 2009)

Page 30: Cours production donnees geographiques participatives

Comment contribuer ?

(Waters, Waters, 2009)

Page 31: Cours production donnees geographiques participatives

Comment contribuer ?

(Waters, Waters, 2009)

Page 32: Cours production donnees geographiques participatives

Comment contribuer ?

Application IGN pour l’iPhone : iPhiGéNie

Page 33: Cours production donnees geographiques participatives

Comment contribuer ?

Page 34: Cours production donnees geographiques participatives

Comment contribuer ?

Page 35: Cours production donnees geographiques participatives

Comment contribuer ?

Brouillon

Bd. Louis Guibert

Bd. Du clos st. george

Bd. Des cents arpents

Page 36: Cours production donnees geographiques participatives

Vidéos

• Chargement de traces GPS dans OpenStreetMap en utilisant l'éditeur Java OSM– http://www.youtube.com/watch?v=tZw38Xy_Ew0

• Contribution d'une nouvelle boulevard dans OpenStreeMap en utilisant l'éditeur Java OSM– http://www.youtube.com/watch?v=rv3a_HnMtBw

Page 37: Cours production donnees geographiques participatives

Comment contribuer ?

Page 38: Cours production donnees geographiques participatives

Comment contribuer ?

Pas encore sur OSM !

Page 39: Cours production donnees geographiques participatives

Comment contribuer ?

Déjà sur OSM !

Page 40: Cours production donnees geographiques participatives

40blog.telemapics.com

Quelques critiques

* Absence de spécifications formelles sur les données

* Donc, les données ne sont pas très utilisable

* Certaine expertise est requise aux contributeurs, il y a certaines situations d'erreurs assez complexes pour être comprises

* Beaucoup de mécanismes de validations a posteriori, automatiques et manuels

* Peut-on vraiment faire confiance aux contributeurs ? Problème d'autorité des données...

Page 41: Cours production donnees geographiques participatives

Spécifications des fournisseurs de données géographiques

BD TOPO ® - IGN

La connaissance associée à comment le monde est observé et comment il est modélisé dans la base de données (Abadie, 2009) 41

Page 42: Cours production donnees geographiques participatives

« Spécifications » pour VGI ?Charte de directives

Documentation

Usage standard des étiquettes (tags)

42

Page 43: Cours production donnees geographiques participatives
Page 44: Cours production donnees geographiques participatives

44

blog.telemapics.com

Quelques critiques

* Absence de spécifications formelles sur les données

* Donc, les données ne sont pas très utilisable

* Certaine expertise est requise aux contributeurs, il y a certaines situations d'erreurs assez complexes pour être comprises

* Beaucoup de mécanismes de validations a posteriori, automatiques et manuels

* Peut-on vraiment faire confiance aux contributeurs ? Problème d'autorité des données...

Page 45: Cours production donnees geographiques participatives

Keep Right!un outil de correction d’erreurs

Des contraintes d’intégrité prédéfinies sont vérifiées sur des données OSM45

Source: http://keepright.ipax.at

Page 46: Cours production donnees geographiques participatives

Intersections sans nœuds de jonctions

Avant

Après

•Editeur Web OSM : Potlatch

46

Page 47: Cours production donnees geographiques participatives

Superposition des routes

Avant

Après

47

•Éditeur Web OSM : Potlatch

Page 48: Cours production donnees geographiques participatives

Mécanismes plus complexes ?

•Manque de cohérence géométrique entre le réseau hydrographique et les limites administratives•Une contrainte d’intégrité indiquant la relation entre les deux les deux types pour assurer le partage de la géométrie•Possible réparation: placer la limite administrative au milieu du fleuve

Données OpenStreetMap autour de Grenoble (Decembre 2009)

48(Brando et Bucher, 2010)

Page 49: Cours production donnees geographiques participatives

49

blog.telemapics.com

Quelques critiques

* Absence de spécifications formelles sur les données

* Donc, les données ne sont pas très utilisable

* Certaine expertise est requise aux contributeurs, il y a certaines situations d'erreurs assez complexes pour être comprises

* Beaucoup de mécanismes de validations a posteriori, automatiques et manuels

* Peut-on vraiment faire confiance aux contributeurs ? Problème d'autorité des données...

Page 50: Cours production donnees geographiques participatives

Qualification de contributeurs et contributions

•Classification des contributeurs basée sur•leur besoin (Coleman et al., 2009)•leur localisation géographique (Goodchild, 2009)•Leur relation de confiance avec des autres utilisateurs (Bishr et al., 2007)•Distinguer entre les bonnes et les mauvaises contributions•Systèmes de classement (Rating) (Elwood, 2008)•Signaler les régions avec des erreurs (Maué et al., 2008)•Comparaison avec une source référentielle (Haklay, 2009)

50

Page 51: Cours production donnees geographiques participatives

Qui sont-ils ?

•Neophytes•L'amateur intéressé•L'amateur expert•L'amateur professionnel•Une autorité experte

(Coleman, 2009)

Page 52: Cours production donnees geographiques participatives

Qui sont-ils ?

52

Un étude (Budhathoki, 2010) plutôt empirique en faisant des questionnaires aux contributeurs

Page 53: Cours production donnees geographiques participatives

Quelles sont-elles leurs motivations ?

•Altruisme•Intérêt professionnel ou personnel•Stimulation intellectuelle•Protection ou amélioration d'un investissement personnel•Rétribution sociale•Amélioration de la réputation personnelle•Fierté de l'endroit•Créativité de l'individu•Intent criminels

(Coleman, 2009)

Page 54: Cours production donnees geographiques participatives

Quelles sont-elles leurs motivations ?

54

L’étude (Budhathoki, 2010) plutôt empirique en faisant des questionnaires aux contributeurs

Page 55: Cours production donnees geographiques participatives

Quelles sont-elles leurs motivations ?

55

L’étude (Budhathoki, 2010) plutôt empirique en faisant des questionnaires aux contributeurs

Page 56: Cours production donnees geographiques participatives

Modèle Spatio-temporel de confiance

(Bishr et Kuhn, 2007)

Bob

Anne

Jeff

Rating des contributions et relations entre les individus, et le temps aussi !

Page 57: Cours production donnees geographiques participatives

Études d’évaluation de qualité par rapport aux données de

référence

Page 58: Cours production donnees geographiques participatives

Similaire à l'étude fait pour évaluer la qualité de Wikipédia

•En 2005, la revue scientifique Nature a fait un étude comparative entre le contenu de Wikipédia et celui de l'encyclopédie Britannique

58

Page 59: Cours production donnees geographiques participatives

Évaluation de la qualité du VGI

(Girres et Touya, 2009)

Page 60: Cours production donnees geographiques participatives

Géométrie

ExhaustivitéExhaustivitéPrécision GéométriquePrécision Géométrique

(Antoniou, Haklay et MorleyAntoniou, Haklay et Morley, 2010)

Page 61: Cours production donnees geographiques participatives

Tags

Combien de tags par feature géographique ?Combien de tags par feature géographique ?

(Antoniou, Haklay et MorleyAntoniou, Haklay et Morley, 2010)

Page 62: Cours production donnees geographiques participatives

Tags

(Antoniou, Haklay et MorleyAntoniou, Haklay et Morley, 2010)Il y a seulement une petite quantité de tags qui couvrent la plus part des features géographique

Page 63: Cours production donnees geographiques participatives

Évaluation de la qualité du VGI

(Girres et Touya, 2009)

Page 64: Cours production donnees geographiques participatives

Évaluation de la qualité du VGI

(Girres et Touya, 2009)

Page 65: Cours production donnees geographiques participatives

Intérêt de VGI•VGI pour actualiser les bases de données des fournisseurs de données géographiques au travers d’alertes•OpenStreetMap, influence importante sur comment le contenu spatial est produit et actualisé•VGI pour compléter et enrichir les bases de données des fournisseurs de données géographique en permettant l’édition de contenu (en plus des alertes)

(Budhathoki, 2008) (Elwood, 2008) (Antoniou, 2009)65

Page 66: Cours production donnees geographiques participatives

Intérêt de VGI

Groupes d’intérêts spéciaux ont•des besoins plus forts sur la qualité des données•des limitations de budget pour collecter, rédiger et actualiser les spécifications•Un manque d’expertise sur des techniques de modélisation pour assurer la cohérence de ces données•un intérêt d’accepter quelques règles pendant la contribution

66(Coote, 2008)

Page 67: Cours production donnees geographiques participatives

Intérêt de VGI

* Mashups* Site Web qui groupe du contenu géographique

récupéré de plusieurs sources d'information dans une seule carte

* En général, un API pour accéder aux données doit être disponible pour récupérer l'information requise (ex : API geoportail)

Page 68: Cours production donnees geographiques participatives

Formats de données* KML : format simple crée par Google

standardisé récemment<?xml version="1.0" encoding="UTF-8"?>

<kml xmlns="http://www.opengis.net/kml/2.2">

<Placemark>

<name>Simple placemark</name>

<description>Attached to the ground. Intelligently places itself

at the height of the underlying terrain.</description>

<Point>

<coordinates>-122.0822035425683,37.42228990140251,0</coordinates>

</Point>

</Placemark>

</kml>

Page 69: Cours production donnees geographiques participatives

Mashup tour de France 2010

Page 70: Cours production donnees geographiques participatives

Mashup articles Wikipédia