Cours production donnees geographiques participatives

Post on 13-Jun-2015

1.552 views 1 download

description

Master's course about Volunteered Geographic Information included in the SIG and Internet module for M2 IG and M2 SIAW at Ecole Nationale des Sciences Géographiques (ENSG)

Transcript of Cours production donnees geographiques participatives

Production de données géographiques participatives

Master 2 IG - SIAWCarmen Brando

Laboratoire COGIT - IGN7 décembre

Institut Géographique National (IGN)Laboratoire COGIT

1

(O’Reilly, 2007)Contenu généré par les utilisateurs

Contenu généré par les utilisateurs

•User Generated Content (UGC)•Principale caractéristique : le contenu est produit par les utilisateurs des sites Web–Le contenu traditionnellement était généré par les compagnies privées ou les organismes gouvernementaux

Volunteered Geographic Information (VGI) : (Michael Goodchild, 2007)

« C’est 'exploitation des outils pour créer, assembler et diffuser des données géographiques fournies volontairement par des individus »

Aussi connu comme contenu spatial généré par les utilisateurs

Quelques termes importants

•(Turner, 2006) propose le terme neogéographie pour définir l’utilisation de techniques et des outils pour traiter l’information géographique, par des communautés et utilisateurs non-experts•Le crowdsourcing est le fait d’utiliser la créativité, l'intelligence et le savoir-faire d'un grand nombre de personnes en sous-traitance, pour réaliser certaines tâches traditionnellement effectuées par un employé ou un entrepreneur (source: Wikipédia)

VGI

* Contenu produit par les communautés sans aucune expertise

* Ils ne reçoivent aucune rétribution pour contribuer

* Production de VGI : approche bottom-up* Pas d'autorité sur les données* Pas de garantie sur la certitude des données* La loi de Linus : « with enough eyes all bugs

(spatial errors) become trivial » (densité !)

8

Types de données spatiales

Données « formelles »IGN, OS, USGS, Navteq, TeleAtlas

VGIOSM, Flickr, etc

Données hybrides (données formelles et VGI)Bing, Google, Yahoo, TomTom (GPS traces)

blog.telemapics.com

Flickr

Géolocalisation

Wikipédia

Géolocalisation

OpenStreetMap (OSM) : La carte coopérative libre

Edition d’instances géographiques : géométrie et tags

Wikimapia : Nous allons décrire le monde

Edition d’instances géographiques: géométrie et tags

Richesse sémantique :Étiquetage et descriptions des features géographiques

Google Map Maker (GMM) : Cartographiez le monde

DémocratieDémocratie

Technologies Technologies WikiWiki

Image: (Antoniou, Haklay et MorleyAntoniou, Haklay et Morley, 2010)

Wikis

•Le meilleur exemple d’UGC : Wikipédia•MediaWiki : logiciel Wiki qui gère l’encyclopédie en ligne Wikipédia•L’édition de contenu est facile et rapide•Fonction pour la modération du contenu•Historiques des éditions•Démocratie : on a tous les mêmes opportunités de publier de l’information

Tremblement de terre Haïti (avant)

http://wiki.openstreetmap.org/wiki/Talk:WikiProject_Haiti#Before_and_After_Quake

Tremblement de terre Haïti (après)

http://wiki.openstreetmap.org/wiki/Talk:WikiProject_Haiti#Before_and_After_Quake

Réseaux Sociaux

•Les réseaux sociaux ont été un facteur indispensable pour exécuter cette tâche•Les plus connus : Facebook et Twitter•Mais aussi des sites plus spécialises comme Crisis Mapping

(Goodchild's NSF presentation, 2010)

Exemple application VGI

Application Web qui utilise des données du Géoportail : New ClicGPX

Exemple application VGI

Application pour l’Iphone : Geomiam

Plus d’applis sur: http://www.ign.fr/institut/documentArticle.do?idDoc=6403661&indexRoot=4&inde

23

blog.telemapics.com

Quelques critiques

* Absence de spécifications formelles sur les données

* Donc, les données ne sont pas très utilisable

* Certaine expertise est requise aux contributeurs, il y a certaines situations d'erreurs assez complexes pour être comprises

* Beaucoup de mécanismes de validations a posteriori, automatiques et manuels

* Peut-on vraiment faire confiance aux contributeurs ? Problème d'autorité des données...

OpenStreetMap

Modèle de données OSM

(Waters, Waters, 2009)

Données OSM

<node id="82344312" lat="46.174" lon="3.87028" version="4" changeset="3203604" user="EtienneChoveBot" uid="183561" visible="true" timestamp="2009-11-24T12:05:35Z">

<tag k="name" v="La Pacaudière"/>

<tag k="place" v="village"/>

<tag k="postal_code" v="42310"/>

<tag k="population" v="1200"/>

<tag k="code_departement" v="42"/>

<tag k="ref:INSEE" v="42163"/>

<tag k="is_in" v="Europe,France,Loire"/>

</node> Format simple en XML

Données OSMGazetteer : indexes des toponymes (ex : GeoNames)

Éditeurs OSM

MerkaartorMerkaartor

PotlatchPotlatch

JOSMJOSM

(Antoniou, Haklay et MorleyAntoniou, Haklay et Morley, 2010)© IGN - 2010

Comment contribuer ?

Assister aux mapping parties !(Waters, Waters, 2009)

Comment contribuer ?

(Waters, Waters, 2009)

Comment contribuer ?

(Waters, Waters, 2009)

Comment contribuer ?

Application IGN pour l’iPhone : iPhiGéNie

Comment contribuer ?

Comment contribuer ?

Comment contribuer ?

Brouillon

Bd. Louis Guibert

Bd. Du clos st. george

Bd. Des cents arpents

Vidéos

• Chargement de traces GPS dans OpenStreetMap en utilisant l'éditeur Java OSM– http://www.youtube.com/watch?v=tZw38Xy_Ew0

• Contribution d'une nouvelle boulevard dans OpenStreeMap en utilisant l'éditeur Java OSM– http://www.youtube.com/watch?v=rv3a_HnMtBw

Comment contribuer ?

Comment contribuer ?

Pas encore sur OSM !

Comment contribuer ?

Déjà sur OSM !

40blog.telemapics.com

Quelques critiques

* Absence de spécifications formelles sur les données

* Donc, les données ne sont pas très utilisable

* Certaine expertise est requise aux contributeurs, il y a certaines situations d'erreurs assez complexes pour être comprises

* Beaucoup de mécanismes de validations a posteriori, automatiques et manuels

* Peut-on vraiment faire confiance aux contributeurs ? Problème d'autorité des données...

Spécifications des fournisseurs de données géographiques

BD TOPO ® - IGN

La connaissance associée à comment le monde est observé et comment il est modélisé dans la base de données (Abadie, 2009) 41

« Spécifications » pour VGI ?Charte de directives

Documentation

Usage standard des étiquettes (tags)

42

44

blog.telemapics.com

Quelques critiques

* Absence de spécifications formelles sur les données

* Donc, les données ne sont pas très utilisable

* Certaine expertise est requise aux contributeurs, il y a certaines situations d'erreurs assez complexes pour être comprises

* Beaucoup de mécanismes de validations a posteriori, automatiques et manuels

* Peut-on vraiment faire confiance aux contributeurs ? Problème d'autorité des données...

Keep Right!un outil de correction d’erreurs

Des contraintes d’intégrité prédéfinies sont vérifiées sur des données OSM45

Source: http://keepright.ipax.at

Intersections sans nœuds de jonctions

Avant

Après

•Editeur Web OSM : Potlatch

46

Superposition des routes

Avant

Après

47

•Éditeur Web OSM : Potlatch

Mécanismes plus complexes ?

•Manque de cohérence géométrique entre le réseau hydrographique et les limites administratives•Une contrainte d’intégrité indiquant la relation entre les deux les deux types pour assurer le partage de la géométrie•Possible réparation: placer la limite administrative au milieu du fleuve

Données OpenStreetMap autour de Grenoble (Decembre 2009)

48(Brando et Bucher, 2010)

49

blog.telemapics.com

Quelques critiques

* Absence de spécifications formelles sur les données

* Donc, les données ne sont pas très utilisable

* Certaine expertise est requise aux contributeurs, il y a certaines situations d'erreurs assez complexes pour être comprises

* Beaucoup de mécanismes de validations a posteriori, automatiques et manuels

* Peut-on vraiment faire confiance aux contributeurs ? Problème d'autorité des données...

Qualification de contributeurs et contributions

•Classification des contributeurs basée sur•leur besoin (Coleman et al., 2009)•leur localisation géographique (Goodchild, 2009)•Leur relation de confiance avec des autres utilisateurs (Bishr et al., 2007)•Distinguer entre les bonnes et les mauvaises contributions•Systèmes de classement (Rating) (Elwood, 2008)•Signaler les régions avec des erreurs (Maué et al., 2008)•Comparaison avec une source référentielle (Haklay, 2009)

50

Qui sont-ils ?

•Neophytes•L'amateur intéressé•L'amateur expert•L'amateur professionnel•Une autorité experte

(Coleman, 2009)

Qui sont-ils ?

52

Un étude (Budhathoki, 2010) plutôt empirique en faisant des questionnaires aux contributeurs

Quelles sont-elles leurs motivations ?

•Altruisme•Intérêt professionnel ou personnel•Stimulation intellectuelle•Protection ou amélioration d'un investissement personnel•Rétribution sociale•Amélioration de la réputation personnelle•Fierté de l'endroit•Créativité de l'individu•Intent criminels

(Coleman, 2009)

Quelles sont-elles leurs motivations ?

54

L’étude (Budhathoki, 2010) plutôt empirique en faisant des questionnaires aux contributeurs

Quelles sont-elles leurs motivations ?

55

L’étude (Budhathoki, 2010) plutôt empirique en faisant des questionnaires aux contributeurs

Modèle Spatio-temporel de confiance

(Bishr et Kuhn, 2007)

Bob

Anne

Jeff

Rating des contributions et relations entre les individus, et le temps aussi !

Études d’évaluation de qualité par rapport aux données de

référence

Similaire à l'étude fait pour évaluer la qualité de Wikipédia

•En 2005, la revue scientifique Nature a fait un étude comparative entre le contenu de Wikipédia et celui de l'encyclopédie Britannique

58

Évaluation de la qualité du VGI

(Girres et Touya, 2009)

Géométrie

ExhaustivitéExhaustivitéPrécision GéométriquePrécision Géométrique

(Antoniou, Haklay et MorleyAntoniou, Haklay et Morley, 2010)

Tags

Combien de tags par feature géographique ?Combien de tags par feature géographique ?

(Antoniou, Haklay et MorleyAntoniou, Haklay et Morley, 2010)

Tags

(Antoniou, Haklay et MorleyAntoniou, Haklay et Morley, 2010)Il y a seulement une petite quantité de tags qui couvrent la plus part des features géographique

Évaluation de la qualité du VGI

(Girres et Touya, 2009)

Évaluation de la qualité du VGI

(Girres et Touya, 2009)

Intérêt de VGI•VGI pour actualiser les bases de données des fournisseurs de données géographiques au travers d’alertes•OpenStreetMap, influence importante sur comment le contenu spatial est produit et actualisé•VGI pour compléter et enrichir les bases de données des fournisseurs de données géographique en permettant l’édition de contenu (en plus des alertes)

(Budhathoki, 2008) (Elwood, 2008) (Antoniou, 2009)65

Intérêt de VGI

Groupes d’intérêts spéciaux ont•des besoins plus forts sur la qualité des données•des limitations de budget pour collecter, rédiger et actualiser les spécifications•Un manque d’expertise sur des techniques de modélisation pour assurer la cohérence de ces données•un intérêt d’accepter quelques règles pendant la contribution

66(Coote, 2008)

Intérêt de VGI

* Mashups* Site Web qui groupe du contenu géographique

récupéré de plusieurs sources d'information dans une seule carte

* En général, un API pour accéder aux données doit être disponible pour récupérer l'information requise (ex : API geoportail)

Formats de données* KML : format simple crée par Google

standardisé récemment<?xml version="1.0" encoding="UTF-8"?>

<kml xmlns="http://www.opengis.net/kml/2.2">

<Placemark>

<name>Simple placemark</name>

<description>Attached to the ground. Intelligently places itself

at the height of the underlying terrain.</description>

<Point>

<coordinates>-122.0822035425683,37.42228990140251,0</coordinates>

</Point>

</Placemark>

</kml>

Mashup tour de France 2010

Mashup articles Wikipédia