Post on 08-Jul-2015
description
Ghis lain AtemezingRaphaël Troncy
Vers une meilleure interopérabilité Vers une meilleure interopérabilité des données géographiques des données géographiques
françaises sur le Web de donnéesfrançaises sur le Web de données
PlanPlan
Où sont les données géographiques ?Le m ob ile e t l’utilisation d e la g o-localisationéD onn e s g ograph ique s sur le we b s m antiqueé é é
Modélisation des objets géographiquesMod lisation d e s e ntit s g ograph ique sé é éMod lisation d e la g om trieé é é Illustration ave c d e s sc nariosé
Aligner les représentations
Formuler quelques recommandations
Conclus ion et travaux futurs
29/06/201 2 - 2IC 201 2, ParisIC 201 2, Paris
Où sont les données géographiques?Où sont les données géographiques?
IC 201 2, Paris - 3
G e oPortail
C IA Factbook
Foursquare : PO I..
Opengeocoder:Bounding Box..
G e oNam e s :
C od e s d e s pays
29/06/201 2
Où sont les données géographiques liées?Où sont les données géographiques liées?
- 4
DBpedia, GeoNames
LinkedGeodata (OpenS treetMap), Freebase (Google)
Ordnance S urvey (UK) , GeoLinkedData (ES )
GADM-RDF
NUTS -RDF
data.ign.fr (FR)
IC 201 2, Paris29/06/201 2
Fournis seur #Donnée disponible
D Bpe d ia 727 232 triple ts
G e oNam e s 5 240 032 ( e ntit s )« é »Linke d G e oD ata 60 356 364 triple ts
O rd nance S urve y 6 295 triple ts
Fre e base 8,5 MB (tsv fich ie rs )
G e oLinke d D ata.e s 1 01 01 8 triple ts
Proje t G AD M 682 605 triple ts
Proje t NU TS 31 6 238 triple ts
Données géographiques liées et LODDonnées géographiques liées et LOD
5
Linking Open Data cloud diagram, by Richard Cyganiak and Anja Jentzs ch. http://lod-cloud.net/
31 je ux d e d onn e sé1 9.43% triple ts
http://lod-cloud.net/s tate
29/06/201 2 IC 201 2, Paris
29/06/201 2 - 6
Les vocabulaires utilis ésLes vocabulaires utilis és
IC 201 2, Paris
Quels sont les modèles IC utilis és ? Quels sont les modèles IC utilis és ?
Des lis tes d’autorité de termes (Foursquare)Pe u structur eéRe pr se nte le s cat gorie s d e s Points d ’Int r té é é êTyp ique m e nt, un type r ponse d ’une APIéN ce ss ite d ’e xplicite r la s m antiqueé é
Des catégories S KOS (GeoNames ) Le s classe s sont d e s skos:conceptSchemeLe s cod e s sont d e s skos:Concept Pe u d e classe s , d e nom bre ux cod e s
IC 201 2, Paris - 729/06/201 2
Quels sont les modèles IC utilis és ? Quels sont les modèles IC utilis és ?
Des ontologies spécifiques au domaineLe s ontologie s par sous-d om aine (transport, unit é
ad m in is trative , hyd rograph ie , e tc.)
O ntologie s inte rconne ct e s (owl:im ports)éU K (O S ) – E S (G e oLinke d D ata)
Des ontologies riches cons truites par des outils automatiques / TALLe s classe s d e haut-nive au pour structure r
LinkedGeoData (1 6 classe s d e haut-nive au; 1 294
classe s au total)
GeOnto (2 classe s d e haut-nive au ; 783 classe s au total)
IC 201 2, Paris - 829/06/201 2
- 9
Point ( lat/long) Vocabulaire WG S 84 d crit au W3Cé
Rectangle (“ bounding box” ) Vocabulaire g opolitique (FAO )é
Points dans une lis te (« Nodes », « waynodes ») S que nce d e points (Linke d G e oD ata)é
Points dans un groupe de res sources RDF U n obje t e s t “formedB y” Lis tO fPoints (G e oLinke d D ata.e s )
Littéraux (représentation GML incluse en RDF) O rd nance S urvey(U K)
Représentation complètement s tructurée Le vocabulaire N e oG e o (G e oVocam p)
IC 201 2, Paris29/06/201 2
Modélisation de la geométrie Modélisation de la geométrie
Scénario: Tour Eiffel / Paris 7èmeScénario: Tour Eiffel / Paris 7ème
- 1 0IC 201 2, Paris29/06/201 2
La Tour Eiffel sur DBpedia La Tour Eiffel sur DBpedia (un “Building”…)(un “Building”…)
- 1 1
dbpedia:Eiffel_Tower a dbpedia-owl:Building ;
a <http://schema.org/Place> ; (16 “types” différent) rdfs:label "Tour Eiffel"@fr ; geo:lat "48.858299"^^xsd:float ; (WGS84 ) geo:long "2.294500"^^xsd:float ; geo:geometry "POINT(2.2945 48.8583)" ;
dbpprop:buildingType "Observation tower"@en ; dbpprop:elevatorCount "9"^^xsd:int ; dbpprop:location dbpedia:Paris ; dbpprop:isofRegion "FR-75" ; dbpprop:architect dbpedia:Stephen_Sauvestre .
IC 201 2, Paris29/06/201 2
La Tour Eiffel sur Freebase (un “skyscraper”)La Tour Eiffel sur Freebase (un “skyscraper”)
- 1 2
fb:en.eiffel_tower a fb:architecture.building ;
a fb:architecture.skyscraper ; (12 rdf:type in total)
fb:architecture.skyscraper.height_with_antenna_spire_meters "324.0"^^xsd:float ; fb:location.geocode [
fb:location.geocode.longitude "2.2946"^^xsd:float ; fb:location.geocode.latitude "48.85839"^^xsd:float . ] ;
IC 201 2, Paris29/06/201 2
La Tour Eiffel sur GeoNames (un “S.MMT”)La Tour Eiffel sur GeoNames (un “S.MMT”)
- 1 3
gnr:6254976 a gn:Feature ;
gn:name "Eiffel Tower" ; gn:alternateName " 에펠 탑 "@ko ; (en 45 langues différentes) gn:featureClass gn:S [ a skos:ConceptScheme ; rdfs:comment "spot, building, farm, ..."@en . ] ;
gn:featureCode gn:S.MMT [ a skos:Concept ; rdfs:comment "a commemorative structure or statue"@en . ] ;
gn:countryCode "FR" ; geo:lat "48.8583" ; geo:long "2.29452" .
IC 201 2, Paris29/06/201 2
La Tour Eiffel sur LGD La Tour Eiffel sur LGD (un “chemin” de 45 points)(un “chemin” de 45 points)
- 1 4
lgd:way5013364 a lgdo:Building , lgdo:ManMadeTower , lgdo:Attraction ; rdfs:label "Wieża Eiffel'a"@pl ; (en 13 langues.) lgdo:layer "2"; lgdp:building:height "301"; lgdp:importance "international"; lgdo:hasNodes <http://linkedgeodata.org/triplify/way5013364/nodes>.
rdf:_1 lgd:node33388356; …………; rdf:_10 lgd:node33388333 ;
(tous les 45 points du polygone)
IC 201 2, Paris29/06/201 2
7ème Arrondissement in DBpedia (a gml_Feature)7ème Arrondissement in DBpedia (a gml_Feature)
- 1 5
dbpedia:7th_arrondissement_of_Paris a gml:_Feature ; (gml n’est pas en OWL )
a <http://dbpedia.org/class/yago/1900SummerOlympicVenuEs> (Yago Class)
rdfs:label "巴黎第七區 "@zh; (14 different languages)
dbpprop:commune "Paris" ; dbpprop:département dbpedia:Paris ; dbpprop:région dbpedia:Île-de-France_(region) ;
grs:point "48.85916666666667 2.312777777777778" ; geo:geometry "POINT(2.31278 48.8592)" ; (fake property?!) geo:lat "48.859165"^^xsd:float; geo:long "2.312778"^^xsd:float.
IC 201 2, Paris29/06/201 2
7ème Arrondissement in GeoNames (a A.ADM4)7ème Arrondissement in GeoNames (a A.ADM4)
- 1 6
gnr:6618613 a gn:Feature ; gn:name "Paris 07";
gn:alternateName "7ème arrondissement"; gn:featureClass gn:A [ a skos:ConceptScheme ; rdfs:comment "country, state, region ..."@en . ] ;
gn:featureColde gn:A.ADM4 [ a skos:Concept ; rdfs:comment "a subdivision of a third-order administrative division"@en . ];
gn:countryCode "FR"; gn:population "57410"; geo:lat "48.8565"; geo:long "2.321".
IC 201 2, Paris29/06/201 2
7ème Arrondissement in LGD (a “Suburb”)7ème Arrondissement in LGD (a “Suburb”)
- 1 7
lgd:node248177663 a lgdo:Suburb ;
rdfs:label "7th Arrondissement"@en , "7e Arrondissement" ; lgdo:contributor lgd:user13442 ;
<http://linkedgeodata.org/ontology/ref%3AINSEE> 75107 ;
lgdp:alt_name "VIIe Arrondissement" ;
georss:point "48.8570281 2.3201953" ; geo:lat 48.8570281 ; geo:long 2.3201953 .
IC 201 2, Paris29/06/201 2
Vocabulaire GeOntoVocabulaire GeOnto
Ontologie des objets géographiques (PI)R sultat d ’un proje t ANRéO bte nue par d e s outils d e TAL
Re couvre la partie BD Topo (IG N)
Clas ses en françaisrdfs:labels e n FR & E N
Pas d e rdfs:commentsPe u d e re lations
783 classe s
- 1 8IC 201 2, Paris29/06/201 2 IC 201 2, Paris
Méthodologie d’alignementMéthodologie d’alignement
Alignement de GeOnto avec 4 vocabulaires et 2 taxonomies LG D , D Bpe d ia, S che m a.org, G e oN am e s
Foursquare , G oogle Place s
Recherche des owl:equivalentClass O util : S ilk
M trique s : Leve nshte inD is tance , Jaro é Labe ls : @ e n d e s classe s
Fonction d ’agr gation : m oye nneé
Validation manuelle Pour le s rd fs :s ubC lassO f « » Aligne m e nt sp cifique ave c G e oN am e sé
- 1 9IC 201 2, Paris29/06/201 2 IC 201 2, Paris
Procédé d’alignement avec GeoNamesProcédé d’alignement avec GeoNames
geOnto:AGeoConcept a owl:Class; rdfs:label “a laben”@en; rdfs:subClassOf gn:Feature; owl:equivalentClass [a owl:Restriction; owl:onProperty gn:featureCode; owl:hasValue gn:CODE. ]
- 20IC 201 2, Paris29/06/201 2 IC 201 2, Paris
Résultats /EvaluationRésultats /Evaluation
Precis ions généralement > 80%
S auf P(S chema.org) = 50%. Raison pos s ib le : le s e ntit s G e O nto plus s p cifique s la Franceé é à N ive au trop d taill d e s e ntit s s ur S che m a.org é é é
- 21IC 201 2, Paris
Vocab/taxonomies #Clas ses #C las ses alignées
LG D owl:Class: 1 294 1 78
D Bpe d ia owl:Class:366 42
S che m a.org owl:Class: 296 52
G e oNam e s skos:Concept:699 287
Foursquare 359 46
G oogle Place 1 26 41
29/06/201 2 IC 201 2, Paris
Recommendations Recommendations S éparation des objets de leur géométrie
Bie n d is tingue r d ans le s e space s d e nom m age
E xe m ple : spatial:Feature vs geom:G eometry
Usage du vocabulaire WGS 84 pour représenter les points R utilis e r le s propri t s native s (long; lat; alt)é é é
Géométrie complexe (polygone, courbe, etc.) U tilis e r le s re pr se ntations plus s tructur e sé é E vite r au m axim um le s n ud s anonym e s d ans le s d onn e sœ é Propose r d e s transform ations aux form ats S IG (KML, G ML, e tc.)
Extens ion de GeOnto U n bon cand id at: N e oG e o
Publie r s e lon le s Bonne s Pratique s (d ata.ign.fr)
- 22IC 201 2, Paris29/06/201 2 IC 201 2, Paris
PerspectivesPerspectives
Publier GeOnto++S e lon le s Bonne s Pratique s d u we b d e d onn e s li e sé é
« Lifter » les données de l’IGNE n utilisant le vocabulaire
Poursuivre les A lignementsS che m a.org, Foursquare , G oogle Place ( volutif)éG e oS PARQ L
Proc d e r d e s aligne m e nts au nive au d e s d onn s é à é
- 23IC 201 2, Paris29/06/201 2 IC 201 2, Paris
Ques tionsQues tions ??
Merci pour votre attention !