Data Tuesday 18 09 2012 Malte Brun - Goulas

7
Data Tuesday – 18 septembre 2012 Data Tuesday – 18 septembre 2012 Adaptation et enrichissement de la donnée géographique brute

Transcript of Data Tuesday 18 09 2012 Malte Brun - Goulas

Page 1: Data Tuesday 18 09 2012   Malte Brun - Goulas

Data Tuesday – 18 septembre 2012

Data Tuesday – 18 septembre 2012

Adaptation et enrichissement de la donnée géographique brute

Page 2: Data Tuesday 18 09 2012   Malte Brun - Goulas

Data Tuesday – 18 septembre 2012

Fournisseurs et besoins

ATTRIBUTS

RELATIONS

● Remodéliser Navigation, îlotage

● Îloter Sectorisation Outil ergonomique de sélection des IHM

Adapter :

● Données à plat➔ Par géocodage, matching d'adresses

● Données spatialisées➔ Par inclusion géométrique➔ Par requête spatiale

Enrichir :

Page 3: Data Tuesday 18 09 2012   Malte Brun - Goulas

Data Tuesday – 18 septembre 2012

Focus : le géocodage28 rue de l'Arbousier, 13300 Salon de Provence17 rue de l'Armandier, 13300 Salon de Provence215 rue de l'Acacia, 13300 Salon de Provence33 rue de l'Abri côtier, 13300 Salon de Provence

En règle générale, les odonymes de graphie identique entre 2 bases d'adresses représentent 80 % de la volumétrie totale.

Les différences de graphie se résolvent par :● La comparaison des mots directeurs● La ressemblance phonétique (soundex)● La ressemblance lexicale :

● Distance de Levenshtein● Score des trigrammes

Page 4: Data Tuesday 18 09 2012   Malte Brun - Goulas

Data Tuesday – 18 septembre 2012

Focus : le géocodageLe score des trigrammes :

● Décompose les chaînes de caractères en groupes de 3 lettres● ABRICOTIER ABR-BRI-RIC-ICO-COT-OTI-TIE-IER● ABRI COTIER ABR-BRI-RI_-_CO-COT-OTI-TIE-IER● Calcule un score construit sur les trigrammes communs

Dans le SGBD PostgreSQL :

select similarity('abricotier', 'abri cotier')= 0.642857

Page 5: Data Tuesday 18 09 2012   Malte Brun - Goulas

Data Tuesday – 18 septembre 2012

Focus : la sectorisation

Réseau filaire de voirie

❷❸

Îlotage Quantification

Page 6: Data Tuesday 18 09 2012   Malte Brun - Goulas

Data Tuesday – 18 septembre 2012

Focus : la sectorisation

Optimisation sur :● La forme● Le potentiel● L'homogénéité● L'hétérogénéité

Algorithme du recuit simulé

Page 7: Data Tuesday 18 09 2012   Malte Brun - Goulas

Data Tuesday – 18 septembre 2012

Exemple d'application

Correspondances adresses–zones urbaines

Cartographie OpenStreetMap

Ilots – IRISDonnées du recensement

géocodage

adjacences

Ilots - IRIS OpenStreetMap

îlotage

Données externesBases clients – prospectsZonages

Enrichir OpenStreetMap par les données INSEE