Caractérisation de parcellaires par méthode de fouille de ...€¦ · – Hypothèse : Ensemble...

30
Caractérisation de parcellaires par méthode de fouille de données Thomas Guyet AGROCAMPUS-OUEST IRISA – Équipe DREAM 21 juin 2010, Saint-Jacut

Transcript of Caractérisation de parcellaires par méthode de fouille de ...€¦ · – Hypothèse : Ensemble...

Page 1: Caractérisation de parcellaires par méthode de fouille de ...€¦ · – Hypothèse : Ensemble d'éléments + règles caractéristiques d'un paysage ... géométrique (actions

Caractérisation de parcellaires par

méthode de fouille de données

Thomas Guyet

AGROCAMPUS-OUEST

IRISA – Équipe DREAM

21 juin 2010, Saint-Jacut

Page 2: Caractérisation de parcellaires par méthode de fouille de ...€¦ · – Hypothèse : Ensemble d'éléments + règles caractéristiques d'un paysage ... géométrique (actions

11/41Seminaire Tahiti ­ 21­22 juin 2010 ­ Saint­Jacut

Illustration du problème de la caractérisation et la simulation de paysages : GenExp

F. Le Ber, C. Lavigne, K. Adamczyk, F. Angevin, N. Colbach, J.-F. Mari and H. Monod, “Neutral modelling of agricultural landscapes by tessellation methods – Application for gene flow simulation”, Journal of Ecological Modelling, 2009

Page 3: Caractérisation de parcellaires par méthode de fouille de ...€¦ · – Hypothèse : Ensemble d'éléments + règles caractéristiques d'un paysage ... géométrique (actions

12/41Seminaire Tahiti ­ 21­22 juin 2010 ­ Saint­Jacut

Bases de parcellaires

● Caractériser un paysage par des règles de composition– Règle de composition = une « règle » d'organisation locale 

entre éléments constitutifs d'un paysage– Hypothèse : Ensemble d'éléments + règles  caractéristiques 

d'un paysage● Simuler des paysages

– Combiner des motifs spatiaux satisfaisant au mieux les règles d'organisation

Caractériser et simuler des paysages à partir de règles de composition locales

Karine Zeitouni, HDR, Université de Versaille Saint-Quentin en Yvelines "Analyse et extraction de connaissances des bases de données spatiotemporelles".

Caractérisationpar des

règles locales

Bases de règles de

composition

Générationde paysages

Page 4: Caractérisation de parcellaires par méthode de fouille de ...€¦ · – Hypothèse : Ensemble d'éléments + règles caractéristiques d'un paysage ... géométrique (actions

13/41Seminaire Tahiti ­ 21­22 juin 2010 ­ Saint­Jacut

Generative landscape grammar (K. Mayall)

● Un paysage peut être vu comme une collection grammaticalement ordonnée d'objets physiques

● Generative landscape grammar– Vocabulaire : catégories d'objets physiques qui peuvent être 

rencontrés dans le paysage● ex. building, trees, road, 

– Règles grammaticales : relations (spatiales) entre catégories d'objets qui régissent la structure du paysage

● ex.  si la pente d'un champ est supérieure à 0.2, alors il ne peut être exploité

● La grammaire d'un paysage le caractérise● Grammaire générative : permet de regénérer des 

paysagesK. Mayall, G. Hall, Landscape grammar 1: spatial grammar theory and landscape planning, Environment and planning B: Planning and Design, vol. 32, p. 895-920, 2005

Page 5: Caractérisation de parcellaires par méthode de fouille de ...€¦ · – Hypothèse : Ensemble d'éléments + règles caractéristiques d'un paysage ... géométrique (actions

14/41Seminaire Tahiti ­ 21­22 juin 2010 ­ Saint­Jacut

Règles spatiales de l'organisation du paysage

● Automates cellulaires– Cas le plus simple d'une grille régulière fixe– Règles sur l'allocation d'une case en 

fonction de l'allocation de ses voisines– Simulation jusqu'à stabilisation– Exemples : Slager  2008, + D. Moreau

● Trepos : règles décisionnelles simuler des arbres d'exutoires (bassin versant)

● F. Flouvat : colocalisation pour l'érosion en Nouvelle Calédonie

● Modèle L1 (Gaucherel) : règles de transformation géométrique (actions géométriques attributaires)

● ajout, disparition, réunion, division ...● Grammaires de formes (Stiny)

Page 6: Caractérisation de parcellaires par méthode de fouille de ...€¦ · – Hypothèse : Ensemble d'éléments + règles caractéristiques d'un paysage ... géométrique (actions

15/41Seminaire Tahiti ­ 21­22 juin 2010 ­ Saint­Jacut

Caractérisation du paysage par des ensembles de cultures colocalisées● Éléments constitutifs d'une grammaire de paysage 

(parcellaire)– Vocabulaire : un élément géométrique avec attributs

● parcelle : 1 point (centre de la parcelle) + attribut d'assolement● haie : 1 point (centre) + attribut de type de haie● exemples :

– « Grande parcelle de maïs » : parcelle de maïs > 10ha

– Règles : ensemble cultures co­localisées « significatives » ● Cultures/haies colocalisées = ensemble de cultures et types de 

haies « proches » dans l'espace● exemple :

– une parcelle de maïs est proche d'une route– une prairie est souvent à coté d'une prairie

Page 7: Caractérisation de parcellaires par méthode de fouille de ...€¦ · – Hypothèse : Ensemble d'éléments + règles caractéristiques d'un paysage ... géométrique (actions

16/41Seminaire Tahiti ­ 21­22 juin 2010 ­ Saint­Jacut

Caractérisation automatique du paysage

● On pourrait récupérer les règles auprès d'un expert : – difficile et couteux,– exprimable ?

● On cherche à extraire automatiquement – le vocabulaire : par catégorisation des types de parcelle– les règles de co­localisation de cultures

● « significatif » : présent de manière fréquente (>seuil) dans le paysage réel

● Utilisation de méthode de fouille de données spatiales– Recherche de motifs colocalisés

Page 8: Caractérisation de parcellaires par méthode de fouille de ...€¦ · – Hypothèse : Ensemble d'éléments + règles caractéristiques d'un paysage ... géométrique (actions

17/41Seminaire Tahiti ­ 21­22 juin 2010 ­ Saint­Jacut

Motifs de colocalisation (Huang et al., Shekhar et al.)

Y. Huang, , S. Shekhar, H. Xiong, « Discovering co-location patterns from spatial datasets: a general approach », IEEE Transaction on Knwoledge and data engineering, 2004

● Une colocalisation C est un sous­ensemble de caractéristiques (C in F).

● Une instance d’une colocalisation C, par rapport à une relation de voisinage R fixée, est un ensemble d’objets de O ayant pour caractéristiques celles de C, et respectant deux à deux la relation spatiale R.– Exemple C={A,B,C}

● Ensemble des instances de C parmi O :  TI RO ,C

O={o1,o2, o3, ...o12}

F={A , B ,C , D , E }

f o1=A ,f o2=C ,

...

Page 9: Caractérisation de parcellaires par méthode de fouille de ...€¦ · – Hypothèse : Ensemble d'éléments + règles caractéristiques d'un paysage ... géométrique (actions

18/41Seminaire Tahiti ­ 21­22 juin 2010 ­ Saint­Jacut

Motifs de colocalisation (Flouvat et al., extension de Shekhar)● Méthode d'extraction de motifs colocalisés « intéressants »

– Cadre théorique de Mannila● « Intéressant » = mesure anti­monotone supérieure à un seuil

– Utilisation des algorithmes de recherche de sous­ensembles d'objets spatiaux « intéressants »

● APriori● FPGrowth● ...

● Dans l'approche de Huang, la relation spatiale est directement intégrée dans la recherche de motifs fréquents

Selmaoui, Flouvat, Grison, Rouet et Gay, ”Découverte de colocations dans un SIG : extension et application à l'étude de l'érosion en nouvelle calédonie”, SAGEO; 2009

Page 10: Caractérisation de parcellaires par méthode de fouille de ...€¦ · – Hypothèse : Ensemble d'éléments + règles caractéristiques d'un paysage ... géométrique (actions

19/41Seminaire Tahiti ­ 21­22 juin 2010 ­ Saint­Jacut

Motifs de colocalisation

● Ratio de participation

● Index de participation– Mesures anti­monotones pour l'inclusion ensembliste

piShekhar=∏∀ f ∈C

prRO,C , f

piHuang=min∀ f ∈C prR O,C , f

piFlouvat=∣TI RO ,C ∣

∣TI R O ,C ∣max∀ f ∈C∣{o∈TI RO ,C ;o∉I ,∀ I∈TI RO ,C }∣

Page 11: Caractérisation de parcellaires par méthode de fouille de ...€¦ · – Hypothèse : Ensemble d'éléments + règles caractéristiques d'un paysage ... géométrique (actions

20/41Seminaire Tahiti ­ 21­22 juin 2010 ­ Saint­Jacut

Motifs de colocalisation

Selmaoui, Flouvat, Grison, Rouet et Gay, ”Découverte de colocations dans un SIG : extension et application à l'étude de l'érosion en nouvelle calédonie”, SAGEO; 2009

prRO , {A , B }, A =1/2prRO , {A , B },B =1/2piShekhar O , {A ,B }=1/4piHuang O , {A , B }=1/2piFlouvat=2 /22=1/2

prR O ,{A ,B }, A =1 /3prR O ,{A ,B }, B =1/3piShekhar O ,{A ,B }=1/9piHuang O ,{A ,B }=1/3piFlouvat=1/12=1 /3

prR O ,{A ,B }, A =1 /3prR O ,{A ,B }, B =1piShekhar O ,{A ,B }=1/3piHuang O ,{A ,B }=1/3piFlouvat=3 /32=3 /5

Page 12: Caractérisation de parcellaires par méthode de fouille de ...€¦ · – Hypothèse : Ensemble d'éléments + règles caractéristiques d'un paysage ... géométrique (actions

21/41Seminaire Tahiti ­ 21­22 juin 2010 ­ Saint­Jacut

Recherche de colocalisation (Guyet T.)

● Méthode en deux étapes1) Recherche des colocalisations C

● Revient à une recherche de cliques dans le graphe des relations

3) Recherche des caractéristiques communes aux objets colocalisés

C={O=o1 , o2 , ... , on;∀oi , o j∈O , R oi , o jvraie}

CF={F i

= f 1i , f 2

i , ... f ni;∀ o j∈Oi , f j

i=f o j

i ,Oi

∈C}

Ensemble des motifs colocalisés

Ensemble des caractéristiques de motifs colocalisés

R

Page 13: Caractérisation de parcellaires par méthode de fouille de ...€¦ · – Hypothèse : Ensemble d'éléments + règles caractéristiques d'un paysage ... géométrique (actions

22/41Seminaire Tahiti ­ 21­22 juin 2010 ­ Saint­Jacut

Recherche de colocalisation (Guyet T.)

● Recherche des caractéristiques fréquentes dans les descripteurs colocalisés– Suppression de la dimension spatiale– Les exemples sont des ensembles de descripteurs

– Utilisation du cadre général de Manilla (pour des itemsets)● Motif intéressant = motif fréquent (anti­monotone !)● Application de l'algorithme APriori

F i= f 1i , f 2

i , ... , f ni

Page 14: Caractérisation de parcellaires par méthode de fouille de ...€¦ · – Hypothèse : Ensemble d'éléments + règles caractéristiques d'un paysage ... géométrique (actions

23/41Seminaire Tahiti ­ 21­22 juin 2010 ­ Saint­Jacut

Comparaison Huang / Guyet

● Expressivité– a priori, les mêmes relations spatiales peuvent être utilisées– Biais Guyet

● un motif de caractéristiques colocalisées est fréquent par rapport aux colocalisés uniquement

– Utiliser plutôt un nombre minimum plutôt d'une fréquence !● on perd l'information sur la présence globale des descripteurs

● Complexité– Huang : travaille sur toute la base de données en même 

temps● étape de calcul de fréquence des motifs calculatoire !

– Guyet : indépendance des deux processus de fouille● gain réel ? la recherche de cliques reste complexe !● possibilité de découpler les calculs (construction des cliques a 

priori)

Page 15: Caractérisation de parcellaires par méthode de fouille de ...€¦ · – Hypothèse : Ensemble d'éléments + règles caractéristiques d'un paysage ... géométrique (actions

24/41Seminaire Tahiti ­ 21­22 juin 2010 ­ Saint­Jacut

Caractérisation du paysage par des ensembles fréquents de cultures colocalisées● Quelques expérimentations

– Données● parcellaire de la zone atelier de « Pleine­

Fougères »– Possibilité de faire enregistrer ce travail 

dans le cadre de cet zone atelier– Dirigée par J. Baudry

● bocage de 2000● données fournies par le CAREN, par 

l'intermédiaire du SAD­Paysage Rennes– Implémentation

● données disposés dans un serveur PostGis

● implémentation expérimentale en Java

Page 16: Caractérisation de parcellaires par méthode de fouille de ...€¦ · – Hypothèse : Ensemble d'éléments + règles caractéristiques d'un paysage ... géométrique (actions

25/41Seminaire Tahiti ­ 21­22 juin 2010 ­ Saint­Jacut

Construction de parcelles colocalisées

● Recherche des groupements de parcelles/haies « proches »– Relation spatiale (R) : distance euclidienne entre centres de 

parcelle inférieure à un seuil (70m)● 1 parcelle ou 1 haie = 1 point

– ICI, l'assolement ou le type de haie n'a pas d'importance

Seuil de distance faible Seuil de distance plus grand

Page 17: Caractérisation de parcellaires par méthode de fouille de ...€¦ · – Hypothèse : Ensemble d'éléments + règles caractéristiques d'un paysage ... géométrique (actions

26/41Seminaire Tahiti ­ 21­22 juin 2010 ­ Saint­Jacut

Construction des ensembles fréquents de cultures colocalisées● Extraction de cultures co­

localisées– ensembles de points co­localisés = 

ensemble d'items● 1 item = 1 catégorie de parcelle● 1 catégorie = 1type de culture● réduit l'information spatiale à la co­

localisation– extraction de motifs fréquents à 

partir d'itemsets● APriori

= { , }IS1 Prairie Mais = { , }III IIIIIII I IIIIIII = { , }III IIIIIII IIIIIII = { , }III IIIIIII IIIIIII = { , , }III IIIIIII I III IIIII = { , }III IIIIIII I III

...

IS1

IS2

IS3

IS4

IS5

IS6

Page 18: Caractérisation de parcellaires par méthode de fouille de ...€¦ · – Hypothèse : Ensemble d'éléments + règles caractéristiques d'un paysage ... géométrique (actions

27/41Seminaire Tahiti ­ 21­22 juin 2010 ­ Saint­Jacut

Caractérisation du paysage par des ensembles fréquents de cultures colocalisées● Résultats par une méthode par co­localisation

– Seuil de co­localisation 70m– Seuil de cultures 

colocalisées : 1%

– Résultats● {Céréales,Prairie}● {Céréales, Céréales}● {Prairie,Prairie,Prairie,Prairie} : 

1.9%

(307902 2396412,312211 2399013)

Page 19: Caractérisation de parcellaires par méthode de fouille de ...€¦ · – Hypothèse : Ensemble d'éléments + règles caractéristiques d'un paysage ... géométrique (actions

28/41Seminaire Tahiti ­ 21­22 juin 2010 ­ Saint­Jacut

Colocalisation de cultures à 1%, Plaine, 70m

Page 20: Caractérisation de parcellaires par méthode de fouille de ...€¦ · – Hypothèse : Ensemble d'éléments + règles caractéristiques d'un paysage ... géométrique (actions

29/41Seminaire Tahiti ­ 21­22 juin 2010 ­ Saint­Jacut

Colocalisation de cultures à 1%, plaine, 300m

● {Plairie, Plairie, Plairie, Plairie, Plairie}

Page 21: Caractérisation de parcellaires par méthode de fouille de ...€¦ · – Hypothèse : Ensemble d'éléments + règles caractéristiques d'un paysage ... géométrique (actions

30/41Seminaire Tahiti ­ 21­22 juin 2010 ­ Saint­Jacut

Caractérisation du paysage par des ensembles fréquents de cultures colocalisées● Résultats par une méthode par co­localisation

– Seuil de co­localisation 70m– Seuil de cultures 

colocalisées : 1%

– Cultures colocalisées extraites● {Prairie, Prairie, Prairie} : 9.9%● {Mais, Prairie, Prairie} : 1,6%● {Cereales, Prairies, Prairies} : 1.1%● {Mais, Mais}, {Mais, Cereales}, {Cereales, Cereales} >1%

(305821 2392998,309419 2395157)

Page 22: Caractérisation de parcellaires par méthode de fouille de ...€¦ · – Hypothèse : Ensemble d'éléments + règles caractéristiques d'un paysage ... géométrique (actions

31/41Seminaire Tahiti ­ 21­22 juin 2010 ­ Saint­Jacut

Colocalisation de cultures à 1%, Bocage, 70m

Page 23: Caractérisation de parcellaires par méthode de fouille de ...€¦ · – Hypothèse : Ensemble d'éléments + règles caractéristiques d'un paysage ... géométrique (actions

32/41Seminaire Tahiti ­ 21­22 juin 2010 ­ Saint­Jacut

Stage Matthieu Oger (M1 IFSIC) 

● Mise en place d'une première méthode permettant de générer des paysages, incluant la dimension géométrique, à partir de règles locales extraites de parcellaires réels– Première expérimentation de A à Z– Inclure les aspects géométriques des parcelles– Interfaçage avec APILand

● API Java de représentation d'un paysage● INRA SAD­Paysage

Parcellaire(s) réel(s)(shp, PostGIS)

Règlescaractéristiquesd'un parcellaire

Représentationd'un paysagedans APILand

Extraction derègles de proximité

entre parcelles Simulation

Parcellairesimulés (shp)

Exportationdes parcellaires

Page 24: Caractérisation de parcellaires par méthode de fouille de ...€¦ · – Hypothèse : Ensemble d'éléments + règles caractéristiques d'un paysage ... géométrique (actions

33/41Seminaire Tahiti ­ 21­22 juin 2010 ­ Saint­Jacut

Méthode utilisée

● Génération du modèle– Reproduire en mémoire un modèle simplifié du paysage réel

● Format propre● Facile à traiter pour générer des motifs

● Extraction de motifs– Approche simple dans un premier temps

● Prise en compte d'un nombre réduit de paramètres– Analyser les relations de voisinage de chaque parcelle

● Type de parcelles à proximité, distance, surface (+ profil angulaire)– Approche floue et principe de règles à base de fréquences

Page 25: Caractérisation de parcellaires par méthode de fouille de ...€¦ · – Hypothèse : Ensemble d'éléments + règles caractéristiques d'un paysage ... géométrique (actions

34/41Seminaire Tahiti ­ 21­22 juin 2010 ­ Saint­Jacut

Méthode utilisée

● Génération du paysage– Pavage d'une zone réduite 

● Ces zones pourront être utilisées conjointement ensuite– Autour de routes par exemple

– Utilisation des règles (motifs) pour placer des parcelles● Tirage aléatoire, placement arbitraire, etc.

– Adaptation de la topologie● Surface, formes de parcelles réelles

– Problème d'incompatibilité● Probabilité de placer deux parcelles incompatibles pour satisfaire la 

répartition● Est­ce vraiment un problème ? (cas ponctuel exceptionnel)

Page 26: Caractérisation de parcellaires par méthode de fouille de ...€¦ · – Hypothèse : Ensemble d'éléments + règles caractéristiques d'un paysage ... géométrique (actions

35/41Seminaire Tahiti ­ 21­22 juin 2010 ­ Saint­Jacut

Résultats attendus

● Génération effective de parcellaires simulés (simples)– sans routes, ni rivières– géométries non­nécessairement très « réalistes »– sur de petits territoires

● Réalisation d'une implémentation de la méthode sur laquelle s'appuyer pour des améliorations futures– implémentation de la méthode générique (avec interface APILand)– modularité du code– généricité dans la représentation des motifs

● Comparer les parcellaires réels avec les parcellaires simulés– mise en place des mesures de distance– comparaison bocage/plaine

Page 27: Caractérisation de parcellaires par méthode de fouille de ...€¦ · – Hypothèse : Ensemble d'éléments + règles caractéristiques d'un paysage ... géométrique (actions

36/41Seminaire Tahiti ­ 21­22 juin 2010 ­ Saint­Jacut

Conclusions ...

● On cherche à caractériser un paysage par une « grammaire de paysage »

● Nécessite d'identifier un formalisme prenant en compte les attributs significatifs– Pour le vocabulaire : les objets géométriques composables

● attributs des parcelles : assolement, pente, nature du sol, ...● haies

– Pour les règles de composition : relations locales entre parcelles

● quelles mesures de distances ?● quelles relations prendre en compte ?

Page 28: Caractérisation de parcellaires par méthode de fouille de ...€¦ · – Hypothèse : Ensemble d'éléments + règles caractéristiques d'un paysage ... géométrique (actions

37/41Seminaire Tahiti ­ 21­22 juin 2010 ­ Saint­Jacut

Conclusions ...

● On cherche à extraire automatiquement ces règles de composition de paysage– C'est une contrainte forte sur la nature des règles qui 

peuvent être extraites

● Utilisation des méthodes de fouille de données

Page 29: Caractérisation de parcellaires par méthode de fouille de ...€¦ · – Hypothèse : Ensemble d'éléments + règles caractéristiques d'un paysage ... géométrique (actions

38/41Seminaire Tahiti ­ 21­22 juin 2010 ­ Saint­Jacut

Conclusions ...

● Utilisation de règles spatiales locales pour caractériser un paysage– Ce sont des descripteurs locaux, – Approche assez différentes des approches statistiques 

utilisant des descripteurs globaux– Pourra­t­on retrouver des caractéristiques globales 

dans les nouveaux paysages simulés ?● Quel formalisme pour représenter des règles spatiales 

locales ?– Expressif pour le problème de la simulation de paysage– Extractible automatiquement– Utilisable pour faire de la simulation de paysage

Page 30: Caractérisation de parcellaires par méthode de fouille de ...€¦ · – Hypothèse : Ensemble d'éléments + règles caractéristiques d'un paysage ... géométrique (actions

39/41Seminaire Tahiti ­ 21­22 juin 2010 ­ Saint­Jacut

Perspectives

● Réalisation du stage pour commencer à répondre aux questions précédentes 

● Exploration des méthodes de fouilles de données spatiales pour l'extraction de règles de composition– Raisonnement sur des graphes de voisinage de parcelles– Formalisation logique des relations spatiales + ILP

● Travailler sur les distances comme élément sémantique– Distance pour l'exploitant agricole– Corridors écologiques

● Approches hiérarchiques : extraire et combiner des « super­motifs »