DECOMPOSITION D’UN ESPACE REGIONAL POUR...

13
Modelisation et automatisation de la production d’information (SA7MOD) 287 DECOMPOSITION D’UN ESPACE REGIONAL POUR UNE APPROCHE INTEGREE Haja ANDRIANASOLO INTRODUCTION L’hypothèse de base est qu’une aire régionale quelconque constitue un système complexe organisé, à propos duquel aucune information à priori n’est disponible. C’est un système d’incertitude maximale. L’approche, sujet de nos recherches actuelles, tendrait à obtenir une réduction de cette incertitude, en réalisant une compréhension “structurelle” d’un tel système. Démarche qui reduit l’incertitude (l’entropie) en décomposant le système en sous-systèmes “éIémentaires” dont il serait plus aisé d’en réaliser l’analyse et la compréhension. Les problèmes posés sont alors ceux recouverts par la découverte des sous- systèmes, leur qualification et l’appréhension de leurs inter-relations. Soit, que sont les sous-systèmes?, comment sont-ils organisés?, comment structurent-ils la région?. En fait la première difficulté est de disposer d’une représentation adéquate de cette réalité qu’est l’aire régionale. Si la réduction de l’incertitude visée concerne la totalité des phénomènes présents et influents sur cet espace, la représentation recherchée doit rendre compte de façon synthétique de ces phénomènes. Les données satellitaires constituent une telle représentation. Représentation apte à fournir des éléments d’analyse tant du point de vue de l’analyse spectrale que spatiale. La donnée satellitaire constitue alors le système d’incertitude maximale, duquel doivent être découverts les sous-systèmes servant à l’analyse. Cet article se limitera à une approche basée sur les propriétés spectrales des images satellitaires d’une part, et d’autre part est illustré par une problématique “Sécurité Alimentaire”, qui a plus particulièrement conduit à la définition des contraintes de l’efficacité et de l’adéquation du modèle. Les

Transcript of DECOMPOSITION D’UN ESPACE REGIONAL POUR...

Modelisation et automatisation de la production d’information (SA7MOD) 287

DECOMPOSITION D’UN ESPACE REGIONAL POUR UNE APPROCHE INTEGREE

Haja ANDRIANASOLO

INTRODUCTION

L’hypothèse de base est qu’une aire régionale quelconque constitue un système complexe organisé, à propos duquel aucune information à priori n’est disponible. C’est un système d’incertitude maximale.

L’approche, sujet de nos recherches actuelles, tendrait à obtenir une réduction de cette incertitude, en réalisant une compréhension “structurelle” d’un tel système.

Démarche qui reduit l’incertitude (l’entropie) en décomposant le système en sous-systèmes “éIémentaires” dont il serait plus aisé d’en réaliser l’analyse et la compréhension.

Les problèmes posés sont alors ceux recouverts par la découverte des sous- systèmes, leur qualification et l’appréhension de leurs inter-relations. Soit, que sont les sous-systèmes?, comment sont-ils organisés?, comment structurent-ils la région?.

En fait la première difficulté est de disposer d’une représentation adéquate de cette réalité qu’est l’aire régionale. Si la réduction de l’incertitude visée concerne la totalité des phénomènes présents et influents sur cet espace, la représentation recherchée doit rendre compte de façon synthétique de ces phénomènes. Les données satellitaires constituent une telle représentation. Représentation apte à fournir des éléments d’analyse tant du point de vue de l’analyse spectrale que spatiale.

La donnée satellitaire constitue alors le système d’incertitude maximale, duquel doivent être découverts les sous-systèmes servant à l’analyse.

Cet article se limitera à une approche basée sur les propriétés spectrales des images satellitaires d’une part, et d’autre part est illustré par une problématique “Sécurité Alimentaire”, qui a plus particulièrement conduit à la définition des contraintes de l’efficacité et de l’adéquation du modèle. Les

288 TELEDETECTION

données utilisées sont des images “Landsat MSS’, et le thème est le riz.

1. CONSTRUCTION DE SOUS-SYSTEMES

Générer des sous-systèmes revient à réaliser des partitions sur la représentation que constitue l’image. Partitions qui sont usuellement réalisées suivant deux grands types de démarche: dirigée et non-dirigée.

De par l’hypothèse de départ: “incertitude maximale sur le système”, la démarche dirigée ne peut s’appliquer. Qu’utiliserait-on en guise de connaissance à priori?

La seule approche possible est celle non-dirigée. Mais alors quels critères de partition employer pour assurer une efficacité et une adéquation optimale aux objectifs? et comment assurer une interprétation systematisable des classes?.

La recherche d’une solution dans ce sens se fera à travers une démarche modélisatrice.

II. MODELISATION

11.1. Criteres de partitions

Soit: l une population P *une variable mesurée x sur les individus de P

On note T la vartance totale sur x.

A une partition quelconque de P. correspond une décomposition de T en: W: variance dans les classes B: variante entre les classes

T=W+B

Les images satellitaires rendent en particulier compte et de la nature des phénomènes, et de leurs états. Ainsi par exemple la représentation des phénomènes végétatifs (nature) est en étroite relation avec leur stade phénologique (état).

Spectralement les phénomènes se retrouvent plus ou moins regroupés suivant leur état et nature: un thème donné appartient à la partie de l’espace radiométrique de sa classe d’état (voir figure).

Région Nuage spectral

théme k g état 1 q état 2 q + état 3 q

état 4 a

Modelisation et automatisation de la production d’information [SATMOD) 289

une partition est optimale, si les critères de sa réaltsation font effectivement ressortir les differentes composantes du nuage. Ils doivent en découvrir les limites.

La décomposition doit faire ressortir les composantes homogènes du nuage. Un critère apte à découvrir celles-ci est celui de la minimisation de la variante totale à l’interieur des classes. Plus celle-ci est petite pour une partition en un nombre de classes donné, plus les composantes qui ressortent sont homogènes, et tendent à recouvrir des classes “intrinsèques” de thèmes et d’états,

Le. modèle de décomposition de T suivant W et B, est donc tel que W soit minimisée. Modèle dont une réalisation sont les méthodes de classifications par réallocations (Forgy. Jancey.. .).

Région

thème k q état 1 Ip état 2 q -b état 3 q état4 El

Image contenant une Information I I sur I’aire régionale

Nuage spectral Décomposition spectrale

T-lP*E

W minimum

Région

Régler de décision

limites de strates tendant vers celles des états, sur le(s) théme ciblé(s)

SchBmatisation:

11.2. Variables

Indépendamment du modèle de classification, la minimisation du rapport F

est aussi fonction des variables utilisées pour la description des individus. Le traitement des images satellitaires reposent souvent, de façon empirique, sur les canaux originaux, les indices, les axes factoriels, et les ratios.

Tel que l’approche est réalisée ici, les variables adéquates doivent exacerber les differences entre les diverses structures présentes dans les données: capacité à maximiser la variante entre les classes.

Ce qui équivaut à maximiser dans “l’absolu” le rapport & Ainsi modélisées

les variables recherchées sont celles d’une fonction discriminante (axes canoniques) sur les classes d’une partition.

TELEDETECTION

La génération de telles variables nécéssite donc l’existence d’une partition (dans le cas présent nous nous ltmiterons à la génération d’une variable).

Pour la construction d’une variable ainsi définie, l’existence d’au moins deux classes est nécéssatre, tel qu’elles soient les plus differentes possibles au

sens du rapport F Il sumt donc de construire une partition en deux par le

modele de classtfkatton précedemment défini, pour remplir cette condition.

Le modèle général ainsi déftni, une autre catégorie de paramètres a une importance capitale quant aux résultats: celui lié aux images elles même. Nous illustrerons cette importance à travers un plan d’expertence mettant en evidence le rôle des dates de prise de vues et des variables uttltsées.

Rappelons que l’adéquation du modèle est vérifiée par les contraintes liées à la stratification pour l’estimation de surfaces rizicoles. L’estimation des W est donc réalisée à partir de la variance de l’extension du riz dans les classes. Une telle vérihcatton sur un thème futé et unique, n’est pas restrictive de la validité du modèle, puisqu’ainsi que déja démontré, les partitions sont réalisées par des regroupements de thèmes suivant leur état et nature.

Une partition en six est réalisée, tel que sont comparés les résultats obtenus sur la base des differentes variables et images.

Les fleures suivantes Illustrent le fait que les partitions obtenues different suivant les variables utilisées.

Partitions par les canaux originaux (avril)

I

fig 2

q Strate 1 l Strate 2 n Strate 3 4 Strate 4 n Strate 5 q Strate 6

3 4 5 6 7 6

Canaux MSS

Modelisation et automatisation de la production d’information (SATMOD) 291

Partition par les axes factoriels (avril)

90, 1

200 3 4 5 6 7 0

Canaux MSS

Partition par l’axe unique (avril) 100 , f

fig 4

00

60

40

7n

-- l , 3 4 5 6 ; 8

Canaux MSS

Partitions par indice de vbgétation verte 100

00

60

40

20 !

fig 5

I . , - I . , *

q Strate 1 l Strate 2 w Strate 3 l Strate 4 n Strate 5 q Strate 6

LI Strate 1 6 Strate 2 n Strate 3 6 Strate 4 w Strate 5 0 Strate 6

q Strate 1 6 Strate 2 H Strate 3 6 Strate 4 n Strate 5 0 Strate 6

3 4 5 6 7 0 Canaux MSS

292 TELEDETECTION

Partition par indice vbg&ation jaune

60

40

20 3 4 5 6 7 0

Canaux MSS

Partition par indice des sols (avril) 80

’ fig7 70 -

z E

i

60 -

50- Iy E 2. 40 -

s 30 -

20- . , . , . , . , 0 3 4 5 6 7 0

Canaux MSS

0 Strate 1 0 Strate 2 II Strate 3 6 Strate4 n Strate 5 0 Strate 6

0 Strate 1 6 Strate 2 n Strate 3 6 Strate 4 m Strate 5 q Strate 6

Une synthèse des résultats, quant aux aptitudes des differentes combinaisons des données de base st représentée sur la figure suivante.

Variations intra (W) des strates 230

190

160

170

.

01 Fl Ul Gl Sl Y1 02 F2 U2 03 F3 U3

0 : canaux originaux

F : axes factoriels

U : axe unique

G : indice vég. verte S : indice sols

Y : indice vbg. jaune

1 : mois d’avril

2 : mois d’août

3 : mois d’août et d’avril

k + : les axes uniques

Types de variables

Modelisation et automatisation de la production d’information (SATMOD) 293

Il apparait bien que la variable telle que modélisée minimise dans l’absolu (relativement aux autres données de comparaison) W aussi bien sur la date d’avril que d’aout. et que d’avril et d’aout. Dans le cas présent il s’avère que l’utilisation des deux dates (U3) simultanément amène peu par rapport à la seule date d’aout (U2): saison sèche, période de maturation du r&.

Les critères de partition ainsi acquis, comment aborder la réduction de l’incertitude sur une aire régionale?.

III. PRINCIPES DE L’ANALYSE

Résolu le point de la génération de sous-systèmes, restent les problèmes liés à la reconnaissance des classes de sous-systèmes dont ils sont issues, et à l’établissement des inter-relations existant entre eux.

Les hypotèses de base de l’approche sont les suivantes: l l’univers est indivise dans son organisation et dans son fonctionnement l le détail de l’étude que l’on peut en faire est lié à l’échelle et au niveau de

nomenclature auquel on se situe l L’ah-e régionale peut donc être vue et comprise â differents niveaux.

Comme elle est une réalité complexe et organisée, ses differents niveaux, en sus des relations entre leurs sous-systemes constitutifs propres, ont des relations entre eux. Puisque ceux sont les mémes réalités que l’on regarde à des niveaux differents.

La compréhension (réduction de l’entropie) de cet univers va donc se faire à travers une démarche, une décomposition hiérarchisée de celle-ci.

111.1. Graphe structurel (Nous rappelons que les démarches présentées ici sont en cours de recherches et ne sont donc pas figées, en particulier il en est ainsi du vocabulaire).

Le principe de partition tendant à découvrir des classes suivant l’état et la nature des phénomènes posé, la hiérarchisation des niveaux de finesse concernera une vision de plus en plus détaillée des états, jusqu’à arriver idéalement à chaque thème élémentaire (mais qu’est donc un thème élémentaire?) présent dans l’univers. Une représentation de cette hiérarchisation est ce que nous appelerons graphe structurel. dont un exemple est fourni par la figure ci-aprés.

294 TELEDETECTION

GRAPHE STRUCTURE1

Région totale

Classes de sous-systèmes

sous- . . -3 sysremes x

Sur cette représentation, un niveau constitue un ensemble de sous-systèmes et le niveau qui lui est superieur un ensemble de classes de sous-systèmes.

Les questions qui se posent sont ceux de la construction d’un tel graphe, et de son interprétation. D’autant qu’un des objectifs de nos recherches est la systématisation et l’automatisation de cette intérprétation.

111.2. Hierarchisation

Le modèle de représentation utilisé à travers les données satellitaire est celui recouvert par le domaine spectral. Dans ce cas il ressort de tout ce qui précede, que chaque sous-système appartient de manière récursive à un sous-système de niveau superieur. jusqu’à l’appartenance â la totalité régionale.

L’arbre structure1 doit donc traduire cette structuration, qui pourrait-on dire est la “grammaire naturelle” de cette sorte de représentation.

Il doit montrer une résolution de détail de plus en plus fine, suivant des segmentations dont la règle d’evolution soit l’apparition progressive des structures les plus fortes en sous-systèmes (décomposition de plus en plus fine du nuage spectral).

Chaque niveau de l’arbre sera alors constitué par une partition.

Une partition à un niveau k donné, comporte k classes, et ainsi de suite jusqu’au regroupement de l’ensemble des sous-systèmes pour former la totalité de l’aire régionale.

Modelisation et automatisation de la production d’information (SATMOD) 295

L’algorithme d’élaboration en serait le suivant:

Dans l’application illustrant notre propos, des partitions successives de deux à six classes ont été générées, dont suivent les caractéristiques:

Une étude succinte permet de dégager les comportements suivants: (lecture: (1.2) signifie: la classe 1 de la partition en 2)

Partition en deux:

La première classe (1.2) regroupe les phénomènes globalement humides: lacs, fleuves, marais, terres agricoles inondées, savanes et steppes plus ou moins hurnides....La seconde classe (2.2) regroupe les phénomènes où domi- nent les thémes végétatifs (chlorophylle) et secs, tels la fôret, certaines savanes ou steppes.. . .

PARTITION EN DEUX

603,

70 -

60

50

40

30 :,k:.,

. l

c/asse 1 classe 2

3 4 5 6 7 6 CANAUX

Partition en trois:

Subdivision du thème global humide (1.2) du niveau précédent en deux sous- thèmes: tout ce qui est vraiment inondé (1.3) d’une part, et le reste (2.3) d’autre part. La classes regroupant les thèmes végétatifs et secs (3.3) de-

296 TELEDETECTION

meurrant globalement la même.

PARTITION EN TROIS

901

70 r

3 4 5 6 7 6

. dassel en 3 b dasse2 8” 3 q classe3 en 3

ParUtion en quatre:

Subdivision de la classe végétative et sèche (3.3) en deux sous-classes: d’un coté la masse forestière (1.4) et de l’autre les savanes et steppes plus ou moins séche, et plus ou moins arborée (2.4).

PARTITION EN QUATRE

classe1 en 4 dasss2 en 4 classe3 en 4 dasse4 en 4

20!. . _, - . - . . 4 3 4 5 6 7 6

CaRaUX

Partition en cinq:

Subdivision de la classe (2.3) en deux sous-classes: d’un coté des phénomènes contenant des traces d’humidité (1.5). et de l’autre des phénomènes où la tendance est vers une domination du végétatif sur l’humide (2.5).

Modelisation et automatisation de la production d’information (SATMOD) 297

PARTITION EN CINQ 100,

3 4 5 6 7 8

6 classele" . da.sss2en 5 q classe3en5 b classe4en 5 6 classe5en5

Partition en six:

Subdivision de la masse forestière (1.4) en deux sous-classes (1.6) et (2.6).

PARTITION EN SIX 100 -l

. , . , . , . n . I

4 5 6 7 6 CP"P"X

classe1 en6 classe2en6 classe3 en6 classe4en 6 classe5en6 classe6en6

Mais une fois constituées ces partitions, comment les relier entre elles pour élaborer l’arbre structure1 proprement dit? et permettre ainsi une réduction de plus en plus importante de l’incertitude sur la région?.

CONCLUSION

Ces premiers résultats et experimentations nous confortent dans nos hypothèses et notre approche. En particulier les principes ici exposés ont donné lieu à de premier-es utilisations pour l’estimation de superficies rizicoles à Madagascar, I’êtude de I’écosystème en région aride (Egypte). l’analyse et le diagnostic d’un paysage sahélien (Burkina Faso), dont les résultats par ailleurs exposés ont fait montre d’une efficacité certaine.

Cependant bien des questions sont encore à résoudre, et nous tenons 5 souligner que cette présentation préliminaire ne constitue qu’une introduction. Ainsi n’ont pas été abordé les problèmes de l’élaboration de l’arbre lui même, ni de celui de sa lecture et de son interprétation.

TELEDETECTION

Tout au plus pouvons nous signaler que la résolution de ces problèmes, dans une optique d’operationnalité, nous oriente actuellement vers le test de solutions integrant sur les systèmes experts, utilisés conjointement avec des systèmes de gestion de base de données (SGBD) localisées (SIG).

Modelisation et automatisation de la production d’information (SATMOQ 299

ELEMENTS BIBLIOGRAPHIQUES

ANDRIANASOLO H. Analyse statisttique des données de télédétection - Statistiques agricoles - Application sur Madagascar. Doctorat en Mathématiques Appliquées aux Sciences Sociales - Paris 1987.

ANDRIANASOLO H. A ricultural Estimation o P

statistics and space images in Madagascar - second rice season acreage in a sub-prefecture. Congress of

ERIM, Nairoby 1987. ANDRIANASOLO H. and MALEK C. Définition et détermination des unités

dynamiques d’un i

aysage sahelien (OURSI) pour un dia f

nostfc des facteurs de dégradation et e regenération des ressources nature es et renouvelables. Congress of ISPRS, KYOTO 1988.

ANDRIANASOLO H. Modélisation de la stratification d’un espace régional par la télédétection, pour l’estimation de surface. Séminaire Informatique de l’ORSTOM (SEMINFOR), Montpellier 1988.