topo 111

download topo 111

of 55

Transcript of topo 111

  • 7/24/2019 topo 111

    1/55E

    NSG/

    DP

    TSInterpolation spatiale

    Pierre Bosser

    ([email protected])

    Ecole Nationale des Sciences Geographiques

    Departement Positionnement Terrestre et Spatial

    Annee Scolaire 2011-2012

  • 7/24/2019 topo 111

    2/55

    EN

    SG/DP

  • 7/24/2019 topo 111

    3/55E

    NSG/

    DP

    TS

    INTERPOLATION SPATIALE Table des matieres

    Table des matieres

    1 Introduction 3

    1.1 Objectifs du cours. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3

    1.2 Notations . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4

    1.3 Caracteristiques des methodes dinterpolation . . . . . . . . . . . . . 4

    1.4 Representations . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6

    1.5 Applications . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8

    2 Linterpolation deterministe globale 10

    2.1 Definition . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10

    2.2 Polygone de Thiessen . . . . . . . . . . . . . . . . . . . . . . . . . . . 10

    2.3 Methode des cellules . . . . . . . . . . . . . . . . . . . . . . . . . . . 12

    2.4 Conclusion. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13

    3 Linterpolation deterministe locale 15

    3.1 Polygones de Thiessen . . . . . . . . . . . . . . . . . . . . . . . . . . 15

    3.2 Interpolation a partir dune triangulation . . . . . . . . . . . . . . . . 16

    3.2.1 Definition . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16

    3.2.2 Interpolation lineaire . . . . . . . . . . . . . . . . . . . . . . . 17

    3.2.3 Methode dAkima. . . . . . . . . . . . . . . . . . . . . . . . . 19

    3.3 Methodes barycentriques . . . . . . . . . . . . . . . . . . . . . . . . . 22

    3.3.1 Inverse des distances . . . . . . . . . . . . . . . . . . . . . . . 22

    3.3.2 Interpolation bilineaire . . . . . . . . . . . . . . . . . . . . . . 24

    3.4 Les surfaces de tendances. . . . . . . . . . . . . . . . . . . . . . . . . 25

    Pierre Bosser 1 2011-2012

  • 7/24/2019 topo 111

    4/55E

    NSG/

    DP

    TS

    INTERPOLATION SPATIALE Table des matieres

    3.5 Les splines . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27

    3.5.1 Generalites . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27

    3.5.2 Spline dinterpolation. . . . . . . . . . . . . . . . . . . . . . . 27

    3.5.3 Les splines de lissage . . . . . . . . . . . . . . . . . . . . . . . 29

    3.6 Conclusion. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31

    4 Linterpolation stochastique 34

    4.1 Notion de fonction aleatoire . . . . . . . . . . . . . . . . . . . . . . . 34

    4.1.1 Definition . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34

    4.1.2 Moments. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35

    4.2 Inference statistique . . . . . . . . . . . . . . . . . . . . . . . . . . . 36

    4.2.1 Definition . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37

    4.2.2 Ergodicite . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37

    4.2.3 Stationnarite . . . . . . . . . . . . . . . . . . . . . . . . . . . 38

    4.2.4 Combinaisons lineaires autorisees . . . . . . . . . . . . . . . . 39

    4.2.5 Conclusion. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40

    4.3 Analyse variographique . . . . . . . . . . . . . . . . . . . . . . . . . . 40

    4.3.1 Proprietes du variogramme. . . . . . . . . . . . . . . . . . . . 41

    4.3.2 Inference du variogramme . . . . . . . . . . . . . . . . . . . . 42

    4.4 Le krigeage . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47

    4.4.1 Origine de la methode . . . . . . . . . . . . . . . . . . . . . . 47

    4.4.2 Principe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48

    4.4.3 Proprietes du krigeage . . . . . . . . . . . . . . . . . . . . . . 50

    4.4.4 Impact du modele de variogramme . . . . . . . . . . . . . . . 51

    4.5 Conclusion. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52

    5 Conclusion 53

    Pierre Bosser 2 2011-2012

  • 7/24/2019 topo 111

    5/55E

    NSG/

    DP

    TS

    INTERPOLATION SPATIALE 1 Introduction

    1 Introduction

    1.1 Objectifs du cours

    A partir dobservations georeferencees, pas necessairement reparties regulierement,

    on cherche a estimer les valeurs prises par le parametre observe en dautres points

    de lespace. On parle alors destimation spatiale : cest une procedure consistant

    a estimer la valeur dune grandeur en un site a partir de dechantillons de cette

    grandeur recoltes dans dautres sites.

    Ce besoin sapplique a de nombreux domaines ou la connaissance de la distribu-

    tion spatiale de phenomenes est importante : altimetrie, gravimetrie, meteorologie,

    geologie, etc.

    Lors de ce cours, nous allons donc etudier les methodes permettant lestimation

    et linterpolation de donnees georeferencees. Ce cours sera une introduction aux

    differentes methodes existantes, mais pas une etude exhaustive (base pour des etudes

    plus approfondies). Les idees developpees ici sont largement inspirees des ouvrages

    suivants :

    Akima, H., A method of bivariate interpolation and smooth surface fitting for

    values given at irregularly distributed points ,OT Report 75-70, U.S. Department

    of Commerce.

    Arnaud, M. & Emery, X., Estimation et interpolation spatiale : methodes

    deterministes et geostatistiques , Hermes, 2000.

    Baillargeon, S., Le krigeage : revue de la theorie et application a linter-

    polation spatiale de donnees de precipitation , Memoire de M. Sc., Universite

    LAVAL, 2005.

    Verdun, J., Methodes destimation et dinterpolation spatiales ,Cours donne

    aux IT2, ENSG, 2006.

    Pierre Bosser 3 2011-2012

  • 7/24/2019 topo 111

    6/55E

    NSG/

    DP

    TS

    INTERPOLATION SPATIALE 1 Introduction

    1.2 Notations

    On definit unevariable regionalisee comme etant une fonction numerique prenant

    ses valeurs dans une region limitee, appelee champ.

    Par la suite, on utilisera les notations suivantes :

    z, la variable regionalisee.

    D, le champ de la regionalisation, cest a dire le domaine dans lequel la variable

    regionalisee est definie. En general, D R, R2 ou R3.

    s D, le vecteur de coordonnees (x,y,z) qui indique la position dun site dans le

    champ D.

    z(s), la valeur prise par la variable regionalisee zau sites D.

    z(V), la valeur moyenne de zsur le domaine V D. n, le nombre de sites ou la variable a ete mesuree.

    z(s1),...,z(sn), les valeurs prises par zaux sites dobservation s1...sn.

    z(s0), une estimation de z(s0) avecs0 D.

    1.3 Caracteristiques des methodes dinterpolation

    Dans le cas general, la variable regionalisee ne peut etre representee par une fonction

    mathematique explicite. Cependant, elle presente une structuration spatiale biendefinie, avec une correlation des valeurs prises en deux sites proches. Ceci rend

    possible la prevision dune valeur inconnue a partir dobservations. On parle ainsi

    dinterpolation pour lestimation de cette valeur. On parle dextrapolation lorsque

    le site inconnu est situe hors des limites du domaine geographique engendre par

    lechantillonnage des sites dobservation.

    On sinteresse dans de ce cours a ces methodes de prevision. Elles se divisent usuelle-

    ment en deux groupes, selon les modeles mathematiques sur lesquels elles reposent :

    Methodes deterministes : elles reposent sur des proprietes purement mathema-

    tiques, generalement geometriques, sans tenir compte du phenomene physique qui

    nous interesse.

    Methodes stochastiques: elles font appel a des modeles probabilistes et decou-

    lent de lanalyse statistique des donnees considerees. On parle alors de techniques

    geostatistiques.

    Pierre Bosser 4 2011-2012

  • 7/24/2019 topo 111

    7/55E

    NSG/

    DP

    TS

    INTERPOLATION SPATIALE 1 Introduction

    Ralit Physique Modle dterministe Modle probabiliste

    f 2 Dgz s s( )/ f 2 DgZ s s( )/

    Variable rgionalise Fonction alatoirePhnomne naturel

    Valeurs rgionalises Variables alatoires

    Interpolation spatialedterministe

    Interpolation spatialestochastique

    z s i n( ) = 1, ...,i pour Z s i n( ) = 1, ...,i pour

    FIG 1 - Methodes deterministes et stochastiques : un

    phenomene physique observe en certains sites peut etre es-time en des sites quelconques via lutilisation de methodes

    deterministes (basees sur de simples constats geometriques)

    ou de methodes stochastiques (basees sur des constats sta-

    tistiques).

    On differencie egalement ces methodes selon quelles soient globales ou locales. Une

    methode globale consiste a calculer la moyenne de la variable generalisee sur le

    champ a partir de lensemble des observations disponibles ; une methode locale

    realise une estimation de cette moyenne sur une partie plus reduite du champ, voire

    en un site ponctuel.

    Une methode exacte conserve les valeurs des echantillons originaux, contrairement

    a une methode approchee.

    Enfin, on parle deffet decran lorsquune observation commande limpact dune

    autre observation lors de linterpolation. Linfluence de lobservation ecrantee se-

    ra alors :

    nulle dans le cas dun ecran total,

    peu elevee dans le cas dun ecran partiel,

    moderee dans le cas dun ecran faible.

    Pierre Bosser 5 2011-2012

  • 7/24/2019 topo 111

    8/55E

    NSG/

    DP

    TS

    INTERPOLATION SPATIALE 1 Introduction

    S3

    S2

    S1

    S6

    S5

    S0S

    7

    FIG 2- Effet decran : le site S7 peut potentiellement mas-

    quer le siteS6; linterpolateur va donner moins dimportance

    au site masque, S6, par rapport au site masquant S7.

    1.4 Representations

    A partir dun champ dont on connait certaines valeurs prises par la variable regionali-

    see, on veut deduire la representation densemble de cette variable sur le champ.

    Cette representation peut se faire sous la forme :

    de lignes de niveau,

    de niveaux de couleur,

    dune perspective 3D, etc.

    On retrouve sur les figures suivantes differents modes de representation du champ

    interpole.

    140 160 180 200 220 240 260 280

    120

    140

    160

    180

    200

    220

    240

    X

    Y

    FIG 3 - Exemple de representation dune variable re-

    gionalisee : sites dobservation.

    Pierre Bosser 6 2011-2012

  • 7/24/2019 topo 111

    9/55E

    NSG/

    DP

    TS

    INTERPOLATION SPATIALE 1 Introduction

    140 160 180 200 220 240 260 280

    120

    140

    160

    180

    200

    220

    240

    X

    Y

    140 160 180 200 220 240 260 280

    120

    140

    160

    180

    200

    220

    240

    X

    Y

    500

    550

    600

    650

    700

    FIG 4 - Exemple de representation dune variable re-

    gionalisee : representations planes.

    140160

    180 200220

    240260

    280

    120

    140

    160

    180

    200

    220

    240

    400

    500

    600

    700

    800

    Y

    X

    Z

    140160

    180 200220

    240260

    280

    120

    140

    160

    180

    200

    220

    240

    400

    500

    600

    700

    800

    Y

    X

    Z

    140160

    180200

    220240

    260280

    120

    140

    160

    180

    200

    220

    240

    400

    500

    600

    700

    800

    Y

    X

    Z

    500

    550

    600

    650

    700

    FIG 5 - Exemple de representation dune variable re-

    gionalisee : perspectives.

    Pierre Bosser 7 2011-2012

  • 7/24/2019 topo 111

    10/55E

    NSG/

    DP

    TS

    INTERPOLATION SPATIALE 1 Introduction

    1.5 Applications

    Linterpolation spatiale est outil que lon retrouve dans differents domaines. Citons

    par exemple :

    En meteorologie : mesures sol du champ de pression, de temperature, dhumidite,

    de pluviometrie.

    En geodesie : mesures du champ de gravite, retards tropospheriques et iono-

    spheriques, hauteur du geode.

    En geologie : teneur du sol en elements mineraux.

    Les figures suivantes presentent differentes visualisations dinterpolation spatiale

    dun jeu dobservation (pression, temperature, pluviometrie, retards tropospherique

    GPS, anomalie de gravite).

    FIG 6 - Exemple dobservations interpolees spatialement :

    mesures de pression, temperature, precipitation (

    Meteo-

    France).

    Pierre Bosser 8 2011-2012

  • 7/24/2019 topo 111

    11/55E

    NSG/

    DP

    TS

    INTERPOLATION SPATIALE 1 Introduction

    FIG 7 - Exemple dobservations interpolees spatialement :retards tropospheriques GPS (

    RGP / IGN), anomalies

    de gravite (

    LAREG / IGN) et temperature a 500 m de

    profondeur (

    BRGM).

    Pierre Bosser 9 2011-2012

  • 7/24/2019 topo 111

    12/55E

    NSG/

    DP

    TS

    INTERPOLATION SPATIALE 2 Linterpolation deterministe globale

    2 Linterpolation deterministe globale

    2.1 Definition

    Lestimation globale vise a estimer la moyenne arithmetique dune ensemble dob-

    servations (valeurs de la variable regionalisee) dans un domaine geographique (le

    champ). Cette estimation nest pas triviale puisque les observations ne sont pas

    forcement representatives et peuvent presenter une densite differentes en fonction

    de la zone du champ, donnant alors une influence trop importante a certaines parties

    de la zone etudiee.

    Deux solutions sont alors envisageables. La premiere consiste en une selection des

    donnees observees. Le probleme reside alors dans le choix des observations a prendre

    en compte. Aucun critere objectif ne peut permettre detre certain ni de la qua-

    lite ni de la pertinence des observations choisies. Une seconde solution consiste a

    ponderer lensemble des observations lors du calcul de la moyenne. Nous allons ici

    nous interesser a des methodes globales basees sur cette solution.

    2.2 Polygone de Thiessen

    Pour tous les points dobservation du champs, on definit un polygone dinfluence tel

    que chaque point du polygone est plus proche du point dobservation que de tout

    autre site :

    s Pi, sj D Pi, si s sj s

    D est alors partitionne en une famille de polygone convexes, nommes polygone de

    Thiessen(aussi appeles polygones de Voronoi ou cellules de Dirichlet).

    Pierre Bosser 10 2011-2012

  • 7/24/2019 topo 111

    13/55E

    NSG/

    DP

    TS

    INTERPOLATION SPATIALE 2 Linterpolation deterministe globale

    S3

    S2

    S1

    S6

    S5

    S0

    FIG 8 - Construction des polygones de Thiessen.

    Les observations groupees vont ainsi se voir affecter un polygone dinfluence de petite

    surface, les donnees isolee un polygone de grande surface. Notons que le decoupagede Thiessen depend uniquement de la configuration geometrique et non pas des

    valeurs observees. Les polygones ne sont pas necessairement fermes dans certaines

    directions de lespace : il faut ainsi limiter la partition aux frontieres de D, ou fixer

    une distance dinfluence limite.

    S3

    S2

    S1

    S6

    S5

    S0

    FIG 9 - Decoupage en polygones de Thiessen.

    Les surfaces des polygones de Thiessen ainsi obtenus vont alors permettre la ponde-

    ration des observations pour le calcul de la moyenne de la variable regionalisee sur

    le champ detude :

    z(D) =ni=1

    |Pi|

    |D|zsi (1)

    Ou |Pi| est laire du polygone Pi associee au sitesi et |D|laire du champ :

    |D| =ni=1

    |Pi| (2)

    Par construction, les zones a observations denses sont les zones a polygones de

    Thiessen de surface moindre : linfluence de ces zones est donc limitee.

    Pierre Bosser 11 2011-2012

  • 7/24/2019 topo 111

    14/55E

    NSG/

    DP

    TS

    INTERPOLATION SPATIALE 2 Linterpolation deterministe globale

    140 160 180 200 220 240 260 280100

    150

    200

    250

    X

    Y

    FIG 10 - Exemple de decoupage en polygones de Thiessen.

    2.3 Methode des cellules

    La methode des cellules consiste a diviser le champ en cellules rectangulaires de

    meme taille, contenant chacune un nombre variable de sites dobservation. La pon-

    deration des observations lors de lestimation globale est realisee a laide du nombre

    de sites contenus dans chaque cellule.

    La procedure destimation est la suivante :

    1. On calcule la moyenne des sites dobservations contenus dans chaque cellule.

    2. On calcule ensuite la moyenne des moyennes de toutes les cellules, sans pon-

    deration.

    Lestimation globale du champ etudie est donc donne par la formule :

    z(D) = 1

    N

    N=1

    ni=1

    s(i)

    (3)

    OuNest le nombre de cellules de decoupage du domaineD contenant au moins un

    site dobservation,s(i) les sites dobservation localises dans la cellule.

    En pratique, on repete lalgorithme plusieurs fois (5 a 10) avec differents decoupages

    dans le but dobtenir une estimation globale independante du reseau.

    Pierre Bosser 12 2011-2012

  • 7/24/2019 topo 111

    15/55E

    NSG/

    DP

    TS

    INTERPOLATION SPATIALE 2 Linterpolation deterministe globale

    Notons que si la taille des cellules est trop petite, chacune contiendra au plus un

    site dobservation et les donnees auront toutes le meme poids. Si la taille est trop

    grande, toutes les observations appartiendront a la meme cellule et auront doncle meme poids. Dans ces 2 cas, lestimation globale reviendra alors a calculer la

    moyenne arithmetique de toutes les observations.

    140 160 180 200 220 240 260 280100

    150

    200

    250

    X

    Y

    FIG 11 - Exemple de decoupage en cellules.

    2.4 Conclusion

    Les methodes destimation globale presentees ici reposent uniquement sur la confi-

    guration geometrique des donnees. Elles permettent donc de quantifier la quantite

    totale ou moyenne dun ensemble dobservations de repartition variable dans les-

    pace.

    Les methodes abordees sont appliquees sur un jeu de donnees test (tableau suivant).

    Mis a part un cas (decoupage en cellules de taille minimale), on observe que les

    resultats obtenus sont dans lensemble relativement homogene.

    Pierre Bosser 13 2011-2012

  • 7/24/2019 topo 111

    16/55E

    NSG/

    DP

    TS

    INTERPOLATION SPATIALE 2 Linterpolation deterministe globale

    Interpolation z(D)

    Polygones de Thiessen 620.6693

    Cellules, pas de 1 m 609.9030Cellules, pas de 10 m 615.4803

    Cellules, pas de 20 m 618.9132

    Cellules, pas de 50 m 619.6649

    Cellules, pas de 100 m 614.0666

    TAB 1- Estimation globale par differentes methodes : esti-

    mation de laltitude moyenne.

    Il est cependant plus important de pouvoir localiser / cartographier les zones defortes valeurs et celles de valeurs moindres : cest le but de lestimation locale que

    nous allons voir par la suite.

    Pierre Bosser 14 2011-2012

  • 7/24/2019 topo 111

    17/55E

    NSG/

    DP

    TS

    INTERPOLATION SPATIALE 3 Linterpolation deterministe locale

    3 Linterpolation deterministe locale

    Nous nous interessons ici aux methodes deterministes pour lestimation locale et

    ponctuelle dune valeur de la variable regionalisee. Cette estimation sera realisee apartir de combinaisons lineaires des observations en tenant compte de leur dispo-

    sition les unes par rapport aux autres mais aussi de la distance entre le secteur a

    estimer et les points de donnees.

    3.1 Polygones de Thiessen

    Nous avons aborde precedemment lutilisation des polygones de Thiessen dans le cas

    de lestimation globale. Linterpolation par la methode de Thiessen consiste a affec-

    ter a lensemble des points dun polygone donne la valeur de la variable regionalisee

    correspondante (on parle aussi de plus proche voisin). On obtient alors une sur-

    face discontinue; ces discontinuites nont rien a voir avec de possibles discontinuites

    reelles, mais sont simplement liees a la configuration geometrique des observations.

    On trouve dans la litterature differentes methodes pour palier ce probleme de discon-

    tinuites (methode de Sibson par exemple basee sur linterpolation par combinaison

    lineaire des valeurs aux sommets voisins).

    S?

    S3

    S2

    S1

    S6

    S5

    S0

    FIG 12 - Interpolation par la methode de Thiessen (plus

    proche voisin).

    Pierre Bosser 15 2011-2012

  • 7/24/2019 topo 111

    18/55E

    NSG/

    DP

    TS

    INTERPOLATION SPATIALE 3 Linterpolation deterministe locale

    Sur la figure suivante, on represente un exemple dinterpolation par plus proche voi-

    sin. On remarque que le resultat obtenu est peu esthetique en raison des nombreuses

    discontinuites.

    140160

    180200

    220240

    260280

    120

    140

    160

    180

    200

    220

    240

    400

    500

    600

    700

    800

    Y

    X

    Z

    FIG 13 - Interpolation par plus proche voisin : application

    sur un champ dobservations - vue en perspective.

    3.2 Interpolation a partir dune triangulation

    3.2.1 Definition

    La triangulation consiste a diviser le champ en triangles disjoints dont les sommets

    sont les sites dobservation. On calcule alors la valeur en un point donne a partir

    des valeurs des sommets du triangle auquel il appartient.

    Il existe plusieurs methode de triangulation, la plus utilisee etant la triangulation

    de Delaunay : les sommets de chaque triangle sont les sites du champ D tels que

    les polygones de Thiessen associes ont un cote en commun. Notons les proprietes

    dune telle triangulation :

    La triangulation est independante de lordre de traitement.

    Lensemble du domaine nest pas recouvert : on opere uniquement dans lenveloppe

    convexe des sites.

    Les cercles circonscrits a chacun des triangles ne contiennent pas dautre site

    dobservation.

    Pierre Bosser 16 2011-2012

  • 7/24/2019 topo 111

    19/55E

    NSG/

    DP

    TS

    INTERPOLATION SPATIALE 3 Linterpolation deterministe locale

    Tous les points sont relies a leur plus proche voisin.

    S?

    S3

    S2

    S1

    S6

    S5

    S0

    FIG 14 - Triangulation de Delaunay.

    Il existe plusieurs methodes pour linterpolation de donnees a partir dune triangu-lation. Ici, deux dentres elles seront exposees.

    3.2.2 Interpolation lineaire

    On considere le triangle (s1, s2, s3) contenant le point dinteret s. La valeur re-

    cherchee de la variable regionalisee secrit sous la forme :

    z(s) = z(x, y) = x+ y+

    S2S1

    S3

    S?

    FIG 15 - Interpolation lineaire : Geometrie du probleme.

    La solution est determinee a partir dune combinaison lineaire des valeur observees

    au sommet du triangle en resolvant le systeme :

    x1+ y1+ = z1

    x2+ y2+ = z2

    x3+ y3+ = z3

    Ou zi=z(si).

    Pierre Bosser 17 2011-2012

  • 7/24/2019 topo 111

    20/55E

    NSG/

    DP

    TS

    INTERPOLATION SPATIALE 3 Linterpolation deterministe locale

    Lequation matricielle secrit sous la forme :

    x1 y1 1x2 y2 1

    x3 y3 1

    = z1

    z2

    z3

    On peut alors montrer que cette solution secrit sous la forme :

    z(s) = |s1, s, s2| z3+ |s1, s, s3| z2+ |s2, s, s3| z1

    |s1, s2, s3|

    Ou |s1, s2, s3| represente laire du triangle forme par les vecteurs (s1, s2, s3) : la

    solution devient donc la somme ponderee des aires des triangles formes par les 3sommets et le point dinteret.

    S2 S1

    S3

    j jS SS2 3, ,

    j jS S S1 2, ,

    jS S S1 3, , j

    S2 S1

    S3

    j 2 3, ,S S Sj

    j jS S S1 2, ,

    j jS SS1 3, ,

    FIG 16- Interpolation lineaire : interpretation geometrique

    de la solution : plus le point auquel on souhaite estimer la

    valeur de la variable regionalisee est proche dun site dob-

    servation, plus la proportion de surface occupee par le tri-

    angle oppose a ce sommet est importante ; le poids associe

    est donc plus important et la valeur estimee proche de celle

    du sommet.

    Chaque site dobservation recoit donc un poids egal a la proportion de surface oc-

    cupee par le triangle qui lui est oppose : plus le point recherche est proche dun

    site dobservation plus la valeur de la variable regionalisee est proche de la valeurobservee en ce site.

    Un exemple de cette methode dinterpolation est represente ci-dessous.

    Pierre Bosser 18 2011-2012

  • 7/24/2019 topo 111

    21/55E

    NSG/

    DP

    TS

    INTERPOLATION SPATIALE 3 Linterpolation deterministe locale

    140160

    180 200220

    240260

    280

    120

    140

    160

    180

    200

    220

    240

    400

    500

    600

    700

    800

    Y

    X

    Z

    FIG 17 - Interpolation lineaire : application sur un champ

    dobservations - vue en perspective. On observe laspect py-

    ramidal de la surface obtenue.

    Linterpolation lineaire presente les proprietes suivantes :

    Lestimation est unique pour une triangulation donnee. Cette methode est exacte.

    La surface obtenue est continue ; elle est composee de pyramides juxtaposees.

    Lextrapolation nest pas possible au dela de lenveloppe convexe des sites dob-

    servation.

    3.2.3 Methode dAkima

    La methode dAkima est une autre methode dinterpolation a partir dune triangu-

    lation. On ajuste cette fois-ci a chaque triangle une surface dont lequation est un

    polynome de degre 5 :

    z(s) = z(x, y) =5

    j=0

    5jk=0

    jkxjyk

    Il faut donc 21 conditions pour determiner les 21 coefficients jk :

    les 3 premieres conditions sont obtenues a partir des valeurs prises par la variable

    Pierre Bosser 19 2011-2012

  • 7/24/2019 topo 111

    22/55E

    NSG/

    DP

    TS

    INTERPOLATION SPATIALE 3 Linterpolation deterministe locale

    regionalisee aux 3 sommets de chaque triangle :

    z(s1), z(s2), z(s3)

    6 autres conditions sont obtenues a partir des derivees premieres aux sommets de

    chaque triangle :

    z

    x(s1),

    z

    y(s1)

    z

    x(s2),

    z

    y(s2)

    z

    x

    (s3), z

    y

    (s3)

    9 autres conditions sont obtenues a partir des derivees secondes aux sommets de

    chaque triangle :

    2z

    x2(s1),

    2z

    y2(s1) ,

    2z

    xy(s1)

    2z

    x2(s2),

    2z

    y2(s2) ,

    2z

    xy(s2)

    2z

    x2(s3),

    2z

    y2(s3) ,

    2z

    xy(s3)

    Les 3 dernieres conditions sont obtenues a laide de considerations de continuite

    et de derivabilite aux limites de chaque triangle. La derivee partielle de la fonc-

    tion dinterpolation dans la direction normale a chaque cote du triangle est un

    polynome de degre 3, au plus, de la variable mesuree selon ce cote.

    5z

    nt4(s1) = 0,

    5z

    nt4(s2) = 0,

    5z

    nt4(s3) = 0

    S2 S1

    S3

    S?

    n1 t1n2

    t2

    n3

    t3

    FIG 18 - Interpolation dAkima : Geometrie de la solution.

    Pierre Bosser 20 2011-2012

  • 7/24/2019 topo 111

    23/55E

    NSG/

    DP

    TS

    INTERPOLATION SPATIALE 3 Linterpolation deterministe locale

    La derniere condition assure donc la continuite et la derivabilite de la surface ob-

    tenue. Le passage (x, y) (n, t) est lineaire : les valeurs de la fonction et de ses

    derivees partielles premieres et secondes selonxet y suffisent donc a determiner lesvaleurs de la fonction et de ses derivees selon net taux sommets.

    Ainsi, En limite de 2 triangles, la section de la surface est un polyn ome de degre

    5 en t ; ses coefficients sont donnes par les valeurs de la fonction et de ses derivees

    aux sommets : on a donc continuite de la surface. Sur chaque cote dun triangle, les

    derivees premiere selonn et seconde selonn puist aux sommets permettent decrire

    la derivee premiere selon n sous forme dun unique polynome de degre 3, en t : on

    a donc egalement la derivabilite.

    Pour calculer les derivees partielles en chaque sommet du triangle, Akima proposelutilisation des sites (entre 3 et 5) les plus proches de chaque sommet du triangle.

    Les derivees premieres sont obtenues en estimant le plan moyen (par rapport aux

    differents sites voisins choisis) passant par le sommet dinteret. Les derivees se-

    condes sont calculees en repetant cette operation, mais cette fois-ci en considerant

    les derivees premieres au lieu des valeurs de la variable regionalisee.

    Bien quen apparence complexe, limplementation de cette methode est relativement

    directe (un formulaire complet existe).

    Cette methode est assez efficace puisque robuste et rapide. Elle est exacte et permetlestimation dune surface continue et derivable. Il existe des variantes permettant

    une extrapolation au dela de lenveloppe convexe formee par lensemble des triangles.

    Pierre Bosser 21 2011-2012

  • 7/24/2019 topo 111

    24/55E

    NSG/

    DP

    TS

    INTERPOLATION SPATIALE 3 Linterpolation deterministe locale

    140160

    180 200220

    240260

    280

    120

    140

    160

    180

    200

    220

    240

    400

    500

    600

    700

    800

    Y

    X

    Z

    FIG 19 - Interpolation par la methode dAkima : applica-

    tion sur un champ dobservations - vue en perspective. On

    observe que la surface obtenue est beaucoup plus esthetique

    que celle issus dune interpolation lineaire.

    3.3 Methodes barycentriques

    Netant pas limitees au voisinage direct du point dinteret, les methodes barycen-

    triques presentent lavantage de prendre en compte plus de donnees du champ dob-

    servation. Un poids plus important est affecte aux sites les plus proches, un poids

    moindre aux sites plus eloignes.

    3.3.1 Inverse des distances

    Cest la methode barycentrique la plus employee. elle consiste a attribuer un poids

    inversement proportionnel a la distance entre les sites et le point a estimer :

    z(s) =

    ni=1

    z(si)

    si sni=1

    1

    si s

    On peut generaliser cette formule en prenant comme ponderation une puissance p

    Pierre Bosser 22 2011-2012

  • 7/24/2019 topo 111

    25/55E

    NSG/

    DP

    TS

    INTERPOLATION SPATIALE 3 Linterpolation deterministe locale

    de la distance entre sites et point a estimer

    p 0 : moyenne arithmetique

    p + : methode de Thiessen

    140160

    180200

    220240

    260280

    120

    140

    160

    180

    200

    220

    240

    400

    500

    600

    700

    800

    Y

    X

    Z

    FIG 20 - Interpolation barycentrique par inverse des dis-

    tances : application sur un champ dobservations - vue en

    perspective.

    Cette methode dinterpolation est exacte et fournit une surface continue. Les valeurs

    interpolees sont limitees par les valeurs minimale et maximale du champ dobserva-

    tion, la ponderation etant positive.

    Elle presente cependant quelques inconvenients. Elle est indifferente a la configu-

    ration geometrique des observations, seule la distance compte. Elle tend a sur-

    ponderer les donnees groupees alors quelles sont redondantes. Les cartes disovaleur

    presentent des structures en forme dil de bufautour des sites dobservationen raison de linfluence du site le plus proche. Plus la puissance de la distance est

    elevee, plus cet est important.

    Pierre Bosser 23 2011-2012

  • 7/24/2019 topo 111

    26/55E

    NSG/

    DP

    TS

    INTERPOLATION SPATIALE 3 Linterpolation deterministe locale

    140 160 180 200 220 240 260 280

    120

    140

    160

    180

    200

    220

    240

    X

    Y

    FIG 21 - Interpolation barycentrique par inverse des dis-

    tances : application sur un champ dobservations - repre-

    sentation par courbes de niveau, vue de dessus. On distingue

    nettement leffet doil de buf lie a lutilisation de cette

    methode.

    3.3.2 Interpolation bilineaire

    Linterpolation bilineaire necessite un echantillonnage regulierdes sites dobser-

    vation. On cherche les quatre points entourant le point dinteret. On effectue alors

    une interpolation a laide de linverse des distances. Linterpolation est exacte et

    restitue une surface continue. Les calculs sont rapides.

    Si j, Si j+1,

    Si j+1, +1Si j, +1

    S

    a1

    b2

    b1

    a2

    z2z1

    FIG 22

    - Interpolation bilineaire : geometrie de la solution.

    Pierre Bosser 24 2011-2012

  • 7/24/2019 topo 111

    27/55E

    NSG/

    DP

    TS

    INTERPOLATION SPATIALE 3 Linterpolation deterministe locale

    Le valeur de la variable regionalisees au points est donnee par :

    z(s) =a1z1+a2z2

    a1+a2

    Avec :

    z1 = b1zi+1,j+1+b2zi,j+1

    b1+b2

    z2 = b1zi+1,j+ b2zi,j

    b1+b2

    Comme nous lavons dit, cette methode necessite un echantillonnage regulier des

    sites dobservation, ce qui la rend inutilisable dans la majorite des cas.

    3.4 Les surfaces de tendances

    On cherche a ajuster par moindre-carre une surface polynomiale aux valeurs ob-

    servees. Cette surface se presente sous la forme :

    z(s) = z(x, y) =pi=0

    pij=0

    ijxiyj

    Ou p est le degre du polynome ou ordre de la surface. Les ij sont obtenus par

    minimisation de la quantiten

    i=1[z(si) z(si)]2 par moindre-carre par exemple. Il

    faut alors que le degre du polynome verifie 12

    (p+ 1)(p+ 2) n. Linversion peut

    secrire sous la forme matricielle suivante :

    x01y

    01 . . . x

    01y

    p1 . . . x

    p1y

    01

    ... . . . ... . . .

    ...

    x0ny0n . . . x0nypn . . . xpny0n

    0,0...

    0,p

    ...p,0

    = z1

    ...

    zn

    On represente sur les figures suivantes, linterpolation par des surfaces de tendance

    dordre respectif 2, 3 et 5.

    Pierre Bosser 25 2011-2012

  • 7/24/2019 topo 111

    28/55E

    NSG/

    DP

    TS

    INTERPOLATION SPATIALE 3 Linterpolation deterministe locale

    140160

    180 200220

    240260

    280

    120

    140

    160

    180

    200

    220

    240

    400

    500

    600

    700

    800

    Y

    X

    Z

    FIG 23 - Interpolation par une surface de tendance dordre

    2 : application sur un champ dobservations - vue en pers-

    pective.

    140160

    180200

    220240

    260280

    120

    140

    160

    180

    200

    220

    240

    400

    500

    600

    700

    800

    Y

    X

    Z

    FIG 24 - Interpolation par une surface de tendance dordre

    3 : application sur un champ dobservations - vue en pers-

    pective.

    Pierre Bosser 26 2011-2012

  • 7/24/2019 topo 111

    29/55E

    NSG/

    DP

    TS

    INTERPOLATION SPATIALE 3 Linterpolation deterministe locale

    140160

    180 200220

    240260

    280

    120

    140

    160

    180

    200

    220

    240

    400

    500

    600

    700

    800

    Y

    X

    Z

    FIG 25 - Interpolation par une surface de tendance dordre

    5 : application sur un champ dobservations - vue en pers-

    pective.

    La solution est unique. Linterpolateur est approche. La duree du calcul depend de

    lordre de la surface.

    Les test statistiques concernant la significativite des resultats sont a utiliser avec

    prudence car ils reposent sur une hypothese dindependance des valeurs, ce qui est

    rarement verifie dans le contexte spatial.

    3.5 Les splines

    3.5.1 Generalites

    Les splines sont une famille de fonctions qui minimisent lenergie de flexion sous

    certaines contraintes dajustement. Dans notre contexte, il existe deux categories

    de fonctions de splines : les splines dinterpolation qui passent exactement par les

    points dobservation et les splines de lissage qui passent a proximite.

    3.5.2 Spline dinterpolation

    On desire obtenir une fonction qui soit la plus lisse possible tout en restituant

    les valeurs mesurees aux differents sites dobservation. Cette fonction (notee z(s))

    Pierre Bosser 27 2011-2012

  • 7/24/2019 topo 111

    30/55E

    NSG/

    DP

    TS

    INTERPOLATION SPATIALE 3 Linterpolation deterministe locale

    represente la surface par une plaque mince et flexible que lon contraint a passer par

    chaque site. Elle doit ainsi minimiser lenergie de flexion :

    2z

    x2+ 2

    2z

    xy+

    2z

    y2dxdy

    Avec comme contrainte z(si) =z(si).

    On peut montrer que la fonction spline solution secrit alors sous la forme :

    z(s) = z(x, y) =a0+a1x+a2y+ni=1

    biK(s si)

    Avec :

    K(h) =h2 ln(h)

    Les inconnues a0, a0, a0, b1, ..., bn sont solutions du systeme suivant :

    a0+a1xi+a2yi+n

    j=1,j=ibjK(si sj) =z(si)

    nj=1

    bj = 0,n

    j=1bjxj = 0,

    nj=1

    bjyj = 0

    On traduit ce systeme sous forme matricielle :

    1 x1 y1 0 . . . K 1,n...

    ... ...

    ... . . . ...

    1 xn yn Kn,1 . . . 0

    0 0 0 1 . . . 1

    0 0 0 x1 . . . xn

    0 0 0 y1 . . . yn

    a0

    a1

    a2

    b1...

    bn

    =

    z1...

    zn

    0

    0

    0

    Lestimation en un point donne necessite la resolution den+3 equations. Lexistence

    et lunicite de la solution sont garanties lorsque les points ne sont pas alignes. Lessplines dinterpolation sont des interpolateurs exacts.

    Pierre Bosser 28 2011-2012

  • 7/24/2019 topo 111

    31/55E

    NSG/

    DP

    TS

    INTERPOLATION SPATIALE 3 Linterpolation deterministe locale

    140160

    180 200220

    240260

    280

    120

    140

    160

    180

    200

    220

    240

    400

    500

    600

    700

    800

    Y

    X

    Z

    FIG 26 - Interpolation par spline dinterpolation : applica-

    tion sur un champ dobservations - vue en perspective.

    3.5.3 Les splines de lissage

    Il peut etre judicieux dans certaines situations (mesures presentant une incertitude

    importante) de chercher une surface qui sapproche au mieux des observations tout

    en restant la plus lisse possible. Dans R2, on traduit ces conditions en cherchant a

    minimiser la fonction qui minimise :

    ni=1

    [z(si) z(si)]2 +

    2z

    x2+ 2

    2z

    xy+

    2z

    y2dxdy

    Ou est un parametre strictement positif et fixe a priori.

    On peut montrer que la solution se presente alors sous la forme de la solution obtenue

    dans le cas des splines dinterpolation :

    z(s) = z(x, y) =a0+a1x+a2y+ni=1

    biK(s si)

    Avec :

    K(h) =h2 ln(h)

    Pierre Bosser 29 2011-2012

  • 7/24/2019 topo 111

    32/55E

    NSG/

    DP

    TS

    INTERPOLATION SPATIALE 3 Linterpolation deterministe locale

    Les inconnues a0, a0, a0, b1, ..., bn sont solutions du systeme suivant :

    a0+a1xi+a2yi+bi+

    nj=1,j=i

    bjK(si sj) =z(si)

    nj=1

    bj = 0,n

    j=1bjxj = 0,

    nj=1

    bjyj = 0

    On traduit ce systeme sous forme matricielle :

    1 x1 y1 . . . K 1,n...

    ... ...

    ... . . .

    ...

    1 xn yn Kn,1 . . .

    0 0 0 1 . . . 1

    0 0 0 x1 . . . xn

    0 0 0 y1 . . . yn

    a0

    a1

    a2

    b1...

    bn

    =

    z1...

    zn

    0

    0

    0

    140160

    180200

    220240

    260280

    120

    140

    160

    180

    200

    220

    240

    400

    500

    600

    700

    800

    Y

    X

    Z

    FIG 27 - Interpolation par spline de lissage - = 103 : ap-

    plication sur un champ dobservations - vue en perspective.

    Pierre Bosser 30 2011-2012

  • 7/24/2019 topo 111

    33/55E

    NSG/

    DP

    TS

    INTERPOLATION SPATIALE 3 Linterpolation deterministe locale

    140160

    180 200220

    240260

    280

    120

    140

    160

    180

    200

    220

    240

    400

    500

    600

    700

    800

    Y

    X

    Z

    FIG 28 - Interpolation par spline de lissage - = 106 : ap-

    plication sur un champ dobservations - vue en perspective.

    La surface obtenue tend vers un plan.

    Le terme permet de faire un compromis entre la contrainte dajustement et cont-

    rainte de lissage : Si = 0, linterpolation est exacte : on est dans le cas des splines dinterpolation.

    Plus augmente, plus les valeurs calculees aux sites dobservation seloignent des

    valeurs observees.

    Lorsque +, la surface estimee tend vers un plan dequation z(x, y) =

    a0+a1x+a2y : les termes bi tendent vers 0 pour compenser la forte valeur de .

    3.6 Conclusion

    Nous avons maintenant un apercu de differentes techniques deterministes permettant

    lestimation locale de variables regionalisees en des sites non echantillonnes. Dans le

    tableau suivant, on represente une synthese de ces methodes.

    Pierre Bosser 31 2011-2012

  • 7/24/2019 topo 111

    34/55E

    NSG/

    DP

    TS

    INTERPOLATION SPATIALE 3 Linterpolation deterministe locale

    Interpolation Interpolation Exacte Effet decran Limite(s)

    Polygones de Thiessen oui total Discontinuites

    Lineaire oui total Aspectpyramidal

    Akima oui total Implementation

    Inverse des distances oui faible Effet

    il-de-buf

    Surface de tendance non faible Peu robuste

    Spline dinterpolation oui partiel

    Spline de lissage non faible

    FIG 29 - Quelques caracteristiques des methodes dinter-

    polation. Si une observation est masquee par une autre

    observation par rapport au site a estimer, elle peut rece-

    voir un poids nul (ecran total), peu eleve (ecran partiel) ou

    modere (ecran faible).

    Ces differentes methodes peuvent etre evaluees en suivant la technique de lechantil-

    lon test (ou Jackknife ou bootstrap). Cette technique consiste a partager les ob-

    servations en deux ensembles : un ensemble permettant la determination du modele,

    un second permettant le test de ce modele. On effectue ainsi une sorte de validationcroisee.

    On est cependant incapable de dire laquelle de ces methodes est la plus proche de

    la verite, leur reussite etant largement dependante du contexte : une methode peut

    fournir de bons resultats dans un cas, mais moins efficace dans un autre. Il est en

    fait impossible de dire quelle methode fournit globalement les meilleurs resultats.

    Aucune methode deterministe ne parait universellement meilleure.

    A titre indicatif, on presente dans le tableau suivant, les valeurs daltitude interpolees

    pour les differentes methodes presentees en un point quelconque de lespace. Si unemajorite des methodes fournissent des valeurs coherentes (de lordre de 670), on ne

    peut pas vraiment conclure quant a la valeur exacte de laltitude du point estimee.

    Pierre Bosser 32 2011-2012

  • 7/24/2019 topo 111

    35/55E

    NSG/

    DP

    TS

    INTERPOLATION SPATIALE 3 Linterpolation deterministe locale

    Interpolation z(s)

    Thiessen 680.0000

    Lineaire 674.3876Methode dAkima 675.8825

    Inverse des distances (d2) 660.6881

    Surface de tendance dordre 2 647.6674

    Surface de tendance dordre 3 654.2670

    Surface de tendance dordre 5 672.3207

    Spline dinterpolation 674.7240

    Spline de lissage (= 103) 668.2837

    Spline de lissage (= 106) 630.6910

    TAB 2 - Valeur de la variable regionalisee estimee en un

    meme point par les differentes methodes : estimation de lal-

    titude.

    Notons enfin une limite importante des methodes ici presentees : celles-ci sap-

    pliquent aveuglement sans tenir compte dune eventuelle structure spatiale de la

    variable regionalisee etudiee. La surface obtenue peut certes etre esthetique, mais

    pas necessairement precise. Nous allons voir par la suite des methodes permettant

    la prise en compte dune eventuelle structuration spatiale en faisant appel a desmodeles probabilistes : les methodes stochastiques.

    Pierre Bosser 33 2011-2012

  • 7/24/2019 topo 111

    36/55E

    NSG/

    DP

    TS

    INTERPOLATION SPATIALE 4 Linterpolation stochastique

    4 Linterpolation stochastique

    On sinteresse desormais a lutilisation de modeles probabilistes pour la description

    du comportement de la variable regionalisee. Lutilisation de telles methodes doitnous permettre egalement devaluer la precision dune estimation. On parle alors de

    geostatistique: on utilise a la fois les valeurs observees et linformation de position

    pour ameliorer lestimation dans le contexte spatial.

    On utilise donc un modele probabiliste pour decrire le phenomene naturel a laide

    dun processus aleatoire. On est cependant limite par la statistique classique qui

    necessitent que les valeurs mesurees soient :

    Independantes.

    Identiquement distribuees.

    Ces hypotheses ne sont pas verifiees dans notre contexte (dependance spatiale, condi-

    tions dobservation differentes). Un nouvelle approche doit etre envisagee.

    Dans ce chapitre, on suppose la notion de variable aleatoire connue. On rap-

    pelle quune variable aleatoire est une fonction renvoyant une valeur resultante

    dune experience aleatoire. Dans notre cas elle permet dassurer la relation entre

    un phenomene et les resultats chiffres dune experience portant sur ce phenomene.

    On appelle ce resultat realisation de la variable aleatoire.

    4.1 Notion de fonction aleatoire

    4.1.1 Definition

    Le concept de fonction aleatoire fournit des outils permettant danalyser le ca-

    ractere a la fois incertain et structure dun phenomene, permettant ulterieurement

    destimer les valeurs en des sites inconnus (non echantillonnes). La fonction aleatoire

    permet de prendre en compte le fait que la variable regionalisee peut prendre des

    valeurs tres erratiques (inconstantes, ne suivent pas de modele, difficiles a predire) etque ces valeurs ne sont par vraiment independantes mais structurees dans lespace.

    Pierre Bosser 34 2011-2012

  • 7/24/2019 topo 111

    37/55E

    NSG/

    DP

    TS

    INTERPOLATION SPATIALE 4 Linterpolation stochastique

    On rappelle que z(s) represente la valeur prise par la variable regionalisee zau site

    s D. On linterprete comme une realisation dune variable aleatoire Z(s) definie

    en s. On appelle alors fonction aleatoire (aussi appelee processus aleatoire ouprocessus stochastique) la famille des variables aleatoires {Z(s) /s D}.

    Chaque valeur z(s) de la variable regionalisee z est donc interpretee comme un

    realisation de la variable aleatoireZ(s) definie en s. La fonction aleatoire represente

    lensemble des variables aleatoires qui interprete la variable regionalisee. Les differen-

    tes variables aleatoires ne sont pas independantes : une correlation existe et permet

    de decrire la structure de la variable regionalisee.

    La variable regionalisee constitue donc une realisation de la fonction aleatoire.

    4.1.2 Moments

    Du point de vue mathematique, une fonction aleatoire est caracterisee par sa loi

    spatiale qui correspond a la donnee de toutes les lois de probabilite de tous les

    vecteurs aleatoires {Z(s1), ...Z(sn)} que lon peut extraire de la fonction aleatoire

    Z(s). Pratiquement, en raison de la complexite de la determination de loi spatiale

    entiere, on limite la description de la loi spatiale a ses deux premiers moments. Le but

    est alors de retrouver les caracteristiques de la loi a partir de la seule connaissance

    de ces 2 moments.

    Moments du premier ordre : Lemoment du premier ordre dune fonction

    aleatoire se situe dans le cas de letude de sa loi monovariable (soit la loi en un

    site) : on sinteresse a lesperance mathematiquequi est dependante du points:

    E [Z(s)] =mZ(s)

    Cest la moyenne autour de laquelle les realisations en un point s de la variable

    aleatoire Z(s) se distribuent. Cest une moyenne sur les realisations et non une

    moyenne spatiale.

    Moments du second ordre : Lesmoments du second ordrefournissent une

    description de la loi spatiale bivariable de la fonction aleatoire Z(s), cest a dire

    la loi de probabilite entre les valeurs prises en deux sitess1 ets2 quelconques.

    Pierre Bosser 35 2011-2012

  • 7/24/2019 topo 111

    38/55E

    NSG/

    DP

    TS

    INTERPOLATION SPATIALE 4 Linterpolation stochastique

    La covariance centree entre Z(s1) et Z(s2) est donnee par :

    cov [Z(s1) , Z(s2)] = E {[Z(s1) mZ(s1)] [Z(s2) mZ(s2)]}

    = E [Z(s1) Z(s2)] mZ(s1) mZ(s2)

    = C (s1, s2)

    Elle caracterise le degre de ressemblance (ou correlation) entre les valeurs prises en

    s1 ets2.

    On appelle variance(ou variance a priori), la covariance entre la variable aleatoire

    Z(s1) et elle-meme :

    var [Z(s1)] = cov [Z(s1) , Z(s1)]

    = E

    [Z(s1) mZ(s1)]2

    Elle mesure la dispersion de la variable aleatoire Z(s1) autour de sa moyenne.

    Enfin, le (semi-)variogramme entre Z(s1) et Z(s2) est donne par

    (s1, s2) =1

    2var [Z(s1) Z(s2)]

    Il caracterise la dissemblance entre les valeurs prises par la variable aleatoire entre

    les sitess1 ets2. On verra par la suite que cette quantite est un outil essentiel de la

    geostatistique, en particulier du krigeage.

    Ces moments sont les principaux parametres de la fonction aleatoire : ils contiennent

    linformation la plus pertinente et la plus utile. Ils seront largement utilises par la

    suite.

    4.2 Inference statistique

    Nous venons dintroduire le concept de fonction aleatoire qui est loutil necessaire

    a letude geostatistique dune variable regionalisee. Nous allons voir maintenant

    comment rattacher la mesure dune variable regionalisee au concept de fonction

    aleatoire pour pouvoir exploiter ses proprietes.

    Pierre Bosser 36 2011-2012

  • 7/24/2019 topo 111

    39/55E

    NSG/

    DP

    TS

    INTERPOLATION SPATIALE 4 Linterpolation stochastique

    4.2.1 Definition

    Linference statistique consiste a reconstituer les caracteristiques de la fonction

    aleatoire (en loccurrence ses deux premiers moments) a partir dune realisation de

    la variable regionalisee (soit un ensemble de donnees experimentales).

    La variable regionalisee constitue une unique realisation de la fonction aleatoire : il

    nexiste pas de bijection entre cette fonction et une realisation. La fonction aleatoire

    ne peut donc etre definie sans ambiguite a partir de la seule variable regionalisee.

    Pour permettre linference, deux hypotheses limitatives supplementaires doivent etre

    realisees :

    lergodicite de la fonction

    la stationnarite du processusSignalons enfin quen fonction des hypotheses realisees, nous serons limites sur les

    possibilites doperations a effectuer sur la fonction aleatoire.

    4.2.2 Ergodicite

    Lhypothese dergodicite suppose que linformation statistique peut etre obtenue

    a partir dune seule realisation quelconque de la fonction aleatoire definie sur un

    domaine spatial infiniment grand. Autrement dit, une realisation de la fonction

    aleatoire sur un grand domaine (cest a dire pour un grand nombre de variables

    aleatoires) apporte la meme information quun grand nombre de realisations de la

    fonction aleatoire.

    En particulier, dans notre cas, la connaissance dun grand nombre de valeurs de la

    variable regionalisee (une realisation de la fonction aleatoire) est suffisant pour la

    description de la fonction aleatoire (cest-a-dire la restitution de ces moments).

    En particulier, la moyenne spatiale realisee sur la variable regionalisee est alors

    supposee egale a lesperance mathematique de la fonction aleatoire :

    mZ = E [Z(s)]

    = limD+

    1

    D

    D

    z(s) ds

    Letude des moments de la fonction aleatoire a partir dune realisation est alors

    possible.

    Pierre Bosser 37 2011-2012

  • 7/24/2019 topo 111

    40/55E

    NSG/

    DP

    TS

    INTERPOLATION SPATIALE 4 Linterpolation stochastique

    4.2.3 Stationnarite

    Nous allons detailler de la plus exigeante a la plus flexible les differentes hypotheses

    de stationnarite qui peuvent etre formulees.

    Hypothese de stationnarite du second ordre : Une fonction aleatoire {Z(s)}

    est ditestationnaire dordre 2quand son esperance mathematique existe et nest

    pas dependante du point et que la covariance entre chaque paire

    Z(s+ h), Z(s)

    existe et ne depend que deh (et pas du point de lespace s) :

    (1) s D, E [Z(s)] =m

    (2) s D, (s+ h) D,covZ(s+ h), Z(s)

    = C

    h

    Formule autrement, cette hypothese signifie donc que la variable regionalisee zfluc-

    tue autour dune meme valeur dans lespace et que la covariance entre deux sites ne

    depend pas de leur position mais du vecteur qui les separe.

    Deux proprietes en decoulent :

    La variance est la meme en chacun des sitess.

    Le variogramme entre deux sites depend uniquement de la distance qui les separe.

    (3) s D, var [Z(s)] = cov [Z(s), Z(s)] = C(0)

    (4) s D, (s+ h) D,varZ(s+ h) Z(s)

    /2 =(h) = C(0) C(h)

    La relation (3) souligne quen chaque site, la dispersion autour de la valeur moyenne

    est la meme. La relation (4) montre que la dissemblance entre deux sites est seule-

    ment fonction du vecteur qui les separe. Elle souligne egalement que, sous cette

    hypothese, lutilisation du variogramme ou de la covariance est equivalente pour

    quantifier la dependance entre deux mesures separees par h.

    Lhypothese de stationnarite dordre 2 ne peut etre validee de maniere rigoureuse

    et infaillible a partir de mesures experimentales : cest une decision plus ou moins

    judicieuse prise par lutilisateur.

    Hypothese intrinseque : Lhypothese intrinseque est une version affaiblie de

    lhypothese de stationnarite du second ordre. Elle est basee uniquement sur les

    accroissements de la fonction aleatoire.

    Une fonction aleatoire est dite intrinseque quand ses accroissements sont station-

    Pierre Bosser 38 2011-2012

  • 7/24/2019 topo 111

    41/55E

    NSG/

    DP

    TS

    INTERPOLATION SPATIALE 4 Linterpolation stochastique

    naires au second ordre :

    s D, (s+ h) D,

    (1) EZ(s+ h) Z(s)

    = 0

    (2) varZ(s+ h) Z(s)

    = E

    Z(s+ h) Z(s)

    2= 2(h)

    Selon cette hypothese, lesperance des accroissements est donc nulle et sa variance

    ne depend que du vecteur separant les deux points. Notons que les variance et

    covariance de la fonction aleatoire ne sont pas forcement definies.

    On remarque que lhypothese de stationnarite du second ordre implique lhypothese

    intrinseque. La reciproque est fausse.

    Hypotheses quasi-stationnaire et quasi-intrinseque : En pratique on sup-

    pose que la fonction aleatoire est intrinseque mais egalement quasi-stationnaire

    dordre 2 sur un domaine borne :

    (1) s D,E [Z(s)] =m

    (2) s D,(s+ h) D/h < b,covZ

    s+ h

    , Z(s)

    = C

    h

    Il faut alors concilier deux facteurs :

    La zone choisie ne doit pas etre trop etendue par rapport a la taille du champs

    considere.

    Le nombre de sites selectionnes ne doit pas etre trop faible.

    4.2.4 Combinaisons lineaires autorisees

    On a choisi dutiliser uniquement les deux premiers moments de la loi spatiale, ce

    qui entraine des limites quand a la manipulation de la fonction aleatoire : on ne peututiliser que des combinaisons lineaires ponderees de Z(s), seules expressions pour

    lesquelles ont peut calculer esperance et covariance.

    Lhypothese de stationnarite choisie impose de plus des contraintes supplementaires

    car elle ne garantit pas necessairement lexistence de lesperance et de la variance

    de toutes les combinaisons lineaires ponderees. On appelle combinaison lineaire

    autorisee une combinaison lineaire qui possede une esperance et une variance.

    Pierre Bosser 39 2011-2012

  • 7/24/2019 topo 111

    42/55E

    NSG/

    DP

    TS

    INTERPOLATION SPATIALE 4 Linterpolation stochastique

    Hypothese stationnaire dordre 2 : Dans ce cas, toutes les combinaisons lin-

    eaires ponderees sont autorisees :

    E

    i

    wiZ(si)

    = m

    i

    wi

    var

    i

    wiZ(si)

    =

    i

    j

    wiwjC (si sj)

    Hypothese intrinseque : Si la fonction aleatoire est intrinseque, seules les com-

    binaisons lineaires de poids total nul sont autorisees car elles peuvent secrire sous

    la forme daccroissements :

    i

    wi= 0

    Ei

    wiZ(si)

    = 0

    vari

    wiZ(si)

    = i

    j

    wiwj(si sj)

    4.2.5 Conclusion

    Le modele probabiliste constitue une meilleure alternative lorsque les donnees etu-

    diees saverent complexes. Pour rendre le modele operationnel a partir dune mesure

    de la variable regionalisee, il est necessaire de se ramener a des hypotheses. Les

    hypotheses de stationnarite (second ordre ou intrinseque) sont choisies en fonction

    de lhomogeneite des donnees.

    Maintenant que nous avons detaille le choix du modele probabiliste, nous allons nous

    focaliser sur un outil indispensable pour la modelisation spatiale des donnees : le

    variogramme.

    4.3 Analyse variographique

    Nous avons vu que le variogramme refletait la structure de la regionalisation. On

    appelle analyse variographique linference du variogramme a partir de donnees

    experimentales. Elle permet de restituer des informations quant a la distribution spa-

    tiale de la variable regionalisee, cest-a-dire de la realisation de la fonction aleatoire

    dinteret. A titre de precision, on sattache usuellement a letude du variogramme

    plutot que de la covariance, celle-ci netant pas necessairement definie dans le cadre

    intrinseque.

    Lanalyse variographique constitue une etape cruciale dans un etude geostatistique :

    Pierre Bosser 40 2011-2012

  • 7/24/2019 topo 111

    43/55E

    NSG/

    DP

    TS

    INTERPOLATION SPATIALE 4 Linterpolation stochastique

    elle permet posterieurement destimer les valeurs inconnues de la variable regiona-

    lisee et dassortir leur estimation dune precision.

    4.3.1 Proprietes du variogramme

    Proprietes mathematiques :

    Cas stationnaire dordre 2 : dans le cas stationnaire dordre 2 le variogramme est

    une fonction paire, nulle pour h = 0, positive et bornee. On dit que cest une

    fonction de type negatif conditionnelle puisque elle obeit a la relation :

    k N, w1,...,wk Rk/

    k

    i=1

    wi= 0,s1, ..., sk Dk,

    n

    i=1

    n

    j=1

    wiwj(si sj) 0

    De plus,

    limh+

    (h) = C(0)

    Ce palier, C(0) est atteint au niveau de la portee (distance a partir de laquelle

    2 valeurs ne sont plus correlees) et correspond donc a la dissemblance maximale.

    Cas intrinseque : Dans le cas intrinseque, la covariance nexiste pas forcement. Le

    variogramme nest pas borne et augmente indefiniment avech. On a de plus :

    (h) =o+(h2)

    Anisotropie Le variogramme depend a la fois du module h deh mais aussi de

    sa direction.

    Comportement a lorigine Le comportement a lorigine reflete de degre de

    regularite spatiale de la variable regionalisee. On distingue usuellement trois types

    de comportements :

    Parabolique : cas dune grande regularite spatiale avec une variable regionalisee

    derivable et daspect lisse.

    Lineaire : comportement moins regulier de la variable regionalisee ; regionalisation

    continue mais plus derivable

    Discontinu : saut abrupt a lorigine en raison de labsence (totale ou partielle) de

    correlation entre les valeurs prises par deux sites proches. La variable regionalisee

    est discontinue. On parle alors deffet de pepitedu fait de lexemple des teneurs

    en or des gisements auriferes qui varient a tres courte echelle.

    Ces differents types de comportement sont representes sur cette figure :

    Pierre Bosser 41 2011-2012

  • 7/24/2019 topo 111

    44/55E

    NSG/

    DP

    TS

    INTERPOLATION SPATIALE 4 Linterpolation stochastique

    (a) (b) (c)

    h h h

    h( ) h( ) h( )

    FIG 30 - Differents comportement a lorigine du vario-

    gramme : (a) : comportement parabolique ; (b) : compor-

    tement lineaire ; (c) : comportement discontinu.

    4.3.2 Inference du variogramme

    On cherche maintenant a estimer le variogramme a partie dun ensemble de donnees

    experimentales {z(si)}/si D}.

    Variogramme experimental : Le variogramme experimentale est calcule empi-

    riquement a partir des observations de la variable regionalise. Il est donne par la

    formule :(h) =

    1

    2|N(h)|

    (i,j)N(h)

    [z(si) z(sj)[2

    Ou N(h) ={(i, j)/si sj =h/i=j } est lensemble des paires distinctes et |N(h)|

    est le cardinal deN(h). En pratique, les donnees netant pas regulierement espacees,

    on definira lensemble N(h) par N(h) ={(i, j)/si sj h /i=j }.

    Le variogramme experimental est un nuage de point. Le calcul sans pas induit la

    restitution dun variogramme tres bruite a partir duquel il est difficile de deduire

    tout information ; Le choix dun calcul moyen par pas permet lobtention dun va-riogramme plus lisse dont les valeurs seront plus fiables.

    Pierre Bosser 42 2011-2012

  • 7/24/2019 topo 111

    45/55E

    NSG/

    DP

    TS

    INTERPOLATION SPATIALE 4 Linterpolation stochastique

    (a) 0 50 100 150 200 250

    0

    0.2

    0.4

    0.6

    0.8

    1

    1.2

    1.4

    1.6

    1.8

    2x 10

    4

    h [m]

    (h)

    (b) 0 50 100 150 200 250

    0

    0.2

    0.4

    0.6

    0.8

    1

    1.2

    1.4

    1.6

    1.8

    2x 10

    4

    h [m]

    (h)

    (c) 0 50 100 150 200 250

    0

    0.2

    0.4

    0.6

    0.8

    1

    1.2

    1.4

    1.6

    1.8

    2x 10

    4

    h [m]

    (h)

    FIG 31 - Exemple de variogramme experimental calcule :

    (a) sans pas, (b) pour un pas de 5 m, (c) pour un pas de 10

    m.

    La variogramme experimental est non biaise (E(h)

    = (h)), mais sa dispersion

    augmente fortement quandh devient grand. Cest un estimateur peu robuste car

    sensible aux valeurs extremes ou aberrantes en particulier pour des pas faibles en

    comparaison des distances entre sites dobservation.

    Modelisations : Le variogramme experimental permet lestimation du variogram-

    me theorique pour un nombre defini de distances, cest-a-dire uniquement des valeurs

    ponctuelles. De plus, il ne respecte pas necessairement les proprietes theoriques

    du variogramme (en particulier la propriete negative conditionnelle, complexe a

    etablir). Lidee est donc dajuster un modele variographique classique presentant les

    caracteristiques necessaires et defini pour un ensemble de vecteursr.

    Pierre Bosser 43 2011-2012

  • 7/24/2019 topo 111

    46/55E

    NSG/

    DP

    TS

    INTERPOLATION SPATIALE 4 Linterpolation stochastique

    Lajustement se fait alors par moindre-carre en minimisant la quantite :

    k

    [(rk) (rk)]2

    On trouve dans la litterature differents types de modele. En fonction du variogramme

    experimental, on choisira le modele variographique qui sen rapproche le plus.

    Modeles isotropes avec palier :

    Modele pepitique de palierC : comportement discontinu a lorigine. Il est ca-

    racteristique des gisements miniers, en particulier auriferes.

    (r) =

    0 pour r= 0

    C pour r >0

    C

    r

    (r)

    (a)

    FIG 32 - Modele pepitique.

    Modele spherique de porteea et de palierC: lineaire a lorigine.

    (r) =

    C

    32ra

    12r3

    a3

    pour 0 r a

    C pour r > a

    Pierre Bosser 44 2011-2012

  • 7/24/2019 topo 111

    47/55E

    NSG/

    DP

    TS

    INTERPOLATION SPATIALE 4 Linterpolation stochastique

    a

    C

    r

    (r)

    (b)

    FIG 33 - Modele spherique.

    Modele cubique de porteea et de palierC : parabolique a lorigine.

    (r) =

    C

    7 r2

    a2 35

    4r3

    a3+ 7

    2r5

    a5 3

    4r7

    a7

    pour 0 r a

    C pour r > a

    a

    C

    r

    (r)

    (c)

    FIG 34 - Modele cubique.

    Modele exponentiel de parametrea et de palierC: lineaire a lorigine.

    (r) =C1 e ra

    a 3a

    0.95CC

    r

    (r)

    (d)

    FIG 35 - Modele exponentiel.

    Pierre Bosser 45 2011-2012

  • 7/24/2019 topo 111

    48/55E

    NSG/

    DP

    TS

    INTERPOLATION SPATIALE 4 Linterpolation stochastique

    Modele gaussien de parametrea et de palierC :parabolique a lorigine.

    (r) =C1 e r2a2

    a 1.7a

    0.95CC

    r

    (r)

    (e)

    FIG 36 - Modele gaussien.

    Modele a effet de trou : parabolique a lorigine ; il permet de modeliser un

    variogramme moins stable, presentant des fluctuations autour du palier : il est

    caracteristique de donnees plus heterogenes.

    (r) =C

    1

    sin

    rara

    4.49a

    C

    1.21C

    r

    (r)

    (f)

    FIG 37 - Modele a effet de trou.

    Modeles isotropes sans palier : ils sont utilises dans le cadre non stationnaire

    dordre 2 :

    Modele puissance dexposant et de facteur dechel le : [0; 2]. Plus est

    proche de 2, plus la variable regionalisee est reguliere. Plus est proche de 0,

    plus son comportement est erratique.

    (r) =r

    Pierre Bosser 46 2011-2012

  • 7/24/2019 topo 111

    49/55E

    NSG/

    DP

    TS

    INTERPOLATION SPATIALE 4 Linterpolation stochastique

    r

    (r)

    (a)

    FIG 38 - Modele puissance dexposant (= 0, 5)

    Modele lineaire de pente : lineaire a lorigine.

    (r) =r

    r

    (r)

    (b)

    FIG 39 - Modele lineaire.

    Les methodes utilisees pour des modeles non-isotropes existent mais sont plus com-

    plexes a mettre en uvre. On cherchera en general a se ramener a un ou plusieurs

    variogramme isotrope en fonction des directions privilegiees.

    4.4 Le krigeage

    4.4.1 Origine de la methode

    Le krigeage est une methode dinterpolation applicable a des donnees spatiales.

    Elle sappuie sur la geostatistique lineaire, notamment le variogramme. La theorie

    du krigeage a ete developpee par un mathematicien francais (G. Matheron) a partir

    des travaux de lingenieur minier sud-africain D. G. Krige. Dans les annees 50,

    Krige a developpe une serie de methodes statistiques empiriques afin de determiner

    la distribution de minerais a partir dun ensemble de forages.

    Pierre Bosser 47 2011-2012

  • 7/24/2019 topo 111

    50/55E

    NSG/

    DP

    TS

    INTERPOLATION SPATIALE 4 Linterpolation stochastique

    4.4.2 Principe

    Voisinage : On appelle voisinage du krigeage le domaine du champ qui contient

    le site a estimer et les donnees utilisees pour linterpolation : dans la plupart des cas,

    il nest pas necessaire de prendre toutes les donnees disponibles (trop nombreuses

    ou trop eloignees : le calcul en serait plus long et pas necessairement plus precis).

    Les sites dinteret sont selectionnes par un critere de nombre (les n plus proches)

    ou de distances (les n sites situes a une distance inferieure a rmax). En general, 15

    sites sont necessaires pour une estimation optimale (trop peu de sites peut rendre

    la solution moins precise : un bon compromis est donc necessaire).

    Contraintes : Lobjectif est destimer le plus precisement possible la grandeurrecherchee par une combinaison lineaire ponderee des observations. Ce critere de

    precision se traduit par une minimisation de lerreur quadratique moyenne. Ces

    conditions se traduisent mathematiquement en 4 contraintes.

    Contrainte de linearite : Lestimee doit etre une combinaison lineaire des donnees :

    z(s0) =ni=1

    i(s0)z(si)

    Contrainte dautorisation : Lesperance et la variance de lerreur de previsionz(s0) z(s0) doivent obligatoirement exister (cette contrainte intervient dans le

    cas stationnaire intrinseque puisquelles existent obligatoirement dans le cas de la

    stationnarite dordre 2).

    Contrainte de non biais : Lesperance de lerreur de prevision est nulle :

    E [z(s0) z(s0)] = 0

    Contrainte doptimalite : les poids i doivent etre estimes de maniere a minimiser

    la variance de lerreur de prevision var [z(s0) z(s0)]

    Estimation : On sinteresse au cas le plus commun avec letude dune seule va-

    riable regionalisee, sous lhypothese de stationnarite intrinseque : on parle de kri-

    geage ordinaire. Cest le type de krigeage le plus communement utilise.

    Le krigeage doit donc repondre aux 4 contraintes enoncees precedemment.

    Contrainte de linearite : Lestimee est donc une combinaison lineaire des observa-

    tions :

    Z(s0) =

    ni=1 i(s0)Z(si)

    Pierre Bosser 48 2011-2012

  • 7/24/2019 topo 111

    51/55E

    NSG/

    DP

    TS

    INTERPOLATION SPATIALE 4 Linterpolation stochastique

    Contrainte dautorisation : On doit assurer lexistence de lesperance et de la va-

    riance de lerreur de prevision.

    Z(s0) Z(s0) =

    ni=1

    i(s0)Z(si)

    Z(s0)

    =

    ni=1

    i(s0)Z(si)

    ni=1

    i(s0)Z(s0)

    +

    ni=1

    i(s0)Z(s0)

    Z(s0)

    =

    ni=1

    i(s0) [Z(si) Z(s0)]

    +Z(s0)

    ni=1

    i(s0) 1

    Lerreur de prevision prend donc la forme dune combinaison lineaire daccroisse-

    ments si et seulement si

    ii(s0) = 1. Dans ce cas, on a bien lexistence de la

    variance et de lesperance sous lhypothese de stationnarite intrinseque.

    Contrainte de non biais : On doit sassurer que lestimateur de lerreur de prevision

    est non biaise :

    EZ(s0) Z(s0)

    =

    ni=1

    i(s0) E [Z(si) Z(s0)]

    cf. equations precedentes

    Lesperance des accroissements etant nulle sous lhypothese intrinseque, on a bien

    un estimateur de lerreur de prevision non biaise. Contrainte doptimalite : On cherche a minimiser lerreur de prevision Z(s0)

    Z(s0). Cette minimisation sous la contrainte

    ii(s0) = 1 se ramene a la recherche

    des extrema du lagrangien suivant :

    L(1(s0),...,n(s0), ) = E

    nj=1

    j(s0)Z(sj) Z(s0)

    2 + 21 ni=1

    i(s0)

    Ourepresente un multiplicateur de Lagrange.

    Apres developpement, on peut reecrire le lagrangien sous la forme :

    L =ni=1

    nj=1

    i(s0)j(s0)ij+ 2n

    j=1

    j(s0)j0+ 2

    1

    ni=1

    i(s0)

    Ouij =(si, sj)

    Le calcul des derivees partielles premieres de Lpar rapport aux i(s0) donne les

    Pierre Bosser 49 2011-2012

  • 7/24/2019 topo 111

    52/55E

    NSG/

    DP

    TS

    INTERPOLATION SPATIALE 4 Linterpolation stochastique

    equations constituant le systeme krigeage :

    L

    i(s0) = 2

    ni=1 i(s0)ij+ 2i0 2

    = 0

    Soit, pour tout i [1; n[,n

    j=1

    j(s0)ij+ = i0

    Au final, le systeme a resoudre secrit donc :

    n

    j=1 j(s0)ij+ = i0n

    j=1j(s0) = 1

    Ce que lon peut reecrire sous forme matricielle :

    0 12 13 . . . 1n 1

    21 0 23 . . . 2n 1...

    ... ... . . .

    ... ...

    n1 n2 n3 . . . 0 1

    1 1 1 . . . 1 0

    1(s0)

    2(s0)...

    n(s0)

    =

    10

    20...

    n0

    1

    (4)

    Notons que la mise en place du systeme de krigeage necessite une unique inversion

    de la matrice carree de lequation de krigeage (modele du krigeage), celle-ci etant

    valide pour le domaine entier. Seul le vecteur du membre de droite doit etre calcule

    en chaque point. Le vecteur estime est lui aussi valable en un point.

    4.4.3 Proprietes du krigeage

    La variance de lerreur destimation au point s0 est donnee par :

    2(s0) = var [z(s0) z(s0)[

    =ni=1

    i(s0)i0+

    La variance depend donc des parametres du krigeage (termes i) ainsi que de la

    structure spatiale de la fonction aleatoire (variogramme).

    Pierre Bosser 50 2011-2012

  • 7/24/2019 topo 111

    53/55E

    NSG/

    DP

    TS

    INTERPOLATION SPATIALE 4 Linterpolation stochastique

    4.4.4 Impact du modele de variogramme

    On evalue en un point quelconque limpact de differents modeles de variogrammes

    sur lestimation de la variable regionalisee.

    Les variogrammes modelises estimes a partir du variogramme experimental sont

    representes sur la figure suivante. Dapres la structure de ce dernier, on choisit de

    sinteresser uniquement aux variogrammes exponentiel, gaussien et a effet de trou.

    Le modele a effet de trou semble etre le plus adequat pour representer le vario-

    gramme determine experimentalement : comportement plus conforme a lorigine,

    meilleure restitution egalement de la dispersion. Cette dispersion nest cependant

    pas representative dun phenomene physique reel, sa representation nest donc pas

    forcement la plus judicieuse. Elle est vraisemblablement plutot liee au manque derobustesse de lestimateur du variogramme.

    0 50 100 150 200 2500

    1000

    2000

    3000

    4000

    5000

    6000

    7000

    8000

    h [m]

    (h)

    FIG 40 - Variogramme experimental et differents modeles

    variographiques associes : modeles exponentiel (magenta),

    gaussien (vert) et a effet de trou (rouge).

    Les valeurs estimees a laide du krigeage pour ces differents modeles de vario-

    grammes, ainsi que leur precision, sont presentees dans le tableau suivant. On

    constate que la variance de lestimateur est minimale pour un modele de vario-

    gramme de type exponentiel.

    Pierre Bosser 51 2011-2012

  • 7/24/2019 topo 111

    54/55E

    NSG/

    DP

    TS

    INTERPOLATION SPATIALE 4 Linterpolation stochastique

    Modele Valeur estimee Incertitude formelle

    Exponentiel 653.2109 0.2729

    Gaussien 660.6695 0.1796Effet de trou 671.9119 0.4602

    TAB 3 - Interpolation par krigeage en un point quelconque

    pour differents modeles de variogramme.

    La surface obtenue par krigeage a partir du jeu dobservation dont on dispose est

    alors :

    140160

    180200

    220240

    260280

    120

    140

    160

    180

    200

    220

    240

    400

    500

    600

    700

    800

    Y

    X

    Z

    FIG 41 - Krigeage : application sur un champ dobservations

    - vue en perspective.

    4.5 Conclusion

    La geostatistique permet de modeliser la structure du phenomene regionalise etudie

    a laide doutils simples (covariance et/ou variogramme) et de resoudre efficacement

    les problemes dinterpolation.

    Letude geostatistique debute avec lanalyse variographique qui consiste a estimer

    le variogramme experimental et a le modeliser a laide dune fonction standard.

    Le modele variographique peut alors etre utilise pour construire un systeme de

    krigeage qui permettre dobtenir des estimations locales et les variances destimation

    Pierre Bosser 52 2011-2012

  • 7/24/2019 topo 111

    55/55

    NSG/

    DP

    TS

    INTERPOLATION SPATIALE 5 Conclusion

    associees.

    5 Conclusion

    Nous avons aborde deux types de methodes pour la resolution des problemes din-

    terpolation spatiale :

    Les methodes deterministes globales : elles permettent lestimation de la moyenne

    sur un domaine donne dune grandeur mesuree en differents points dobservation.

    Elles sont basees sur des proprietes purement geometriques de lechantillon dob-

    servation.

    Les methodes deterministes locales : elles sont aussi basees sur des proprietespurement geometriques de lechantillon dobservation et ne permettent pas une

    evaluation de leur precision. Il est de plus generalement difficile de conlcure quant

    a la fiabilite globale dune technique deterministe.

    Les methodes stochastiques : elles font appel a un modele cense mieux sadapter

    aux donnees observees. Ce modele permet lestimation de la variable en des sites

    non echantillonnes apres letude de la distribution spatiale (variogramme) de la

    variable.

    Lutilisation de techniques de validation croisee (bootstrap) permet de controler la

    conformite du modele choisi a la realite.