Claude Bernard University Lyon 1 - Modélisation et estimation de...

25
Modélisation et estimation de la dispersion du pollen de maïs à l’aide de processus de diffusion Agnès GRIMAUD Unité MIA, INRA, Jouy-en-Josas et Université Paris 11, Orsay Séminaire de Probabilités et Statistique, Université Lyon 1 - 10 Avril 2006

Transcript of Claude Bernard University Lyon 1 - Modélisation et estimation de...

Page 1: Claude Bernard University Lyon 1 - Modélisation et estimation de …math.univ-lyon1.fr/~jberard/resume-Grimaud.pdf · 2006-04-20 · Modélisation et estimation de la dispersion

Modélisation et estimation de la dispersion du pollen

de maïs à l’aide de processus de diffusion

Agnès GRIMAUD

Unité MIA, INRA, Jouy-en-Josas et Université Paris 11, Orsay

Séminaire de Probabilités et Statistique, Université Lyon 1 - 10 Avril 2006

Page 2: Claude Bernard University Lyon 1 - Modélisation et estimation de …math.univ-lyon1.fr/~jberard/resume-Grimaud.pdf · 2006-04-20 · Modélisation et estimation de la dispersion

Pourquoi étudier la dispersion du pollen ?

➩ En génétique des populations et en écologie : étude des flux de gènes.En agronomie : pureté des récoltes et des graines, risques possibles sur l’en-vironnement.Développement des OGM : améliorations et avantages économiques.Débats autour de leur culture à grande échelle.

➩ Conséquences :

Etude de la dispersion du flux de pollen dans le but de pouvoir faire desprédictions spatiales.Aide à la gestion des cultures, au contrôle des échanges de gènes.

Morris, Kareiva et Rayner (1994) ; Nurminiemi, Tufto, Nilsson et Rognli (1998) ; Klein, Lavigne,

Foueillassar, Gouyon, et Larédo (2003) ; Tufto, Engen et Hindar (1997) ;

Page 3: Claude Bernard University Lyon 1 - Modélisation et estimation de …math.univ-lyon1.fr/~jberard/resume-Grimaud.pdf · 2006-04-20 · Modélisation et estimation de la dispersion

Plan

I Modélisation de la dispersion du pollen

1. Fonctions de dispersion

2. Modèle statistique

II Etude en milieu homogène (2 champs contigus)

1. Modélisation de la trajectoire d’un grain de pollen

2. Estimation des paramètres et validation des résultats

III Etude en milieu hétérogène (2 champs séparés par une autre culture)

Page 4: Claude Bernard University Lyon 1 - Modélisation et estimation de …math.univ-lyon1.fr/~jberard/resume-Grimaud.pdf · 2006-04-20 · Modélisation et estimation de la dispersion

Caractéristiques du maïs

➩ Espèce anémophile

➩ Le pollen part de la hauteur des fleurs mâles, prise comme originePollinisation à la hauteur des fleurs femelles, h < 0

➩ Marqueur génétique dominant, non transgénique, colorant les grains en bleu

➩ Les épis de maïs à grains jaunes utilisés comme capteurs :Une fleur de maïs à grains jaunes fécondée par du pollen de maïs à grainsbleus donne un grain bleu.

Page 5: Claude Bernard University Lyon 1 - Modélisation et estimation de …math.univ-lyon1.fr/~jberard/resume-Grimaud.pdf · 2006-04-20 · Modélisation et estimation de la dispersion

Description de l’expérience

Graphique des données

0 20 40 60 80 100 120

0

20

40

60

80

100

120 0

1e−05

1e−04

1e−03

1e−02

0.05

0.1

0.2

0.46

155 lignes avec 800 plantes par ligne , environ 3000 épis récoltés.

Nk : nombre de grains bleus sur l’épi localisé en (xk, yk).nk : nombre total de grains de maïs sur l’épi localisé en (xk, yk).

Page 6: Claude Bernard University Lyon 1 - Modélisation et estimation de …math.univ-lyon1.fr/~jberard/resume-Grimaud.pdf · 2006-04-20 · Modélisation et estimation de la dispersion

Modélisation de la dispersion du pollen

Fonction de dispersion globale µ(x, y) :

Probabilité qu’un grain de maïs situé sur un épi en (x, y) soit bleu.

Souvent utilisée en biologie car observée directement. Mais dépend du dispositifexpérimental.

Fonction de dispersion individuelle du pollen γ(x, y) :

γ(x, y)dxdy : probabilité qu’un grain de pollen émis en (0, 0) tombe et fécondeune plante dans le rectangle ((x, y), (x + dx, y + dy)).

Théoriquement indépendante du dispositif expérimental.

Cadre :- Toutes les plantes dispersent leur pollen suivant la même fonction γ.- Modélisation des différences génétiques entre les deux espèces de plantes àl’aide d’un paramètre m.

Page 7: Claude Bernard University Lyon 1 - Modélisation et estimation de …math.univ-lyon1.fr/~jberard/resume-Grimaud.pdf · 2006-04-20 · Modélisation et estimation de la dispersion

Relation entre µ(x, y) et γ(x, y)

Notations :- SA : source composée de plantes de maïs à grains bleus, localisées en(xk, yk)k=1,...,SA

- SB : source composée de plantes de maïs à grains jaunes, localisées en(xk, yk)k=1,...,SB

Pollinisation au point (x, y) :suivant la composition du nuage pollinique situé au dessus de la plante.

Alors µ(x, y) =

∑SAk=1 γ(x − xk, y − yk)

∑SAk=1 γ(x − xk, y − yk) + m

∑SBk=1 γ(x − x

′k, y − y

′k)

Pour le maïs : le marqueur agit uniquement sur la couleur donc m = 1.

Page 8: Claude Bernard University Lyon 1 - Modélisation et estimation de …math.univ-lyon1.fr/~jberard/resume-Grimaud.pdf · 2006-04-20 · Modélisation et estimation de la dispersion

Modèle statistique

➩ Hypothèses sur les v.a. Nk, données de comptage :

– Nk = nµ(θ; xk, yk) + εk

– les (εk)k sont supposées indépendantes.– E(εk) = 0 et V ar(εk) = σ2v(n; b, µ(θ; xk, yk))

avec σ2 : paramètre de sur-dispersion.

et :

1. Variance de type binomial : v(n; µ(x, y)) = nµ(x, y)(1 − µ(x, y)).

2. Variance de type linéaire : v(n; b, µ(x, y)) = n(b + µ(x, y)).

➩ Problème de déconvolution non linéaire :étude de fonctions de dispersion individuelles paramétriques{γ(θ; x, y), θ ∈ Θ et (x, y) ∈ R

2}

Page 9: Claude Bernard University Lyon 1 - Modélisation et estimation de …math.univ-lyon1.fr/~jberard/resume-Grimaud.pdf · 2006-04-20 · Modélisation et estimation de la dispersion

Modèles en milieu homogène

➩ Modélisation de la trajectoire

Le grain de pollen : particule soumise à un champ de forces.Pt = (Xt, Yt, Zt) : position à l’instant t d’un grain de pollen.

➩ Modélisation du temps de fécondation TF , supposé indépendant de (Xt, Yt).

➩ Prop : Le couple (XTF, YTF

) admet une densité sur R2, qui est une fonction de

dispersion individuelle γ.Densité de (XTF

, YTF) = γ.

Page 10: Claude Bernard University Lyon 1 - Modélisation et estimation de …math.univ-lyon1.fr/~jberard/resume-Grimaud.pdf · 2006-04-20 · Modélisation et estimation de la dispersion

Mouvement brownien avec drift dans R3 (Klein et al 2003)

Modélisation de la position (Pt)t≥0 par

dXt = fxdt + τdB1t

dYt = fydt + τdB2t

dZt = fzdt + τzdB3t

où les (Bit)i=1,2,3 sont des mouvements browniens indépendants .

fx et fy : vitesses moyennes dans le plan horizontal.

fz : vitesse de chûte due à la gravité et supposé négatif.

τ, τz : turbulences dues au vent sur le grain et supposés positifs.

Exemple :

Page 11: Claude Bernard University Lyon 1 - Modélisation et estimation de …math.univ-lyon1.fr/~jberard/resume-Grimaud.pdf · 2006-04-20 · Modélisation et estimation de la dispersion

Hypothèses sur le temps de fécondation TF

Densité GIG(α, ρ, η) (Generalized Inverse Gaussian) :

fGIG(α, ρ, η; t) = C(α, ρ, η)t−αe−ρt−ηt It≥0

➩ Modèle 1 : Prédominance de la végétation

Te : v.a. de loi E(λ). TF : loi de Te conditionnellement à {ZTe = h}.TF : GIG avec paramètre α = 1

2.

➩ Modèle 2 : Prédominance du sol

Temps de premier passage du niveau h : TF = Th = inf{t > 0, Zt = h}Th : GIG avec paramètre α = 3

2.

➩ Modèle 3 : Généralisation

TF : GIG de paramètre α quelconque.

Page 12: Claude Bernard University Lyon 1 - Modélisation et estimation de …math.univ-lyon1.fr/~jberard/resume-Grimaud.pdf · 2006-04-20 · Modélisation et estimation de la dispersion

Calcul des fonctions de dispersion individuelles

Prop (Barndorff-Nielsen) : Si (Xt, Yt) est un mouvement brownien avec drift etTF de densité GIG, indépendant de (Xt, Yt), alors la densité de (XTF

, YTF) est une

GHD (Generalized Hyperbolic Distribution).

➩ Modèle 1 : γ : GTM (Generalized Tufto Model)

➩ Modèle 2 : γ : NIG (Normal Inverse Gaussian).

fNIG(λz, λx, λy, δ; x, y) =δ2eλz

(q(x, y)−1/2 + p1/2)

q(x, y)e−√

pq(x,y)eδ(λxx+λyy)

où p = λ2z+λ2

x+λ2y ; q(x, y) = 1+δ2(x2+y2) et δ = τz

τ |h|, λx = fxhττz

, λy =fyh

ττz, λz = fzh

τ2z

➩ Modèle 3 : Généralisation

γ : GHD de paramètres (α, δ, λx, λy, λz).

fGHD(α, λz, λx, λy, δ; x, y) =λ1−α

z δ2(p/q(x, y))α

2

Kα(√

pq(x, y))

K1−α(λz)eδ(λxx+λyy)

Page 13: Claude Bernard University Lyon 1 - Modélisation et estimation de …math.univ-lyon1.fr/~jberard/resume-Grimaud.pdf · 2006-04-20 · Modélisation et estimation de la dispersion

Modèle 4 : modélisation de la vitesse verticale

➩ (Xt) et (Yt) : deux mouvements browniens avec drift indépendants.

➩ Pour (Zt) : modélisation de la vitesse (à l’aide de l’équation de Langevin).

dVt = (cz − βzVt)dt + ηzdBt et Zt =∫ t

0 Vsds : O-U intégré.

➩ Temps de fécondation : TF = inf{t > 0, Zt = h}

➩ Prop : La fonction de densité de TF peut être approchée par une fonction p1

avec au v(0) : p1(t) ∝ t−5/2exp(−ρt − ηt3

)

et au v(+∞) : p1(t) ∝ t−3/2exp(−ρ1t − η1t)

Preuve : Changement de temps permettant de se ramener à l’ approximation de la densitédu temps de premier passage d’une courbe a(t) par un mouvement brownien ,

νh = inf{s > 0, B̃s ≥ a(s)} (Durbin, 1992)

➩ Conséquence : obtention d’une fonction de dispersion individuelle γMV V .

Page 14: Claude Bernard University Lyon 1 - Modélisation et estimation de …math.univ-lyon1.fr/~jberard/resume-Grimaud.pdf · 2006-04-20 · Modélisation et estimation de la dispersion

Modèle 5 : modélisation de la vitesse dans le plan horizontal

➩ La vitesse n’est plus considérée constante dans le plan horizontal.Introduction d’une vitesse de vent minimale, v0, pour l’émission des grains depollen.

➩ Modélisation de (Pt)t≥0 par : dXt = V xt dt , dYt = V y

t dt

avec (V xt ) et (V y

t ) processus d’O-U indépendants, avec V x0 = vx

0 et V y0 = vy

0 .(processus non stationnaires contrairement à Tufto et al, 1997)

(Zt) : mouvement brownien avec drift.

➩ Temps de fécondation : TF = Th = inf{t > 0, Zt = h}.

➩ Approximation des fonctions E(Xt) et Var(Xt) (resp. E(Yt) et Var(Yt)).Obtention d’une fonction de dispersion individuelle, γMV H.

Page 15: Claude Bernard University Lyon 1 - Modélisation et estimation de …math.univ-lyon1.fr/~jberard/resume-Grimaud.pdf · 2006-04-20 · Modélisation et estimation de la dispersion

Récapitulatif

➩ Modélisation du couple (Xt, Yt).

➩ Modélisation de TF de façon indépendante de (Xt, Yt).

(Xt, Yt) Temps de fécondation TF Fonction de dispersionindividuelle γ

Modèle 1 2 M.B. avec drift GIG α = 1/2 γGTM

Loi normale N1

Modèle 2 2 M.B. avec drift GIG α = 3/2 γNIG

Loi normale N1 TF = inf{t > 0, Zt = h}avec Zt M.B. avec drift

Modèle 3 2 M.B. avec drift GIG α libre γGHD

Loi normale N1

Modèle 4 2 M.B. avec drift densité p1 γMV V

Loi normale N1 TF = inf{t > 0, Zt = h}avec Zt O-U intégré

Modèle 5 2 O-U intégrés GIG α = 3/2 γMV H

Loi normale N2 TF = inf{t > 0, Zt = h}

Page 16: Claude Bernard University Lyon 1 - Modélisation et estimation de …math.univ-lyon1.fr/~jberard/resume-Grimaud.pdf · 2006-04-20 · Modélisation et estimation de la dispersion

Estimation des paramètres

➩ Modèle statistique de la forme

Nk = nµ(θ; xk, yk) + εk avec E(εk) = 0 et V ar(εk) = σ2v(b, n; µ(θ; xk, yk))

les (εk)k étant supposées indépendantes.

➩ Equations de quasi-vraisemblance :

Ui(θ) =

nd∑

k=1

∂µ

∂θi(θ; xk, yk)

Nk − nµ(θ; xk, yk)

v(b, n; µ(θ; xk, yk), pour i = 1, ..., p

Up+1(θ, b) =

nd∑

k=1

∂v

∂b(b, n; µ(θ; xk, yk))

(Nk − nµ(θ; xk, yk))2 − σ2nv(b, n; µ(θ; xk, yk))

v2(b, n; µ(θ; xk, yk))

➩ Estimateurs de quasi-vraisemblance :

(θ̂, b̂) défini par Ui(θ, b) = 0 (i = 1, ..., p + 1) , σ̂2 estimé par variance résiduelle.

➩ Propriétés asymptotiques des estimateurs (McCullagh, 1983).

Page 17: Claude Bernard University Lyon 1 - Modélisation et estimation de …math.univ-lyon1.fr/~jberard/resume-Grimaud.pdf · 2006-04-20 · Modélisation et estimation de la dispersion

Analyse et validation des résultats

➩ Résultats :- Obtention d’écart-types plus petits avec la variance de type linéairepar rapport à la variance de type binomial.- Pour GHD : α ' 1.4

➩ Test de quasi-vraisemblance pour les modèles GHD :H0 : "α = 3/2" contre H1 : "α 6= 3/2"H0 acceptée au niveau asymptotique 5% avec variance lin.

➩ Critère de sélection de type Akaïke (Hurvich et Tsai, 1995)

➩ Etude des résidus réduits (sur le champ, par rapport aux ajustés).

➩ Le modèle 2 (NIG), avec la variance de type linéaire, est choisi.

Page 18: Claude Bernard University Lyon 1 - Modélisation et estimation de …math.univ-lyon1.fr/~jberard/resume-Grimaud.pdf · 2006-04-20 · Modélisation et estimation de la dispersion

Analyse et validation des résultats

➩ Courbes des fonctions de dispersion individuelles pour les modèlesproposés avec la variance de type linéaire

Suivant l’axe dominant du vent Suivant l’axe orthogonal

−5 0 5 10 1510

−10

10−9

10−8

10−7

10−6

10−5

10−4

10−3

10−2

10−1

100

Distance from the source

Den

sity

func

tion

Model 2, NIGModel 3, GHDModel 4

−10 −8 −6 −4 −2 0 2 4 6 8 1010

−10

10−9

10−8

10−7

10−6

10−5

10−4

10−3

10−2

10−1

100

Distance from the source

Den

sity

func

tion

Model2, NIGModel 3, GHDModel 4

Page 19: Claude Bernard University Lyon 1 - Modélisation et estimation de …math.univ-lyon1.fr/~jberard/resume-Grimaud.pdf · 2006-04-20 · Modélisation et estimation de la dispersion

Analyse et validation des résultats

Comparaison avec les paramètres biologiques du maïs (h, fz) et avecles paramètres physiques basés sur les données météorologiques.

NIG NIG NIG GHD Modèle 4

Paramètres Minimum Moyenne Maximum Klein et al. Var de type bin Var de type lin Var de type lin Var de type lin

Drift vertical, fz (m.s−1) 0.183Différence de hauteur, h (m) 0.831Drift horizontal : fx (m.s−1) -0.056 -0.074 -0.042 -0.061 -0.036 -0.154

fy (m.s−1) 0.998 1.74 1.37 1.22 0.742 1.08Variance verticale, τz (m.s−1) 0.35 1.175 2 2.37 1.65 1.51 1.33 -

Variances horizontales, 0.65 1.325 2 5.70 3.83 3.51 2.75 0.974τx = τy (m.s−1)

Pour le modèle 5 : vitesse minimale d’émission des grains de pollen v0 ' 0.6 m.s−1

Conclusion : Le modèle 2 (NIG) est choisi avec une variance de type linéaire.

Page 20: Claude Bernard University Lyon 1 - Modélisation et estimation de …math.univ-lyon1.fr/~jberard/resume-Grimaud.pdf · 2006-04-20 · Modélisation et estimation de la dispersion

Etude en milieu hétérogène

➩ Deux champs de maïs séparés par une autre culture ou un sol nu.

Proportions de grains bleus observés sur les épis pour le trèfle

Trèfle

Maïs jaune

1 grain bleu

2 à 5 grains bleus

5 à 10 grains bleus

plus de 10 grains bleus

Maïs bleu

0 50 100 150 200

0

20

40

60

80

100

120

140

160

180

Proportions de grains bleus observés sur les épis pour le tournesol

Tournesol

Maïs jaune

1 grain bleu

2 à 5 grains bleus

5 à 10 grains bleus

plus de 10 grains bleus

Maïs bleu

0 20 40 60 80 100 120 140 160

0

20

40

60

80

100

120

140

160

180

TAB. 1 – nombre observés de grains bleus sur les épis échantillonnés pour une discontinuité de trèfle ou de tournesol.

➩ L’hypothèse "Toutes les plantes dispersent leur pollen suivant la même fonc-tion de dispersion individuelle γ" n’est plus valide.

Page 21: Claude Bernard University Lyon 1 - Modélisation et estimation de …math.univ-lyon1.fr/~jberard/resume-Grimaud.pdf · 2006-04-20 · Modélisation et estimation de la dispersion

Etude en milieu hétérogène

➩ Utilisation des processus de diffusion : pas exploitable sur les données

➩ Modèle choisi quand deux champs sont contigus : NIG (3 mouvements brow-niens avec drift et Th = inf{t > 0, Zt = h}.)

➩ Introduction de paramètres de translation en adaptant un modèle proposépour l’étude de la dispersion isotrope du colza (Poilleux et Huet, 2002)

f (x) → f (x − αd) 0 0.5 1 1.5 2 2.5 3 3.5 40

0.05

0.1

0.15

0.2

0.25

0.3

0.35

0.4

Fon

ctio

n de

dis

pers

ion

indi

vidu

elle

Distance

Courbealpha > 0alpha < 0

α > 0 : accélération de la dispersion ; α < 0 : ralentissement.

Page 22: Claude Bernard University Lyon 1 - Modélisation et estimation de …math.univ-lyon1.fr/~jberard/resume-Grimaud.pdf · 2006-04-20 · Modélisation et estimation de la dispersion

Etude en milieu hétérogène

➩ Fonction de dispersion individuelle pour une plante émettrice située en (0, 0) :

γ(0,0)(x, y) =

fNIG(x, y; θ) si (x, y) ∈ D1

0 si (x, y) ∈ D2

fNIG(x − α1,iD0,x, y − α2,iD0,y; θ) si (x, y) ∈ D3 ∩ Si

➩ Estimation des paramètres par quasi-vraisemblance.

Page 23: Claude Bernard University Lyon 1 - Modélisation et estimation de …math.univ-lyon1.fr/~jberard/resume-Grimaud.pdf · 2006-04-20 · Modélisation et estimation de la dispersion

Etude en milieu hétérogène

➩ Conclusion : la discontinuité a un effet d’ accélération sur la dispersion dupollen dans les deux cas : trèfle et tournesol.

➩ Courbes des fonctions de dispersion individuelles dans le cas du trèfle

Dans le sens du vent dominant dans le sens opposé au vent dominant

50 60 70 80 90 100 1100

0.002

0.004

0.006

0.008

0.01

0.012

0.014

0.016

0.018

Distance par rapport à laplante émettrice

Fon

ctio

n de

dis

pers

ion

indi

vidu

elle

NIGNIG "translatée"

50 60 70 80 90 100 1101.5

2

2.5

3

3.5

4

4.5

5x 10

−3

Distance par rapport à lap lante émettrice

Fon

ctio

n de

dis

pers

ion

indi

vidu

elle

NIGNIG "translatée"

Page 24: Claude Bernard University Lyon 1 - Modélisation et estimation de …math.univ-lyon1.fr/~jberard/resume-Grimaud.pdf · 2006-04-20 · Modélisation et estimation de la dispersion

Conclusions

➩ Modélisation et analyse statistique pour étudier la dispersion non isotrope dupollen de maïs (valable pour toute autre espèce anémophile).

➩ Quand deux champs sont contigus :Modélisation de la trajectoire à l’aide de processus de diffusion, permettantde réaliser des prédictions.

➩ Quand deux champs sont séparés par une autre culture :le modèle NIG "translatée" : effet d’accélération sur la dispersion quelque soitla culture.

Page 25: Claude Bernard University Lyon 1 - Modélisation et estimation de …math.univ-lyon1.fr/~jberard/resume-Grimaud.pdf · 2006-04-20 · Modélisation et estimation de la dispersion

Perspectives

➩ Quand deux champs sont contigus :intégrer les résultats obtenus au logiciel MAPOD.

➩ Quand deux champs sont séparés par une autre culture :- Nécessité d’avoir plus d’expériences. (Projet SIGMEA)- Envisager des expériences simultanées : milieu homogène/milieu hétéro-gène pour mieux étudier les différences de comportements.