Présentation du sujet de thèse Génétique des populations ...

22
Pr´ esentation du sujet de th` ese en´ etique des populations et processus de coalescence Linglong Yuan Ecole Doctorale Galil´ ee Villetaneuse, 25 juin 2010 Linglong Yuan () en´ etique des populations et coalescence 25 juillet 2010 1/5

Transcript of Présentation du sujet de thèse Génétique des populations ...

Page 1: Présentation du sujet de thèse Génétique des populations ...

Presentation du sujet de theseGenetique des populations

et processus de coalescence

Linglong Yuan

Ecole Doctorale Galilee

Villetaneuse, 25 juin 2010

Linglong Yuan () Genetique des populations et coalescence 25 juillet 2010 1 / 5

Page 2: Présentation du sujet de thèse Génétique des populations ...

Presentation

Formation :2009-2010 : Polytechnique-Paris 6, Paris. Quatrieme annee du Cycle Polytechnicien : Master de« Probabilites et Modeles Aleatoires ».Cours importants suivis :Mouvement brownien et calcul stochastique ; Processus de Markov ;Theoremes Limites et GrandesDeviations ; Processus de Levy ; Modelisation stochastique de populations ; Modeles probabilistesen neurosciences ; Temps locaux, excursions, et points multiples du mouvement brownien plan ;Equations aux derivees partielles stochastiques ;2006-2009 : Trois premieres annees du Cycle Polytechnicien. Specialite : Ingenierie mathematiquepour la finance et les systemes ecologiques.Cours importants suivis :Modeles stochastiques en finance ; Theorie des jeux ; Reseau de communication, Algorithmes etProbabilites ; promenade aleatoire ; statistique ; microeconomie, macroeconomie ; Simulationstochastique et methodes de Monte-Carlo ; Processus et estimation ; Modele aleatoire en ecologieet evolution.2003-2006 Tong Ji University, Chine (Departement de Statistiques)Experience de recherche04/2010-06/2010 : Stage de recherche M2 avec M. Jean-Stephane Dhersin : Comportementasymptotique de la longueur d’une branche externe de certains processus de coalescence.05/2009-09/2009 : Stage de recherche au Japon : Continuous version of Real Business CycleModel : Deterministic and Stochastic modeling, Ritsumeikan University.09/2008-12/2008 : Projet de finance :Modele a volatilite stochastique, Polytechnique05/2007-06/2007 : Projet sur marche aleatoire avec exclusion simple.

Linglong Yuan () Genetique des populations et coalescence 25 juillet 2010 2 / 5

Page 3: Présentation du sujet de thèse Génétique des populations ...

Processus de Cannings et processus de coalescence

��������

����

����

temps0 1 2 3 4 5 6 7

����

����

����

����

����

����

����

Processus de Cannings (1974) : ν(r)i = nombre de descendants de l’individu i de la generation r .

Taille de population constante : ν(r)1 + ν

(r)2 + · · ·+ ν

(r)N = N.

Echangeabilite : pour toute permutation s ∈ SN , (ν(r)s(1)

, ν(r)s(2)

, . . . , ν(r)s(N)

)d= (ν

(r)1 , ν

(r)2 , . . . , ν

(r)N ).

Homogeneite : la loi de (ν(r)1 , ν

(r)2 , . . . , ν

(r)N ) ne depend pas de r .

Linglong Yuan () Genetique des populations et coalescence 25 juillet 2010 3 / 5

Page 4: Présentation du sujet de thèse Génétique des populations ...

Processus de Cannings et processus de coalescence

��������

����

����

temps0 1 2 3 4 5 6 7

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

Processus de Cannings (1974) : ν(r)i = nombre de descendants de l’individu i de la generation r .

Taille de population constante : ν(r)1 + ν

(r)2 + · · ·+ ν

(r)N = N.

Echangeabilite : pour toute permutation s ∈ SN , (ν(r)s(1)

, ν(r)s(2)

, . . . , ν(r)s(N)

)d= (ν

(r)1 , ν

(r)2 , . . . , ν

(r)N ).

Homogeneite : la loi de (ν(r)1 , ν

(r)2 , . . . , ν

(r)N ) ne depend pas de r .

Linglong Yuan () Genetique des populations et coalescence 25 juillet 2010 3 / 5

Page 5: Présentation du sujet de thèse Génétique des populations ...

Processus de Cannings et processus de coalescence

��������

����

����

temps0 1 2 3 4 5 6 7

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

Processus de Cannings (1974) : ν(r)i = nombre de descendants de l’individu i de la generation r .

Taille de population constante : ν(r)1 + ν

(r)2 + · · ·+ ν

(r)N = N.

Echangeabilite : pour toute permutation s ∈ SN , (ν(r)s(1)

, ν(r)s(2)

, . . . , ν(r)s(N)

)d= (ν

(r)1 , ν

(r)2 , . . . , ν

(r)N ).

Homogeneite : la loi de (ν(r)1 , ν

(r)2 , . . . , ν

(r)N ) ne depend pas de r .

Linglong Yuan () Genetique des populations et coalescence 25 juillet 2010 3 / 5

Page 6: Présentation du sujet de thèse Génétique des populations ...

Processus de Cannings et processus de coalescence

��������

����

����

temps0 1 2 3 4 5 6 7

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

Processus de Cannings (1974) : ν(r)i = nombre de descendants de l’individu i de la generation r .

Taille de population constante : ν(r)1 + ν

(r)2 + · · ·+ ν

(r)N = N.

Echangeabilite : pour toute permutation s ∈ SN , (ν(r)s(1)

, ν(r)s(2)

, . . . , ν(r)s(N)

)d= (ν

(r)1 , ν

(r)2 , . . . , ν

(r)N ).

Homogeneite : la loi de (ν(r)1 , ν

(r)2 , . . . , ν

(r)N ) ne depend pas de r .

Linglong Yuan () Genetique des populations et coalescence 25 juillet 2010 3 / 5

Page 7: Présentation du sujet de thèse Génétique des populations ...

Processus de Cannings et processus de coalescence

��������

����

����

temps0 1 2 3 4 5 6 7

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

Processus de Cannings (1974) : ν(r)i = nombre de descendants de l’individu i de la generation r .

Taille de population constante : ν(r)1 + ν

(r)2 + · · ·+ ν

(r)N = N.

Echangeabilite : pour toute permutation s ∈ SN , (ν(r)s(1)

, ν(r)s(2)

, . . . , ν(r)s(N)

)d= (ν

(r)1 , ν

(r)2 , . . . , ν

(r)N ).

Homogeneite : la loi de (ν(r)1 , ν

(r)2 , . . . , ν

(r)N ) ne depend pas de r .

Linglong Yuan () Genetique des populations et coalescence 25 juillet 2010 3 / 5

Page 8: Présentation du sujet de thèse Génétique des populations ...

Processus de Cannings et processus de coalescence

��������

����

����

temps0 1 2 3 4 5 6 7

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

Processus de Cannings (1974) : ν(r)i = nombre de descendants de l’individu i de la generation r .

Taille de population constante : ν(r)1 + ν

(r)2 + · · ·+ ν

(r)N = N.

Echangeabilite : pour toute permutation s ∈ SN , (ν(r)s(1)

, ν(r)s(2)

, . . . , ν(r)s(N)

)d= (ν

(r)1 , ν

(r)2 , . . . , ν

(r)N ).

Homogeneite : la loi de (ν(r)1 , ν

(r)2 , . . . , ν

(r)N ) ne depend pas de r .

Linglong Yuan () Genetique des populations et coalescence 25 juillet 2010 3 / 5

Page 9: Présentation du sujet de thèse Génétique des populations ...

Processus de Cannings et processus de coalescence

��������

����

����

temps0 1 2 3 4 5 6 7

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

Processus de Cannings (1974) : ν(r)i = nombre de descendants de l’individu i de la generation r .

Taille de population constante : ν(r)1 + ν

(r)2 + · · ·+ ν

(r)N = N.

Echangeabilite : pour toute permutation s ∈ SN , (ν(r)s(1)

, ν(r)s(2)

, . . . , ν(r)s(N)

)d= (ν

(r)1 , ν

(r)2 , . . . , ν

(r)N ).

Homogeneite : la loi de (ν(r)1 , ν

(r)2 , . . . , ν

(r)N ) ne depend pas de r .

Linglong Yuan () Genetique des populations et coalescence 25 juillet 2010 3 / 5

Page 10: Présentation du sujet de thèse Génétique des populations ...

Processus de Cannings et processus de coalescence

��������

����

����

temps0 1 2 3 4 5 6 7

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

Processus de Cannings (1974) : ν(r)i = nombre de descendants de l’individu i de la generation r .

Taille de population constante : ν(r)1 + ν

(r)2 + · · ·+ ν

(r)N = N.

Echangeabilite : pour toute permutation s ∈ SN , (ν(r)s(1)

, ν(r)s(2)

, . . . , ν(r)s(N)

)d= (ν

(r)1 , ν

(r)2 , . . . , ν

(r)N ).

Homogeneite : la loi de (ν(r)1 , ν

(r)2 , . . . , ν

(r)N ) ne depend pas de r .

Linglong Yuan () Genetique des populations et coalescence 25 juillet 2010 3 / 5

Page 11: Présentation du sujet de thèse Génétique des populations ...

Processus de Cannings et processus de coalescence

��������

����

����

0 1 2 3 4 5 6 7

1

2

3

4

5

temps

0

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

Processus de Cannings (1974) : ν(r)i = nombre de descendants de l’individu i de la generation r .

Taille de population constante : ν(r)1 + ν

(r)2 + · · ·+ ν

(r)N = N.

Echangeabilite : pour toute permutation s ∈ SN , (ν(r)s(1)

, ν(r)s(2)

, . . . , ν(r)s(N)

)d= (ν

(r)1 , ν

(r)2 , . . . , ν

(r)N ).

Homogeneite : la loi de (ν(r)1 , ν

(r)2 , . . . , ν

(r)N ) ne depend pas de r .

Linglong Yuan () Genetique des populations et coalescence 25 juillet 2010 3 / 5

Page 12: Présentation du sujet de thèse Génétique des populations ...

Processus de Cannings et processus de coalescence

��������

����

����

0 1 2 3 4 5 6 7

1

2

3

4

5

temps

01

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

Processus de Cannings (1974) : ν(r)i = nombre de descendants de l’individu i de la generation r .

Taille de population constante : ν(r)1 + ν

(r)2 + · · ·+ ν

(r)N = N.

Echangeabilite : pour toute permutation s ∈ SN , (ν(r)s(1)

, ν(r)s(2)

, . . . , ν(r)s(N)

)d= (ν

(r)1 , ν

(r)2 , . . . , ν

(r)N ).

Homogeneite : la loi de (ν(r)1 , ν

(r)2 , . . . , ν

(r)N ) ne depend pas de r .

Linglong Yuan () Genetique des populations et coalescence 25 juillet 2010 3 / 5

Page 13: Présentation du sujet de thèse Génétique des populations ...

Processus de Cannings et processus de coalescence

��������

����

����

0 1 2 3 4 5 6 7

1

2

3

4

5

temps

012

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

Processus de Cannings (1974) : ν(r)i = nombre de descendants de l’individu i de la generation r .

Taille de population constante : ν(r)1 + ν

(r)2 + · · ·+ ν

(r)N = N.

Echangeabilite : pour toute permutation s ∈ SN , (ν(r)s(1)

, ν(r)s(2)

, . . . , ν(r)s(N)

)d= (ν

(r)1 , ν

(r)2 , . . . , ν

(r)N ).

Homogeneite : la loi de (ν(r)1 , ν

(r)2 , . . . , ν

(r)N ) ne depend pas de r .

Linglong Yuan () Genetique des populations et coalescence 25 juillet 2010 3 / 5

Page 14: Présentation du sujet de thèse Génétique des populations ...

Processus de Cannings et processus de coalescence

��������

����

����

0 1 2 3 4 5 6 7

1

2

3

4

5

temps

0123

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

Processus de Cannings (1974) : ν(r)i = nombre de descendants de l’individu i de la generation r .

Taille de population constante : ν(r)1 + ν

(r)2 + · · ·+ ν

(r)N = N.

Echangeabilite : pour toute permutation s ∈ SN , (ν(r)s(1)

, ν(r)s(2)

, . . . , ν(r)s(N)

)d= (ν

(r)1 , ν

(r)2 , . . . , ν

(r)N ).

Homogeneite : la loi de (ν(r)1 , ν

(r)2 , . . . , ν

(r)N ) ne depend pas de r .

Linglong Yuan () Genetique des populations et coalescence 25 juillet 2010 3 / 5

Page 15: Présentation du sujet de thèse Génétique des populations ...

Processus de Cannings et processus de coalescence

��������

����

����

0 1 2 3 4 5 6 7

1

2

3

4

5

temps

01234

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

Processus de Cannings (1974) : ν(r)i = nombre de descendants de l’individu i de la generation r .

Taille de population constante : ν(r)1 + ν

(r)2 + · · ·+ ν

(r)N = N.

Echangeabilite : pour toute permutation s ∈ SN , (ν(r)s(1)

, ν(r)s(2)

, . . . , ν(r)s(N)

)d= (ν

(r)1 , ν

(r)2 , . . . , ν

(r)N ).

Homogeneite : la loi de (ν(r)1 , ν

(r)2 , . . . , ν

(r)N ) ne depend pas de r .

Linglong Yuan () Genetique des populations et coalescence 25 juillet 2010 3 / 5

Page 16: Présentation du sujet de thèse Génétique des populations ...

Processus de Cannings et processus de coalescence

��������

����

����

0 1 2 3 4 5 6 7

1

2

3

4

5

temps

012345

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

Processus de Cannings (1974) : ν(r)i = nombre de descendants de l’individu i de la generation r .

Taille de population constante : ν(r)1 + ν

(r)2 + · · ·+ ν

(r)N = N.

Echangeabilite : pour toute permutation s ∈ SN , (ν(r)s(1)

, ν(r)s(2)

, . . . , ν(r)s(N)

)d= (ν

(r)1 , ν

(r)2 , . . . , ν

(r)N ).

Homogeneite : la loi de (ν(r)1 , ν

(r)2 , . . . , ν

(r)N ) ne depend pas de r .

Linglong Yuan () Genetique des populations et coalescence 25 juillet 2010 3 / 5

Page 17: Présentation du sujet de thèse Génétique des populations ...

Processus de Cannings et processus de coalescence

��������

����

����

0 1 2 3 4 5 6 7

1

2

3

4

5

temps

012345

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

Coalescent limite :

Coalescent de Kingman (1981) : coalescences simples.

Λ-coalescent (Pitman, 1999, Sagitov, 1999) : coalescences multiples non simultanees.

Ξ-coalescent : (Schweinsberg 2000, Mohle et Sagitov 2001) : coalescences multiplessimultanees.

Linglong Yuan () Genetique des populations et coalescence 25 juillet 2010 3 / 5

Page 18: Présentation du sujet de thèse Génétique des populations ...

Processus de Cannings et processus de coalescence

��������

����

����

0 1 2 3 4 5 6 7

1

2

3

4

5

temps

012345

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

X

X

Coalescent limite :

Coalescent de Kingman (1981) : coalescences simples.

Λ-coalescent (Pitman, 1999, Sagitov, 1999) : coalescences multiples non simultanees.

Ξ-coalescent : (Schweinsberg 2000, Mohle et Sagitov 2001) : coalescences multiplessimultanees.

Linglong Yuan () Genetique des populations et coalescence 25 juillet 2010 3 / 5

Page 19: Présentation du sujet de thèse Génétique des populations ...

Processus de Cannings et processus de coalescence

��������

����

����

0 1 2 3 4 5 6 7

1

2

3

4

5

temps

012345

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

����

X

X

Coalescent limite :

Coalescent de Kingman (1981) : coalescences simples.

Λ-coalescent (Pitman, 1999, Sagitov, 1999) : coalescences multiples non simultanees.

Ξ-coalescent : (Schweinsberg 2000, Mohle et Sagitov 2001) : coalescences multiplessimultanees.

Linglong Yuan () Genetique des populations et coalescence 25 juillet 2010 3 / 5

Page 20: Présentation du sujet de thèse Génétique des populations ...

Branche externe

Certaines caracteristiques del’arbre de coalescence sontd’un interet majeur. L’uned’elle est la longueur d’unebranche externe.

X

X

Theoreme (Caliebe et al. 2007)

On note Zn la longueur d’une branche externe d’un n-coalescent de Kingman. Alors nZn convergeen loi vers une variable aleatoire Z = 2W /(1−W ), ou W est une variable aleatoire de densite8/(2 + x)3 sur [0, 1].

Proposition

On a une majoration de la vitesse de convergence :

supx∈[0,1]

|P(nZn ≤ x)− P(Z ≤ x)| ≤15

n1/7·

1cm D’autres resultats de convergence de la suite nZn sont connus dans le cas de certains Λ-coalescents (Gnedin et al. 2008, Freund et Mohle 2010).

Linglong Yuan () Genetique des populations et coalescence 25 juillet 2010 4 / 5

Page 21: Présentation du sujet de thèse Génétique des populations ...

Branche externe

Certaines caracteristiques del’arbre de coalescence sontd’un interet majeur. L’uned’elle est la longueur d’unebranche externe.

X

X

Theoreme (Caliebe et al. 2007)

On note Zn la longueur d’une branche externe d’un n-coalescent de Kingman. Alors nZn convergeen loi vers une variable aleatoire Z = 2W /(1−W ), ou W est une variable aleatoire de densite8/(2 + x)3 sur [0, 1].

D’autres resultats de convergence de la suite nZn sont connus dans le cas de certains Λ-coalescents(Gnedin et al. 2008, Freund et Mohle 2010).

Linglong Yuan () Genetique des populations et coalescence 25 juillet 2010 4 / 5

Page 22: Présentation du sujet de thèse Génétique des populations ...

Deroulement de la these : etude de certaines caracteristiques des processusde coalescence.

1reetape :

Extension de la convergence en loi de la longueur d’une branche externe dans le cas desΛ-coalescents generaux, et des Ξ-coalescents.

Etude des vitesses de convergence.

Utilisation de ces resultats pour determiner le type de coalescent adapte a une population apartir de donnees reelles.

2eetape : Etude d’autres caracteristiques statiques (longueur totale, nombre d’enfants du PlusRecent Ancetre Commun, . . . )

3eetape : Etude de l’evolution dynamique de l’arbre des genealogies au cours du temps. Dans lecas Kingman, de nombreuses choses sont connues (Pfaffelhuber et Wakolbinger 2006,Pfaffelhuber, Wakolbinger, et Weisshaupt 2009, Delmas, Dhersin et Siri-Jegousse 2010). La suitedu deroulement de la these sera consacree a l’etude de l’evolution de l’arbre des genealogies dansle cas des Λ-coalescents.

Linglong Yuan () Genetique des populations et coalescence 25 juillet 2010 5 / 5