LA DATATION MOLÉCULAIRE DE LA PHYLOGÉNIE DES...

45
LA DATATION MOLÉCULAIRE DE LA PHYLOGÉNIE DES EUCARYOTES : UNE HISTOIRE D'HORLOGES, DE FOSSILES ET DE GÉNOMES. Emmanuel J. P. DOUZERY Institut des Sciences de l'Evolution de Montpellier (ISE-M) Université Montpellier II UE ADAPHYL "Adaptation & Phylogénie" Banyuls - 10 mai 2010 http://www.isem.cnrs.fr/spip.php?rubrique380&lang=en

Transcript of LA DATATION MOLÉCULAIRE DE LA PHYLOGÉNIE DES...

LA DATATION MOLÉCULAIREDE LA PHYLOGÉNIE DES EUCARYOTES :

UNE HISTOIRE D'HORLOGES,DE FOSSILES ET DE GÉNOMES.

Emmanuel J. P. DOUZERY

Institut des Sciences de l'Evolution de Montpellier (ISE-M) Université Montpellier II

UE ADAPHYL "Adaptation & Phylogénie"Banyuls - 10 mai 2010

http://www.isem.cnrs.fr/spip.php?rubrique380&lang=en

1. QU'EST CE QUE L'HORLOGE MOLÉCULAIRE ?

2. POURQUOI DATERLES ÉVÉNEMENTS DE SPÉCIATION ?

La datation moléculaire en 6 questions…

4. COMMENT MARIER GÉNOMES ET FOSSILESPOUR UNE DATATION MOLÉCULAIRE ?

5. QUELS SONT LES ÉCUEILSQUI LIMITENT LA FIABILITÉ DES DATATIONS ?

3. COMMENT EXTRAIRE L'INFORMATIONDE DATATION À PARTIR DES PHYLOGÉNIES ?

6. QUELS ENSEIGNEMENTS TIRER DE LA DATATIONDE L'HISTOIRE ÉVOLUTIVE DES EUCARYOTES ?

1. QU'EST CE QUE L'HORLOGE MOLÉCULAIRE ?

La datation moléculaire en 6 questions…

Les biomolécules

constituent

une machine

à remonter

le temps.

ALIGNEMENT DE L'α-GLOBINE CHEZ 6 VERTÉBRÉS(vache, homme, ornithorhynque, poulet, carpe, requin)

L'HORLOGE MOLÉCULAIRE GLOBALE :LE CAS DE L'α-GLOBINE

0 100 200 300 400 500

Age de l'ancêtre commun (Ma)

vache

ornithorhynque

poulet

carperequin

homme

0

0.2

0.4

0.6

0.8

1.0

0

0.2

0.4

0.6

0.8

1.0

0 100 200 300 400 500

Age de l'ancêtre commun (Ma)

Nombre desubstitutions

d'acidesaminés / site

vache / homme

ornithorhynque poulet

carpe

requin

L'HORLOGE MOLÉCULAIRE GLOBALE :LE CAS DE L'α-GLOBINE

Pente = 0.81 / 450= 1,8 . 10-3 subs./site/Ma

COMPARAISON POULET / ALLIGATOR

K = 41 / 144 = 0.28Horloge = 1,8 . 10-3 subs./site/Ma

D'où la divergence Oiseaux / Crocodiles : 0.28 / 1,8 . 10-3 = 155 Ma

1. QU'EST CE QUE L'HORLOGE MOLÉCULAIRE ?

2. POURQUOI DATERLES ÉVÉNEMENTS DE SPÉCIATION ?

La datation moléculaire en 6 questions…

[Avise & Johns 1999]40 30 20 10 0 Ma

Drosophiles(13 espèces

d'un seul genre)

Primates7 espèces

de diversesfamilles

Cichlidés(14 espècesen 9 genres)

Harmonisation de la taxonomie de groupes distinctsgrâce à l'établissement d'un cadre temporel de référence.

UN SUPERARBREDES ANGIOSPERMES

(379 familles)

[Jones et al. 2004]

Taux de diversification :- faibles ;- élevés.

* : nœuds àforte asymétrie

de richesse spécifique

Compréhension des modalités de diversificationdes espèces au cours du temps.

1. QU'EST CE QUE L'HORLOGE MOLÉCULAIRE ?

2. POURQUOI DATERLES ÉVÉNEMENTS DE SPÉCIATION ?

La datation moléculaire en 6 questions…

3. COMMENT EXTRAIRE L'INFORMATIONDE DATATION À PARTIR DES PHYLOGÉNIES ?

Taux desubstitution r

A G

C T

rGTrAC

rAG

rCT

rATrCG

Fréquencesen bases π

Fréq

uenc

es

A C G TAPPROCHES

PROBABILISTES :Modèles d'évolution

des séquences

2N - 3Longueurs

de branches

LB

Vraisemblance

0 0,005 0,01 0,015 0,02 0,025 0,03 0,035 0,04

-6296

-6294

-6292

-6290

-6288

-6286

-6284

-6282

QUANTITÉ D'ÉVOLUTION : Branche (Bi) =Taux d'évolution (Ri) x Temps (ΔTi)

Un arbre phylogénétique=

une topologie+

des longueurs de branches

i

A

B

C

D

E

F

Echelle :1 changement évolutif

En supposant la constance de R(hypothèse d'horloge moléculaire),

nous en déduisons que :

ΔTi = Bi / RABSOLU

0.1 substitution par site

(= 10 %)

Branche (Bi)Taux d'évolution (Ri) x Temps (ΔTi)

i

A

B

C

D

E

F

1. Taux LENT = 0.1 % / Ma Temps important : 100 Ma

2. Taux RAPIDE = 1 % / Ma Temps plus court : 10 Ma

Gène X

ArbreML

DATATION AVEC HORLOGE MOLÉCULAIRE

ArbreML

avec horloge

Calibrationfossile

Estimationsdes âges

1. QU'EST CE QUE L'HORLOGE MOLÉCULAIRE ?

2. POURQUOI DATERLES ÉVÉNEMENTS DE SPÉCIATION ?

La datation moléculaire en 6 questions…

4. COMMENT MARIER GÉNOMES ET FOSSILESPOUR UNE DATATION MOLÉCULAIRE ?

3. COMMENT EXTRAIRE L'INFORMATIONDE DATATION À PARTIR DES PHYLOGÉNIES ?

A B C0

x

y

z

t A/B

[Benton 2009]

Distribution de probabilité de l'âge d'origine d'un clade.

Courbelogistique

Des fossiles plus ancienspeuvent être découverts…

*

*

0

x

y

z

LES PROBLÈMES POSÉSPAR LE REGISTRE FOSSILE

DES PREMIERS EUCARYOTES.

1. Distinction délicate entre Procaryotes / Eucaryotes :les 1ers seraient petits, et les 2nds plus grands ;

2. Difficultés d'interprétation du faitdu peu de différenciation morphologique.

1 µ

PICO-EUCARYOTES

EUCARYOTESTANDARD

Euglène

BACTÉRIE

Il existe des eucaryotes aussi petits que des bactéries !

Epulopiscium est unedes plus grandes bactéries

connues : 500 µ !

106 foisplus

volumineusequ'E. coli

[Angert et al. 1993]

Il existe des bactéries aussi grosses que des eucaryotes !

[Javaux et al. 2001]

1 500 Ma(Australie)

ACRITARCHES[EUCARYOTES D’AFFINITÉSÉVOLUTIVES INCERTAINES]

Protistes avec une architecture cytosquelettique

35 µ

Hallucigenia

EXPLOSION CAMBRIENNEDES ANIMAUX

505 Ma(Burgess, CA)

Diversification dite explosiveau début de l'ère primaire.Trilobites

Eponges

Annélides

Chordés

1. QU'EST CE QUE L'HORLOGE MOLÉCULAIRE ?

2. POURQUOI DATERLES ÉVÉNEMENTS DE SPÉCIATION ?

La datation moléculaire en 6 questions…

4. COMMENT MARIER GÉNOMES ET FOSSILESPOUR UNE DATATION MOLÉCULAIRE ?

5. QUELS SONT LES ÉCUEILSQUI LIMITENT LA FIABILITÉ DES DATATIONS ?

3. COMMENT EXTRAIRE L'INFORMATIONDE DATATION À PARTIR DES PHYLOGÉNIES ?

Gène X

ArbreML

ArbreML

avec horloge

Taux plus lent,âges plusprofonds

L'ERREUR PALÉONTOLOGIQUE

Une autrecalibration

fossile

Gène Y

Longueursde branchesdifférentes

Arbreavec

horloge

Tauxdifférent,

âges différents

L'ERREUR STOCHASTIQUE

Calibrationfossileinitiale

Gène Z

Longueursde branchesdifférentes

Distorsionde l'arbre

avec horloge

Tauxdifférent,

âges différents

L'ABSENCE D'HORLOGE

Calibrationfossileinitiale

Heritabilitédes taux

Les taux d'évolution varientgraduellement le long des branches

Lent RapideTaux

LES HORLOGES MOLÉCULAIRES RELÂCHÉES

Auto-corrélation des taux d'évolutionde branches en branches

rrP

[Kishino, Thorne & Bruno 2001]

3 % / Ma

4 % / Ma 5 % / Ma

5 % / Ma7 % / Ma 10 % / Ma

Ages

APPROCHE BAYÉSIENNEPOUR L'HORLOGE MOLÉCULAIRE RELÂCHÉE

Chaîne stationnaireEchantillonnage de 9 000 valeurs

µ = 11,0 Ma ± 2,1Intervalle de crédibilité à 95% = 7,5 - 15,9 Ma

MCMC

1. QU'EST CE QUE L'HORLOGE MOLÉCULAIRE ?

2. POURQUOI DATERLES ÉVÉNEMENTS DE SPÉCIATION ?

La datation moléculaire en 6 questions…

4. COMMENT MARIER GÉNOMES ET FOSSILESPOUR UNE DATATION MOLÉCULAIRE ?

5. QUELS SONT LES ÉCUEILSQUI LIMITENT LA FIABILITÉ DES DATATIONS ?

3. COMMENT EXTRAIRE L'INFORMATIONDE DATATION À PARTIR DES PHYLOGÉNIES ?

6. QUELS ENSEIGNEMENTS TIRER DE LA DATATIONDE L'HISTOIRE ÉVOLUTIVE DES EUCARYOTES ?

LES ÂGES DE LA VIE DES BILATÉRIENS(Divergence Protostomiens / Deutérostomiens)

540Ma

Wray et al.(1996)

1 200 Ma

Aris-Brosou & Yang(2002, 2003)

582 Ma

656-573 MaPeterson et al.

(2004)

Lynch(1999)

630 Ma

Ayala et al.(1998)

736-670 Ma

850-730 MaFeng et al. (1997)

Gu(1998)

830 Ma

Wang et al.(1999)

993 Ma

1 000 MaHedges et al.

(2004)

700-579 MaPeterson & Butterfield (2005)

> 586 MaBromham & Hendy

(2000)

Blair et al. (2005)

1166-1074 Ma

x 2

≠ caractères moléculairesADN mt ADN nuc Acides aminés

≠ marqueurs moléculaires chez ≠ espèces4 6 19 39 73 105 151 protéines

≠ méthodesHorloge globale Horloges relâchées

≠ calibrations paléontologiquesMammifères / Oiseaux à 310 ± 0 Ma

≠ niveaux de calibrationPrimaires (fossiles) / Secondaires (moléculaires)

≠ topologiesProtostomes versus Coelomates

1. RÉDUIRE LES ERREURS STOCHASTIQUES !

Utilisation d’un grand nombre de protéines

2. RÉDUIRE LES ERREURS PHYLOGÉNÉTIQUES !

Utilisation d’un grand nombre d’espèces

3. RÉDUIRE LES ERREURS PALÉONTOLOGIQUES !

Utilisation de multiples intervalles de calibration.

4. RÉDUIRE LES ERREURS DE DATATION ! Utilisation d’horloges protéiques relâchées

par approche bayésienne

COMMENT AMÉLIORER LA DATATION MOLÉCULAIREDE L'HISTOIRE DES EUCARYOTES ?

129 protéines30 399 sites 0.1

Choanoflagellés

StraménopilesCiliophoraCryptosporidiumSarcocystidaePiroplasmidaPlasmodium

ALVÉOLÉS

Dictyostelium

ANIMAUX(BILATÉRIENS)

[Philippe et al. 2004]

RhodophytaChlorophytaBryophytaLiliopsidaArabidopsis

PLANTES

BasidiomycètesSchizosaccharomycesSordarialesSaccharomycesCandida

FUNGI

ChelicerataDrosophilaLepidopteraHymenopteraPlathelminthesTrichocephalidaStrongyloididaTylenchidaSpiruridaAscarididaDiplogasteridaCaenorhabditis

PROTOSTOMES

LeishmaniaTrypanosoma bruceiTrypanosoma cruzi

KINÉTOPLASTIDÉS

UrochordataActinopterygiiMammalia

DEUTEROSTOMES

100Mya

RhodophytaChlorophytaBryophytaLiliopsidaArabidopsisLeishmaniaTrypanosoma bruceiTrypanosoma cruziStramenopilesCiliophoraCryptosporidiumSarcocystidaePiroplasmidaPlasmodiumBasidiomycetesSchizosaccharomycesSordarialesSaccharomycesCandidaChoanoflagellatesUrochordataActinopterygiiMammaliaChelicerataDrosophilaLepidopteraHymenopteraPlatyhelminthesTrichocephalidaStrongyloididaTylenchidaSpiruridaAscarididaDiplogasteridaCaenorhabditis

PLANTS

KINETOPLASTIDS

ALVEOLATES

FUNGI

ANIMALS

DEUTEROSTOMES

PROTOSTOMESHorloge moléculairebayésienne relâchée.

849 ± 50

695 ± 30

984 ± 65

1085 ± 79

625 ± 20

727 ± 53

729 ± 38928 ± 60

1010 ± 69

872 ± 60

LATEMIDDLE IIIIIIPROTEROZOIC PHANEROZOIC [Douzery et al. 2004]

CONCLUSIONS

L'horloge moléculaire bayésiennerelâchée sur 129 protéines :

réduit l'écart entre les estimations

paléontologiques et moléculaires

pour les âges des grands groupes eucaryotes ;

démontre l'importance de la prise en compte

des variations des taux d'évolution ;

souligne la nécessité d'un échantillonnage

taxonomique et génétique conséquent.

Avril 2006

Fossile basal« stem »

Fossileterminal

« couronne »

Les choanoflagellés

LE GROUPE ÉTUDIÉLes animaux

ORIGINE

DIVERSIFICATION

Taxonéteint †

QU'EST-CE QUE L'ÂGE D'UN TAXON ?

Ann. Arth.Moll. Chor.

LE PLUSPROCHE PARENT

Temps

RhodophytaChlorophytaBryophytaLiliopsidaArabidopsisLeishmaniaTrypanosoma bruceiTrypanosoma cruziStraménopilesCiliophoraCryptosporidiumSarcocystidaePiroplasmidaPlasmodiumBasidiomycètesSchizosaccharomycesSordarialesSaccharomycesCandidaChoanoflagellésUrochordataActinopterygiiMammaliaChelicerataDrosophilaLepidopteraHymenopteraPlathelminthesTrichocephalidaStrongyloididaTylenchidaSpiruridaAscarididaDiplogasteridaCaenorhabditis

PLANTES

FUNGI

DEUTEROSTOMES

PROTOSTOMES

ALVÉOLÉS

KINÉTOPLASTIDÉS

ANIMAUX(BILATÉRIENS)

HORLOGES :lnL SANS = -779 283lnL AVEC = -783 020PLRT < 0.0001 [Douzery et al. 2004]

δ = AX - BX

A

BC

X

R

δ = AC - BCVitesse A ≠ Vitesse B

si : δ / σ > 1.96

EVALUER L'HORLOGE : LE TEST DU TAUX RELATIF

Ratio des taux

% derejet

du tauxconstant

100 pb

200

400700

2 kb3 kb

90%

1 kb