LA DATATION MOLÉCULAIRE DE LA PHYLOGÉNIE DES...
Embed Size (px)
Transcript of LA DATATION MOLÉCULAIRE DE LA PHYLOGÉNIE DES...

LA DATATION MOLÉCULAIREDE LA PHYLOGÉNIE DES EUCARYOTES :
UNE HISTOIRE D'HORLOGES,DE FOSSILES ET DE GÉNOMES.
Emmanuel J. P. DOUZERY
Institut des Sciences de l'Evolution de Montpellier (ISE-M) Université Montpellier II
UE ADAPHYL "Adaptation & Phylogénie"Banyuls - 10 mai 2010
http://www.isem.cnrs.fr/spip.php?rubrique380&lang=en

1. QU'EST CE QUE L'HORLOGE MOLÉCULAIRE ?
2. POURQUOI DATERLES ÉVÉNEMENTS DE SPÉCIATION ?
La datation moléculaire en 6 questions…
4. COMMENT MARIER GÉNOMES ET FOSSILESPOUR UNE DATATION MOLÉCULAIRE ?
5. QUELS SONT LES ÉCUEILSQUI LIMITENT LA FIABILITÉ DES DATATIONS ?
3. COMMENT EXTRAIRE L'INFORMATIONDE DATATION À PARTIR DES PHYLOGÉNIES ?
6. QUELS ENSEIGNEMENTS TIRER DE LA DATATIONDE L'HISTOIRE ÉVOLUTIVE DES EUCARYOTES ?

1. QU'EST CE QUE L'HORLOGE MOLÉCULAIRE ?
La datation moléculaire en 6 questions…

Les biomolécules
constituent
une machine
à remonter
le temps.

ALIGNEMENT DE L'α-GLOBINE CHEZ 6 VERTÉBRÉS(vache, homme, ornithorhynque, poulet, carpe, requin)

L'HORLOGE MOLÉCULAIRE GLOBALE :LE CAS DE L'α-GLOBINE
0 100 200 300 400 500
Age de l'ancêtre commun (Ma)
vache
ornithorhynque
poulet
carperequin
homme
0
0.2
0.4
0.6
0.8
1.0

0
0.2
0.4
0.6
0.8
1.0
0 100 200 300 400 500
Age de l'ancêtre commun (Ma)
Nombre desubstitutions
d'acidesaminés / site
vache / homme
ornithorhynque poulet
carpe
requin
L'HORLOGE MOLÉCULAIRE GLOBALE :LE CAS DE L'α-GLOBINE
Pente = 0.81 / 450= 1,8 . 10-3 subs./site/Ma

COMPARAISON POULET / ALLIGATOR
K = 41 / 144 = 0.28Horloge = 1,8 . 10-3 subs./site/Ma
D'où la divergence Oiseaux / Crocodiles : 0.28 / 1,8 . 10-3 = 155 Ma

1. QU'EST CE QUE L'HORLOGE MOLÉCULAIRE ?
2. POURQUOI DATERLES ÉVÉNEMENTS DE SPÉCIATION ?
La datation moléculaire en 6 questions…

[Avise & Johns 1999]40 30 20 10 0 Ma
Drosophiles(13 espèces
d'un seul genre)
Primates7 espèces
de diversesfamilles
Cichlidés(14 espècesen 9 genres)
Harmonisation de la taxonomie de groupes distinctsgrâce à l'établissement d'un cadre temporel de référence.

UN SUPERARBREDES ANGIOSPERMES
(379 familles)
[Jones et al. 2004]
Taux de diversification :- faibles ;- élevés.
* : nœuds àforte asymétrie
de richesse spécifique
Compréhension des modalités de diversificationdes espèces au cours du temps.

1. QU'EST CE QUE L'HORLOGE MOLÉCULAIRE ?
2. POURQUOI DATERLES ÉVÉNEMENTS DE SPÉCIATION ?
La datation moléculaire en 6 questions…
3. COMMENT EXTRAIRE L'INFORMATIONDE DATATION À PARTIR DES PHYLOGÉNIES ?

Taux desubstitution r
A G
C T
rGTrAC
rAG
rCT
rATrCG
Fréquencesen bases π
Fréq
uenc
es
A C G TAPPROCHES
PROBABILISTES :Modèles d'évolution
des séquences
2N - 3Longueurs
de branches
LB
Vraisemblance
0 0,005 0,01 0,015 0,02 0,025 0,03 0,035 0,04
-6296
-6294
-6292
-6290
-6288
-6286
-6284
-6282

QUANTITÉ D'ÉVOLUTION : Branche (Bi) =Taux d'évolution (Ri) x Temps (ΔTi)
Un arbre phylogénétique=
une topologie+
des longueurs de branches
i
A
B
C
D
E
F
Echelle :1 changement évolutif
En supposant la constance de R(hypothèse d'horloge moléculaire),
nous en déduisons que :
ΔTi = Bi / RABSOLU

0.1 substitution par site
(= 10 %)
Branche (Bi)Taux d'évolution (Ri) x Temps (ΔTi)
i
A
B
C
D
E
F
1. Taux LENT = 0.1 % / Ma Temps important : 100 Ma
2. Taux RAPIDE = 1 % / Ma Temps plus court : 10 Ma

Gène X
ArbreML
DATATION AVEC HORLOGE MOLÉCULAIRE
ArbreML
avec horloge
Calibrationfossile
Estimationsdes âges

1. QU'EST CE QUE L'HORLOGE MOLÉCULAIRE ?
2. POURQUOI DATERLES ÉVÉNEMENTS DE SPÉCIATION ?
La datation moléculaire en 6 questions…
4. COMMENT MARIER GÉNOMES ET FOSSILESPOUR UNE DATATION MOLÉCULAIRE ?
3. COMMENT EXTRAIRE L'INFORMATIONDE DATATION À PARTIR DES PHYLOGÉNIES ?

A B C0
x
y
z
t A/B

[Benton 2009]
Distribution de probabilité de l'âge d'origine d'un clade.
Courbelogistique
Des fossiles plus ancienspeuvent être découverts…
*
*
0
x
y
z

LES PROBLÈMES POSÉSPAR LE REGISTRE FOSSILE
DES PREMIERS EUCARYOTES.
1. Distinction délicate entre Procaryotes / Eucaryotes :les 1ers seraient petits, et les 2nds plus grands ;
2. Difficultés d'interprétation du faitdu peu de différenciation morphologique.

1 µ
PICO-EUCARYOTES
EUCARYOTESTANDARD
Euglène
BACTÉRIE
Il existe des eucaryotes aussi petits que des bactéries !

Epulopiscium est unedes plus grandes bactéries
connues : 500 µ !
106 foisplus
volumineusequ'E. coli
[Angert et al. 1993]
Il existe des bactéries aussi grosses que des eucaryotes !

[Javaux et al. 2001]
1 500 Ma(Australie)
ACRITARCHES[EUCARYOTES D’AFFINITÉSÉVOLUTIVES INCERTAINES]
Protistes avec une architecture cytosquelettique
35 µ

Hallucigenia
EXPLOSION CAMBRIENNEDES ANIMAUX
505 Ma(Burgess, CA)
Diversification dite explosiveau début de l'ère primaire.Trilobites
Eponges
Annélides
Chordés

1. QU'EST CE QUE L'HORLOGE MOLÉCULAIRE ?
2. POURQUOI DATERLES ÉVÉNEMENTS DE SPÉCIATION ?
La datation moléculaire en 6 questions…
4. COMMENT MARIER GÉNOMES ET FOSSILESPOUR UNE DATATION MOLÉCULAIRE ?
5. QUELS SONT LES ÉCUEILSQUI LIMITENT LA FIABILITÉ DES DATATIONS ?
3. COMMENT EXTRAIRE L'INFORMATIONDE DATATION À PARTIR DES PHYLOGÉNIES ?

Gène X
ArbreML
ArbreML
avec horloge
Taux plus lent,âges plusprofonds
L'ERREUR PALÉONTOLOGIQUE
Une autrecalibration
fossile

Gène Y
Longueursde branchesdifférentes
Arbreavec
horloge
Tauxdifférent,
âges différents
L'ERREUR STOCHASTIQUE
Calibrationfossileinitiale

Gène Z
Longueursde branchesdifférentes
Distorsionde l'arbre
avec horloge
Tauxdifférent,
âges différents
L'ABSENCE D'HORLOGE
Calibrationfossileinitiale

Heritabilitédes taux
Les taux d'évolution varientgraduellement le long des branches
Lent RapideTaux
LES HORLOGES MOLÉCULAIRES RELÂCHÉES

Auto-corrélation des taux d'évolutionde branches en branches
rrP
[Kishino, Thorne & Bruno 2001]
3 % / Ma
4 % / Ma 5 % / Ma
5 % / Ma7 % / Ma 10 % / Ma

Ages
APPROCHE BAYÉSIENNEPOUR L'HORLOGE MOLÉCULAIRE RELÂCHÉE
Chaîne stationnaireEchantillonnage de 9 000 valeurs
µ = 11,0 Ma ± 2,1Intervalle de crédibilité à 95% = 7,5 - 15,9 Ma
MCMC

1. QU'EST CE QUE L'HORLOGE MOLÉCULAIRE ?
2. POURQUOI DATERLES ÉVÉNEMENTS DE SPÉCIATION ?
La datation moléculaire en 6 questions…
4. COMMENT MARIER GÉNOMES ET FOSSILESPOUR UNE DATATION MOLÉCULAIRE ?
5. QUELS SONT LES ÉCUEILSQUI LIMITENT LA FIABILITÉ DES DATATIONS ?
3. COMMENT EXTRAIRE L'INFORMATIONDE DATATION À PARTIR DES PHYLOGÉNIES ?
6. QUELS ENSEIGNEMENTS TIRER DE LA DATATIONDE L'HISTOIRE ÉVOLUTIVE DES EUCARYOTES ?

LES ÂGES DE LA VIE DES BILATÉRIENS(Divergence Protostomiens / Deutérostomiens)
540Ma
Wray et al.(1996)
1 200 Ma
Aris-Brosou & Yang(2002, 2003)
582 Ma
656-573 MaPeterson et al.
(2004)
Lynch(1999)
630 Ma
Ayala et al.(1998)
736-670 Ma
850-730 MaFeng et al. (1997)
Gu(1998)
830 Ma
Wang et al.(1999)
993 Ma
1 000 MaHedges et al.
(2004)
700-579 MaPeterson & Butterfield (2005)
> 586 MaBromham & Hendy
(2000)
Blair et al. (2005)
1166-1074 Ma
x 2

≠ caractères moléculairesADN mt ADN nuc Acides aminés
≠ marqueurs moléculaires chez ≠ espèces4 6 19 39 73 105 151 protéines
≠ méthodesHorloge globale Horloges relâchées
≠ calibrations paléontologiquesMammifères / Oiseaux à 310 ± 0 Ma
≠ niveaux de calibrationPrimaires (fossiles) / Secondaires (moléculaires)
≠ topologiesProtostomes versus Coelomates

1. RÉDUIRE LES ERREURS STOCHASTIQUES !
Utilisation d’un grand nombre de protéines
2. RÉDUIRE LES ERREURS PHYLOGÉNÉTIQUES !
Utilisation d’un grand nombre d’espèces
3. RÉDUIRE LES ERREURS PALÉONTOLOGIQUES !
Utilisation de multiples intervalles de calibration.
4. RÉDUIRE LES ERREURS DE DATATION ! Utilisation d’horloges protéiques relâchées
par approche bayésienne
COMMENT AMÉLIORER LA DATATION MOLÉCULAIREDE L'HISTOIRE DES EUCARYOTES ?

129 protéines30 399 sites 0.1
Choanoflagellés
StraménopilesCiliophoraCryptosporidiumSarcocystidaePiroplasmidaPlasmodium
ALVÉOLÉS
Dictyostelium
ANIMAUX(BILATÉRIENS)
[Philippe et al. 2004]
RhodophytaChlorophytaBryophytaLiliopsidaArabidopsis
PLANTES
BasidiomycètesSchizosaccharomycesSordarialesSaccharomycesCandida
FUNGI
ChelicerataDrosophilaLepidopteraHymenopteraPlathelminthesTrichocephalidaStrongyloididaTylenchidaSpiruridaAscarididaDiplogasteridaCaenorhabditis
PROTOSTOMES
LeishmaniaTrypanosoma bruceiTrypanosoma cruzi
KINÉTOPLASTIDÉS
UrochordataActinopterygiiMammalia
DEUTEROSTOMES

100Mya
RhodophytaChlorophytaBryophytaLiliopsidaArabidopsisLeishmaniaTrypanosoma bruceiTrypanosoma cruziStramenopilesCiliophoraCryptosporidiumSarcocystidaePiroplasmidaPlasmodiumBasidiomycetesSchizosaccharomycesSordarialesSaccharomycesCandidaChoanoflagellatesUrochordataActinopterygiiMammaliaChelicerataDrosophilaLepidopteraHymenopteraPlatyhelminthesTrichocephalidaStrongyloididaTylenchidaSpiruridaAscarididaDiplogasteridaCaenorhabditis
PLANTS
KINETOPLASTIDS
ALVEOLATES
FUNGI
ANIMALS
DEUTEROSTOMES
PROTOSTOMESHorloge moléculairebayésienne relâchée.
849 ± 50
695 ± 30
984 ± 65
1085 ± 79
625 ± 20
727 ± 53
729 ± 38928 ± 60
1010 ± 69
872 ± 60
LATEMIDDLE IIIIIIPROTEROZOIC PHANEROZOIC [Douzery et al. 2004]

CONCLUSIONS
L'horloge moléculaire bayésiennerelâchée sur 129 protéines :
réduit l'écart entre les estimations
paléontologiques et moléculaires
pour les âges des grands groupes eucaryotes ;
démontre l'importance de la prise en compte
des variations des taux d'évolution ;
souligne la nécessité d'un échantillonnage
taxonomique et génétique conséquent.

Avril 2006



Fossile basal« stem »
Fossileterminal
« couronne »
Les choanoflagellés
LE GROUPE ÉTUDIÉLes animaux
ORIGINE
DIVERSIFICATION
Taxonéteint †
QU'EST-CE QUE L'ÂGE D'UN TAXON ?
Ann. Arth.Moll. Chor.
LE PLUSPROCHE PARENT
Temps

RhodophytaChlorophytaBryophytaLiliopsidaArabidopsisLeishmaniaTrypanosoma bruceiTrypanosoma cruziStraménopilesCiliophoraCryptosporidiumSarcocystidaePiroplasmidaPlasmodiumBasidiomycètesSchizosaccharomycesSordarialesSaccharomycesCandidaChoanoflagellésUrochordataActinopterygiiMammaliaChelicerataDrosophilaLepidopteraHymenopteraPlathelminthesTrichocephalidaStrongyloididaTylenchidaSpiruridaAscarididaDiplogasteridaCaenorhabditis
PLANTES
FUNGI
DEUTEROSTOMES
PROTOSTOMES
ALVÉOLÉS
KINÉTOPLASTIDÉS
ANIMAUX(BILATÉRIENS)
HORLOGES :lnL SANS = -779 283lnL AVEC = -783 020PLRT < 0.0001 [Douzery et al. 2004]

δ = AX - BX
A
BC
X
R
δ = AC - BCVitesse A ≠ Vitesse B
si : δ / σ > 1.96
EVALUER L'HORLOGE : LE TEST DU TAUX RELATIF

Ratio des taux
% derejet
du tauxconstant
100 pb
200
400700
2 kb3 kb
90%
1 kb