Novembre 2009Phylogénétique1 Les nouvelles preuves de lévolution: y accéder en classe PO 422.
-
Upload
dieudonne-froment -
Category
Documents
-
view
105 -
download
3
Embed Size (px)
Transcript of Novembre 2009Phylogénétique1 Les nouvelles preuves de lévolution: y accéder en classe PO 422.

Novembre 2009Phylogénétique 1
Les nouvelles preuves de l’évolution: y accéder en
classePO 422

Novembre 2009Phylogénétique 2
Phylogénie
Etude des relations de parenté entre espèces.
Une analyse phylogénétique permet d’estimer (modéliser) les relations évolutives qui existent entre les espèces grâce à un arbre: qui a un ancêtre commun - qui est le cousin de qui ?

Novembre 2009Phylogénétique 3
http://www.unige.ch/450/expositions/genome/presentation/slogans.html

Novembre 2009Phylogénétique 4
Il est possible de construire un arbre phylogénétique à partir de différents types de données:
– Les données morphologiques (écailles ou plumes, présence de certains os du crâne, forme des feuilles…). Il existe quelques centaines de caractères définis dans ce but par les spécialistes.
– Les caractères physiologiques (température corporelle…)

Novembre 2009Phylogénétique 5

Novembre 2009Phylogénétique 6
Il est possible de construire un arbre phylogénétique à partir de différents types de données:
– les données morphologiques (écailles ou plumes, présence de certains os du crâne,, forme des feuilles…). Il existe quelques centaines de caractères définis dans ce but par les spécialistes.
– Les caractères physiologiques (température corporelle…)
Mais aussi….
– L’ordre des gènes (par exemple sur l’ADN des mitochondries)– les données moléculaires (séquences d’ADN ou de protéines). Des
mutations modifient les séquences de l’ADN et par conséquent des protéines au cours de l’évolution.
– toutes les données existantes….(défi scientifique !)

Novembre 2009Phylogénétique 7
http://tecfa.unige.ch/perso/lombardf/calvin/images/restricted/index.php?op=5&path=evolution&file=cytochrome-divers-org.jpg
Cytochrome C

Novembre 2009Phylogénétique 8
Comment construire des arbres phylogénétiques sur la
base des séquences des protéines…

Novembre 2009Phylogénétique 9
Actin-related protein 2
ARP2_A MESAP---IVLDNGTGFVKVGYAKDNFPRFQFPSIVGRPILRAEEKTGNVQIKDVMVGDEARP2_B MDSQGRKVIVVDNGTGFVKCGYAGTNFPAHIFPSMVGRPIVRSTQRVGNIEIKDLMVGEEARP2_C MDSQGRKVVVCDNGTGFVKCGYAGSNFPEHIFPALVGRPIIRSTTKVGNIEIKDLMVGDEARP2_D MDSQGRKVVVCDNGTGFVKCGYAGSNFPEHIFPALVGRPIIRSTTKVGNIEIKDLMVGDEARP2_E MDSKGRNVIVCDNGTGFVKCGYAGSNFPTHIFPSMVGRPMIRAVNKIGDIEVKDLMVGDE *:* :* ******** *** *** . **::****::*: . *::::**:***:*
Les différentes espèces sont:Caenorhabditis briggsaeDrosophila melanogasterHomo sapiensMus musculusSchizosaccharomyces pombe
Quelle séquence ‘appartient’ à quelle espèce ?
?

Novembre 2009Phylogénétique 10
• ARP2_A MESAP---IVLDNGTGFVKVGYAKDNFPRFQFPSIVGRPILRAEEKTGNVQIKDVMVGDE• ARP2_B MDSQGRKVIVVDNGTGFVKCGYAGTNFPAHIFPSMVGRPIVRSTQRVGNIEIKDLMVGEE• *:* **:******** *** *** . ***:*****:*: :..**::***:***:*
• ARP2_B MDSQGRKVIVVDNGTGFVKCGYAGTNFPAHIFPSMVGRPIVRSTQRVGNIEIKDLMVGEE• ARP2_C MDSQGRKVVVCDNGTGFVKCGYAGSNFPEHIFPALVGRPIIRSTTKVGNIEIKDLMVGDE• ********:* *************:*** ****::*****:*** .************:*
• ARP2_C MDSQGRKVVVCDNGTGFVKCGYAGSNFPEHIFPALVGRPIIRSTTKVGNIEIKDLMVGDE• ARP2_D MDSQGRKVVVCDNGTGFVKCGYAGSNFPEHIFPALVGRPIIRSTTKVGNIEIKDLMVGDE• ************************************************************
• ARP2_D MDSQGRKVVVCDNGTGFVKCGYAGSNFPEHIFPALVGRPIIRSTTKVGNIEIKDLMVGDE• ARP2_E MDSKGRNVIVCDNGTGFVKCGYAGSNFPTHIFPSMVGRPMIRAVNKIGDIEVKDLMVGDE• ***:**:*:******************* ****::****:**:..*:*:**:********
• ARP2_A MESAP---IVLDNGTGFVKVGYAKDNFPRFQFPSIVGRPILRAEEKTGNVQIKDVMVGDE• ARP2_C MDSQGRKVVVCDNGTGFVKCGYAGSNFPEHIFPALVGRPIIRSTTKVGNIEIKDLMVGDE• *:* :* ******** *** .*** . **::*****:*: *.**::***:*****
• ARP2_D MDSQGRKVVVCDNGTGFVKCGYAGSNFPEHIFPALVGRPIIRSTTKVGNIEIKDLMVGDE• ARP2_B MDSQGRKVIVVDNGTGFVKCGYAGTNFPAHIFPSMVGRPIVRSTQRVGNIEIKDLMVGEE• ********:* *************:*** ****::*****:*** .************:*

Novembre 2009Phylogénétique 11
• PhiloPhylo ‘kit tout en 1’, mais avec un choix limité de protéines au départ…
http://education.expasy.org/philophylo
• www.uniprot.org: banques de données de protéines (encyclopédie) contenant des informations biologiques et les séquences en acides aminés.
• www.phylogeny.fr

Novembre 2009Phylogénétique 12
Le principe
• 1. Sélection: set de séquences de protéines ‘homologues’
• 2. Comparaison: alignement multiple
• 3. Construction de l’arbre: ‘calculer les différences’

Novembre 2009Phylogénétique 13
Le principe
• Sélection: set de séquences de protéines ‘homologues’
• Comparaison: alignement multiple• Construction de l’arbre: ‘calculer
les différences’

Novembre 2009Phylogénétique 14
PhiloPhylo

Novembre 2009Phylogénétique 15
www.uniprot.org
• ‘query’ par nom de protéines ou nom de gènesUtiliser http://www.uniprot.org/Exemples:
http://education.expasy.org/cours/FLO/Liste_prot_evol.html
• Blast Utiliser h
ttp://www.expasy.org/tools/blast/ou le Blast@UniProt

Novembre 2009Phylogénétique 16
Scénario 5: www.uniprot.org

Novembre 2009Phylogénétique 18
Protein and gene nameS
www.uniprot.org/ query FOLH1

Novembre 2009Phylogénétique 19
Liste de protéines ‘candidats’http://education.expasy.org/cours/FLO/Liste_prot_evol.html

Novembre 2009Phylogénétique 20
Le principe
• Sélection: set de séquences de protéines ‘homologues’
• Comparaison: alignement multiple• Construction de l’arbre: ‘calculer
les différences’

Novembre 2009Phylogénétique 21
PhiloPhylo

Novembre 2009Phylogénétique 22
Alignement multiple des séquences en acides aminés de l’insuline de différentes espèces
www.uniprot.org (query ‘insulin’, align)

Novembre 2009Phylogénétique 23
http://www.unige.ch/450/expositions/genome/presentation/slogans.html

Novembre 2009Phylogénétique 24
• Les mutations dans l’ADN peuvent être dûes à– Des erreurs lors de la réplication de l’ADN– Des agents chimiques ou physiques (fumée de cigarette, UV,…)– Des virus
• Les conséquences des mutations peuvent être des changements ‘mineurs’ (changement d’un acide aminé pour un autre) ou majeurs (duplication de gènes, délétion d’un bout de chromosomes, …)
• Chez les mammifères, à chaque génération, il se produit en moyenne quelques dizaines de mutations dans le génome de chaque individu.
– Si ces mutations se trouvent dans l’ADN des cellules sexuelles, elles seront transmises à la descendance.
– La dérive génétique (‘genetic drift’) et/ou la sélection naturelle (favorisant la sélection des individus avec des mutations qui augmentent les chances de reproduction et de survie dans un environnement donné) fixeront les mutations dans une population puis une espèce donnée.

Novembre 2009Phylogénétique 25
http://www3.interscience.wiley.com/cgi-bin/fulltext/117981248/HTMLSTART
(i) FR1• The FRIGIDA (FR1) gene has been shown to be a major determinant of flowering time in
Arabidopsis thaliana. A majority of early-flowering ecotypes shows one or two deletions that generate a frameshift in the FR1 open reading frame (ORF), suggesting that this phenotype has arisen at least twice. Le Corre, Roux & Reboud (2002) performed a population analysis on different ecotypes and confirmed that the loss of function mutations was associated with an early-flowering phenotype, these gene inactivations systematically evolved in a non-neutral fashion. Moreover, they confirmed that the gene inactivation was phenotypically linked to an early flowering ecotype adaptated to cold environments (Johanson et al., 2000; Le Corre et al., 2002). This represents a strong indication that environmental change has driven this genetic change.
(ii) CCR5• This primate transmembrane receptor is a cellular gateway for the entry of HIV-1 and all
strains of SIV. Human homozygotes for the CCR5 null allele which has a 32 base pair (bp) deletion are highly resistant to HIV-1 infection. Another null allele (24 bp deletion) of CCR5 has convergently evolved in sooty mangabeys (Cercocebus atys), a natural host of SIV. The occurrence of the mangabey null allele at an appreciable frequency (around 4%) could be explained by positive selection; null homozygotes are protected from SIV infection because the encoded protein is not transported to the cell surface (Palacios et al., 1998). The null allele has been shown to be positively selected in humans (Galvani & Novembre, 2005). However, the exact nature of the selective pressure involved in the origin of the CCR5-{delta} 32 allele and its high prevalence in European populations (approximately 10%) is unclear as the HIV epidemic in humans is much more recent than the age of the null allele (about 700 years). However, both HIV and poxviruses enter leukocytes using chemokine receptors; it is plausible that the loss of the CCR5 chemokine receptor originally conferred resistance against smallpox. This hypothesis is supported by a correlation between historical smallpox epidemics and allele geographic distribution (Galvani & Slatkin, 2003).

Novembre 2009Phylogénétique 26
Hélice alpha
Hélice alpha
Peptide signal
On ne peut pas ‘muter’ n’importe quoi….

Novembre 2009Phylogénétique 27
Propriétés physico-chimiques des différents acides aminés
NQ
DE
R
K
F
HW
YM
I LV T
S
AG
CP Hydrophilic
NH2
OHTiny
Hydrophobic
Aliphatic
Aromatic
PositiveNegative
Charged

Novembre 2009Phylogénétique 29
Les gènes (et les protéines) évoluent à des vitesses différentes
L’histone H4 n’a accumulé que 2 mutations ‘conservatives’ en 1.5 milliard d’années

Novembre 2009Phylogénétique 30
Une protéine qui a évolué extrêmement rapidement: l’involucrin (une protéine de la peau): 10 % de changements en l’espace de 4 millions d’années (séparation des chimpanzés et de l’homme)
Les gènes (et les protéines) évoluent à des vitesses différentes

Novembre 2009Phylogénétique 31
Le principe
• Sélection: set de séquences de protéines ‘homologues’
• Comparaison: alignement multiple• Construction de l’arbre: ‘calculer
les différences’

Novembre 2009Phylogénétique 32
• Un arbre phylogénétique est un modèle qui décrit les relations entre des unités taxonomiques

Novembre 2009Phylogénétique 33
Le résultat dépend de la protéine utilisée pour construire l’arbre….et le résultat ne correspond pas toujours à l’’arbre des espèces’…

Novembre 2009Phylogénétique 34
www.phylogeny.fr
• Introduire le set de séquences sélectionnées à www.uniprot.org (format ‘fasta’)
• Utiliser les paramètres par défaut (‘one’ click)

Novembre 2009Phylogénétique 35
www.phylogeny.fr

Novembre 2009Phylogénétique 36
Cladogramme obtenu à partir de l’analyse phylogénétique de l’alignement multiple des séquences d’insuline
www.phylogeny.fr
Le résultat dépend de la protéine utilisée pour construire l’arbre….et le résultat ne correspond pas toujours à l’’arbre des espèces’…

Novembre 2009Phylogénétique 37
Les différents types d’arbres (1)

Novembre 2009Phylogénétique 38
Arbres (cladogrammes)
BA
Roots
Internal nodes
C D E F G BA C D E F GEnd nodes
Branches

Novembre 2009Phylogénétique 39
Peabody museum exhibition on the Tree of Life http://www.peabody.yale.edu/exhibits/treeoflife/

Combien d’arbres différents ?

Novembre 2009Phylogénétique 41
Les différents types d’arbres (2)

Arbres phylogénétiques
• Cladogramme
• PhylogrammeLa longueur des branches est proportionnelle aux différences. Cette longueur n’est pas toujours facile à interpréter ! Elle dépend entre autre de la vitesse d’évolution…(nombres de variations par site dans un laps de temps donné)
Qui est le cousin de qui ?

Novembre 2009Phylogénétique 43
Exemple de cladogramme obtenu à partir de l’analyse bioinformatique de l’alignement multiple des séquences d’insuline- Qui est le cousin de qui ? Qui a un ancêtre commun ?
www.phylogeny.fr

Exemple de phylogramme obtenu à partir de l’analyse bioinformatique de l’alignement multiple des séquences d’insuline- Quelle protéine a évolué plus rapidement ?
Le temps qui s’écoule….
Echelle: ‘expected number of changes
per site’

Novembre 2009Phylogénétique 45
Exemple de phylogramme obtenu à partir de l’analyse bioinformatique de l’alignement multiple des séquences d’insuline
Probabilité que l’arbre ait la bonne configuration à chaque embranchement
(> 0.95: OK)
Le temps qui s’écoule….
L’insuline de la carpe a ‘évolué’ (moins de
changements dans sa séquences en acides
aminés) moins rapidement que
l’insuline des autres espèces…

Novembre 2009Phylogénétique 46
Les embranchements
• Spéciation• Duplication de gènes

Novembre 2009Phylogénétique 47
Human gene A
Mouse gene B
Mouse gene A
Human gene B
Frog gene A
Frog gene B
Drosophila gene AB
Orthologs
Orthologs
Paralogs
Homologs
Gene duplication
Ancestral gene
Spéciation et duplication de gène
speciation
speciation
speciation
speciation

Novembre 2009Phylogénétique 48
Spéciation et duplication de gène
Duplication ins1 – ins 2
Spéciation rat - souris

Novembre 2009Phylogénétique 49
"Ce qui n'est pas entouré d'incertitudes ne peut pas être la vérité » R. Feynmann

Novembre 2009Phylogénétique 50
A vous de jouer…

Novembre 2009Phylogénétique 51
Ressources taxonomiques

Novembre 2009Phylogénétique 52
http://www.ncbi.nlm.nih.gov/guide/taxonomy/

Novembre 2009Phylogénétique 53http://www.uniprot.org/taxonomy/

Novembre 2009Phylogénétique 54
Animal Diversity Web (ADW)
http://animaldiversity.ummz.umich.edu/site/index.html

Novembre 2009Phylogénétique 55
Perspectives et applications

Novembre 2009Phylogénétique 56
Les mitochondries et chloroplastes sont d’origine bactérienne ‘endosymbiotique’
http://education.expasy.org/cours/FLO/Liste_prot_evol.html
Facteur d’élongation

Novembre 2009Phylogénétique 57
Autres projets
- ~200 protéines universelles - Arbre ‘global’
Applications- métagénomes (identifications de nouvelles espèces, de nouveaux gènes (20 mo), de nouveaux enzymes….)-1ml d’eau de mer: 1 million de bactéries et 10 million de virus (C.Venter).- découvertes de nouvelles bactéries (la moitié de la biomasse)
- médecine: identification de nouveaux pathogènes.

Novembre 2009Phylogénétique 58
Références
• http://www.unige.ch/presse/Campus/campus95.html

Novembre 2009Phylogénétique 59
Liste de gènes intéressants
‘Conceptual bases for quantifying the role of the environment on gene evolution: the participation of positive selection and neutral evolution’
http://www3.interscience.wiley.com/cgi-bin/fulltext/117981248/HTMLSTART

Novembre 2009Phylogénétique 60
http://www3.interscience.wiley.com/cgi-bin/fulltext/117981248/HTMLSTART
(i) FR1• The FRIGIDA (FR1) gene has been shown to be a major determinant of flowering time in
Arabidopsis thaliana. A majority of early-flowering ecotypes shows one or two deletions that generate a frameshift in the FR1 open reading frame (ORF), suggesting that this phenotype has arisen at least twice. Le Corre, Roux & Reboud (2002) performed a population analysis on different ecotypes and confirmed that the loss of function mutations was associated with an early-flowering phenotype, these gene inactivations systematically evolved in a non-neutral fashion. Moreover, they confirmed that the gene inactivation was phenotypically linked to an early flowering ecotype adaptated to cold environments (Johanson et al., 2000; Le Corre et al., 2002). This represents a strong indication that environmental change has driven this genetic change.
(ii) CCR5• This primate transmembrane receptor is a cellular gateway for the entry of HIV-1 and all
strains of SIV. Human homozygotes for the CCR5 null allele which has a 32 base pair (bp) deletion are highly resistant to HIV-1 infection. Another null allele (24 bp deletion) of CCR5 has convergently evolved in sooty mangabeys (Cercocebus atys), a natural host of SIV. The occurrence of the mangabey null allele at an appreciable frequency (around 4%) could be explained by positive selection; null homozygotes are protected from SIV infection because the encoded protein is not transported to the cell surface (Palacios et al., 1998). The null allele has been shown to be positively selected in humans (Galvani & Novembre, 2005). However, the exact nature of the selective pressure involved in the origin of the CCR5-{delta} 32 allele and its high prevalence in European populations (approximately 10%) is unclear as the HIV epidemic in humans is much more recent than the age of the null allele (about 700 years). However, both HIV and poxviruses enter leukocytes using chemokine receptors; it is plausible that the loss of the CCR5 chemokine receptor originally conferred resistance against smallpox. This hypothesis is supported by a correlation between historical smallpox epidemics and allele geographic distribution (Galvani & Slatkin, 2003).

Novembre 2009Phylogénétique 61
Exemple de gènes / protéines
• http://education.expasy.org/cours/FLO/Liste_prot_evol.html

Novembre 2009Phylogénétique 62
Divers
- Simulation par ordinateur: avec 2 mécanismes, le hasard et la sélection, l’informaticien Karl Sim a généré une complexité fascinante: http://www.archive.org/details/sims_evolved_virtual_creatures_1994

Novembre 2009Phylogénétique 63
Phylogenetic servers
• http://www.phylogeny.fr/ • http://bioweb.pasteur.fr/seqanal/phylogeny/intro-uk.htm
l• http://atgc.lirmm.fr/phyml/• http://phylobench.vital-it.ch/raxml-bb/• http://power.nhri.org.tw/power/home.htm

Novembre 2009Phylogénétique 64
Un ancêtre commun

Novembre 2009Phylogénétique 65
La construction d’arbre phylogénétique ne serait pas
possible …
sans la notion d’ancêtre commun…
Les espèces ne sont pas immuables, mais issues d’autres espèces et peuvent elles-mêmes
donner naissance à de nouvelles. La sélection naturelle est opportuniste et ne poursuit aucun
but à long terme.
Jean-Baptiste de Lamarck et Charles Darwin

Novembre 2009Phylogénétique 66
• Cette notion d’ancêtre commun a été confirmée – par la découverte de l’ADN et du code
génétique ‘quasi universel’* que se partagent tous les organismes vivants.
*http://www.ncbi.nlm.nih.gov/Taxonomy/Utils/wprintgc.cgi?mode=c
– par la découverte de gènes très conservés entre les espèces (exemples: gène ‘engrailed’, histone H4, ARN ribosomal) et de gènes ‘universels’ (~200).
http://education.expasy.org/cours/FLO/Liste_prot_evol.html

Novembre 2009Phylogénétique 67
Peabody museum exhibition on the Tree of Life http://www.peabody.yale.edu/exhibits/treeoflife/

Novembre 2009Phylogénétique 68
LUCA: Last Universal Common Ancestor
LUCA est la ‘racine’ de l’arbre de la vie, mais probablement pas le premier organisme unicellulaire vivant. Il devait être déjà complexe et donc le résultat d’un long processus d’évolution

Novembre 2009Phylogénétique 69
Peabody museum exhibition on the Tree of Life http://www.peabody.yale.edu/exhibits/treeoflife/

Novembre 2009Phylogénétique 70
http://www.peabody.yale.edu/exhibits/treeoflife/challenge.html

Novembre 2009Phylogénétique 71http://www.sciencedaily.com/releases/2009/11/091104132706.htm