Influence de la structure des chromosomes sur lexpression des gènes.
Définition La génomique est létude des génomes, de leur organisation, et de leur évolution,...
-
Upload
augustin-abadie -
Category
Documents
-
view
105 -
download
0
Transcript of Définition La génomique est létude des génomes, de leur organisation, et de leur évolution,...
Définition
La génomique est l’étude des génomes, de leur organisation,et de leur évolution, ainsi que de l’expression et de la fonctiondes gènes.
Génome ancestral Génome Contemporain
Evolution des gènes ancestraux
temps
Addition de nouveaux gènes
Pertes de gènes
Différences qualitatives :changement dans la nature des gènes
Différences quantitatives :variations du nombre de gènes
Evolution des Génomes
Les génomes ne sont pas statiques
Mécanismes produisant des différences quantitatives :deux forces opposées
Augmentation du nombre de gènes
1. Création interne de novo• Duplication de gènes, de fragments chromosomiques ou de
génomes complets (polyploidie) 2. Apport extérieur
• Transfert horizontal
Pertes de gènes
1. Elimination des gènes « non nécessaires »• Adaptation à un nouveau mode de vie• Processus naturel de régulation des Génomes
Evolution des Génomes
Deux grandes approches nécessaires et complémentaires
Etude de l’évolution de chacun des gènes d’un génome
Basé sur le concept d’homologieAnalyse des évènements de duplication,Fusion et fission de gènesStructure/fonction des protéines
Phylogénie moléculaire
Etude de l’évolution d’un génomeEn tant que tel
Gain et perte de gènesSynténieContexte Génétique
Mise en évidence des forcesMotrices sous-jacentes aux Modes d’évolution des génomes
L’évolution moléculaire dans le contexte de la Génomique
Génomique comparativeDès que l’on a disposé de plusieurs génomes entièrement séquencés, on a eu envie de
les comparer : démarche classique en Recherche Fondamentale
Les applications :
aider à l’annotation en identifiant les régions fonctionnelles
identifier le jeu de gènes de chaque organisme
Comprendre les mécanismes de l’évolution moléculaire
comprendre les solutions trouvées par des organismes différentspour une même fonction
Caractériser les gènes de l’adaptationAmélioration des espèces domestiquées
Mesurer/appréhender la biodiversitéGestion, conservation des ecosystèmes
Reconstruire l’histoire des espèces
AAAAA
ExonIntro
n
ARN pré-message
r
ARN message
r
Protéine
Codon start Codon stop
chromosome
séquence structure fonctions
QuantificationexpressionADNcESTs
séquence
gèneposition
structureséquence
Motifs régulateurs
Que compare-t-on ?
Dynamique des génomes
Biochimie des organismes
Plasticité du génome
Ilôts de pathogénicité
Évolution moléculaire
Arbre du vivantDernier ancêtre
commun universel
transferts horizontaux
Évolution des protéines
Organisation des gènes
synténie
Voies métaboliques Systèmes d’information
Génomique comparative
Vue d'ensemble :• comparaison des données issues du séquençage de génomes d'organismes variés peut se faire à différents niveaux :
comparer les jeux de gènes (protéines) entre génomes informations sur la dynamique des génomes à courte et longue distance comparer les gènes (protéines) homologues entre eux au niveau de leur séquence notion de gènes paralogues et orthologues comparer la position des gènes et leur voisinage sur le chromosome
notion de synténie notion de contexte génétique
Incidence : informations sur les relations fonctionnelles, le métabolisme, la physiologie d'organismes peu ou pas étudiés mise en évidence de différents types de gènes : informationnel, opérationnel mise en évidence de phénomènes de transfert horizontal
1. Les différents types de gènes a. au niveau homologieb. au niveau fonctionnel
2. Acquisition et perte de gènesa. Duplicationb. Dégradation en pseudogènes
3. Conservation de l'ordre des gènesa. Mécanisme de rupture de la
synténieb. Contexte génétique : déduction
fonctionnelle
Les différents types de gènes homologues
A B
A B1 B2
A B1 B2 A’ B1’ B2’
Les gènes A et A’ sont des
GènesOrthologues
B1 et de B2 sont des
Gènes Paralogues
duplication interne du gène B et
divergence des deux copies
divergence par spéciation
espèce 1 espèce 2
espèce ancestrale
Les différents types de gènes homologues
• Deux gènes sont homologues s’ils ont divergé à partir d’une séquence ancêtre Commune
• Deux gènes sont orthologues si leur divergence est due à la spéciation
•Deux gènes sont paralogues si leur divergence est due à une duplication
• Donc 2 séquences sont ou ne sont pas homologues
•Dire que la protéine X a 80% d’homologie avec la protéine Y est donc incorrect :• les deux protéines présentent 80% d’identité (résidus identiques)• les deux protéines présentent 80% de similitude (résidus similaires)
• Recherche des relations de parentés entre les gènes appartenant à différents génomes• Deux types de comparaison menés en parallèle pour
constituer des familles de gènes homologues identifier les gènes uniques à chaque génome
Les différents types de gènes homologues
Comparaison interspécifique (orthologues) et intraspécifique (paralogues)
Comparaison intragénomique
familles de gènes paralogues
Comparaison intergénomique
familles de gènes orthologues
Dénombrement des gènes issus d'une duplication
ancestrale
Dénombrement des gènes présents dans l'ancêtre commun aux espèces
comparées
1
2
3
• Résultat obtenu au cours de comparaisons intergénomiques• Mode d'évolution différent selon les trois Domaines du Vivant
Les différents types de gènes
Comparaison au niveau fonctionnel
Gènes opérationnels
métabolisme
transport actif
grandes fonctions cellulaires
secrétion
Gènes informationnels
réplication
recombinaison
transcription
traduction
1. Les différents types de gènes a. au niveau homologieb. au niveau fonctionnel
2. Acquisition et perte de gènesa. Duplicationb. Dégradation en pseudogènes
3. Conservation de l'ordre des gènesa. Mécanisme de rupture de la
synténieb. Contexte génétique : déduction
fonctionnelle
Acquisition et perte de gènes : les grands mécanismes internes et externes
mécanismes internes d'acquisition de nouvelles fonctions : duplication de gènes et/ou fusion
duplication d’un gène puis divergence des copies par accumulation de
mutations
génomeancestral
apparition de fonctions plus spécialisées par évolution
progressive des copies de gènes dupliqués
apparition de nouvelles fonctions par évolution
progressive des produits de fusion de gènes voisins
fusion de deux gènes
voisins
Acquisition et perte de gènes : les grands mécanismes internes et externes
2. gène morcelé transcrit
3. gène morcelé non transcrit
4. gène très dégradé
5. disparition complète sous forme de région intergénique
1. gène (ORF) intact
mécanismes moléculaires de la conversion des gènes en pseudogènes
AtRH2330924-32477
ATPase39026-43607
ATPase38791-34264
AtRH1933516-31996 30674-28838 27833-26708 26071-24586
acetyltransferase 20390-17958
Région répétée
11461-15991
ATPase16434-16742 17945-19438
AtRH421978-25453
acetyltransferase
MDC16 Chr III
F20D21 Chr I
F28P22 Chr I
7857-9397 10299-11554 12386-13590 14209-15397 16772-18184 19507-21291 23369-23489 25725-28323 32062-34348 34758-36622 16434-16742 16434-16742 16434-16742
72698-71532 69661-65915 65071-62063 61582-57933 57259-53821 53392-51060 50484-48499 47823-45956
Flavonol synthase
Flavonol synthase
AtRH25 AtRH26
AtRH31
Pyruvate kinase
Pyruvate kinase
MBK5 ChrV
MAH20Chr V
Exemple de régions dupliquées (I)
34109-36965
AtRH1137422-38706 39260-41720 42524-42727 43007-43734 44381-47397 50600-53853 54367-57198 58779-61988 62247-64500 65062-68140 73898-76140 78337-79272 80664-86176
495-3857 4304-4986 6354-7079 8309-9343 9926-11934 12611-15034 23968-26160 27231-28888 29654-33791 43117-43650 51282-53363 53644-55821
AtRH52
AtRH37Protéine putative
Protéine putative
Protéine kinase
Protéine kinase
F14P22Chr III
F14N22Chr II
29417-31912 32343-33142 35068-38133 38938-40847 43698-41875 44143-44769 45520-47445 48638-50337 51356-53096 54129-57048 57318-58720 59207-60916 61922-63189
71435-70782 69945-68540 51633-48191 13738-11396 8965-7672 6586-487716087-15018 1550-241
6 gènes 10 gènes 1 gène 1 gène 1 gène
F4P13Chr III
T15N1Chr V
AtRH14
AtRH46
Protéineinconnue
Protéineinconnue
Protéineinconnue
Protéineinconnue
Protéineinconnue
Proteine C
Proteine C
Protéineinconnue
Protéineinconnue
Protéineinconnue
Protéineinconnue
Beta-1,4 Nacetylglucosaminyltransferase
Beta-1,4 Nacetylglucosaminyltransferase
Exemple de régions dupliquées (II)
Turmel, M., et al. Plant Cell 2003;15:1888-1903
Comparaison du génome mitochondrial de différents végétaux
1. Les différents types de gènes a. au niveau homologieb. au niveau fonctionnel
2. Acquisition et perte de gènesa. Duplicationb. Dégradation en pseudogènes
3. Conservation de l'ordre des gènesa. Mécanisme de rupture de la
synténieb. Contexte génétique : déduction
fonctionnelle
Synténie
Une région observée chez deux organismes est dite synthénique lorsqu’elle n’a pas subi de réarrangement depuis l’ancêtre commun de ces deux organismes
Espèce 1
Espèce 2
Rupture de la synténie
GèneDuplicationsTranslocationsInsertionsDélétions InversionsFusionsReliques
ChromosomeDuplicationsTranslocationsInsertionsDélétions InversionsFusions
Génomeduplication
Rupture de la synténie
Contexte génétique
Problèmes de voisinage
Conservation de l'ordre de certains gènes malgré la rupture de la synténie Maintien strict de relations de voisinage pour certaines associations de gènes Notion de contexte génétique
Gènes ayant une régulation commune de leur expression
Gènes codant des protéines ayant des relations fonctionnelles cruciales
If two genes (blue and yellow in the figure) are found to be neighbours in several different genomes, a functional linkage may be inferred between the proteins they encode.The method is most robust for microbial genomes but may work to some extent even for human genes where operon-like clusters are observed
Modèle de travail
Eisenberg et al, 2000, Nature 405:823
Contexte génétique
Le voisinage peut indiquer un lien fonctionnel
plasticité des génomes
Un équilibre résultant de la neutralisation réciproque de forces motrices antagonistes
Fluidité
rupture de synténie par mouvement
incessant des gènes
Rigidité
certains gènes ne peuvent être séparés :
contexte génétique
Apport de gènes par duplication
Perte programmée de gènes
Apport de gènes et rupture de synténie
Chez les végétaux
Les génomes végétaux disponibles
45 génomes dont 5 complets
Les Angiospermes
• Plantes à fleurs• Domestication - ~200 espèces - Principale source de nourriture et de fibre pour l’homme• 2 sous-classes - dicotylédone (Fleurs)
Génome modèle : Arabidopsis thaliana - monocotylédone (Herbes, céréales)
Génome modèle : Oriza sativa
•Séparation : ~170-235 Ma
Le génome d’Arabidopsis thaliana
• 25498 gènes - ~5,2 exons/gènes• tRNA - 589 cytoplasmiques - 27 organelles - 13 pseudogènes• snRNA (small nuclear) - constituent la machinerie d’épissage - 10 à 16 copies• snoRNA (small nucleolar) - modification des ARNr et ARNsn dans le nucléole - 36 gènes
• Duplications segmentales : 6303 gènes• Gènes dupliqués en tandem : 4140 gènes
• 17% des gènes • 1528 groupes jusqu’à 23 membres
Les familles de gènes
Les duplications segmentales
• 24 blocs dupliqués > 100 kb65,6 Mb (58% du génome)+ réarrangements locaux
• Ancêtre tétraploïde ? Evènement ayant eu lieu : 112 Ma
Exemple d’une duplication
Les génomes du riz
• 2 sous-espèces japonica et indica
• 12 chromosomes
• 57000 à 62500 gènes
• Taille des exons et nombre similaires à ceux d’A. thaliana
• Taille des introns 3,6 fois plus grand
Synténie Indica/Japonica (chromosome IV°
Comparaison des gènomes monocotylédone/dicotylédone
Répertoire des gènes
• Transcriptome (en 2004)
- A. thaliana : 30078 gènes 80 à 85% des protéines homologues à celles du riz les gènes sans similarité sont notés comme putatifs
- O. sativa : 32277 à 62500 gènes 43,7% à 63% de protéines homologues avec celles d’Arabidopsis problème d’annotation, les éléments transposables sont annotés comme des gènes
• Identité ~49,5%
Organisation Génomique
• Pas de synténie monocot/dicot :chez les vertébrés, conservation de la synténie sur des 100ainesde millions d’années
• Polyploidisation suivi de perte aléatoire et rapide des gènes en double exemplaire
• Taille des génomes varie d’un facteur 1000• A. thaliana 125 Mb, Riz 400 Mb, maïs 2500 Mb, Orge 5000 Mb• Blé (héxaploïde) 16000 Mb
Et les génomes non séquencés ?
Utilisation des génomes modèles
Conservation de la synthénie chez les graminées
Hybridations in situ de chromosomes en métaphase et interphase de différentes espèces
Heslop-Harrison,J. S. Plant Cell 2000;12:617-636
L’origine de la fleur
A+ E
sépale
A+ B + E
pétale
A+ C + E
étamine
C + E
carpel
L’origine de la fleur
L’origine de la fleur
Génome " minimal " dépendant
ne contient que les gènes contemporains codant les
fonctions nécessaires
perte programmée de gènes
État homéostatique où gain et perte de gènes s'équilibrent
gènes contemporains codant de nombreuses
fonctions variées et sophistiquées
Génome multipotent
autosuffisant
acquisition de gènes
évolutio
n des gèn
es ance
straux
évolution des génomes
Génome ancestralgènes ancestraux codant
quelques fonctions primordiales
Notion de génome minimal
• Concept Rechercher le jeu de gènes minimal permettant une vie autonome permettrait de se représenter le contenu génétique des premiers organismes ancestraux
• Premières approches expérimentales génomique comparative des premiers petits génomes séquencés (H. influenzae et M. genitalium) biais car pathogènes n’ont pas de vie autonome
256 gènes prédits analyse expérimentale sur M. genitalium 265-350 gènes indispensables analyse expérimentale sur H. influenzae 259 gènes indispensables cas récent de B. subtilis (4200 gènes), un organisme capable de mener une réelle vie autonome environ 300 gènes seulement seraient essentiels
• Donc, grande convergence !!
Approches conceptuelle et expérimentale
Le riz – génome pivot