Les propriétés physicochimiques de l’ADN Structure des...
Transcript of Les propriétés physicochimiques de l’ADN Structure des...
Cours de Biologie MoléculaireL2S3
Structure de l’ADNOrganisation des génomes
2ème cours (1h30)
Les propriétés physicochimiques de l’ADNStructure des génomes
La chromatine
L’ADN est chargé négativement
• Electrophorèse sur gel d’acrylamide
L’ADN absorbe la lumière à 260nm (UV)Le chauffage des solutions d'ADN produit une augmentation d'absorbance à 260 nm. Ce phénomène correspond à la dénaturation de l’ADN bicaténaire en 2 brins d’ADN monocaténaires, d’ou le doublement de densité optique.
On peut caractériser la température de fusion de l’ADN notée Tm qui correspond à la température à la moitiédu phénomène. simple brin
double brin
Les brins d’ADN s’hybrident• Hybridation = Association spontanée, spécifique et
réversible de deux brins d’ADN complémentaires (formant des paires WC)
• L’hybridation est : – spécifique : une séquence d’ADN monobrin ne peut s’apparier
qu’à la séquence qui lui est complémentaire dans le génome. – réversible : En jouant sur les conditions expérimentales
(température) on peut entrainer ou briser (dissociation) l’hybridation de deux molécules d’ADN.
• Ce passage se visualise en mesurant la DO à 260 nm.
T > Tm T = Tm T < Tm
Organisation des génomes
Définition du mot génome
Ensemble de l’information héréditaire d’un organisme, présente en totalité dans chaque cellule de l’organisme
Organisation des génomes
Définition du mot génome
Ensemble de l’information héréditaire d’un organisme, présente en totalité dans chaque cellule de l’organisme
Taille- Quelques dizaines de milliers de bases pour le génome d’un virus
- Quelques millions de bases pour une bactérie- 3 milliards de bases pour le génome humain -16 milliards de bases pour le génome du blé
Organisation des génomes
Définition du mot génome
Ensemble de l’information héréditaire d’un organisme, présente en totalité dans chaque cellule de l’organisme
Taille- Quelques dizaines de milliers de bases pour le génome d’un virus
- Quelques millions de bases pour une bactérie- 3 milliards de bases pour le génome humain -16 milliards de bases pour le génome du blé
Les individus d’espèces différentes ont des génomes différents par leur taille, l’ordre et la nature des informations qu’ils contiennent.
Par contre 2 individus de la même espèce possèdent le même génome même si au sens strict le génome de chaque individu est unique. Chez l’homme le génome ne diffère que de 0.1% entre 2
personnes non apparentées
La ressemblance entre génomes
• Homme/chimpanzé– Codant: <1,5% de différence– Non codant ~3% de différence– Quelques duplications/délétions importantes de région de
quelques dizaines de kb• Homme/souris
– Codant: 10% de différence– Non codant: la plus grande partie des régions non codantes
est sans identité apparente, mais il y aurait ~2000nt conservés dans chaque région intergénique chez l’ensemble des mammifères
– Mutations : 0,6/site• Homme/poulet
– Mutations : 1,5/site
ratioGenesBpOrganism
80,500~30,000~3,400,000,000human
3,500,000~40,000?~140,000,000,000Protopterus aethiopicus(lungfish)
900,000~20,000?~18,000,000,000Allium cepa(onion)
250,000~20,000?~5,000,000,000Zea mays
2,400,000~15, 000?~36,000,000,000Lilium formosanum(lily)
12,000~10,000~120,000,000Arabidopsis thaliana
14,000~12,000~170,000,000Drosophila melanogaster
7000~14,000~100,000,000Caenorhabditis elegans
5,000,000~5000?~25,000,000,000Coscinodiscus asteromphalus(diatom)
150,000~10,000?~1,500,000,000Erysiphe cichoracearum(fungus)
22095885~13,000,000Saccharomyces cerevisiae
54,000,000~5000?~270,000,000,000Amoeba proteus
134,000,000~5000?~670,000,000,000Amoeba dubia
95517381,660,000Methanococcus jannashchii
107242884,600,000Escherichia coli
107517031,830,000Haemophilus influenzae
10001010,000HIV-1
Espèce modèle Taxon Nb de chromosomes
Taille du génome
Nb de gènes estimé
Virus de la grippe Virus ARN simple brin 13 500 bp 12
Bactériophage T4 Virus 1 (circulaire) 165 000 bp 200 Escherichia coli Bactérie 1 (circulaire) 4,7 Mb 4000 Saccharomyces cerevisiae Ascomycète 16 14 Mb 6000
Arabidopsis thaliana Crucifère 5 100 Mb 25000
Caenorhabditis elegans Nématode 6 100 Mb 13500
Drosophila melanogaster Insecte 4 165 Mb 12000-
16000
Mus musculus Mammifère 20 3400 Mb 25000-30000
Homo sapiens Mammifère 23 3400 Mb 25000-30000
Codant et non
codant…
Chabalina et al. Genome Biology, 2004
Génomes procaryotes et génomes eucaryotes
Caractéristiques des génomes procaryotes
-Chromosome circulaire unique
-Présence possible de petites séquences d’ADN circulaires indépendantes : les plasmides.
-Contenu en G+C variable selon les espèces.
Ex : 22% chez un parasite Wiggleworthia glossinidia
67% chez deinicoccus radiodurans
Répartition des gènes procaryotes
– Longueur gène 950 nt. en moyenne (coli)– Densité en gènes. 95% du génome est
transcrit chez E. coli.– Gènes organisés en opérons. 600 opérons
dans le génome de Coli.
Les gènes procaryotes
Séquences qui contiennent les informations nécessaires au développement, au fonctionnement, au maintien de l’intégrité et à la reproduction de la cellule.fraction codante des génomes procaryotes élevée de 85 à 90%.
Ex. :97% chez Bacillus subtilis49.5% chez Mycobacterium leprae
Les séquences codantes codent des protéines ou des ARNs (ribosomiques et de transfert)
- Chez les procaryotes la séquence des gènes est continue. Pas d’intron-Le nombre de pseudogènes (gènes mutés, non transcrits ou non traduits est faible (1 à 2%).
-Les domaines non codants sont représentés par les régions intergéniquescontenant les séquences régulatrices
- Les séquences répétées sont beaucoup plus rares chez les procaryotes que chez les eucaryotes.
Fig1348a.jpeg
les génomes eucaryotes, caractéristiques
-noyau-taille
-plusieurs chromosomes,
plusieurs origines de réplication/chromosome
-notion de gène, disloqués (exons, introns)
-grandes régions intergéniques, fonction inconnue
Pendant la division cellulaires les chromosomes individualiséssont observables au microscope
leur nombre, leur taille et leur forme sont caractéristiquesd’une espèce donnée
Chez homme: 23 paires de chromosomes
Chez la vache et la chèvre: 30
Chez le porc: 19
Chez le cheval: 32
Répartition des gènes eucaryotes
– Densité: humain: 1 gène tous les 100kb en moyenne;
– C.elegans: 1gène/5-6kb (25%);
– S. Cerevisiae: 1 gène/2kb.
From « Genomes 2 », T.A. Brown
Le gène de mammifère
–Gène humain moyen: 9 introns, 27 kb, 3'UTR:770bp, 5'UTR:300bp, CDS:1340bp, exon moyen: 145 bp (218 bp pour C. elegans), intron moyen:3365 bp.
–Gènes "monstres": dystrophine: 2,4 Mb; Facteur de coagulation VIII: 186 kb, 26 exons; Tinine: CDS de 80780 bp, 178 exons
Analyse fonctionnelle des génomesex. génome humain 3.4gb
• 80 à 85% de fonction inconnue:- régions intergéniques- régions intragéniques: les introns
• 15 à 20% de fonction connue:- les gènes qui codent les protéines- les gènes qui codent les ARNs- les séquences régulatrices- Télomères, centromères, MAR..
Junk DNA: les séquences répétées dans le génome humain
• Les principales séquences répétées– Répétition de type transposon– Répétition simples de k-mères courts, p. ex. (A)n, (CA)n ou
(CGG)n – Segments dupliqués: blocs de 10–300 kb copiés d'une
région à l'autre ou en tandem
• Un ADN pas si "poubelle" que ça qui joue un grand rôle dans la transformation des gènes et l'apparition de nouveaux gènes.
• Les répétitions humaines sont relativement anciennes comparées à celles qu'on trouve dans le génome de drosophile. Notre génome a des difficultés pour se débarasser des répétitions.
Pseudogènes et retrotransposons• Deux mécanismes proches
From « Genomes 2 », T.A. Brown
Séquences répétées de typetransposon
• Les séquences répétées de type transposon représentent plus de 1/3 du génome des vertébrés
• Génome humain: 45% !!
LINES (Long interspersed repeated sequences)
– 21% du génome humain (850.000 copies). Le plus commun de ces éléments est L1: 6kb.
– Contiennent un promoteur et 2 ORFs. – Après traduction, l'ARN LINE s'assemble avec ses propres protéines et se
déplace vers le noyau où l'ARN est reverse transcrit et s'insère dans le génome au niveau d'une coupure simple brin. La transcription inverse s'interrompt souvent avant terme, créant de nombreux inserts tronqués (la plupart en fait)
– La machinerie LINE est responsable également de la retrotranscription des éléments SINE.
– Il y a en fait trois familles de LINE dans le génome humain (LINE1, LINE2, LINE3), mais seule L1 est active.
SINEs (Short interspersed repeated sequences)
– Contiennent un promoteur pol-III mais pas d'ORF – Vivent « sur le dos » des LINE – 13% du génome humain. 3 types: Alu, MIR et Ther2/MIR3. – (1 500 000 SINEs par génome humain haploide, dont 1 000
000 Alu)– La plus connue est ALU, la seule SINE active: 290 bp
constitué de 2 répétitions en tandem de 130 bp. – On ne trouve pas ces séquences dans les régions codantes,
mais souvent dans l'unité de transcription, soit dans lesintrons, soit dans les parties non traduites des ARNm.
Autres séquences répétées
• Les répétitions simples (Simple Sequence Repeats - SSR) – Répétition parfaite ou non d'un fragment de longueur k (k-mère). – Fragment court (1 à 13b): microsatellite – Fragment long (14 à 500b): minisatellite – Représentent 3% du génome humain, 0,5% provenant des
répétitions de dinucléotides (85% AC ou AT).
La chromatine
Taille du génome humain: 3,4 Mpb soit une taille de 1m contenue dans une cellule de 6 µ de diamètre. Nécessité d’empaquetage de l’ADN