5. La génomique · ADN génomique est purifié et fragmenté - fragments d'ADN clonés dans...

28
5. La génomique 1 5.1 Introduction - discipline qui étudie les génomes - a réellement débuté avec le séquençage des génomes d'organismes 1995 : 1 er génome d’une bactérie séquencé (Haemophilus influenzae) 1996 : … d’un eucaryote, la levure 1999 : … d’un animal, le nématode Caenorhabditis elegans 2001 : … d’une plante, Arabidopsis thaliana - date clé : 2004 : 1 er séquençage du génome humain (1 ère version) - génomique fonctionnelle : discipline basée sur des approches globales pour déterminer la fonction des gènes "orphelins" (orphans) - génomique comparative : discipline utile pour l'annotation bioinformatique des génomes et qui permet d'étudier l'évolution des génomes

Transcript of 5. La génomique · ADN génomique est purifié et fragmenté - fragments d'ADN clonés dans...

Page 1: 5. La génomique · ADN génomique est purifié et fragmenté - fragments d'ADN clonés dans plasmides introduits dans E. coli (sélection des clones basée sur la résistance à

5. La génomique

1

5.1 Introduction

- discipline qui étudie les génomes

- a réellement débuté avec le séquençage des génomes d'organismes

1995 : 1er génome d’une bactérie séquencé (Haemophilus influenzae)1996 : … d’un eucaryote, la levure 1999 : … d’un animal, le nématode Caenorhabditis elegans 2001 : … d’une plante, Arabidopsis thaliana

- date clé : 2004 : 1er séquençage du génome humain (1ère version)

- génomique fonctionnelle : discipline basée sur des approches globales pour déterminer la fonction des gènes "orphelins" (orphans)

- génomique comparative : discipline utile pour l'annotation bioinformatique des génomes et qui permet d'étudier l'évolution des génomes

Page 2: 5. La génomique · ADN génomique est purifié et fragmenté - fragments d'ADN clonés dans plasmides introduits dans E. coli (sélection des clones basée sur la résistance à

Grande variété dans la taille des génomes au sein de la plupart des groupes (sans relation avec le degré de complexité biologique)

La taille minimale des génomes tend à augmenter avec le degré de complexité biologique

24 chr. pour H. sapiens : 1-22, X et Y

2

5.2 La taille des génomes

maize

Page 3: 5. La génomique · ADN génomique est purifié et fragmenté - fragments d'ADN clonés dans plasmides introduits dans E. coli (sélection des clones basée sur la résistance à

3

- Génomes bactériens :- entre 0,5.106 et ∼107 de pb (ex. E. coli : 4,6.106 pb)

- taille proportionnelle au nombre d’ORFs (n’est pas le cas des eucayotes)

- minigénomes (ex. Mycoplasma) : b. vivant dans environnements confinés (ex. b. endosym-biotiques, b. parasites)

- génomes de grande taille : grandes capacités d’adaptation à des environnements différents

- cf. http://www.ncbi.nlm.nih.gov/genomes/lproks.cgi : milliers d’espèces de b.

- Génomes eucaryotes : - entre ∼107 et ∼1012 pb (H. sapiens : 3.109 pb)

- grande variation de la taille des génomes au sein de chaque groupe biologique (sansrapport donc avec des degrés différents de complexité biologique) -> séquencesrépétées dont les transposons (ex. maïs : 2,5. 109 pb, dont 85% = transposons)

- .. taille minimale des génomes tend à augmenter avec la degré de complexité biologique

- cf. http://www.ncbi.nlm.nih.gov/genome/browser : milliers d’espèces

Page 4: 5. La génomique · ADN génomique est purifié et fragmenté - fragments d'ADN clonés dans plasmides introduits dans E. coli (sélection des clones basée sur la résistance à

4

5.3 Le séquençage des génomes

5.3.1 Historique

1985: un projet de télescope géant à l'origine des premières discussions sur l’opportunité de séquencer le génome … humain (!)

Juin 1986: débat et … désaccord entre les scientifiques (trop cher, travail trop monotone, ..)

1987: création d’un comité de réflexion présidé par B. Alberts (sous l’égide de l’Académie des sciences des USA) sur la faisabilité du séquençage du génome humain

Février 1988: conclusions du comité :

Cout estimé à 3 milliards $ (réparti sur 15 ans)

Avant d’entamer le séquençage du génome de H. sapiens, il convient de :

- réaliser des cartes génétique et physique de qualité du génome humain (et de la souris, qui sert de modèle) - améliorer le rendement des méthodes de séquençage de l’ADN- débuter par le séquençage de "petits" génomes, ceux d’organismes modèles comme E. coli, la levure, le nématode Caenorhabditis. elegans, la drosophile Drosophila melanogaster, … ®données précieuses pour l’analyse ultérieure de la séquence du génome humain

Page 5: 5. La génomique · ADN génomique est purifié et fragmenté - fragments d'ADN clonés dans plasmides introduits dans E. coli (sélection des clones basée sur la résistance à

5.3.2 Deux stratégies possibles pour séquencer un génome

a) Stratégie " shotgun sequencing "

S1 TACATCCATGAATCCCTAAATA............CACTGGGACTAATTCCCTAAACCCGAAACC

S2 ACTCCTTTGTGGAAATGTTTGT...........TTTTATCCTTAGCCAAAAGGATTGGTGGTTT

S3 TCTATCAATTTATCTTTTGTGGG...........AAAAAAGCTATCGCCTCGACGATGCTCTATT

S4 AAAATTATTTAGTTGTAGGGATA...........TCTATCCTTGTAGCACACATTTTGGCACTCA

S5 GTCTTTCTTCGTTGTTGTTACG............CACTGGGACTAATTCCCTAAACCCGAAACC

Sn TACATCCATGAATCCCTAAATA............ TTTTTAGATGTTTGTTTTGCTTCTTTGAAGTA

- L’ADN de l’espèce est fragmenté en petits morceaux ("shotgun clones")

- Chaque fragment est séquencé à partir d’une extrémité (-> séquence de qqes centaines de pb) (cf. p. 22)

début de séquence fin de séquence

.....

5

Page 6: 5. La génomique · ADN génomique est purifié et fragmenté - fragments d'ADN clonés dans plasmides introduits dans E. coli (sélection des clones basée sur la résistance à

6

1 2 3 4 5 6 7 8 9 10 11 12 13 n1234567 ✔89101112 ✔13

n

S7 …..AAAAAAGCTATCGCCTCGACGATGCTCTATTACTTCTCGACGATGCTCTATTACTTCTCGGTACTGCAAA…. s11

- Chaque séquence obtenue est comparée à toutes les autres (matrice de comparaison) -> recherche de séquences chevauchantes (-> contig)

- Construction de proche en proche de la séquence complète à partir de l’ensemble des séquences chevauchantes

…..AAAAAAGCTATCGCCTCGACGATGCTCTATTACTTCTCGGTACTGCAAA…. contig

Page 7: 5. La génomique · ADN génomique est purifié et fragmenté - fragments d'ADN clonés dans plasmides introduits dans E. coli (sélection des clones basée sur la résistance à

7

La qualité de la séquence du génome est déterminée par le taux de recouvrement moyendu séquençage (“coverage fold” ou “sequencing depth”) :

Ex. Pour cette partie, le tr est de ~6

Ex :

rem : 1er séquençage du génome humain : t.r. moyen de 8-10

c = LN / G

c = coverageL = longueur des séquencesN = nbre de séquencesG : taille du génome

Page 8: 5. La génomique · ADN génomique est purifié et fragmenté - fragments d'ADN clonés dans plasmides introduits dans E. coli (sélection des clones basée sur la résistance à

Approche " shotgun sequencing "

- Appliquée avec succès pour la 1ère fois par Craig Venter (TIGR) pour séquencer les génomes de deux bactéries : Haemophilus influenzae (1.830.137 pb) et Mycoplasma genitalium (580.070 pb): deux premiers génomes d’organismes cellulaires totalement séquencés (en 1995) !

- Méthode appliquée depuis avec succès pour le séquençage des petits génomes et/ou de génomes contenant relativement peu de séquences répétées (bactéries, virus, …)

- .. mais peu efficace pour les génomes de grande taille, généralement riche en séquences répétées

rem : la méthode a malgré tout été employée par la société privée CELERA pour le séquençage du génome humain (projet mené par C. Venter) : polémique ® l’assemblage informatique des séquences par CELERA eut-il été possible sans l’accès libre aux séquences générées par le projet du consortium international (soutenu par les fonds publics), basé lui sur une autre stratégie, ″clone by clone ″

8

Page 9: 5. La génomique · ADN génomique est purifié et fragmenté - fragments d'ADN clonés dans plasmides introduits dans E. coli (sélection des clones basée sur la résistance à

- Appliquée pour la plupart des programmes de séquençage génomique (E. coli, levure, C. elegans, A. thaliana…), y compris pour celui du génome humain (consortium international)

- Principe général : face à l’ampleur du travail, celui-ci est subdivisé (en chromosomes, et en parties de chr.). Comment ? On commence par baliser le génome (cartographie génétique, cf. chap. III) et ensuite on exploite ces balises pour établir une cartographie physique du génome.

- Cartographie physique ? Consiste à isoler, pour chaque chromosome, une série de fragments de grande taille, qui recouvrent toute la longueur de chaque chromosome et qui se chevauchent partiellement.

b) Stratégie "clone by clone"

chr.

carte physique

carte génétique

- Chaque fragment ("clone contig") défini par cartographie physique est ensuite séquencé selon une approche "shotgun ″ (fragmentation, séquençage aléatoire, matrice de comparaison, et répétition jusqu’à l’obtention d’un taux de recouvrement satisfaisant)- Génome humain : plusieurs années de tâtonnement avant de mettre au point le système vecteur adapté pour cloner les "clone contig" de grande longueur = plasmides BAC 9

Page 10: 5. La génomique · ADN génomique est purifié et fragmenté - fragments d'ADN clonés dans plasmides introduits dans E. coli (sélection des clones basée sur la résistance à

BAC (bacterial artificial chromosome)= plasmide dérivé du plasmide F (1-2 copies / cellule) capable d’accueillir des fragments de grande taille (~300 kpb) ® particulièrement utile pour le séquençage des génomes

Exemple de vecteurs BAC :

- parA et parB : séquences assurant la répartition des copies du BAC entre les cellules filles

- repE et oriS : pour la réplication du BAC

- Cm R : gène de résistance au chloramphénicol (antibiotique)

- NotI : site de restriction (rare) : 5'GCGGCCGC3’

Pour le projet IHGC (1) : 300.000 clones BAC isolés contenant chacun un fr. d'ADN humain de 150.000 pb en moyenne (donc, 15 x le génome)

(1) International Human Genome Consortium

10

Page 11: 5. La génomique · ADN génomique est purifié et fragmenté - fragments d'ADN clonés dans plasmides introduits dans E. coli (sélection des clones basée sur la résistance à

Deux BACs chevauchants11

Chaque BAC recombinant est extrait de la bactérie ("miniprep") etdigéré par une enzyme de restriction. Les fragments sont analyséspar une électrophorèse en gel d'agarose. Chaque BAC donne une"fingerprint » (sorte de code barre). La comparaison de ces"fingerprints" permet de repérer les fragments chevauchants et lalongueur de la zone commune > carte physique (rem : il y a un mêmemarqueur de poids moléculaires toutes les 5 pistes)

Comment identifier les BACs chevauchants ?

Page 12: 5. La génomique · ADN génomique est purifié et fragmenté - fragments d'ADN clonés dans plasmides introduits dans E. coli (sélection des clones basée sur la résistance à

1er génome séquencé : Haemophilus influenzae

5.3.3 Déroulement des programmes de séquençage durant les années 90s

12

Page 13: 5. La génomique · ADN génomique est purifié et fragmenté - fragments d'ADN clonés dans plasmides introduits dans E. coli (sélection des clones basée sur la résistance à

a) rappel : la méthode de F. Sanger (méthode des didésoxynucléotides)

Technique basée sur la polymérisation d’ADN en présence :

- des quatre désoxyribonucléosides triphosphates standards (dATP, dTTP, dGTP, dTTP)

- plus un didésoxyribonucléoside triphosphate (ex. ddATP)

Si le ddATP est incorporé dans l’ADN en cours de polymérisation, celle-ci est interrompue (car le C en 3’ ne peut lier un nucléotide supplémentaire).

5.3.4 L’amélioration des méthodes de séquençage de l’ADN

13

Page 14: 5. La génomique · ADN génomique est purifié et fragmenté - fragments d'ADN clonés dans plasmides introduits dans E. coli (sélection des clones basée sur la résistance à

Quatre réactions de polymérisation à partir d’une amorce hybridée sur l’ADN simple brin à séquencer

Chaque réaction contient les quatre dNTP plus un des quatre ddNTP en faible proportion

Dans chaque réaction, une fraction des polymérisations sera interrompue suite à l’incorporation du ddNTP au lieu du dNTP correspondant

Les fragments de différentes longueurs (du côté de leur extrémité 3 polymérisée) sont séparés par électrophorèse.

Les fragments marqués par la radioactivitié (ou par des molécules fluorescentes) sont détectés.

Lecture de l’ADN de 5’ vers 3’

GATC

5'-T

ATAA

ACTG

GAC

AA …

. –3'

Page 15: 5. La génomique · ADN génomique est purifié et fragmenté - fragments d'ADN clonés dans plasmides introduits dans E. coli (sélection des clones basée sur la résistance à

16 capillaires

Progrès déterminants par la société Applied Biosystems :

- développement de quatre ddNTP marqués chacun par une molécule fluorescente différente (spectre d’émission différents) : une seule réaction (au lieu de quatre) contenant les 4 ddNTP et une seule piste de migration, traversée dans le bas du gel par un rayon laser qui exiteles fluorochromes (-> lumière émise enregistrée par détecteurs)- remplacement du gel classique d'acrylamide par des capillaires (ex. système à 16 puis 96 capillaires)

Animations disponibles sur : http://www.dnalc.org/resources/animations/cycseq.html

ancienne technologie

technologieABI

4 couleurs d’émission

15

Page 16: 5. La génomique · ADN génomique est purifié et fragmenté - fragments d'ADN clonés dans plasmides introduits dans E. coli (sélection des clones basée sur la résistance à

Pour le séquençage du génome humain : robotisation de la procédure de préparation des ADNs à séquencer, et

multiplication en série des machines ABI

16

Page 17: 5. La génomique · ADN génomique est purifié et fragmenté - fragments d'ADN clonés dans plasmides introduits dans E. coli (sélection des clones basée sur la résistance à

5.3.5 Le séquençage complet des premiers génomes : quelques chiffres

a) Organismes modèles

17

Page 18: 5. La génomique · ADN génomique est purifié et fragmenté - fragments d'ADN clonés dans plasmides introduits dans E. coli (sélection des clones basée sur la résistance à

Celera Genomics vs. IHGC (1)

26 juin 2000

b) Le génome humain

(1) International Human Genome Consortium

18

Page 19: 5. La génomique · ADN génomique est purifié et fragmenté - fragments d'ADN clonés dans plasmides introduits dans E. coli (sélection des clones basée sur la résistance à

Nature, vol. 431, 21 octobre 2004, p.931-945

Film à propos du programme de séquençage du génome humain : « Cracking the Code of Life » PBS Nova. YouTube code : _IgSDVD4QEc

19

Page 20: 5. La génomique · ADN génomique est purifié et fragmenté - fragments d'ADN clonés dans plasmides introduits dans E. coli (sélection des clones basée sur la résistance à

20

5.4 La génomique comparative

Ex. : cas des champignons

En 1996: séquençage du génome de la levure Saccharomyces cerevisiae (Goffeau et al. 1996)

Ensuite, le génome d’autres champignons évoluti-vement proches de S. cerevisiae a été séquencé :

Pq ? Utile pour l'annotation des génomeset pour étudier l'évolution des génomes

Page 21: 5. La génomique · ADN génomique est purifié et fragmenté - fragments d'ADN clonés dans plasmides introduits dans E. coli (sélection des clones basée sur la résistance à

GATCGGCCTGTTGCTTTCTGCGTCGAATAAATTCTTTCCGTCGTGCCAAAGCATCTTGTCGTGCTCCACCCGAATGAACTGATGAGATCGAAGACGATGGACTTGTCATTTGCCCTGCGATTTTACGCTGAAAAAAGTTTAATTAGAAAATAAATTCCTATATAGAAATTAAAATAAGAAATGCTAAATTTTAAAAACTAAATTTAATTCAAGTTTTCAAAAAACGTGACTTTTTGCAATAAATAAATAAATATGATTCTATCTTTTTTGGTTACATGATTTTCTTACGAAAAAAAGTGTAAATAAAATTGATTACAGCTAATTTGGAACCAAATTCTAGATATTTTTTGCTTTACAATTCATATTTCAATATCTAAATAAATAATTCTTTAAAACTTTTTTCCATCTGTTGATCACCTGCTGGTTCGAGGTCACTCACCCAAAGACAATCTGCCAGCAGCATTGTTTTTTTTAAACGAAATTCAATAGAAATATCAAATATGTATTGAAAATGGCCTAGCGAATATTTTTTTGCAGATTTTTTTTTCGAAAGTTATGCTCTGCTCTTCTTTTCTGCTTTAAGACTGCTCTCTACGAGTTTTCAAAGCGGGCTCTCCGACCGGAACAAGACAAAGTAAGAGGAGAAGAAGATGTGGAGGAAGAAATTGAGAAGAAGAGAAGAAATAAGATGTCGTTTTTTTTCCGGCAACTGACCAAAATGGGATAGAAAAAAGTGCAAAAAATGGGAGGAAGTGAACGACTCATTTTTTGCAAAAATAAAGAAGGAAACCCCCCAACGCGCGAACTTTTTCTTGAAAAATGAGGTAGATCAAAAATGTAAAATGATGCAATTTTTCAAATTTTACAGAAAGAACTGGAAGATGGAGCAGTAATGCATTCGAAATGAATTGTGTTTACTCGAAATTGATAGATTTATGAATGAAAATGGTTAAACATTGATTTTTGGCATGAAAAATTATTTTGCAGTATTTTGAAAAAAAAAATATTTTTTCGTTTACAAAACCGCAAATTTTTGGAAATTTGTGACTGGTTTTATATATTAAAATATTTTAGTGTCCGCTAATATTTTTATAAATTTATAAATTATGCGAGTTTCGACGCAGAAATACAGTACTCATGTTTTTCGAATTTTCTTGAAAAAATAATTCAAATAGTCAATAATTTCCTATCTTTTTTTTTCATTTTTAAAACAAAATCGAAAATGTTCTTTTTTAGAAGTTATATTTCGTAGAAACTTATATTTTTCGAAAAGAGCTTAAAATATCGGTTTCTGGTTGAAAGGAATGTTTTTTTTTTGATAAACTGTTGAATGATTTTCAATTAAGTTTTAAAAATCACACTTTTTGTTCTTCGAAATTTGAAAATCGATGTTCTCTGGAAAAAAACCGAAAAAATTGAAATTATATTTTCACGTCAATATGTCTTTTTCTCAATCATTTTTTAAATTCCAACAAACCTGATGTTCCAACGAGAAATCAATATTATAAAATGCTAATTTCTTTCTTGCATCATTCGGTTTTGGAGGCATCACCAAGTTTTCGTTTCTGAAAATTAAAAATTTTAAAAGAAAAATCCGATGATTCAAATGAAGAAGTTGACCACCATCGATTAATCCCAATGGCCACAACTTCATTAATGCAAATCTTTTTCTCAATTTTGGGAAATTTCATATCTGTTGTTGTGTCTCTAGTAATGTTGAGTCATGTGTTCCGAGAGAGGCATGAGAAATTTCCAAAAAAAAATAAAAGAACACATTATTTTTTTTCGGCTTTTTCAAAATGTTTGCATATCAAAATATATAAAAGAATTGAAGCGTATAACCATTGATAAATTGTGAGAAAAAAAGTCTCGAGACTTTTACGGAAGAATTTTGTTCGGCAACGCTTTTCTAGTTATCAATTTGCTTAAAACATTGTTTTATTCATTTTTCTGTGCTTATTCAATTTTTCAACAAAAAAAATACTCAAAATAGCTGAATTCTTTTTGAATTTTCGTGGAAATTATAGGCCTAGTTTCGTAATTTTCGCTTTTTGAGCTAAATTTTTTGATTTTTGTCATAACGAAGCTAGGCCAATAATTTCCGCAACAAAATTTTTTTAAAAATTTAAAAACTTTTTTTTCAATATCTTAATACTTTTAAATTTCAAACTTACTCATGTAAATCCAAAACTTTCAAATCAGGCAACAAATGTATTCCCTCTGGCAGTGTAATCAATCGATTATGATCTAATTTCAATTTCTGAAGCTTAACACATCGCGAGATTCCTTCTGGAACTAATTCCAGCTTGTAAAAAACCGAAAAAATTGAAATTATATTTTCACGTCAATATGTCTTTTTCTCAATCATTTTTTAAATTCCAACAAACCTGATGTTCCAACGAGAAATCAATATTATAAAATGCTAATTTCTTTCTTGCATCATTCGGTTTTGGAGGCATCACCAAGTTTTCGTTTCTGAAAATTAAAAATTTTAAAAGAAAAATCCGATGATTCAAATGAAGAAGTTGACCACCATCGATTAATCCCAATGGCCACAACTTCATTAATGCAAATCTTTTTCTCAATTTTGGGAAATTTCATATCTGTTGTTGTGTCTCTAGTAATGTTGAGTCATGTGTTCCGAGAGAGGCATGAGAAATTTCCAAAAAAAAATAAAAGAACACATTATTTTTTTTCGGCTTTTTCAAAATGTTTGCATATCAAAATATATAAAAGAATTGAAGCGTATAACCATTGATAAATTGTGAGAAAAAAAGTCTCGAGACTTTTACGGAAGAATTTTGTTCGGCAACGCTTTTCTAGTTATCAATTTGCTTAAAACATTGTTTTATTCATTTTTCTGTGCTTATTCAATTTTTCAACAAAAAAAATACTCAAAATAGCTGAATTCTTTTTGAATTTTCGTGGAAATTATAGGCCTAGTTTCGTAATTTTCGCTTTTTGAGCTAAATTTTTTGATTTTTGTCATAACGAAGCTAGGCCAATAATT

Annotation d’un génome ?

rechercher, dans la séquence "brute" d’ADN, tous les éléments génétiques fonctionnels, par l’emploi combiné de méthodes bioinformatiques et expéri-mentales

21

Page 22: 5. La génomique · ADN génomique est purifié et fragmenté - fragments d'ADN clonés dans plasmides introduits dans E. coli (sélection des clones basée sur la résistance à

Principe de la méthode :

On compare les séquences génomiques d'espèces +/- proches afin de rechercher toutes les séquences fonctionnelles (gènes > protéines, gènes > ARN non traduits, séquences régulatrices de gènes,…) en sa basant sur leur conservation évolutive :

® ex. : différentes espèces de levures hémiascomycètes

® ex. : Homo sapiens vs. chimpanzé vs. rat vs. souris …

!! L’annotation du génome humain a pu se faire de manière plus complète et précise en le comparant à celui de la souris, du rat, du chimpanzé, … !!

22

Matrice de comparaison pour un gèneconservé chez l'homme et la souris : les traitsobliques noirs correspondent aux zones trèsconservées (ici, surtout les exons)

Page 23: 5. La génomique · ADN génomique est purifié et fragmenté - fragments d'ADN clonés dans plasmides introduits dans E. coli (sélection des clones basée sur la résistance à

23

5.5 Les méthodes de "Next Generation Sequencing" (NGS)

Différences entre la méthode "classique" de séquençage de F. Sanger et les technologies "NGS" :

ADN génomique est purifié et fragmenté

- fragments d'ADN clonés dans plasmides introduits dans E. coli (sélection des clones basée sur la résistance à un antibiotique)

- chaque clone de E. coli cultivé (amplification in vivo du plasmide recombinant)

- purification de chaque plasmide à partir de E. coli ("miniprep")

- réaction de séquençage (à partir d'une amorce) sur chaque plasmide (dénaturé) (ex. x 16 ou 96 avec séquenceur ABI)

méthode de F. Sanger NGS

- tous les fragments d'ADN sont amplifiés in vitro (par PCR) en parallèle (en une seule étape)

- les fragments amplifiés sont séquencés enparallèle en quelques heures

Utilisée pour les premiers programmes de séquençage de

génomes

Page 24: 5. La génomique · ADN génomique est purifié et fragmenté - fragments d'ADN clonés dans plasmides introduits dans E. coli (sélection des clones basée sur la résistance à

24

PCR locale

Ex. technologie "Illumina" : les fragments d'ADN à séquencer sont (i) reliés à chaque extrémité à une amorce (oligonucléotide) (ii) injectés dans une cellule où ils se fixent, grâce à l’amorce ajoutée,au support (iii) amplifié localement par PCR (env. 100 millions de "clusters") :

Page 25: 5. La génomique · ADN génomique est purifié et fragmenté - fragments d'ADN clonés dans plasmides introduits dans E. coli (sélection des clones basée sur la résistance à

25

Réaction de séquençage par extension (par une ADN polymérase ) d'une amorce qui se lie à l’extrémité du fragment. Les quatre dNTPs sont associés à une molecule fluorescente différente (spectre d'émission différent, donc quatre couleurs d'émission) :

(1) (2) (3)

Trois étapes : (1) ajout des quatre dNTPs fluorescents, insertion par l’ADN polymérase d’un seul nucléotide, lavage (2) excitation du fluorochrome incorporé et enregistrement de la lumière fluorescente émise (3) traitement chimique pour déprotéger le nucléotide incorporé et éliminer le fluorochrome, ce qui permet l’incorporation d’un autre nucléotide à la suite -> répétition de ce cycle

amorce

Page 26: 5. La génomique · ADN génomique est purifié et fragmenté - fragments d'ADN clonés dans plasmides introduits dans E. coli (sélection des clones basée sur la résistance à

26

Enregistrement des images à chaque cycle d'incoporation d'un nucléotide et "lecture" de la séquence (des couleurs successives) de chacun des 100 M de fragments d'ADN

Limitations de cette technologie : petite taille des séquences obtenues (max. 150 nt) et le gros du travail reste à faire au niveau du traitement bioinformatique des données récoltées

Page 27: 5. La génomique · ADN génomique est purifié et fragmenté - fragments d'ADN clonés dans plasmides introduits dans E. coli (sélection des clones basée sur la résistance à

27

Applications des méthodes NGS :

- Étude du polymorphisme génétique (séquençage et comparaison avec la séquence déjà établie du génome), par ex. de H. sapiens :

- biopsies cancéreuse vs. non-cancéreuse d’un individu -> mutations associées au cancer ?

- 1000 genomes Project (http://www.1000genomes.org) > séquençage du génome de 2504 individus (26 groupes ethniques)

- UK10K (www.uk10k.org): séquençage du génome de 10.000 individus : 4000 individus sains, 6000 individus porteurs de pathologies diverses

- ...

- Séquençage de novo de génomes : microorganismes, plantes, animaux

Approche shotgun (cf. 5.3.2.a) : difficile en raison de la courte longueur des séquences générées, mais compensée en adaptant les stratégies de séquençage – ex. paired-end sequencing :

Chaque fragment est séquencé (shotgun sequencing) à chacune de ses extrémités, et la longueur du fragment est connue

Page 28: 5. La génomique · ADN génomique est purifié et fragmenté - fragments d'ADN clonés dans plasmides introduits dans E. coli (sélection des clones basée sur la résistance à

28

- Métagénomique : extraction de l’ADN extrait d’un échantillon de sol, d’eau de mer, de la flore intestinale (microbiome) ... et séquençage global -> image de la diversité des microorganismes et de leurs proportions relatives

- Séquençage du génome d’espèces éteintes (mammouth, homme de Néandethal, ..)

(sequenc* AND genom* [ti]) AND (nature [so] OR science [so])

Pour suivre les derniers développements, entrez dans http://www.ncbi.nlm.nih.gov/pubmed/ :

- ....

[ti] : recherche dans le titre de l’article[so] : recherche dans la source, cad le nom de la revue