5. La génomique · comparaison, et répétition jusqu’à l’obtention d’un taux de...

29
5. La génomique 1 5.1 Introduction - discipline qui étudie les génomes - a réellement débuté avec le séquençage des génomes d'organismes 1995 : 1 er génome d’une bactérie séquencé (Haemophilus influenzae) 1996 : … d’un eucaryote, la levure 1999 : … d’un animal, le nématode Caenorhabditis elegans 2001 : … d’une plante, Arabidopsis thaliana - date clé : 2004 : 1 er séquençage du génome humain (1 ère version) - génomique fonctionnelle : discipline basée sur des approches globales pour déterminer la fonction des gènes "orphelins" (orphans) - génomique comparative : discipline utile pour l'annotation bioinformatique des génomes et qui permet d'étudier l'évolution des génomes

Transcript of 5. La génomique · comparaison, et répétition jusqu’à l’obtention d’un taux de...

Page 1: 5. La génomique · comparaison, et répétition jusqu’à l’obtention d’un taux de recouvrement satisfaisant) - Génome humain : plusieurs années de tâtonnement avant de mettre

5. La génomique

1

5.1 Introduction

- discipline qui étudie les génomes - a réellement débuté avec le séquençage des génomes d'organismes 1995 : 1er génome d’une bactérie séquencé (Haemophilus influenzae) 1996 : … d’un eucaryote, la levure 1999 : … d’un animal, le nématode Caenorhabditis elegans 2001 : … d’une plante, Arabidopsis thaliana - date clé : 2004 : 1er séquençage du génome humain (1ère version) - génomique fonctionnelle : discipline basée sur des approches globales pour déterminer la fonction des gènes "orphelins" (orphans) - génomique comparative : discipline utile pour l'annotation bioinformatique des génomes et qui permet d'étudier l'évolution des génomes

Page 2: 5. La génomique · comparaison, et répétition jusqu’à l’obtention d’un taux de recouvrement satisfaisant) - Génome humain : plusieurs années de tâtonnement avant de mettre

Grande variété dans la taille des génomes au sein de la plupart des groupes (sans relation avec le degré de complexité biologique)

La taille minimale des génomes tend à augmenter avec le degré de complexité biologique

24 chr. pour H. sapiens : 1-22, X et Y

2

5.2 La taille des génomes

maize

Page 3: 5. La génomique · comparaison, et répétition jusqu’à l’obtention d’un taux de recouvrement satisfaisant) - Génome humain : plusieurs années de tâtonnement avant de mettre

3

- Génomes bactériens :

- entre 0,5.106 et ∼107 de pb (ex. E. coli : 4,6.106 pb) - taille proportionnelle au nombre d’ORFs (n’est pas le cas des eucayotes) - minigénomes (ex. Mycoplasma) : b. vivant dans environnements confinés (ex. b. endosym- biotiques, b. parasites) - génomes de grande taille : grandes capacités d’adaptation à des environnements différents - cf. http://www.ncbi.nlm.nih.gov/genomes/lproks.cgi : milliers d’espèces de b.

- Génomes eucaryotes :

- entre ∼107 et ∼1012 pb (H. sapiens : 3.109 pb) - grande variation de la taille des génomes au sein de chaque groupe biologique (sans rapport donc avec des degrés différents de complexité biologique) -> séquences répétées dont les transposons (ex. maïs : 2,5. 109 pb, dont 85% = transposons) - .. taille minimale des génomes tend à augmenter avec la degré de complexité biologique - cf. http://www.ncbi.nlm.nih.gov/genome/browser : milliers d’espèces

Page 4: 5. La génomique · comparaison, et répétition jusqu’à l’obtention d’un taux de recouvrement satisfaisant) - Génome humain : plusieurs années de tâtonnement avant de mettre

4

5.3 Le séquençage des génomes

5.3.1 Historique

1985: un projet de télescope géant à l'origine des premières discussions sur l’opportunité de séquencer le génome … humain (!)

Juin 1986: débat et … désaccord entre les scientifiques (trop cher, travail trop monotone, ..)

1987: création d’un comité de réflexion présidé par B. Alberts (sous l’égide de l’Académie des sciences des USA) sur la faisabilité du séquençage du génome humain

Février 1988: conclusions du comité : Cout estimé à 3 milliards $ (réparti sur 15 ans) Avant d’entamer le séquençage du génome de H. sapiens, il convient de : - réaliser des cartes génétique et des cartes physiques de qualité du génome humain (et de la souris, qui sert de modèle) - augmenter le rendement des méthodes de séquençage de l’ADN - débuter par le séquençage de "petits" génomes, ceux d’organismes modèles comme E. coli, la levure, le nématode Caenorhabditis elegans, la drosophile Drosophila melanogaster, … → données précieuses pour l’analyse ultérieure de la séquence du génome humain

Page 5: 5. La génomique · comparaison, et répétition jusqu’à l’obtention d’un taux de recouvrement satisfaisant) - Génome humain : plusieurs années de tâtonnement avant de mettre

5.3.2 Deux stratégies possibles pour séquencer un génome

a) Stratégie " shotgun sequencing "

S1 TACATCCATGAATCCCTAAATA............CACTGGGACTAATTCCCTAAACCCGAAACC

S2 ACTCCTTTGTGGAAATGTTTGT...........TTTTATCCTTAGCCAAAAGGATTGGTGGTTT

S3 TCTATCAATTTATCTTTTGTGGG...........AAAAAAGCTATCGCCTCGACGATGCTCTATT

S4 AAAATTATTTAGTTGTAGGGATA...........TCTATCCTTGTAGCACACATTTTGGCACTCA

S5 GTCTTTCTTCGTTGTTGTTACG............CACTGGGACTAATTCCCTAAACCCGAAACC

Sn TACATCCATGAATCCCTAAATA............ TTTTTAGATGTTTGTTTTGCTTCTTTGAAGTA

- L’ADN de l’espèce est fragmenté en petits morceaux ("shotgun clones")

- Chaque fragment est séquencé à partir d’une extrémité (-> séquence de qqes centaines de pb)

début de séquence fin de séquence

.....

5

Page 6: 5. La génomique · comparaison, et répétition jusqu’à l’obtention d’un taux de recouvrement satisfaisant) - Génome humain : plusieurs années de tâtonnement avant de mettre

6

1 2 3 4 5 6 7 8 9 10 11 12 13 n1 2 3 4 5 6 7 ✔ 8 9 10 11 ✔ 12 13 n

S7 …..AAAAAAGCTATCGCCTCGACGATGCTCTATTACTTCT CGACGATGCTCTATTACTTCTCGGTACTGCAAA…. S11

- Chaque séquence obtenue est comparée à toutes les autres (matrice de comparaison) -> recherche de séquences chevauchantes (-> contig)

- Construction de proche en proche de la séquence complète à partir de l’ensemble des séquences chevauchantes

…..AAAAAAGCTATCGCCTCGACGATGCTCTATTACTTCTCGGTACTGCAAA…. contig

Page 7: 5. La génomique · comparaison, et répétition jusqu’à l’obtention d’un taux de recouvrement satisfaisant) - Génome humain : plusieurs années de tâtonnement avant de mettre

7

Ex. Pour cette partie, le tr est de ~6,6

Ex : petite région du génome, séquencée sur les deux brins :

rem : 1er séquençage du génome humain : t.r. moyen de 8-10

La qualité ou fiabilité de la séquence du génome est déterminée par le taux de recouvrement moyen du séquençage (“coverage fold” ou “sequencing depth”) :

c = LN / G c = coverage L = longueur moyenne des séquences N = nbre de séquences G : taille du génome

Page 8: 5. La génomique · comparaison, et répétition jusqu’à l’obtention d’un taux de recouvrement satisfaisant) - Génome humain : plusieurs années de tâtonnement avant de mettre

Approche " shotgun sequencing "

- Appliquée avec succès pour la 1ère fois par Craig Venter (TIGR) pour séquencer les génomes de deux bactéries : Haemophilus influenzae (1.830.137 pb) et Mycoplasma genitalium (580.070 pb): deux premiers génomes d’organismes cellulaires totalement séquencés (en 1995) ! - Méthode appliquée depuis avec succès pour le séquençage des petits génomes et/ou de génomes contenant relativement peu de séquences répétées (bactéries, virus, …) - .. mais peu efficace pour les génomes de grande taille, généralement riches en séquences répétées rem : la méthode a malgré tout été employée par la société privée CELERA pour le séquençage du génome humain (projet mené par C. Venter) : polémique → l’assemblage informatique des séquences par CELERA eut-il été possible sans l’accès libre aux séquences générées par le projet du consortium international (soutenu par les fonds publics), basé lui sur une autre stratégie, ″clone by clone ″

8

Page 9: 5. La génomique · comparaison, et répétition jusqu’à l’obtention d’un taux de recouvrement satisfaisant) - Génome humain : plusieurs années de tâtonnement avant de mettre

- Appliquée pour la plupart des programmes de séquençage génomique (E. coli, levure, C. elegans, A. thaliana…), y compris pour celui du génome humain (consortium international) - Principe général : face à l’ampleur du travail, celui-ci est subdivisé (en chromosomes, et en parties de chr.). Comment ? On commence par baliser le génome (cartographie génétique, cf. chap. III) et ensuite on exploite ces balises pour établir une cartographie physique du génome. - Cartographie physique ? Consiste à isoler, pour chaque chromosome, une série de fragments de grande taille, qui recouvrent toute la longueur de chaque chromosome et qui se chevauchent partiellement.

b) Stratégie "clone by clone"

chr.

carte physique

carte génétique

- Chaque fragment ("clone contig") défini par cartographie physique est ensuite séquencé selon une approche "shotgun ″ (fragmentation, séquençage aléatoire, matrice de comparaison, et répétition jusqu’à l’obtention d’un taux de recouvrement satisfaisant)

- Génome humain : plusieurs années de tâtonnement avant de mettre au point le système vecteur adapté pour cloner les "clone contig" de grande longueur = plasmides BAC 9

balises = marqueurs génétiques

Page 10: 5. La génomique · comparaison, et répétition jusqu’à l’obtention d’un taux de recouvrement satisfaisant) - Génome humain : plusieurs années de tâtonnement avant de mettre

BAC (bacterial artificial chromosome)

= plasmide dérivé du plasmide F (1-2 copies / cellule) capable d’accueillir des fragments de grande taille (∼300 kpb) → particulièrement utile pour le séquençage des génomes

Exemple de vecteurs BAC : - parA et parB : séquences assurant la répartition des copies du BAC entre les cellules filles - repE et oriS : pour la réplication contrôlée du BAC (1-2 copies / cellule) - Cm R : gène de résistance au chloramphénicol (antibiotique) - NotI : site de restriction (rare) : 5'GCGGCCGC3’ Pour le projet IHGC (1) : 300.000 clones BAC isolés contenant chacun un fr. d'ADN humain de 150.000 pb en moyenne (donc, clonage de +/- 15 x le génome)

(1) International Human Genome Consortium

10

Page 11: 5. La génomique · comparaison, et répétition jusqu’à l’obtention d’un taux de recouvrement satisfaisant) - Génome humain : plusieurs années de tâtonnement avant de mettre

Profil de restriction de deux BACs chevauchants 11

Chaque BAC recombinant est extrait de la bactérie ("miniprep") et digéré par une enzyme de restriction. Les fragments sont analysés par une électrophorèse en gel d'agarose. Chaque BAC donne une "fingerprint  » (sorte de code barre). La comparaison de ces "fingerprints" permet de repérer les fragments chevauchants (bandes en commun) et la longueur de la zone commune (= somme des bandes communes) -> carte physique (rem : il y a un même marqueur de poids moléculaires toutes les 5 pistes)

Comment identifier les BACs chevauchants ?

Page 12: 5. La génomique · comparaison, et répétition jusqu’à l’obtention d’un taux de recouvrement satisfaisant) - Génome humain : plusieurs années de tâtonnement avant de mettre

1er génome séquencé : Haemophilus influenzae

5.3.3 Déroulement des programmes de séquençage durant les années 90s

12

ESTs : “expressed sequence tags” -> clonage et séquençage systématiques des ADNc copiés (par transcription réverse) à partir d’ARNm extraits de différents tissus : revient à séquencer toutes les ORFs (1,5% de l’ADN humain)

Page 13: 5. La génomique · comparaison, et répétition jusqu’à l’obtention d’un taux de recouvrement satisfaisant) - Génome humain : plusieurs années de tâtonnement avant de mettre

a) rappel : la méthode de F. Sanger (méthode des didésoxynucléotides)

Technique basée sur la polymérisation d’ADN en présence : - des quatre désoxyribonucléosides triphosphates standards (dATP, dTTP, dGTP, dTTP) - plus un didésoxyribonucléoside triphosphate (ex. ddATP) Si le ddATP est incorporé dans l’ADN en cours de polymérisation, celle-ci est interrompue (car le C en 3’ ne peut lier un nucléotide supplémentaire).

5.3.4 L’amélioration des méthodes de séquençage de l’ADN

RAPPEL

13

Page 14: 5. La génomique · comparaison, et répétition jusqu’à l’obtention d’un taux de recouvrement satisfaisant) - Génome humain : plusieurs années de tâtonnement avant de mettre

Quatre réactions de polymérisation à partir d’une amorce hybridée sur l’ADN simple brin à séquencer Chaque réaction contient les quatre dNTP plus un des quatre ddNTP en faible proportion Dans chaque réaction, une fraction des polymérisations sera interrompue suite à l’incorporation du ddNTP au lieu du dNTP correspondant Les fragments de différentes longueurs (du côté de leur extrémité 3 polymérisée) sont séparés par électrophorèse. Les fragments marqués par la radioactivitié (ou par des molécules fluorescentes) sont détectés. Lecture de l’ADN de 5’ vers 3’

GATC

RAPPEL

5'-T

ATA

AA

CTG

GA

CA

A …

. – 3

'

Page 15: 5. La génomique · comparaison, et répétition jusqu’à l’obtention d’un taux de recouvrement satisfaisant) - Génome humain : plusieurs années de tâtonnement avant de mettre

16 capillaires

Progrès déterminants par la société Applied Biosystems :

- développement de quatre ddNTP marqués chacun par une molécule fluorescente différente (spectre d’émission différents) : une seule réaction (au lieu de quatre) contenant les 4 ddNTP et une seule piste de migration, traversée dans le bas du gel par un rayon laser qui excite les fluorochromes (-> lumière émise enregistrée par détecteurs) - remplacement du gel classique d'acrylamide par des capillaires (ex. système à 16 puis 96 capillaires)

Animations disponibles sur : http://www.dnalc.org/resources/animations/cycseq.html

ancienne technologie

technologie ABI

4 couleurs d’émission

15

Page 16: 5. La génomique · comparaison, et répétition jusqu’à l’obtention d’un taux de recouvrement satisfaisant) - Génome humain : plusieurs années de tâtonnement avant de mettre

Pour le séquençage du génome humain : robotisation de la procédure de préparation des ADNs à séquencer, et

multiplication en série des machines ABI

16

Page 17: 5. La génomique · comparaison, et répétition jusqu’à l’obtention d’un taux de recouvrement satisfaisant) - Génome humain : plusieurs années de tâtonnement avant de mettre

5.3.5 Le séquençage complet des premiers génomes : quelques chiffres

a) Organismes modèles

17

Page 18: 5. La génomique · comparaison, et répétition jusqu’à l’obtention d’un taux de recouvrement satisfaisant) - Génome humain : plusieurs années de tâtonnement avant de mettre

Celera Genomics vs. IHGC (1)

26 juin 2000

b) Le génome humain

(1) International Human Genome Consortium

18

Page 19: 5. La génomique · comparaison, et répétition jusqu’à l’obtention d’un taux de recouvrement satisfaisant) - Génome humain : plusieurs années de tâtonnement avant de mettre

Nature, vol. 431, 21 octobre 2004, p.931-945

Film à propos du programme de séquençage du génome humain : « Cracking the Code of Life » PBS Nova. YouTube code : _IgSDVD4QEc

19

Page 20: 5. La génomique · comparaison, et répétition jusqu’à l’obtention d’un taux de recouvrement satisfaisant) - Génome humain : plusieurs années de tâtonnement avant de mettre

20

5.4 La génomique comparative

Ex. : cas des champignons En 1996: séquençage du génome de la levure Saccharomyces cerevisiae (Goffeau et al. 1996) Ensuite, le génome d’autres champignons évoluti- vement proches de S. cerevisiae a été séquencé : Pq ? Utile pour l'annotation des génomes et pour étudier l'évolution des génomes

Page 21: 5. La génomique · comparaison, et répétition jusqu’à l’obtention d’un taux de recouvrement satisfaisant) - Génome humain : plusieurs années de tâtonnement avant de mettre

GATCGGCCTGTTGCTTTCTGCGTCGAATAAATTCTTTCCGTCGTGCCAAAGCATCTTGTCGTGCTCCACC CGAATGAACTGATGAGATCGAAGACGATGGACTTGTCATTTGCCCTGCGATTTTACGCTGAAAAAAGTTT AATTAGAAAATAAATTCCTATATAGAAATTAAAATAAGAAATGCTAAATTTTAAAAACTAAATTTAATTC AAGTTTTCAAAAAACGTGACTTTTTGCAATAAATAAATAAATATGATTCTATCTTTTTTGGTTACATGAT TTTCTTACGAAAAAAAGTGTAAATAAAATTGATTACAGCTAATTTGGAACCAAATTCTAGATATTTTTTG CTTTACAATTCATATTTCAATATCTAAATAAATAATTCTTTAAAACTTTTTTCCATCTGTTGATCACCTG CTGGTTCGAGGTCACTCACCCAAAGACAATCTGCCAGCAGCATTGTTTTTTTTAAACGAAATTCAATAGA AATATCAAATATGTATTGAAAATGGCCTAGCGAATATTTTTTTGCAGATTTTTTTTTCGAAAGTTATGCT CTGCTCTTCTTTTCTGCTTTAAGACTGCTCTCTACGAGTTTTCAAAGCGGGCTCTCCGACCGGAACAAGA CAAAGTAAGAGGAGAAGAAGATGTGGAGGAAGAAATTGAGAAGAAGAGAAGAAATAAGATGTCGTTTTTT TTCCGGCAACTGACCAAAATGGGATAGAAAAAAGTGCAAAAAATGGGAGGAAGTGAACGACTCATTTTTT GCAAAAATAAAGAAGGAAACCCCCCAACGCGCGAACTTTTTCTTGAAAAATGAGGTAGATCAAAAATGTA AAATGATGCAATTTTTCAAATTTTACAGAAAGAACTGGAAGATGGAGCAGTAATGCATTCGAAATGAATT GTGTTTACTCGAAATTGATAGATTTATGAATGAAAATGGTTAAACATTGATTTTTGGCATGAAAAATTAT TTTGCAGTATTTTGAAAAAAAAAATATTTTTTCGTTTACAAAACCGCAAATTTTTGGAAATTTGTGACTG GTTTTATATATTAAAATATTTTAGTGTCCGCTAATATTTTTATAAATTTATAAATTATGCGAGTTTCGAC GCAGAAATACAGTACTCATGTTTTTCGAATTTTCTTGAAAAAATAATTCAAATAGTCAATAATTTCCTAT CTTTTTTTTTCATTTTTAAAACAAAATCGAAAATGTTCTTTTTTAGAAGTTATATTTCGTAGAAACTTAT ATTTTTCGAAAAGAGCTTAAAATATCGGTTTCTGGTTGAAAGGAATGTTTTTTTTTTGATAAACTGTTGA ATGATTTTCAATTAAGTTTTAAAAATCACACTTTTTGTTCTTCGAAATTTGAAAATCGATGTTCTCTGGA AAAAAACCGAAAAAATTGAAATTATATTTTCACGTCAATATGTCTTTTTCTCAATCATTTTTTAAATTCC AACAAACCTGATGTTCCAACGAGAAATCAATATTATAAAATGCTAATTTCTTTCTTGCATCATTCGGTTT TGGAGGCATCACCAAGTTTTCGTTTCTGAAAATTAAAAATTTTAAAAGAAAAATCCGATGATTCAAATGA AGAAGTTGACCACCATCGATTAATCCCAATGGCCACAACTTCATTAATGCAAATCTTTTTCTCAATTTTG GGAAATTTCATATCTGTTGTTGTGTCTCTAGTAATGTTGAGTCATGTGTTCCGAGAGAGGCATGAGAAAT TTCCAAAAAAAAATAAAAGAACACATTATTTTTTTTCGGCTTTTTCAAAATGTTTGCATATCAAAATATA TAAAAGAATTGAAGCGTATAACCATTGATAAATTGTGAGAAAAAAAGTCTCGAGACTTTTACGGAAGAAT TTTGTTCGGCAACGCTTTTCTAGTTATCAATTTGCTTAAAACATTGTTTTATTCATTTTTCTGTGCTTAT TCAATTTTTCAACAAAAAAAATACTCAAAATAGCTGAATTCTTTTTGAATTTTCGTGGAAATTATAGGCC TAGTTTCGTAATTTTCGCTTTTTGAGCTAAATTTTTTGATTTTTGTCATAACGAAGCTAGGCCAATAATT TCCGCAACAAAATTTTTTTAAAAATTTAAAAACTTTTTTTTCAATATCTTAATACTTTTAAATTTCAAAC TTACTCATGTAAATCCAAAACTTTCAAATCAGGCAACAAATGTATTCCCTCTGGCAGTGTAATCAATCGA TTATGATCTAATTTCAATTTCTGAAGCTTAACACATCGCGAGATTCCTTCTGGAACTAATTCCAGCTTGT AAAAAACCGAAAAAATTGAAATTATATTTTCACGTCAATATGTCTTTTTCTCAATCATTTTTTAAATTCC AACAAACCTGATGTTCCAACGAGAAATCAATATTATAAAATGCTAATTTCTTTCTTGCATCATTCGGTTT TGGAGGCATCACCAAGTTTTCGTTTCTGAAAATTAAAAATTTTAAAAGAAAAATCCGATGATTCAAATGA AGAAGTTGACCACCATCGATTAATCCCAATGGCCACAACTTCATTAATGCAAATCTTTTTCTCAATTTTG GGAAATTTCATATCTGTTGTTGTGTCTCTAGTAATGTTGAGTCATGTGTTCCGAGAGAGGCATGAGAAAT TTCCAAAAAAAAATAAAAGAACACATTATTTTTTTTCGGCTTTTTCAAAATGTTTGCATATCAAAATATA TAAAAGAATTGAAGCGTATAACCATTGATAAATTGTGAGAAAAAAAGTCTCGAGACTTTTACGGAAGAAT TTTGTTCGGCAACGCTTTTCTAGTTATCAATTTGCTTAAAACATTGTTTTATTCATTTTTCTGTGCTTAT TCAATTTTTCAACAAAAAAAATACTCAAAATAGCTGAATTCTTTTTGAATTTTCGTGGAAATTATAGGCC TAGTTTCGTAATTTTCGCTTTTTGAGCTAAATTTTTTGATTTTTGTCATAACGAAGCTAGGCCAATAATT

Annotation d’un génome ? rechercher, dans la séquence "brute" d’ADN, tous les éléments génétiques fonctionnels, par l’emploi combiné de méthodes bioinformatiques et expéri-mentales

21

Page 22: 5. La génomique · comparaison, et répétition jusqu’à l’obtention d’un taux de recouvrement satisfaisant) - Génome humain : plusieurs années de tâtonnement avant de mettre

Principe de la méthode : On compare les séquences génomiques d'espèces +/- proches afin de rechercher toutes les séquences fonctionnelles (gènes > protéines, gènes > ARN non traduits, séquences régulatrices de gènes,…) en sa basant sur leur conservation évolutive : → ex. : différentes espèces de levures hémiascomycètes → ex. : Homo sapiens vs. chimpanzé vs. rat vs. souris … !! L’annotation du génome humain a pu se faire de manière plus complète et précise en le comparant à celui de la souris, du rat, du chimpanzé, … !!

22

Matrice de comparaison pour un gène conservé chez l'homme et la souris : les traits obliques noirs correspondent aux zones très conservées (ici, surtout les exons)

Page 23: 5. La génomique · comparaison, et répétition jusqu’à l’obtention d’un taux de recouvrement satisfaisant) - Génome humain : plusieurs années de tâtonnement avant de mettre

23

5.5 La révolution des méthodes de "Next Generation Sequencing" (NGS)

Différences entre la méthode "classique" de séquençage de F. Sanger et les technologies "NGS" :

ADN génomique est purifié et fragmenté

- fragments d'ADN insérés dans plasmides introduits dans E. coli (sélection des clones basée sur la résistance à un antibiotique) - chaque clone de E. coli est cultivé (amplification in vivo du plasmide recom-binant) - purification de chaque plasmide à partir de E. coli ("miniprep") - réaction de séquençage (à partir d'une amorce) sur chaque plasmide (dénaturé) (ex. x 16 ou 96 avec séquenceur ABI)

méthode de F. Sanger NGS

- tous les fragments d'ADN sont en général d’abord amplifiés in vitro (par PCR) en parallèle (en une seule étape) - les fragments amplifiés sont séquencés en parallèle en quelques heures

Utilisée pour les premiers programmes de séquençage de

génomes

plusieurs technologies NGS ont été développées, par ex. la technologie Illumina

Page 24: 5. La génomique · comparaison, et répétition jusqu’à l’obtention d’un taux de recouvrement satisfaisant) - Génome humain : plusieurs années de tâtonnement avant de mettre

24

PCR locale

Technologie "Illumina" : les fragments d'ADN à séquencer sont (i) reliés à chaque extrémité à un oligonucléotide (ii) dénaturés (iii) injectés dans une cellule où ils se fixent au support recouvert d’un oligonucléotide complémentaire à celui rajouté (iv) amplifié localement par PCR (chaque molécule d’ADN forme un "cluster" , env. 100 millions au total) :

v=womKfikWlxM sur Youtube

Page 25: 5. La génomique · comparaison, et répétition jusqu’à l’obtention d’un taux de recouvrement satisfaisant) - Génome humain : plusieurs années de tâtonnement avant de mettre

25

Réaction de séquençage au niveau de chaque cluster : après dénaturation de l’ADN et élimination d’un des deux brins, hybridation d'une amorce sur l’oligonucléotide greffé à l’extrémité du monobrin restant. Extension de l’amorce (par l’ADN polymérase) en présence des quatre dNTPs associés à une molécule fluorescente différente (spectre d'émission différent, donc quatre couleurs d'émission) :

(1) (2) (3)

Trois étapes : (1) ajout des quatre dNTPs fluorescents, insertion par l’ADN polymérase d’un seul nucléotide (car un groupement chimique sur le dNTP empêche l’incorporation d’un second dNTP), lavage (2) excitation du fluorochrome incorporé et enregistrement de la lumière fluorescente émise par le cluster (3) traitement chimique pour déprotéger le nucléotide incorporé et éliminer le fluorochrome, ce qui permet l’incorporation d’un autre nucléotide à la suite -> répétition de ce cycle

amorce

olig

onuc

léot

ide

gref

Page 26: 5. La génomique · comparaison, et répétition jusqu’à l’obtention d’un taux de recouvrement satisfaisant) - Génome humain : plusieurs années de tâtonnement avant de mettre

26

Enregistrement des images à chaque cycle d'incoporation d'un nucléotide et "lecture" de la séquence (des couleurs successives) de chacun des 100 millions de fragments d'ADN Limitations de cette technologie : petite taille des séquences obtenues (max. 150 nt) et le gros du travail reste à faire au niveau du traitement bioinformatique des données récoltées

Page 27: 5. La génomique · comparaison, et répétition jusqu’à l’obtention d’un taux de recouvrement satisfaisant) - Génome humain : plusieurs années de tâtonnement avant de mettre

27

Applications des méthodes NGS :

- Étude du polymorphisme génétique (séquençage et comparaison avec la séquence déjà établie du génome), par ex. de H. sapiens :

- biopsies cancéreuse vs. non-cancéreuse d’un individu -> mutations associées au cancer ?

- 1000 genomes Project (http://www.1000genomes.org) > séquençage du génome de 2504 individus (26 groupes ethniques)

- UK10K (www.uk10k.org): séquençage du génome de 10.000 individus : 4000 individus sains, 6000 individus porteurs de pathologies diverses - ...

-> recensement de +/- 88 millions de variations génétiques pour l’espèce humaine (avec d’importantes différences d’un groupe géographique à l’autre) -> un génome présente typiquement entre 4 et 5 millions de différences par rapport à la séquence de référence établie initialement

Page 28: 5. La génomique · comparaison, et répétition jusqu’à l’obtention d’un taux de recouvrement satisfaisant) - Génome humain : plusieurs années de tâtonnement avant de mettre

28

- Séquençage de novo de génomes : surtout plantes et animaux

Approche shotgun classique (cf. 5.3.2.a) : problématique en raison de la courte longueur des séquences NGS générées > impossible d’assembler une séquence complète en raison des séquences répétées (ex. transposons)

Derniers progrès technolo-giques : obtention par des méthodes NGS adaptées de séquences de grande longueur (10-20 kpb) capables de couvrir les séquences répétées de petite taille > permet l’assemblage de génomes complets malgré la présence de ces séquences répétées contig

NON VU EN 2019

Page 29: 5. La génomique · comparaison, et répétition jusqu’à l’obtention d’un taux de recouvrement satisfaisant) - Génome humain : plusieurs années de tâtonnement avant de mettre

29

- Métagénomique : extraction de l’ADN extrait d’un échantillon de sol, d’eau de mer, de la flore intestinale (microbiome) ... et séquençage global -> image de la diversité des microorganismes et de leurs proportions relatives

- Séquençage du génome d’espèces éteintes (mammouth, homme de Néanderthal, ..)

(sequenc* AND genom* [ti]) AND (nature [so] OR science [so])

Pour suivre les derniers développements, entrez dans http://www.ncbi.nlm.nih.gov/pubmed/ :

- ....

[ti] : recherche dans le titre de l’article [so] : recherche dans la source, cad le nom de la revue