Séquençage de nouvelle génération - boisvert.info · ... Séquençage de nouvelle génération...

50
Date: Mercredi le 2 février 2011 Heure: 9h00 à 12h00 Durée: 3 heures Lieu: salle de conférence du 3e étage (T3-61), bloc T du Centre de recherche du CHUL-CHUQ PHS 7013 - Génomique humaine Responsable du cours: professeure Francine Durocher Section: Séquençage de nouvelle génération Responsable de la section: professeur Jacques Corbeil Séquençage de nouvelle génération Étudiant au doctorat -- Directeur: professeur Jacques Corbeil -- Codirecteur: professeur François Laviolette S.B. n'est pas Auxiliaire d'enseignement à l'Université Laval Faculté de médecine, Université Laval Préparation et présentation du cours: Sébastien Boisvert

Transcript of Séquençage de nouvelle génération - boisvert.info · ... Séquençage de nouvelle génération...

Date: Mercredi le 2 février 2011Heure: 9h00 à 12h00Durée: 3 heuresLieu: salle de conférence du 3e étage (T3-61),bloc T du Centre de recherche du CHUL-CHUQ

PHS 7013 - Génomique humaineResponsable du cours: professeure Francine Durocher

Section: Séquençage de nouvelle générationResponsable de la section: professeur Jacques Corbeil

Séquençage de nouvelle génération

Étudiant au doctorat -- Directeur: professeur Jacques Corbeil -- Codirecteur: professeur François LavioletteS.B. n'est pas Auxiliaire d'enseignement à l'Université Laval

Faculté de médecine, Université Laval

Préparation et présentation du cours: Sébastien Boisvert

La structure de l'ADN

Watson JD, Crick FH.Molecular structure of nucleic acids; a structure for deoxyribose nucleic acid.Nature. 1953 Apr 25;171(4356):737-8. http://www.nature.com/nature/dna50/archive.html

© 2011 Nature Publishing Group

Technologies parallèles des acides nucléiques

Détection

Quantification

Décodage

Plusieurs cibles sont détectées ou quantifiées ou décodées en parallèle

Jian-Bing Fan, Mark S. Chee & Kevin L. GundersonHighly parallel genomic assaysNature Reviews Genetics 7, 632-644 (August 2006) | doi:10.1038/nrg190http://www.nature.com/nrg/journal/v7/n8/full/nrg1901.html

Vidéo sur les puces Affymetrix

Durée: 1 minute, 16 secondesLangue: anglais

Source:

tpaparountas sur YouTubehttp://www.youtube.com/watch?v=MuN54ecfHPw

Vidéo éducatif

Pourquoi séquencer l'ADN?

Expliquer et guérir les maladies génétiques

Étudier l'évolution

Étudier la spéciation

Lier le protéome au génome

Étudier l'épissage

Étudier la variation des génomes

Quantifier l'expression des ARNs messagers en séquençant l'ADN complémentaire

Idées générales

• Pour séquencer un polymère, on doit détecter le monomère à chaque position

• L'ADN a 4 monomères

• La méthode intuitive: détecter le monomère à chaque position itérativement

exemple: ATTCGGGACTAGGGCAT

• La méthode par compression: détecter le “déroulement de la séquence”

exemple: 1A 2T 1C 3G 1A 1C 1T 1A 3G 1C 1A 1T

TerminateurQuatre réactions de séquençage – unepour chaque base

deoxynucléotides and dideoxynucléotides (terminateurs)

Fin aléatoire de la polymérisation

Pour chaque base (A,T, C et G), nous avons toutes les sous-chaînes finissant par celle-ci,triées par longueur (sur gel)

L'analyse pénible est faite manuellement

Sanger F, Nicklen S, Coulson AR.DNA sequencing with chain-terminating inhibitors.Proc Natl Acad Sci U S A. 1977 Dec;74(12):5463-7.http://www.pnas.org/content/74/12/5463.abstract

Copyright ©2011 by the National Academy of Sciences

Cette méthode était fastidieuse

AutomatisationBasée sur la méthode de Sanger

Les réactions sont combinées

électrophorèse capillaire & fluorescence

Réception automatique desdonnées & analyse automatique

Commercialisée par Applied Biosystems

Le séquençeur du CRCHUL est comme ça

Smith LM et al..Fluorescence detection in automated DNA sequence analysis.Nature. 1986 Jun 12-18;321(6071):674-9.http://dx.doi.org/10.1038/321674a0

Le problème principale de cette méthode est la présence de terminateurs

Une molécule d'ADN peut être vue comme une chaîne de caractères

Avec cette méthode, il faut générer dans un tube toutes les sous-chaînes de caractères

Vidéo sur la méthode de Sanger

Durée: 1 minute, 7 secondesLangue: anglais

Source:

PHG Foundationhttp://www.youtube.com/watch?v=oYpllbI0qF8

Vidéo éducatif

Pyrosequençage

Pas de terminaison aléatoire, Séquençage par synthèse

Détection lors de l'incorporation des nucléotides

Problème majeur avec les homopolymères (AAAA versus AAAAA, 4A vs 5A)

Ronaghi M, Uhlén M, Nyrén P.A sequencing method based on real-time pyrophosphate.Science. 1998 Jul 17;281(5375):363, 365http://www.sciencemag.org/content/281/5375/363.long

© 2011 American Association for the Advancement of Science

Avec le pyroséquençage, il n'y a pas de terminateurs

La nouvelle génération

Jay Shendure & Hanlee JiNext-generation DNA sequencingNature Biotechnology 26, 1135 - 1145 (2008) http://www.nature.com/nbt/journal/v26/n10/full/nbt1486.html

Lecture parallèle de l'ADN

© 2011 Nature Publishing Group

Tout comme la technologie d'Affymetrix, les nouvelles technologies de séquençage utilisent des matrices d'échantillons

En général, les nouvelles technologies de séquençage filment les réactions qui se déroulent en parallèle

Les images sont analysées par ordinateur et on obtient beaucoup de données génétiques

Version parallèle

Basée sur une technologie à flux sur cellule

Developpée by 454, acheté by Roche

Margulies M et al.Genome sequencing in microfabricated high-density picolitre reactors.Nature. 2005 Sep 15;437(7057):376-80.http://www.nature.com/nature/journal/v437/n7057/abs/nature03959.html

© 2011 Nature Publishing Group

Avantage de la technologie 454: longue lectures (430)

Désavantage: beaucoup d'erreurs dans les homopolymères

Vidéo sur la technologie 454

Durée: 4 minutes, 33 secondesLangue: anglais

Source:

DaftPunkCA sur YouTubehttp://www.youtube.com/watch?v=bFNjxKHP8Jc

Vidéo éducatif

Par ligation

Pas de polymérase

Utilise une ligase

Belle technologie, compliquée

Applied Biosystems SOLiD

Shendure J, Porreca GJ, Reppas NB, Lin X, McCutcheon JP, Rosenbaum AM, Wang MD, Zhang K, Mitra RD, Church GM.Accurate multiplex polony sequencing of an evolved bacterial genome.Science. 2005 Sep 9;309(5741):1728-32.http://www.sciencemag.org/content/309/5741/1728.abstract

© 2011 American Association for the Advancement of Science

Stephen M. Rumble, Phil Lacroute, Adrian V. Dalca, Marc Fiume, Arend Sidow, Michael BrudnoSHRiMP: Accurate Mapping of Short Color-space ReadsPLoS Comput Biol 5(5): e1000386. doi:10.1371/journal.pcbi.1000386http://www.ploscompbiol.org/article/info:doi/10.1371/journal.pcbi.1000386

L'espace de couleursLa technologie SOLiD génère des lectures colorées

Exemple: vert veut dire A si le nucléotide précédent était un C

© 2009 Rumble et al., Creative Commons Attribution License

Vidéo sur la technologie SOLiD

Durée: 4 minutes, 45 secondesLangue: anglais

Source:

KingofBiotech sur YouTubehttp://www.youtube.com/watch?v=nlvyF8bFDwM

Vidéo éducatif

Le retour des terminateurs

Developpée par Solexa

Achetée par Illumina

Terminateurs réversibles

Pas de problème avec les homopolymères

Séquences en paires

Succès commercial

Bentley DR, et al.Accurate whole human genome sequencing using reversible terminator chemistry.Nature. 2008 Nov 6;456(7218):53-9.http://www.nature.com/nature/journal/v456/n7218/abs/nature07517.html

© 2011 Nature Publishing Group

Illumina a environ 70% du marché de l'analyse génétique

Madalina IacobIllumina: Shining In Dreary Times Forbes, FastTech, 01.29.09, 06:00 PM ESThttp://www.forbes.com/2009/01/29/illumina-biotech-equities-technology-breakthroughs-0129_illumina.html

Bentley DR, et al.Accurate whole human genome sequencing using reversible terminator chemistry.Nature. 2008 Nov 6;456(7218):53-9.http://www.nature.com/nature/journal/v456/n7218/abs/nature07517.html

Séquences en pairesFabrication des librairies en paires

a petites distances

d longues distances

© 2011 Nature Publishing Group

Permet d'obtenir des paires de séquences dont la distance qui les séparent est approximativement connue

Vidéo sur la technologie d'Illumina

Durée: 1 minute, 37 secondesLangue: anglais

Source:

Aidan Flynn sur YouTubehttp://www.youtube.com/watch?v=77r5p8IBwJk

Vidéo éducatif

Une molecule

Une molécule à la fois

Developpée par Helicos

Harris TD et al.Single-molecule DNA sequencing of a viral genome.Science. 2008 Apr 4;320(5872):106-9.http://www.sciencemag.org/content/320/5872/106.short

© 2011 American Association for the Advancement of Science

Vidéo sur la technologie d'Hélicos

Durée: 4 minutes, 2 secondesLangue: anglais

Source:

WIRED sur YouTubehttp://www.youtube.com/watch?v=TboL7wODBj4

Vidéo éducatif

En temps réel

Le décodage est fait pendant que la polymérase fait son travail

Developpée par Pacific Biosciences

Eid J et al.Real-time DNA sequencing from single polymerase molecules.Science. 2009 Jan 2;323(5910):133-8.http://www.sciencemag.org/content/323/5910/133.abstract

© 2011 American Association for the Advancement of Science

Vidéo sur la technologie de Pacific Biosciences

Durée: 4 minutes, 4 secondesLangue: anglais

Source:

Pacific Bioscienceshttp://www.pacificbiosciences.com/sites/default/files/video_gallery/Pacbio%20Lg.flv

Vidéo éducatif

Ion Torrent

La technologie de Ion Torrent

Utilise des semi-conducteurs, nanotechnologie

Achetée par Life Technologies (Life Technologies = Applied Biosystems + Invitrogen)

Vidéo sur la technologie d'Ion Torrent

Durée: 2 minutes, 36 secondesLangue: anglais

Source:

IonTorrent sur YouTubehttp://www.youtube.com/watch?v=yVf2295JqUg

Vidéo éducatif

Daniel Branton et al.The potential and challenges of nanopore sequencingNature Biotechnology 26, 1146 - 1153 (2008) doi:10.1038/nbt.1495http://www.nature.com/nbt/journal/v26/n10/full/nbt.1495.html

Séquençagepar

nanopore

© 2011 Nature Publishing Group

Illumina et Oxford Nanopore

2008

Oxford Nanopore signe une attente exclusive avec Illumina pour la distribution des machines

Source: WIRED

12 janvier 2009

Illumina a pris une participation de 18,0 millions de dollars dans Oxford Nanopore

Source: http://investor.illumina.com/

1 février 2010

Illumina joint un investissement de 28,0 millions de dollars dans Oxford Nanopore

Source: Xconomy

Vidéo éducatif

Vidéo sur la technologie de Oxford Nanopore

Durée: 3 minutes, 20 secondesLangue: anglais

Source:

Oxford Nanopore sur YouTubehttp://www.youtube.com/watch?v=HbjAMJehSlg

Le déluge

Nicole RuskTorrents of sequenceNature Methods 8, 44 (2011) doi:10.1038/nmeth.f.330http://www.nature.com/nmeth/journal/v8/n1/full/nmeth.f.330.html

Il y a plusieurs technologies à surveiller en 2011

© 2011 Nature Publishing Group

Deux types d'analyse

Paul Flicek & Ewan BirneySense from sequence reads: methods for alignment and assembly.Nature Methods 6, S6 - S12 (2009) http://www.nature.com/nmeth/journal/v6/n11s/abs/nmeth.1376.html

•Assemblage avec référence•Assemblage sans référence

Enrichir des régions

Andreas Gnirk et al.Solution hybrid selection with ultra-long oligonucleotides for massively parallel targeted sequencingNature Biotechnology 27, 182 - 189 (2009) | doi:10.1038/nbt.1523http://www.nature.com/nbt/journal/v27/n2/abs/nbt.1523.html

© 2011 Nature Publishing Group

Lorsque l'on n'est pas intéressé par tout le génome

Sélectionner des régions d'intérêt

Les enrichir

Les séquencer

Analyses en génomique humaine

Surtout avec une référence: la séquence du génome humain

Avec ou sans enrichissement

La réaction en chaîne de la polymérase (PCR) est une méthode d'enrichissement !

Sarah B. Ng et al.Targeted capture and massively parallel sequencing of 12 human exomesNature 461, 272-276 (10 September 2009) | doi:10.1038/nature08250http://www.nature.com/nature/journal/v461/n7261/full/nature08250.html

Capturer et

séquencer les exons

© 2011 Nature Publishing Group

Seulement les variations dans les exons sont étudiées

The 1000 Genomes Project ConsortiumA map of human genome variation from population-scale sequencingNature 467, 1061–1073 (28 October 2010) doi:10.1038/nature09534 http://www.nature.com/nature/journal/v467/n7319/full/nature09534.html

1000 genomes humains

© 2011 Nature Publishing Group

Cole Trapnell & Steven L SalzbergHow to map billions of short reads onto genomesNature Biotechnology 27, 455 - 457 (2009) doi:10.1038/nbt0509-455http://www.nature.com/nbt/journal/v27/n5/abs/nbt0509-455.html

Assemblageavec une référence

Chaque lecture est placée à la bonne place sur le génome humain en utilisant une sorte de table des matières

Deux algorithmes principaux:

•Graines espacées•Burrows-Wheeler

© 2011 Nature Publishing Group

Assemblagesans uneréférence

Paul Flicek & Ewan BirneySense from sequence reads: methods for alignment and assembly.Nature Methods 6, S6 - S12 (2009) http://www.nature.com/nmeth/journal/v6/n11s/abs/nmeth.1376.html

On trouve des chevauchements petits entre les lectures d'ADN et on construit un consensus

© 2011 Nature Publishing Group

Vidéo sur le séquençage “shotgun”

Durée: 59 secondesLangue: anglais

Source:

HHMIhttp://www.youtube.com/watch?v=vg7Y5EeZsjk

Vidéo éducatif

Ewan BirneyAssemblies: the good, the bad, the uglyNature Methods 8, 59–60 (2011) doi:10.1038/nmeth0111-59http://www.nature.com/nmeth/journal/v8/n1/abs/nmeth0111-59.html

Erreurs d'assemblage

“The low cost of short-read sequencing has motivated the development of de novo assemblies from only short-read data; impressively, assemblies for large mammalian genomes are now available. However, this is still a developing field, and these de novo assemblies have many artifacts, as do all de novo assemblies.

” -- Ewan Birney

RNA-Seq

Zhong Wang, Mark Gerstein & Michael SnyderRNA-Seq: a revolutionary tool for transcriptomicsNature Reviews Genetics 10, 57-63 (January 2009) | doi:10.1038/nrg2484http://www.nature.com/nrg/journal/v10/n1/abs/nrg2484.html

Quantifier l'expression des gènes en utilisant le séquençage à haut débit

© 2011 Nature Publishing Group

Séquençage direct de l'ARN

Pas de conversion de l'ARN en ADNc, compréhension sans biais des transcriptomes

Ozsolak F et al.Direct RNA sequencing.Nature. 2009 Oct 8;461(7265):814-8.http://www.nature.com/nature/journal/v461/n7265/full/nature08390.html

© 2011 Nature Publishing Group

Microbiome humain

Peter J. Turnbaugh, Ruth E. Ley, Micah Hamady, Claire M. Fraser-Liggett, Rob Knight & Jeffrey I. GordonThe Human Microbiome ProjectNature 449, 804-810 (18 October 2007) | doi:10.1038/nature06244http://www.nature.com/nature/journal/v449/n7164/full/nature06244.html

© 2011 Nature Publishing Group

Le microbiome humain est un métagénome – un ensemble formé de plusieurs génomes

Il est variable

Microbiome humain

Junjie Qin et al.A human gut microbial gene catalogue established by metagenomic sequencingNature 464, 59-65 (4 March 2010) | doi:10.1038/nature08821http://www.nature.com/nature/journal/v464/n7285/full/nature08821.html

Les malades ont un microbiome différent

© 2011 Nature Publishing Group

Liens utiles

Nature Newshttp://www.nature.com/news/index.html

The Human Genome at Ten – Naturehttp://www.nature.com/humangenome

GenomeWebhttp://www.genomeweb.com/

Strunk, William, Jr. 1918. The Elements of Stylehttp://www.bartleby.com/141/