Le séquençage Roche 454 - Roscoffapplication.sb-roscoff.fr/download/fr2424/abims/corre/...Roche...
Transcript of Le séquençage Roche 454 - Roscoffapplication.sb-roscoff.fr/download/fr2424/abims/corre/...Roche...
Systèmes “Genome Sequencers” Une stratégie unique en séquençage nouvelle génération
Pionniers en séquençage de nouvelle génération
Premier séquenceur à haut-débit : GS20 (2004)
Systèmes “Genome Sequencers” Une stratégie unique en séquençage nouvelle génération
Longueur de séquence X 8 en moins de 5 ans
Séquençage toutes applications
Exactitude de séquence
Flexibilité et complémentarité
0
100
200
300
400
500
600
700
800
GS 20 GS FLX
standard
GS FLX
Titanium
GS FLX + Sanger NGS
Ba
se
s
GS Junior
Illumina
GAIIx
100M
1M
10M
1G
10G
100G
400 800 0
Ba
se
s
Longueur de lecture
GS FLX
Titanium
System
200 600
Helicos Séquençage d’amplicons
Haplotypage
Genotypage
Séquencage de Gènes & Régions ciblés
Métagénomique
GS Junior
System
Illumina
HiSeq2000 ABI
SOLiD
1T
Complete
Genomics
Sanger
La technologie “longues lectures” 454 La seule technique capable de remplacer la méthode Sanger
Ion Torrent
MiSeq
1. Préparation de la librairie
2. emPCR amplification Amplification clonale des fragments
3. Préparation de la PicoTiterPlate – Séquençage clonal
454 Sequencing Workflow
Un fragment – Une bille – Une lecture
Shotgun
Blunt-end Ligation
Genomes entiers
BACs, Long Range PCR
Transcrits
ncRNA, ADN Ancien
ESTs, ADN fragmenté
ss DNA Library
Amplicons
Produits de PCR de 200-500 bp (HIV, exons, 16S...)
454 Sequencing Workflow
Un fragment – Une bille – Une lecture
emPCR
Sequençage
Amplification clonale en émulsion
454 Sequencing Workflow
Un fragment – Une bille – Une lecture
Mélange des fragments
d’ADN de la librairie avec
les billes et de l’huile.
Création d’un
microréacteur par
émulsion
Selection
(enrichissement) des
billes ayant les
fragments d’ADN
Amplification clonale
au sein de chaque
microréacteurs
454 Sequencing Workflow
Chargement de la PicoTiterPlate Device
• Diamètre des puits : 30 µm • > 100 000 lectures obtenues en paralleles • Une seule bille de capture avec l’ADN
simple brin amplifié est déposée par puits.
Les billes de capture et les fragments d’ADN sont déposés
dans la plaque de séquençage (PicoTiterPlate device)
• Polymerase ajoute 1 nucleotide (dNTP)
• Pyrophosphate est relargué (PPi)
• Sulfurylase crée ATP à partir PPi
• Luciferase hydrolyse l’ATP et utilise la lucéférine pour émettre de la lumière.
• 4 nucleotides (TACG) sont incorporés
par flux pendant 200 cycles
• Un nucléotide complémentaire au brin
matrice va s’incorporer et générer un
signal lumineux.
• Le signal lumineux est enregistré par la
caméra CCD.
• L’intensité du signal est proportionnelle
au nombre de nucléotides incorporés.
GS Junior : la chimie Titanium
Séquençage par synthèse
Flowgram
Key sequence = TCAG permet de calibrer le signal
Flow Order
1-mer
2-mer
3-mer
4-mer TACG
T T C T G C G A A
GS Titanium Sequencing
Flowgrams
11
One read
One bead
Un Fragment, Une Bille, Une Lecture
Librairie emPCR
Pyroséquençage Analyse des résultats
One Fragment One Well
Dépôt
La technologie Roche - 454
Une technique robuste
Une technique mondialement reconnue
Robustesse des résultats
Reproductibilité
Fiabilité
Evolution de la chimie
L’assurance de résultats de qualité
Une méthode facile à acquérir
Une technique rapidement opérationnelle
>1500
publications
La sécurité des résultats
La reconnaissance des résultats et des travaux effectués
Gain de temps et de coûts
2005 06 07 08 09 10 2011
La technologie Roche - 454
Une technique précise
L’exactitude de lecture
Qualité identique à Sanger (gold standard)
99,6% en lecture simple
99,995% en lecture consensus
(équivalent phred 50)
Des résultats de haute qualité
Méthode fiable
Méthode de référence (QC)
Une qualité de résultats incomparable
Gain de temps et de coûts
Q20
90,0%
91,0%
92,0%
93,0%
94,0%
95,0%
96,0%
97,0%
98,0%
99,0%
100,0%
0 100 200 300 400 500 600 700 800
Position on Read (bp)
Ac
cu
rac
y
Illumina TruSeq
GS Junior
GS FLX Titanium
GS FLX +
Séq courtes
La technologie Roche - 454
Les apports des longues séquences
Combinaison unique – longue séquence et exactitude
Chimie FLX+ Titanium = 800 bases
Pour GS Junior = améliorations prévues courant 2012
Des génomes simples aux plus complexes
Meilleure qualité d’assemblage
Lecture des séquences répétées
Détection de toutes les anomalies génétiques
Transfert des protocoles Sanger
Une seule technique = tous les résultats
Gain de temps pour l’obtention des résultats finaux
Séquences courtes
Séquences longues
La technologie Roche - 454
La préparation d’échantillons (amplicons)
Les solutions de préparation d’échantillons
La problématique de la préparation des
échantillons résolue
Des kits, des essais, des notes d’application, …
de l’échantillon aux résultats.
Fluidigm +
Roche 454
Raindance +
Roche 454
Capture de séquences +
Roche 454
10
50
100
200
500
0
Nb
de
ré
gio
ns
ou
Nb
de
gè
ne
s
Méthodes maison
Kits Roche
100 1000
Nb d’échantillons 500
Multiplicom +
Roche 454
Améliorer le rendement du laboratoire
Répondre à la demande croissante de séquençage
Réduire le temps / coût sur le développement et sur les résultats
La technologie Roche - 454
Rapidité et flexibilité
De l’échantillon aux résultats
1 run = 10 heures
2h d’analyse pour 40 Mbases (100.000 séquences)
Optimisation = 1 run /jour
Un séquenceur haut débit
à la fois de paillasse et de plateforme
Capable de répondre aux urgences
Flexibilité d’utilisation
Optimiser l’utilisation d’un séquenceur de plateforme pour différentes applications
Gain de temps pour l’accès aux résultats
Day 3 Data
Analysis
Day 2
Sequencing Day 1 Sample
Preparation
La technologie Roche - 454
Une analyse des données simplifiée
L’analyse des données
3 logiciels: de Novo, reséquençage, amplicons
Assemblage d’E. Coli de novo <10 minutes
Interface graphique intuitive
Une analyse informatique facilitée
Manipulation simple des données et export ouvert
Transfert et stockage des données économiques
Analyses faciles à intégrer et à maîtriser
Script(s) spécifique(s) par application
Réduction des coûts
Bioinformaticien non nécessaire en routine
Gain de temps pour l’implémentation de la technologie
Microbiologie
Séquençage 454 exemples d’applications
Phylogénie, Biogéographie Génétique des populations
Microbiologie
Séquençage 454 exemples d’applications
Phylogénie, Biogéographie Génétique des populations
Importance de la longueur de lecture dans la
caractérisation fine des populations virales
• 3 mutations sont régulierement observées en association
avec des résistances à des cocktails de molécles
thérapeutiques M46I/L, I84V, and L90M
• Il faut donc savoir si dans la population virale portée par un
patient ces mutations se rencontrent au sein d’un même
génome ou sur des génome séparés :
• - au sein du même génome viral : le traitement aura peu de
chance de marcher + risque de sélectionner le virus résistant
• - sur différents génomes : le traitement combinant plusieurs
molécules pourra convenir
• Ces 3 mutations se rencontrent dans une séquence de
500pb : seule la technologie Roche-454 peut permettre
de savoir si elles sont sur des génomes différents ou non
Séquençage de la souche épidémique O: 109 de E. coli
Problématique
Emergence de nouveaux variants pathogènes de E. coli
identification des facteurs de virulence
May 24 June 1 2 juin 9 juin 10 juin
Dépôt des premières données
de séquençage ion torrent +
Hiseq 2000
La communauté
bioinformatique reconnait
l’échec d’indentification
des gènes de virulence Test sur
GS Junior
May 24 June 1 2 juin 9 juin 10 juin
7 runs ion torrent
> 3000 contigs
data HiSeq 2000
Analyse complexe
>450 scaffolds
3 runs GS Junior:
Analyse : 3 « clics »
13 scaffolds
Résultats
Séquences courtes génèrent des assemblages très fragmentés
Caractérisation précise
des facteurs
virulence/résistance
Microbiologie
Séquençage 454 exemples d’applications
Phylogénie, Biogéographie Génétique des populations
Génétiques des populations :
analyse de la diversité intra- et inter-populations
Analyse de la diversité :
étude des fréquences alléliques
Ex : polymorphisme de taille de marqueurs microsatellites…
polymoprhisme mitochondrial ou nucléotidique…
- Approche « classique » :
Nombreux runs de séquenceurs capillaires…
Nombreuses analyses de fragments (Genscan, etc)
ou de séquences Sanger à relire
- Approche « NGS » :
PCR avec « tag » (MID) par population
Séquençage 454 : un run !
Tableau de variants = allèles rencontrés dans chaque population et leur fréquence.
Accès aux séquences (plus de problème d’homoplasie)
Ex : 20 populations – 50 individus diploïdes/ pop – 10 marqueurs
= 2000 séquences à analyser
=> 1 run de GS Junior = 100.000 séquences = couverture 50x
Génétiques des populations :
analyse de la diversité intra- et inter-populations
5 Long-Range PCR sur le génome
mitochondrial complet (15kb)
Analyse simultanée = 1 run GS Jr
226 variants répartis sur l’ensemble
des populations
Génétiques des populations :
développement rapide de nouveaux marqueurs
Séquençage direct (pas d’étape de clonage)
Filtrage bio-informatique des séquences contenant des motifs répétés…
Obtention de nouveaux microsatellites
Microbiologie
Séquençage 454 exemples d’applications
Phylogénie, Biogéographie Génétique des populations
Analyses phylogénétiques, phylogéographiques…
Avec les approches « classiques » :
Limites techniques : difficultés de travailler sur séquences nucléaires…
(clonage obligatoire)
Ces limites imposent les choix des séquences analysées !
- Séquences chloroplastiques ou mitochondriales analysées en priorité
- Pas d’information de diversité nucléotidiques nucléaires!
- Analyses de polymorphisme de taille (µsats) mais inférence
phyologénétiques difficiles…
Avec approche « NGS » :
Levée des contraintes techniques => séquençage clonal !!!
Accès à un plus large choix de séquences
Roche 454 => séquences longues => haplotypage / génotypage fiable
Analyses phylogénétiques, phylogéographiques…
“A crucial advantage is that the high coverage of clonally amplified sequences
simplifies haplotype determination, even in highly polymorphic species. This
targeted nextgeneration approach can greatly increase the use of nuclear DNA
sequence loci in phylogeographic and population genetic studies by mitigating
many of the time, cost, and analytical issues associated with highly
polymorphic, diploid sequence markers.“
Puritz et al (PloS One, 2012)
En résumé…
>100.000 séquences / run
Stockage des données aisé : 1 run = 10Gb
Facilité de prise en main = uniquement du pipetage!
1 workflow = plusieurs applications (shotgun, amplicons)
Robustesse = pas de laser, pas d’éléments mobiles
Longues séquences = haplotypage, génotypage, assemblage facilités
et transfert facile de projets « sanger »
Pas de licence logiciel = Linux !
Rapidité = 1,5 jours de labo – 10h de run
Fiabilité = 1ère technologie de séquençage à Haut-débit
> 30 GS Juniors
- en hôpitaux (Toulouse, Lille, Marseille, Bordeaux, Nantes,
Montpellier, La Pitié, HEGP )
- en biotech / Pharma
- en recherche (INRA, CNRS, INSERM)
(4 sites supplémentaires en préparation)
Les domaines d’application
- Oncologie / Génétique humaine
- Microbiologie
- Ecologie / génétique des populations
- Plantes
- Interactions hôtes/pathogènes
- ADN ancien…
Le GS Junior en France
GS Systems :
des machines et des hommes !!!
- Accompagnement à l’installation et validation de votre séquenceur dans votre laboratoire.
- Formation complète sur site et accompagnement sur les premières manipulations.
- Accompagnement au développement de nouvelles applications.
----------------------------------
- Un support application avec des spécialistes français Puces/Séquençage (4 Chefs de Projets “terrain” et un Chef de Produit).
- Un support “applications” Europe (hotline) : >15 spécialistes en séquençage.
- Un support SAV machine régionalisé avec intervention selon les “contraintes” du Diagnostic.