'Le séquençage à haut débit NGS dans le cadre du diagnostic'€¦ · séquençage étant...

19
ASSOCIATION NATIONALE DES PROFESSEURS ET MAITRES DE CONFERENCES BIOCHIMISTES3BIOLOGISTES MOLECULAIRES DES UFR MEDICALES (ANPMCB) Guidel (Morbihan), 21 Mai 2014 Atelier de formation DPC 'Le séquençage à haut débit NGS dans le cadre du diagnostic'

Transcript of 'Le séquençage à haut débit NGS dans le cadre du diagnostic'€¦ · séquençage étant...

!!

ASSOCIATION!NATIONALE!DES!PROFESSEURS!ET!MAITRES!DE!CONFERENCES!BIOCHIMISTES3BIOLOGISTES!MOLECULAIRES!DES!UFR!MEDICALES!(ANPMCB)!

Guidel (Morbihan), 21 Mai 2014

Atelier de formation DPC

'Le séquençage à haut débit NGS dans le cadre du diagnostic'

!

!!!

!

!

!!!

!!

! !

__________________________________________________________________________________________!ANPMCB,!!Atelier!de!formation!DPC!2014!'Le!séquençage!à!haut!débit!NGS!!dans!le!cadre!du!diagnostic'!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!! !!!!!!!!!!!!!!!!!!!2!!!!!!!!!!!!!!!!!!!!!!!!!!

__________________________________________________________________________________________!ANPMCB,!!Atelier!de!formation!DPC!2014!'Le!séquençage!à!haut!débit!NGS!!dans!le!cadre!du!diagnostic'!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!! !!!!!!!!!!!!!!!!!!!3!!!!!!!!!!!!!!!!!!!!!!!!!!

PROGRAMME DE L'ATELIER TECHNIQUE DPC 'Le séquençage à haut débit NGS dans le cadre du diagnostic'

Le séquençage à haut débit de l'ADN, dit de nouvelle génération (Next generation sequencing ou NGS), apporte des possibilités considérables en matière de connaissance du génome humain, bactérien ou viral. Une évaluation des connaissances par 20 QCM couvrant tout le domaine sera faite avant la formation et une évaluation sera aussi réalisée après la formation pour mesurer l'impact de cette formation. Cet atelier sera validant pour le Développement Personnel Continu (DPC) (Numéro d’ODPC en cours d’obtention). Début : 14h00

Emargement et distribution du formulaire de satisfaction [à rendre à la fin de l'atelier] Evaluation des pratiques et des connaissances pour le DPC (20 min)

Présentation introductive "Le Séquençage Haut Débit en diagnostic: Principes et Stratégies" (20 + 10 min) (J. Leclerc, Lille & M. de Tayrac, Rennes) Principes du NGS, présentation brève des technologies de NGS les plus utilisées dans nos laboratoires, des stratégies de capture et d'amplification et les analyses bioinformatiques associées.

Des expériences dans l'implémentation du NGS à visée diagnostique en génétique constitutionnelle et somatique (2h)

• Recherche de mutations responsables d’hypogonadisme hypogonadotrope syndromique

et non syndromique par séquençage PGM en routine hospitalière. C. Dodé • Mise en place du diagnostic moléculaire par NGS de la Sclérose Latérale Amyotrophique

au CHRU de Tours. P. Vourc'h • Diagnostic moléculaire des cardiomyopathies via une stratégie «Banques

AmpliSeq/Séquençage Ion PGM/Analyse NextGENe». G. Millat • Détection de grandes insertions/délétions par NGS: La lecture de séquences, c'est du

passé! Vive le calcul informatique! Exemple de la maladie de Charcot-Marie-Tooth. AS Lia-Baldini

• Oncogénétique digestive, l'expérience Lilloise. J. Leclerc • Diagnostic moléculaire des tumeurs solides, l'expérience Rennaise. A. Lespagnol

Pause : 20 min

Des données brutes au rendu de résultat : l'importance de la bioinformatique (Table ronde de 1h animée par M. Figeac & J. Leclerc et B. Ndiaye & M. de Tayrac) Les grandes étapes de l'analyse bioinformatique des données de NGS à visée diagnostique seront abordées: format des fichiers, alignement de séquences, qualité des données, méthodes d'identification de variants ('variant calling'), annotation et exploration visuelle.

Evaluation post-formation des pratiques et des connaissances (20 min) Rendu du Formulaire de satisfaction

Fin de l'atelier : 18h30

__________________________________________________________________________________________!ANPMCB,!!Atelier!de!formation!DPC!2014!'Le!séquençage!à!haut!débit!NGS!!dans!le!cadre!du!diagnostic'!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!! !!!!!!!!!!!!!!!!!!!4!!!!!!!!!!!!!!!!!!!!!!!!!!

Le Séquençage Haut Débit en diagnostic: Principes et Stratégies. Julie LECLERC, [email protected] Laboratoire d'Oncogénétique Moléculaire. Centre de Biologie Pathologie CHRU LILLE

__________________________________________________________________________________________!ANPMCB,!!Atelier!de!formation!DPC!2014!'Le!séquençage!à!haut!débit!NGS!!dans!le!cadre!du!diagnostic'!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!! !!!!!!!!!!!!!!!!!!!5!!!!!!!!!!!!!!!!!!!!!!!!!!

Le Séquençage Haut Débit en diagnostic: Principes et Stratégies. Marie DE TAYRAC, [email protected] Laboratoire de Génomique Médicale, CHU Rennes

!

!!

! !

__________________________________________________________________________________________!ANPMCB,!!Atelier!de!formation!DPC!2014!'Le!séquençage!à!haut!débit!NGS!!dans!le!cadre!du!diagnostic'!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!! !!!!!!!!!!!!!!!!!!!6!!!!!!!!!!!!!!!!!!!!!!!!!!

__________________________________________________________________________________________!ANPMCB,!!Atelier!de!formation!DPC!2014!'Le!séquençage!à!haut!débit!NGS!!dans!le!cadre!du!diagnostic'!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!! !!!!!!!!!!!!!!!!!!!7!!!!!!!!!!!!!!!!!!!!!!!!!!

Recherche de mutations responsables d’hypogonadisme hypogonadotrope syndromique et non syndromique par séquençage PGM en routine hospitalière Catherine DODE, [email protected] Laboratoire de biochimie et génétique moléculaire, Hôpital Cochin, Paris L’hypogonadisme hypogonadotrope (HH) est dû dans la plupart des cas à un déficit congénital en GnRH, l’hormone hypothalamique déclenchant la puberté. Ce déficit peut être non syndromique ou syndromique, et chacune de ces formes est génétiquement hétérogène. Les mutations responsables d’HH non syndromique sont situées dans les gènes de la GnRH (GNRH1) ou de son récepteur (GNRHR), ou dans des gènes codant pour d’autres couples ligand/récepteur (KISS1, KISS1R, TAC3, TACR3), qui contrôlent la sécrétion de l’hormone. Les HH syndromiques correspondent principalement au syndrome de Kallmann, dans lequel le signe clinique associé à l’HH est un déficit olfactif, total (anosmie) ou partiel (hyposmie), le plus souvent accompagné de l’aplasie des bulbes olfactifs. Ce syndrome résulte d’un défaut de migration des neurones produisant la GnRH au cours de l’embryogénèse, suite à un défaut de développement du système olfactif périphérique. D’autres signes cliniques peuvent être associés, selon la nature du gène impliqué: agénésie rénale, fente labiale et/ou palatine, mouvements en miroir, surdité, colobome de l’iris… 10 gènes responsables ont déjà été identifiés, KAL1, FGFR1, FGF8, PROKR2, PROK2, CHD7, SOX10, SEMA3A, HS6ST1, WDR11, mais seuls 30% des malades atteints du syndrome de Kallmann sont porteurs de mutations dans l’un de ces gènes. Différents modes de transmission de ce syndrome sont associés aux mutations de ces gènes : récessif lié au chromosome X (KAL1), autosomique dominant (FGFR1, SOX10), autosomique récessif (PROK2, PROKR2), et oligogénique. La technique classique de séquençage de Sanger n’est pas adaptée à la recherche de mutations dans les 16 gènes responsables d’HH syndromique et non syndromique. C’est pourquoi nous avons mis au point la technique de séquençage NGS des exons codants et régions adjacentes de l’ensemble des ces gènes sur séquenceur Ion Torrent (Life technologies). Les amorces ont été choisies à l’aide du logiciel Ampliseq designer. La taille des amplicons varie de 125bp à 225pb représentant 59,9 kb de régions séquencées. La couverture théorique est de 96,12%. Deux PCR multiplex permettent d’amplifier l’ensemble des exons pour chaque malade. Cinq exons ne sont pas amplifiés ou mal couverts, et doivent être séquencés séparément par la méthode de Sanger. 24 malades peuvent être analysés ensemble sur une puce 316. Les couvertures obtenues sont supérieures à 50X en moyenne, avec des écarts allant de 10 à 300X. Les résultats sont interprétés à l’aide des logiciels variant caller, nextgene et integrative genome viewer. Plus de 200 patients ont été analysés par cette technique, et les résultats obtenus seront présentés. Cette méthode de séquençage étant quantitative, il est en principe possible d’identifier des insertions/délétions d’un ou plusieurs exons à l’état hétérozygote, une application que nous sommes en train de mettre au point, en validant les résultats obtenus par PCR quantitative. !!!!!!!

!

__________________________________________________________________________________________!ANPMCB,!!Atelier!de!formation!DPC!2014!'Le!séquençage!à!haut!débit!NGS!!dans!le!cadre!du!diagnostic'!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!! !!!!!!!!!!!!!!!!!!!8!!!!!!!!!!!!!!!!!!!!!!!!!!

!

__________________________________________________________________________________________!ANPMCB,!!Atelier!de!formation!DPC!2014!'Le!séquençage!à!haut!débit!NGS!!dans!le!cadre!du!diagnostic'!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!! !!!!!!!!!!!!!!!!!!!9!!!!!!!!!!!!!!!!!!!!!!!!!!

Mise en place du diagnostic moléculaire par NGS de la Sclérose Latérale Amyotrophique (SLA) au CHRU de Tours Patrick VOURC’H Pr C. Andres, Laboratoire de Biochimie et Biologie moléculaire, CHRU de Tours. La SLA est une maladie neurodégénérative de l’adulte affectant les motoneurones centraux et périphériques. Le CHRU de Tours travaille sur la mise en place du diagnostic moléculaire de la SLA par NGS sur MiSeq (Illumina ; plateformes UTTIL et PPF ASB de l’Université François Rabelais). L’objectif, en lien avec les Centres SLA Hospitaliers et les laboratoires du projet européen STRENGTH (études génétiques et épigénétiques des pathologies du motoneurone ; débuté en mars 2014), est d’étudier une 20aine de gènes causaux de la SLA, ainsi que 80 à 100 gènes de susceptibilité et gènes candidats. Nos premiers résultats montrent la nécessité d’utiliser en parallèle plusieurs pipelines bioinformatiques d’analyse des résultats de séquençage. Ceci nous paraît particulièrement important dans le cadre d’anomalies par insertion ou délétion. Ils nous confortent également dans l’idée que nous développons depuis plusieurs années avec l’unité INSERM U930 (Tours) d’étudier tous les nouveaux variants par des études fonctionnelles, ceci si possible en amont ou en parallèle du rendu des résultats aux services cliniques.

__________________________________________________________________________________________!ANPMCB,!!Atelier!de!formation!DPC!2014!'Le!séquençage!à!haut!débit!NGS!!dans!le!cadre!du!diagnostic'!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!! !!!!!!!!!!!!!!!!!!!10!!!!!!!!!!!!!!!!!!!!!!!!!!

__________________________________________________________________________________________!ANPMCB,!!Atelier!de!formation!DPC!2014!'Le!séquençage!à!haut!débit!NGS!!dans!le!cadre!du!diagnostic'!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!! !!!!!!!!!!!!!!!!!!!11!!!!!!!!!!!!!!!!!!!!!!!!!!

Diagnostic moléculaire des cardiomyopathies via une stratégie «Banques AmpliSeq/Séquençage Ion PGM/Analyse NextGENe» Gilles MILLAT, [email protected] Laboratoire de Cardiogénétique Moléculaire, CHU Lyon Plateforme Séquençage NGS à visée diagnostic, Centre de Biologie Est, CHU Lyon Les cardiomyopathies héréditaires sont des atteintes primitives dans lesquelles le muscle cardiaque est structurellement et fonctionnellement anormal en l’absence de toute autre cause de cardiomyopathie. Les plus fréquemment retrouvées sont les cardiomyopathies hypertrophiques (CMH) et dilatées (CMD).

L’exploration moléculaire de ces pathologies est complexe car ces pathologies se caractérisent par une forte hétérogénéité génétique, génique et allélique. A ce jour, l’exploration des patients porteurs de CMH ou de CMD se limitait à l’analyse des séquences codantes des gènes les plus prévalents par des méthodologies couplant analyses HRM et séquençage Sanger. L’émergence du séquençage haut-débit permet de d’envisager des stratégies plus ambitieuses visant à explorer, de façon plus rapide et moins couteuse, un plus grand nombre de gènes.

Une cohorte de patients porteurs de CMH ou de CMD préalablement explorés par HRM/séquençage Sanger a été réanalysée par séquençage NGS sur un séquenceur Ion PGM (LifeTechnologies). Un panel restreint (MYH7, MYBPC3, MYL2, LMNA, TNNT2, TNNI3, TPM1, et SCN5A) a été testé via une préparation de bibliothèques basée sur la stratégie AmpliSeq (LifeTechnologies). Plusieurs runs indépendants de séquençage ont été effectués sur une puce Ion-318. L’analyse des régions couvertes et l’identification des différents variants ont été effectuées à l’aide du logiciel NextGENe 2.3.4. Les résultats obtenus montrent que le design réalisé permet de couvrir parfaitement 93% (145/156) des séquences exoniques ciblées (et de leurs bordures introniques) avec une profondeur minimale supérieure à 30 X (profondeur moyenne: 400 lectures). L’utilisation des paramètres par défaut du logiciel NextGENe a permis de détecter 91,2% (83/91) des variations précédemment identifiées: l’intégralité des substitutions (57/57) a été aisément mise en évidence, mais 8 des 34 indels attendus n’ont pas été initialement détectés. Ces indels étaient principalement localisés dans des zones d’homopolymères. Une modification des paramètres NextGENe au niveau de la lecture de ces variants dans les zones d’homopolymères a permis de mettre en évidence 7 des 8 indels manquants. La modification des paramètres NextGENe a cependant fortement réduit la spécificité de l’analyse en augmentant de façon significative le nombre de faux positifs d’indels. Une comparaison de l’ensemble des variants identifiés pour l’ensemble des patients présents au sein d’une même expérience via un fichier Excel a permis d’éliminer la plupart de ces faux-positifs.

En résumé, cette stratégie d’exploration moléculaire basée sur l’utilisation d’un panel AmpliSeq restreint et d’une analyse in silico centrée sur le logiciel NextGENe permet d’explorer de façon rapide (env. 5 jours) et à un coût raisonnable (env. 120 € HT/patient) 22 patients simultanément pour les 8 gènes les plus fréquemment impliqués dans les cardiomyopathies. Les régions non-couvertes sont actuellement étudiées par analyses HRM et séquençage Sanger. Une étude, toujours axée sur la technologie AmpliSeq, est actuellement en cours afin d’améliorer la couverture des gènes inclus dans ce panel, mais également d’augmenter significativement le nombre de gènes explorés, tout en conservant le plus possible ce coût d’analyse et ce délai de rendu du résultat.!

!!!!!

__________________________________________________________________________________________!ANPMCB,!!Atelier!de!formation!DPC!2014!'Le!séquençage!à!haut!débit!NGS!!dans!le!cadre!du!diagnostic'!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!! !!!!!!!!!!!!!!!!!!!12!!!!!!!!!!!!!!!!!!!!!!!!!!

!

__________________________________________________________________________________________!ANPMCB,!!Atelier!de!formation!DPC!2014!'Le!séquençage!à!haut!débit!NGS!!dans!le!cadre!du!diagnostic'!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!! !!!!!!!!!!!!!!!!!!!13!!!!!!!!!!!!!!!!!!!!!!!!!!

Détection de grandes insertions/délétions par NGS: La lecture de séquences, c'est du passé! Vive le calcul informatique! Exemple de la maladie de Charcot-Marie-Tooth! Anne-Sophie LIA, [email protected] Service de Biochimie et Génétique Moléculaire. CHU de Limoges Les neuropathies périphériques de type Charcot-Marie-Tooth (CMT) sont les maladies neuro-musculaires d’origine génétique les plus fréquentes (prévalence 1/2500). De nombreux gènes (plus de 62 actuellement) ont été impliqués dans les différentes formes de la maladie (démyélinisante, axonale, intermédiaire, motrice pure…), avec des modes de transmission variables. L’hétérogénéité génétique de ce syndrome complique le diagnostic moléculaire, qui se réalise classiquement par séquençage Sanger en suivant des arbres décisionnels. Dans les formes axonales, la recherche du gène muté s’avère infructueuse chez environ 2/3 des patients, les gènes décrits comme rarement mutés n’étant pas systématiquement testés. Afin d’identifier de façon plus efficace les mutations responsables de formes génétiquement très hétérogènes de CMT, nous avons adapté la stratégie Ampliseq (LifeTech) au séquenceur Proton (Life Tech). Nous avons ainsi créé un design de 1402 amplicons, couvrant les 37 gènes (120 kb) que nous avons répertoriés comme impliqués dans les formes intermédiaires, axonales et motrices pures de CMT, ainsi que le gène PMP22. Grâce à la stratégie d’étiquetage, nous analysons les ADNs de 8 patients à chaque expérience. 98,9% des séquences ciblées sont lues plus de 200 fois par patient. L’analyse par le logiciel Ion Reporter nous a permis de détecter aisément, chez nos contrôles, l’ensemble des mutations de type SNP, les variations sur des petits homopolymères (5 répétitions) et les petits indels (9 nucléotides). Cependant, cette approche n’a pas permis de mettre en évidence les grands indels de 2 de nos contrôles (un ayant une duplication du gène PMP22 et l’autre une délétion de ce même gène). Nous avons alors essayé d’exploiter les profondeurs de lectures de chacun de nos 1402 amplicons afin de pister ces grands indels en créant un logiciel d’analyse de ces données. Ce programme nous a permis de détecter, de façon très efficace, les duplications et délétions du gène PMP22 chez nos 2 patients contrôles et également de découvrir un syndrome 48, XXXY chez l’un de nos patients. Ces premiers résultats confirment l’intérêt de l’utilisation des profondeurs de lectures pour détecter les (très) grands indels. Nous testons actuellement cette approche sur l’ensemble de nos runs NGS afin de pister des indels de taille plus modérée (200-300 bp).

__________________________________________________________________________________________!ANPMCB,!!Atelier!de!formation!DPC!2014!'Le!séquençage!à!haut!débit!NGS!!dans!le!cadre!du!diagnostic'!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!! !!!!!!!!!!!!!!!!!!!14!!!!!!!!!!!!!!!!!!!!!!!!!!

__________________________________________________________________________________________!ANPMCB,!!Atelier!de!formation!DPC!2014!'Le!séquençage!à!haut!débit!NGS!!dans!le!cadre!du!diagnostic'!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!! !!!!!!!!!!!!!!!!!!!15!!!!!!!!!!!!!!!!!!!!!!!!!!

Oncogénétique digestive, l’expérience lilloise Julie LECLERC, [email protected] Laboratoire d'Oncogénétique Moléculaire, Biochimie et Biologie Moléculaire HMNO, Centre de Biologie Pathologie, CHRU LILLE

Le laboratoire d’Oncogénétique de Lille réalise le diagnostic génétique de prédisposition héréditaire au cancer du côlon pour environ 200 cas index par an. Les gènes explorés sont les gènes MMR (MisMatch Repair) MLH1, MSH2, MSH6 et PMS2, impliqués dans le syndrome de Lynch et les gènes de polyposes : polyposes adénomateuses (APC, MUTYH et AXIN2) et polyposes hamartomateuses (STK11, impliqué dans le syndrome de Peutz Jeghers, SMAD4 et BMPR1A, impliqués dans la polypose juvénile). Un des principaux objectifs du transfert de l’activité diagnostique du séquençage classique Sanger vers les technologies de séquençage de nouvelle génération était de réduire le délai de rendu des résultats, sans toutefois diminuer le rendement diagnostique, ce qui impose notamment une couverture suffisante de l’ensemble des régions d’intérêt. La stratégie choisie est une stratégie de type amplicons (PCR multiplex AmpliSeq, Life Technologies) sur Ion Torrent, avec un panel dédié aux polyposes et deux panels dédiés au syndrome de Lynch. L‘intérêt du deuxième panel dédié syndrome de Lynch est de permettre une amplification spécifique des exons du gène PMS2 qui présentent une grande homologie de séquence avec plusieurs autres régions du génome (existence de pseudogènes), via une amplification préalable par long range PCR. Les principales modifications du protocole technique et de l’analyse bioinformatique sont présentées : enrichissement en amorces des pools d’amorces de la PCR multiplex pour les amplicons avec une profondeur de couverture insuffisante, adaptation de la quantité de matrice à utiliser pour la PCR multiplex à partir de produit amplifié par long range PCR, adaptation de l’analyse bioinformatique à la stratégie utilisée pour l’étude du gène PMS2… !!! !

__________________________________________________________________________________________!ANPMCB,!!Atelier!de!formation!DPC!2014!'Le!séquençage!à!haut!débit!NGS!!dans!le!cadre!du!diagnostic'!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!! !!!!!!!!!!!!!!!!!!!16!!!!!!!!!!!!!!!!!!!!!!!!!!

! !

__________________________________________________________________________________________!ANPMCB,!!Atelier!de!formation!DPC!2014!'Le!séquençage!à!haut!débit!NGS!!dans!le!cadre!du!diagnostic'!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!! !!!!!!!!!!!!!!!!!!!17!!!!!!!!!!!!!!!!!!!!!!!!!!

Diagnostic moléculaire des tumeurs solides, l'expérience Rennaise! Alexandra LESPAGNOL, [email protected] Plateforme INCa de Rennes, CHU Rennes

Le développement des thérapies ciblées dans le traitement des cancers rend le diagnostic moléculaire des tumeurs solides indispensable pour la prise en charge thérapeutique des patients. La capacité de génotyper un nombre croissant de mutations pour affiner la stratification moléculaire de la tumeur fait partie intégrante de l’amélioration des soins proposés aux patients. Dans ce cadre, le séquençage nouvelle génération (NGS) permet une exploration moléculaire plus complète de la tumeur. Nous présenterons la stratégie que nous avons mis en place sur la plateforme INCa de Rennes afin de permettre l’implémentation du NGS en diagnostic.

Une cohorte de 2000 patients génotypés par des techniques de diagnostic de routine (pyroséquençage, et PCR spécifiques d’allèles) et 250 ADN contrôles extraits de lignées cellulaires ont été analysés par NGS sur séquenceur MiSeq (Illumina). Les librairies ont été produites selon une méthode « Amplicon » grâce au système Access Array (Fluidigm). Un panel de 92 amplicons couvrant 5,5kb de séquence utile a été développé afin de détecter des mutations ponctuelles ou des petites insertions et délétions sur 17 oncogènes (AKT1, ALK, BRAF, CTNNB1, EGFR, ERBB2, FGFR3, HRAS, IDH1, IDH2, KIT, KRAS, MET, MAP2K1, NRAS, PDGFRA, PIK3CA). L’analyse des séquences issues de 30 runs a été réalisée par le pipeline informatique dédié « VariantDx ». Ce pipeline intègre des outils open-source ainsi que des outils développés à façon pour permettre la détection d’altérations de basse fréquence allélique sur de l’ADN de mauvaise qualité (extraction à partir d’échantillon FFPE). Les résultats obtenus montrent que ce design permet de couvrir la totalité des régions analysées avec une profondeur minimale de 200X (profondeur moyenne : 500X) quelque soit la nature du prélèvement. Considérant le pyroséquençage comme notre méthode de référence, les résultats de NGS donne une sensibilité et une spécificité supérieure à 99%.

Nous démontrons que notre approche de séquençage NGS peut être utilisée en diagnostic pour la détection systématique de mutations somatiques. Notre stratégie permet l'analyse simultanée de 48 exons de 17 oncogènes pour 96 échantillons par run et permet d'améliorer de manière efficace le diagnostic moléculaire des tumeurs pour un coût (75-90€) et dans un délai raisonnable (9-12 jours). Nous ferons un retour sur l’expérience que nous avons acquis durant les deux années de mise en place de cette nouvelle technologie.

! !

__________________________________________________________________________________________!ANPMCB,!!Atelier!de!formation!DPC!2014!'Le!séquençage!à!haut!débit!NGS!!dans!le!cadre!du!diagnostic'!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!! !!!!!!!!!!!!!!!!!!!18!!!!!!!!!!!!!!!!!!!!!!!!!!

__________________________________________________________________________________________!ANPMCB,!!Atelier!de!formation!DPC!2014!'Le!séquençage!à!haut!débit!NGS!!dans!le!cadre!du!diagnostic'!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!! !!!!!!!!!!!!!!!!!!!19!!!!!!!!!!!!!!!!!!!!!!!!!!

Des données brutes au rendu de résultat : l'importance de la bioinformatique Table ronde de 1h animée par Martin FIGEAC, [email protected] Plate-forme génomique fonctionnelle et structurale, IRCL Lille Julie LECLERC, [email protected] Laboratoire d'Oncogénétique Moléculaire, Biochimie et Biologie Moléculaire HMNO, Centre de Biologie Pathologie, CHRU LILLE Birama NDIAYE, [email protected] Laboratoire de Génomique Médicale, CHU Rennes Marie DE TAYRAC, [email protected] Laboratoire de Génomique Médicale, CHU Rennes !Les grandes étapes de l'analyse bioinformatique des données de NGS à visée diagnostique seront abordées: format des fichiers, alignement de séquences, qualité des données, méthodes d'identification de variants ('variant calling'), annotation et exploration visuelle. !