La Génétique pour les nuls - sfndt.org · Inserm La Génétique pour les nuls Mutations...

Post on 11-Sep-2018

225 views 0 download

Transcript of La Génétique pour les nuls - sfndt.org · Inserm La Génétique pour les nuls Mutations...

Inserm

La Génétique pour les Nuls

Inserm

Marie Pierre AUDREZET

Laboratoire de Génétique Moléculaire

INSERM U1078 - CHRU BREST

pour les Nuls

Inserm

La Génétique pour les nuls

� Mutations

� Référence : Base de données HGMD

� Différents types de mutations

� Conséquences

� Nomenclature Inserm� Nomenclature

� Techniques d’étude

� Interprétation d’un CR

� Bases de données

Inserm

Mutations

� Référence : Base de données HGMD

� Mutations responsables des maladies génétiques

� Etat des lieux

Inserm

Inserm

HGMD

� Analyse des données HGMD

� 2014 : 148 413 entrées dans 6137 gènes

Non sens/ faux sens InsermSubstitutions

nucléotidiques

Insertions-délétions

de quelques nucléotides

Remaniements géniques

de grande taille

0 10000 20000 30000 40000 50000 60000 70000 80000

Délétions de grande tail le

Réarrangements complexes

Insertions de grande tail le et duplications

Répétitions variables

Insertions/délétions de quelques nucléotides

Insertions de quelques nucléotides

Délétions de quelques nucléotides

Promoteurs

Epissage

Inserm

Les substitutions nucléotidiques

� 70% des mutations

� Induites

� Agents mutagènesInserm

� Métabolisme endogène

� Erreurs spontanées lors de la réplication de l’ADN, non détectées par les systèmes de réparation

� CpG : 20% des substitutions nucléotidiques responsables de maladies génétiques (« point chauds »)

Inserm

Les substitutions nucléotidiques

� Dans une séquence codante : Conséquences

� Remplacement d’un acide aminé par un autre

- Mutations faux sens, polymorphismes, SNP

Séquence d’ADN sauvage

Bases ADN C T G A G C C C T G C C T G G T T C C T GI I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I

InsermBases ADN

Séquence protéique leu Pro Ala TrpSer LeuPhe

Séquence d’ADN mutée

Bases ADN

Séquence protéique

C T G A G C C C T G T C T G G T T C C T GI I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I

Leu Pro Val TrpSer leuPhe

Inserm

Les substitutions nucléotidiques

� Dans une séquence codante : Conséquences

Séquence d’ADN sauvage

Bases ADN C T G A G C C C T G C C T G G T T C C T GI I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I

- Mutations nonsens

� Remplacement d’un codon par un codon stop

InsermBases ADN

Séquence protéique leu Pro Ala TrpSer LeuPhe

Séquence d’ADN mutée

Bases ADN

Séquence protéique

C T G A G C C C T G C C T A G T T C C T GI I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I

Leu Pro Ala StopSer

Inserm

Les substitutions nucléotidiques

� Dans un site canonique d’épissage : Conséquences

� Abolition d’un site canonique d’épissage ou création d’un site alternatif d’épissage

15 16 1817

Inserm

15 16AG GT AGGT

18AG

17 AG

15 16AG GT AGGT

18TG

17 AG

1715 16 18

1715 16 18

16 1815

Inserm

Mécanismes et conséquences des mutations

� 3 grandes classes de mutations

Substitutions Epissage

Non sens/ faux sens

Inserm Substitutions

nucléotidiques

Insertions-délétions

de quelques nucléotides

Remaniements géniques

de grande taille

0 10000 20000 30000 40000 50000 60000 70000 80000

Délétions de grande tail le

Réarrangements complexes

Insertions de grande tail le et duplications

Répétitions variables

Insertions/délétions de quelques nucléotides

Insertions de quelques nucléotides

Délétions de quelques nucléotides

Promoteurs

Epissage

Inserm

Les courtes insertions-délétions

� 20-25% des anomalies répertoriées

� Surviennent souvent au niveau de courtes répétitions en tandem par un mécanisme de « slippage »

5’ 3’3’ 5’

Réplication

3’ 5’3’5’

Inserm5’

Slippage

5’ 3’3’ 5’

3’ 5’3’5’

3’ 5’3’5’

3’ 5’3’5’

Réplication

+ 1 répétition

3’ 5’3’5’

- 1 répétition

Inserm

Les courtes insertions-délétions

� Conséquences

� Non multiples de 3 : décalage du cadre de lecture

Séquence d’ADN sauvage

I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I IInserm

…Stop

Bases ADN

Séquence protéique

C T G A G C C C T G C C T G G T T C C T GI I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I

leu Pro Ala TrpSer LeuPhe

Séquence d’ADN mutée

Bases ADN

Séquence protéique

C T G A G C C C C C T G C C T G G T T C C I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I

Leu Pro Leu ProSer SerGly

Inserm

Les courtes insertions-délétions

� Conséquences

Séquence d’ADN sauvage

I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I

� Multiple de 3 : perte d’un ou plusieurs AA

InsermBases ADN

Séquence protéique

C T G A G C C C T G C C T G G T T C C T GI I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I

leu Pro Ala TrpSer LeuPhe

Séquence d’ADN mutée

Bases ADN

Séquence protéique

C T G A G C T G G T T C C T GI I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I

Leu Trp Phe LeuSer

Inserm

Mécanismes et conséquences des mutations

� 3 grandes classes de mutations

Substitutions Epissage

Non sens/ faux sens

Inserm Substitutions

nucléotidiques

Insertions-délétions

de quelques nucléotides

Remaniements géniques

de grande taille

0 10000 20000 30000 40000 50000 60000 70000 80000

Délétions de grande tail le

Réarrangements complexes

Insertions de grande tail le et duplications

Répétitions variables

Insertions/délétions de quelques nucléotides

Insertions de quelques nucléotides

Délétions de quelques nucléotides

Promoteurs

Epissage

Inserm

Les réarrangements génomiques

� 5-10% des anomalies répertoriées

� Evènements de recombinaison homologue non allélique (NAHR) intra ou extra chromosomiques- Impliquent des séquences semblables (pas nécessairement identiques)Inserm- Impliquent des séquences semblables (pas nécessairement identiques)

Inserm

Les réarrangements génomiques

� Conséquences

� Perte ou gain de matériel génétique

Stop5’UTR 3’UTR

ATG

1 2 23 24 4626 45Inserm1 2 23 24 4626 45

Stop5’UTR 3’UTR

ATG

1 23 24 4625 452 23 24

Inserm

Mécanismes et conséquences des mutations

� 3 grandes classes de mutations

Substitutions Epissage

Non sens/ faux sens

Inserm Substitutions

nucléotidiques

Insertions-délétions

de quelques nucléotides

Remaniements géniques

de grande taille

0 10000 20000 30000 40000 50000 60000 70000 80000

Délétions de grande tail le

Réarrangements complexes

Insertions de grande tail le et duplications

Répétitions variables

Insertions/délétions de quelques nucléotides

Insertions de quelques nucléotides

Délétions de quelques nucléotides

Promoteurs

Epissage

Autres évènements rares

Inserm

Les autres évènements rares

� Mutations dynamiques

� Expansions de triplets

- Régions codantes des gènes, ex CAG (glutamine), amplification modérée

- Régions non codantes � 10 kbInserm- Régions non codantes � 10 kb

� Nombreuses maladies neurodégénératives

- Huntington, X Fragile…

- Caractérisées par un phénomène d’anticipation

- Âge plus précoce et accentuation de la gravité

- Amplification du nombre de motifs au cours des générations

Inserm

Les autres évènements rares

� Insertions d’éléments transposables

� Eléments transposables représentent ½ du génome humain

- Majoritairement des rétrotransposons (40%), intermédiaire ARN

- Déplacement peut générer des mutations– Directement par insertion dans un gène– Indirectement (recombinaison homologue)Inserm– Indirectement (recombinaison homologue)

1ère description 2004 : F8, hémophilie

� Conversion génique

� Mécanisme de recombinaison particulier avec remplacement d’une courte séquence d’ADN (pseudogène)

- Ex :hyperplasie congénitale des surrénales par mutations du gène 21-OH

Inserm

Les autres évènements rares

� Les mécanismes épigénétiques

� Empreinte parentale

- De nombreux gènes soumis à empreinte parentale identifiés

- Pathologies dues a une modification de l’équilibre entre les allèles parentaux

- Expression phénotypique de la maladie peut dépendre du parent qui a transmis Inserm- Expression phénotypique de la maladie peut dépendre du parent qui a transmis l’anomalie génétique

� Disomies uniparentales

- 1ère observation (1988) : enfant CF de petite taille suggérant existence d’un gène impliqué dans la croissance soumis à empreinte, gène maternel n’étant pas exprimé

- Prader willi (maternelle) et Angelman (paternelle) du Chr15

Inserm

Les autres évènements rares

� Les mutations de novo et les mosaïques germinales

� Mutations de novo surviennent dans la lignée germinale au cours des divisions mitotiques (spermatogénèse, ovogénèse)

� Peuvent être très importantes pour certaines maladies- 30% myopathie de Duchenne, hémophilie AInserm- 30% myopathie de Duchenne, hémophilie A

- 50% NF1, Sclérose Tubéreuse de Bourneville

- 90% Achondroplasie

� Fréquence des néomutations paternelles plus élevée (200 divisions)

� Peu de récidive- Cas de parents de phénotype normal ayant plus d’un enfant atteint

� Mosaïque germinale Clone de cellules germinales porteur de la mutation

Inserm

Quelles sont les conséquences des anomalies moléculaires sur la

fonction de la protéine ???Inserm

Inserm

Conséquence des anomalies moléculaires sur la fonction de la protéine

� Quand on pense mutation, on sous entend… perte de fonction

� Mutations troncatives (non sens, épissage, frameshift, grands réarrangements…)

- Absence de protéineInserm

- Formation d’une protéïne tronquée (activité nulle ou réduite)

� Les conséquences des mutations faux sens, des délétions en phase, des anomalies d’épissage… sont moins certaines

- Changement de la séquence protéique

- Affectent la stabilité, l’adressage cellulaire, la maturation, l’assemblage dans une structure, des sites importants pour l’activité enzymatique, les interactions avec d’autres protéines…

- Nécessité d’un faisceau d’arguments pour déterminer les conséquences de ces anomalies

Inserm

Conséquence des mutations sur la fonction de la protéine

� Arguments à prendre en compte

� Répertoriée dans les bases de données (fréquence ?)

� Localisation dans la protéine (région essentielle si connue…)

� Localisation au sein d’une séquence orthologue très conservéeInserm� Localisation au sein d’une séquence orthologue très conservée

� Nature du changement d’acide aminé

- Charge, polarité, encombrement stérique…

- Outils bioinformatiques

� Vérification de son absence chez des sujets témoin

� Apparition de novo chez un sujet atteint : critère majeur

Inserm

Mais tout cela ne suffit pas…

� Pour connaitre les véritables conséquences des mutations

� Tests fonctionnels

� Les mutations peuvent avoir plusieurs effetInserm� Les mutations peuvent avoir plusieurs effet

� Perte de fonction

� Gain de fonction

� Effet dominant négatif

Inserm

Conséquence des mutations sur la fonction de la protéine

� Mutations par perte de fonction

� Allèles amorphes (nuls) ou hypomorphes

- Perte totale ou partielle d’expression ou d’activité

Inserm� Retrouvées

- dans la majorité des maladies récessives

- dans les maladies dominantes par haploinsuffisance– Concentration en protéine est critique– Hypercholestérolémie familiale

� Grande hétérogénéité (sauf effet fondateur)

Inserm

Conséquence des mutations sur la fonction de la protéine

� Mutations par gain de fonction

� Allèles hypermorphes

- Expression d’une forme hyperactive de son produit

- Surexpression du gène sauvageInserm- Surexpression du gène sauvage

� Allèles néomorphes

- Code pour une protéine dont la fonction est différente

- Mutations somatiques associées aux cancers

- Plus rarement dans les maladies héréditaires

Inserm

Conséquence des mutations sur la fonction de la protéine

� Mutations par effet dominant négatif

� A la frontière entre perte et gain de fonction

- Allèle antimorphe

- Protéine mutée perd sa fonction et interfère avec la fonction de l’allèle normal Inserm- Protéine mutée perd sa fonction et interfère avec la fonction de l’allèle normal chez les hétérozygotes

- Gènes codant des protéines de structure ou capables de former des homo- ou hétérodimères

Inserm

La nomenclature des mutations

Inserm

Inserm

La nomenclature des mutationsRationnel

� Harmonisation de la façon de dénommer les gènes humains et leurs mutations

� Trop de noms pour la même mutation- IVS3+2T>C, 359+2T>C…

- c.5764C>T, Q1922X…

Inserm� Un seul nom pour des mutations différentes

- W1893X, TGG > TAG ou TGA

� De nouvelles mutations identifiées chaque jour

� Plus de séquençage � plus de complexité

� Risque réel d’erreur en diagnostic

Inserm

La nomenclature des mutations

� Exigence pour une nomenclature qui soit

� Universelle

� Cohérente entre les gènesInserm

http://www.gene.ucl.ac.uk/nomenclature/guidelines.html

� Non équivoque

� Simple

Inserm

Rêgles de base

Stop

5’UTR 3’UTRATG

1 2 3 4 46

Séquence de référenceInserm

n°accession et n° de version

NM_1009944.2

ADNc

1 : A de l’ATG

Numérotation de la

séquence codante

+ ou – pour introns

ADN génomique

1 : 1ère base de la

séquence

Inserm

La nomenclature des mutations

Inserm

� Exemple : le gène PKD1 46 exons

� 51 kb chromosome 16 (2 187 899 à 2 136 711)

Illustrations Alamut v2.3 Interactive Biosoftware

Inserm

La nomenclature des mutations

Partie de l’ADN génomique de l’exon 5g.DNAInserm g.DNA

Partie de l’ADN codant de l’exon 5c.DNA

Partie de la séquence protéique de l’exon 5 p.

A chaque nucléotide correspond une position en ADN génomique, cDNA, Proteine

Inserm

Substitutions nucléotidiques

� Sont notées « > »

Inserm

c.1597p.533g.2.168 843Pos/ATG : 18848Exon 7

c.1597G>T

CAG>TAG Gln > Stop

p.Gln533Ter ou p.Q533* ou p.Q533X

c.1597G>A

CAG>AAG Gln > Lys

p.Gln533Lys ou p.Q533L

Inserm

Acide Aminé Abbréviation AbbréviationNom complet (3 Lettres) (1 lettre)

Alanine Ala AArginine Arg RAsparagine Asn NAspartate Asp D

Au niveau protéique

� 3 facons de nommer les acides aminés

InsermAspartate Asp DCysteine Cys CGlutamate Glu EGlutamine Gln QGlycine Gly GHistidine His HIsoleucine Ile ILeucine Leu LLysine Lys KMethionine Met MPhenylalanine Phe FProline Pro PSerine Ser SThreonine Thr TTyrosine Tyr YTryptophan Trp WValine Val VTermination Ter ou * X

Préférence pour le code à 3 lettres

Inserm

Délétions

� Notées « del » après le nucléotide ou le dernier délété

TCAGCGCCGCACAGCTACGTCTGCGAGCTGCAInserm

c.1576p.533g.2.168 843Pos/ATG : 18848Exon 7

Simples : c.1576del

Multiples : c.1576_1588del

Dans une répétition : (exemple CCGCACAGCT), on choisit la séquence normale la plus longue c.1578_1579del (pas c.1576_1577del)

p.His526Thrfs*32

p.His526Alafs*28

p.His526Glnfs*60

Inserm

Insertions

� Notées « ins » après les nucléotides flanquants

TCAGCGCCGCAC AGCTACGTCTGCGAGCTGCA٧A٧

Inserm

Simples : c.1578_1579insA

Multiples : c.1578_1579insCTA

Dans une répétition : (exemple CCGCACACAGCT), c’est une duplication, on choisit la séquence normale la plus longue c.1578_1579dup (pas c.1576_1577dup)

p.His526Thrfs*32

p.His526Alafs*28

p.Thr504Serfs*14

TCAGCGCCGCAC AGCTACGTCTGCGAGCTGCA٧

c.1578p.526g.2.168 862Pos/ATG : 18829Exon 7

٧

Inserm

Insertions-délétions

� Notées « delins » après le segment délété

TCAGCGCCGCAC AGCTACGTCTGCGAGCTGCA٧A

AC Inserm

c.1578_1579delinsA

TCAGCGCCGCAC AGCTACGTCTGCGAGCTGCA

c.1578p.526g.2.168 862Pos/ATG : 18829Exon 7

AC

Inserm

Mutations d’épissage

� Mutations d’épissage

� Variants introniques- Numérotés en + à partir du début de l’intron et en – à partir de la fin

Inserm

c.7863+2T>G

c.7864-1G>A

L’effet sur la protéine n’étant pas connu, pas de nomenclature protéique

GTG CTG AAC GAG GTGAGTGC….. GCCTGCCCCAG TAC GAG CGG GCC

15 16

15 16 18

AG GT AGGT18

TG17 AG

Inserm

Grands réarrangements

� Grands réarrangements

Stop5’UTR 3’UTR

ATG

1 2 23 24 4626 45Inserm

Bornes non précisées

PKD1dele24-26

PKD2dele10-15

Bornes précisées

c.8791+89_9397+743del

g.87876727_89162895del

Inserm

Les techniques d’analyse

� Maintenant que les mutations et la nomenclature n’ont plus aucun secret…

Inserm

� Quelle sont les techniques d’analyse qui permettent d’identifier ces différents types de mutations ?

Inserm

Les techniques d’analyse

� Le choix de la technique est fonction de ce que l’on veut rechercher

5-10% de grands Inserm70% de substitutions nucléotidiques

20-25% de courtes insertions délétions

réarrangement

Mutations récurrentes ou hétérogénéïté allélique ?

Techniques de screening

Techniques de scanning (balayage)

Inserm

Le séquençage

� Basées sur la PCR de courts fragmentsSubstitutions, petites insertions délétions

1 2 3 4 75 6Inserm

Amplification des régions codantes

Séquençage de l’ADN du patient

Comparaison avec séquence de référence

GGC TTG CAG CACGGC TTG TAG CAC

stop

Substitution hétérozygote

Inserm

Recherche de mutations ponctuelles

� Les techniques basées sur la PCR de courts fragments

� Amplification de courts fragment

� Analyse de la dénaturation ou des courbes de fusion

Inserm

DHPLC HRM

Inserm

Recherches de réarrangements

� Les techniques basées sur la PCR ou le caryotype moléculaire

Par qPCRMLPA, QMPSF

Par hybridation comparativePuce à ADN, CGH Array

Inserm

Inserm

Le NGS

� NGS

Inserm

Inserm

� Maintenant qu’on a tout vu

� Comment comprendre un compte rendu d’analyse génétique

Inserm� Que doit-il contenir ?

Inserm

Le compte rendu d’analyse génétique

� Recommandations

Inserm

Inserm

Le compte rendu d’analyse génétique

� Ce que doit contenir Chaque Compte-rendu

� Partie administrative

- Identité précise du laboratoire avec contacts– Si une partie des analyses a été réalisée ailleurs, cela doit être clairement mentionné

- Titre explicite « Analyse moléculaire du gène xx »

- Date du rapport, pages numérotées

- Nom et adresse du prescripteur Inserm- Nom et adresse du prescripteur

- Signature du biologiste (co-validation et co-signature recommandés »

� Patient

- Nom, prénom, NJF, DDN, sexe (nom sur chaque page si pages multiples

- Nature et date du prélèvement (état si congelé, par ex), date réception

- N° echantillon

� Indication d’étude

- Informations cliniques

- Raisons de l’étude (familial, diagnostic…)

Inserm

Le compte rendu d’analyse génétique

� Ce que doit contenir Chaque Compte-rendu

� Methodologie

- Détail des tests utilisés depuis l’extraction de l’ADN

- Si kit commercial, référence et version

- Analyse génétique : N° de la séquence de référence utilisée pour identifier Inserm- Analyse génétique : N° de la séquence de référence utilisée pour identifier les variants

- Quels exons testés

- Par quelle technique

- Sensibilité du test, si approprié

Inserm

Le compte rendu d’analyse génétique

� Ce que doit contenir Chaque Compte-rendu

� Résultats

- Présentés brièvement sans ambigüité

- Si plusieurs tests, résultats séparés pour chaque test

- Mutation en nomenclature HGVS (autre nomenclature si besoin entre ())Inserm

- Si plus d’un variant, commentaires sur la phase, prenant en compte le mode de transmission

� Interprétation « full and clear interpretation of results »

- Dépend du contexte clinique et de la raison d’étude

- Utilisation d’outils de prédiction bioinfo sous la responsabilité du biologiste

- Données de la littérature, databases spécifiques

- Informations sur l’intérêt des études familiales ou généalogiques dans l’aide à l’interprétation

Inserm

Le compte rendu d’analyse génétique

� Après lecture d’un CR final

� Confirmation ou infirmation diagnostique

� Est-ce que tout a été fait (analyse complète)

Inserm� Si ce n’est pas clair

� Appelez le biologiste

� S’il y a une demande, répondez y

� Etude familiale

� Complément d’informations cliniques

Inserm

Bases de données

Base de données phénotypiques codée

6 chiffres

mode de transmission

1, 2, 6 autosomiques (dates)

3 lié à l’X

4 lié à l’Y

5 mitochondrial

1 symbole

* gène de séquence connueInserm

http://www.ncbi.nlm.nih.gov/omim

Online medelian inheritance in man

* gène de séquence connue

# phenotype multi locus

+ gene de séquence et phenotype connu

% maladie connue, gène inconnu

^ entrée inexistante

Inserm

Bases de données

� Liste des mutations responsables de maladies héréditaires chez l’homme ↗↗

Inserm

http://www.hgmd.org

Human Gene Mutation Database

Inserm

Bases de données

� Exemple :

� ADPKD

Inserm