La Génétique pour les nuls - sfndt.org · Inserm La Génétique pour les nuls Mutations...
Transcript of La Génétique pour les nuls - sfndt.org · Inserm La Génétique pour les nuls Mutations...
Inserm
La Génétique pour les Nuls
Inserm
Marie Pierre AUDREZET
Laboratoire de Génétique Moléculaire
INSERM U1078 - CHRU BREST
pour les Nuls
Inserm
La Génétique pour les nuls
� Mutations
� Référence : Base de données HGMD
� Différents types de mutations
� Conséquences
� Nomenclature Inserm� Nomenclature
� Techniques d’étude
� Interprétation d’un CR
� Bases de données
Inserm
Mutations
� Référence : Base de données HGMD
� Mutations responsables des maladies génétiques
� Etat des lieux
Inserm
Inserm
HGMD
� Analyse des données HGMD
� 2014 : 148 413 entrées dans 6137 gènes
Non sens/ faux sens InsermSubstitutions
nucléotidiques
Insertions-délétions
de quelques nucléotides
Remaniements géniques
de grande taille
0 10000 20000 30000 40000 50000 60000 70000 80000
Délétions de grande tail le
Réarrangements complexes
Insertions de grande tail le et duplications
Répétitions variables
Insertions/délétions de quelques nucléotides
Insertions de quelques nucléotides
Délétions de quelques nucléotides
Promoteurs
Epissage
Inserm
Les substitutions nucléotidiques
� 70% des mutations
� Induites
� Agents mutagènesInserm
� Métabolisme endogène
� Erreurs spontanées lors de la réplication de l’ADN, non détectées par les systèmes de réparation
� CpG : 20% des substitutions nucléotidiques responsables de maladies génétiques (« point chauds »)
Inserm
Les substitutions nucléotidiques
� Dans une séquence codante : Conséquences
� Remplacement d’un acide aminé par un autre
- Mutations faux sens, polymorphismes, SNP
Séquence d’ADN sauvage
Bases ADN C T G A G C C C T G C C T G G T T C C T GI I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I
InsermBases ADN
Séquence protéique leu Pro Ala TrpSer LeuPhe
Séquence d’ADN mutée
Bases ADN
Séquence protéique
C T G A G C C C T G T C T G G T T C C T GI I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I
Leu Pro Val TrpSer leuPhe
Inserm
Les substitutions nucléotidiques
� Dans une séquence codante : Conséquences
Séquence d’ADN sauvage
Bases ADN C T G A G C C C T G C C T G G T T C C T GI I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I
- Mutations nonsens
� Remplacement d’un codon par un codon stop
InsermBases ADN
Séquence protéique leu Pro Ala TrpSer LeuPhe
Séquence d’ADN mutée
Bases ADN
Séquence protéique
C T G A G C C C T G C C T A G T T C C T GI I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I
Leu Pro Ala StopSer
Inserm
Les substitutions nucléotidiques
� Dans un site canonique d’épissage : Conséquences
� Abolition d’un site canonique d’épissage ou création d’un site alternatif d’épissage
15 16 1817
Inserm
15 16AG GT AGGT
18AG
17 AG
15 16AG GT AGGT
18TG
17 AG
1715 16 18
1715 16 18
16 1815
Inserm
Mécanismes et conséquences des mutations
� 3 grandes classes de mutations
Substitutions Epissage
Non sens/ faux sens
Inserm Substitutions
nucléotidiques
Insertions-délétions
de quelques nucléotides
Remaniements géniques
de grande taille
0 10000 20000 30000 40000 50000 60000 70000 80000
Délétions de grande tail le
Réarrangements complexes
Insertions de grande tail le et duplications
Répétitions variables
Insertions/délétions de quelques nucléotides
Insertions de quelques nucléotides
Délétions de quelques nucléotides
Promoteurs
Epissage
Inserm
Les courtes insertions-délétions
� 20-25% des anomalies répertoriées
� Surviennent souvent au niveau de courtes répétitions en tandem par un mécanisme de « slippage »
5’ 3’3’ 5’
Réplication
3’ 5’3’5’
Inserm5’
Slippage
5’ 3’3’ 5’
3’ 5’3’5’
3’ 5’3’5’
3’ 5’3’5’
Réplication
+ 1 répétition
3’ 5’3’5’
- 1 répétition
Inserm
Les courtes insertions-délétions
� Conséquences
� Non multiples de 3 : décalage du cadre de lecture
Séquence d’ADN sauvage
I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I IInserm
…Stop
Bases ADN
Séquence protéique
C T G A G C C C T G C C T G G T T C C T GI I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I
leu Pro Ala TrpSer LeuPhe
Séquence d’ADN mutée
Bases ADN
Séquence protéique
C T G A G C C C C C T G C C T G G T T C C I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I
Leu Pro Leu ProSer SerGly
Inserm
Les courtes insertions-délétions
� Conséquences
Séquence d’ADN sauvage
I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I
� Multiple de 3 : perte d’un ou plusieurs AA
InsermBases ADN
Séquence protéique
C T G A G C C C T G C C T G G T T C C T GI I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I
leu Pro Ala TrpSer LeuPhe
Séquence d’ADN mutée
Bases ADN
Séquence protéique
C T G A G C T G G T T C C T GI I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I
Leu Trp Phe LeuSer
Inserm
Mécanismes et conséquences des mutations
� 3 grandes classes de mutations
Substitutions Epissage
Non sens/ faux sens
Inserm Substitutions
nucléotidiques
Insertions-délétions
de quelques nucléotides
Remaniements géniques
de grande taille
0 10000 20000 30000 40000 50000 60000 70000 80000
Délétions de grande tail le
Réarrangements complexes
Insertions de grande tail le et duplications
Répétitions variables
Insertions/délétions de quelques nucléotides
Insertions de quelques nucléotides
Délétions de quelques nucléotides
Promoteurs
Epissage
Inserm
Les réarrangements génomiques
� 5-10% des anomalies répertoriées
� Evènements de recombinaison homologue non allélique (NAHR) intra ou extra chromosomiques- Impliquent des séquences semblables (pas nécessairement identiques)Inserm- Impliquent des séquences semblables (pas nécessairement identiques)
Inserm
Les réarrangements génomiques
� Conséquences
� Perte ou gain de matériel génétique
Stop5’UTR 3’UTR
ATG
1 2 23 24 4626 45Inserm1 2 23 24 4626 45
Stop5’UTR 3’UTR
ATG
1 23 24 4625 452 23 24
Inserm
Mécanismes et conséquences des mutations
� 3 grandes classes de mutations
Substitutions Epissage
Non sens/ faux sens
Inserm Substitutions
nucléotidiques
Insertions-délétions
de quelques nucléotides
Remaniements géniques
de grande taille
0 10000 20000 30000 40000 50000 60000 70000 80000
Délétions de grande tail le
Réarrangements complexes
Insertions de grande tail le et duplications
Répétitions variables
Insertions/délétions de quelques nucléotides
Insertions de quelques nucléotides
Délétions de quelques nucléotides
Promoteurs
Epissage
Autres évènements rares
Inserm
Les autres évènements rares
� Mutations dynamiques
� Expansions de triplets
- Régions codantes des gènes, ex CAG (glutamine), amplification modérée
- Régions non codantes � 10 kbInserm- Régions non codantes � 10 kb
� Nombreuses maladies neurodégénératives
- Huntington, X Fragile…
- Caractérisées par un phénomène d’anticipation
- Âge plus précoce et accentuation de la gravité
- Amplification du nombre de motifs au cours des générations
Inserm
Les autres évènements rares
� Insertions d’éléments transposables
� Eléments transposables représentent ½ du génome humain
- Majoritairement des rétrotransposons (40%), intermédiaire ARN
- Déplacement peut générer des mutations– Directement par insertion dans un gène– Indirectement (recombinaison homologue)Inserm– Indirectement (recombinaison homologue)
1ère description 2004 : F8, hémophilie
� Conversion génique
� Mécanisme de recombinaison particulier avec remplacement d’une courte séquence d’ADN (pseudogène)
- Ex :hyperplasie congénitale des surrénales par mutations du gène 21-OH
Inserm
Les autres évènements rares
� Les mécanismes épigénétiques
� Empreinte parentale
- De nombreux gènes soumis à empreinte parentale identifiés
- Pathologies dues a une modification de l’équilibre entre les allèles parentaux
- Expression phénotypique de la maladie peut dépendre du parent qui a transmis Inserm- Expression phénotypique de la maladie peut dépendre du parent qui a transmis l’anomalie génétique
� Disomies uniparentales
- 1ère observation (1988) : enfant CF de petite taille suggérant existence d’un gène impliqué dans la croissance soumis à empreinte, gène maternel n’étant pas exprimé
- Prader willi (maternelle) et Angelman (paternelle) du Chr15
Inserm
Les autres évènements rares
� Les mutations de novo et les mosaïques germinales
� Mutations de novo surviennent dans la lignée germinale au cours des divisions mitotiques (spermatogénèse, ovogénèse)
� Peuvent être très importantes pour certaines maladies- 30% myopathie de Duchenne, hémophilie AInserm- 30% myopathie de Duchenne, hémophilie A
- 50% NF1, Sclérose Tubéreuse de Bourneville
- 90% Achondroplasie
� Fréquence des néomutations paternelles plus élevée (200 divisions)
� Peu de récidive- Cas de parents de phénotype normal ayant plus d’un enfant atteint
� Mosaïque germinale Clone de cellules germinales porteur de la mutation
Inserm
Quelles sont les conséquences des anomalies moléculaires sur la
fonction de la protéine ???Inserm
Inserm
Conséquence des anomalies moléculaires sur la fonction de la protéine
� Quand on pense mutation, on sous entend… perte de fonction
� Mutations troncatives (non sens, épissage, frameshift, grands réarrangements…)
- Absence de protéineInserm
- Formation d’une protéïne tronquée (activité nulle ou réduite)
� Les conséquences des mutations faux sens, des délétions en phase, des anomalies d’épissage… sont moins certaines
- Changement de la séquence protéique
- Affectent la stabilité, l’adressage cellulaire, la maturation, l’assemblage dans une structure, des sites importants pour l’activité enzymatique, les interactions avec d’autres protéines…
- Nécessité d’un faisceau d’arguments pour déterminer les conséquences de ces anomalies
Inserm
Conséquence des mutations sur la fonction de la protéine
� Arguments à prendre en compte
� Répertoriée dans les bases de données (fréquence ?)
� Localisation dans la protéine (région essentielle si connue…)
� Localisation au sein d’une séquence orthologue très conservéeInserm� Localisation au sein d’une séquence orthologue très conservée
� Nature du changement d’acide aminé
- Charge, polarité, encombrement stérique…
- Outils bioinformatiques
� Vérification de son absence chez des sujets témoin
� Apparition de novo chez un sujet atteint : critère majeur
Inserm
Mais tout cela ne suffit pas…
� Pour connaitre les véritables conséquences des mutations
� Tests fonctionnels
� Les mutations peuvent avoir plusieurs effetInserm� Les mutations peuvent avoir plusieurs effet
� Perte de fonction
� Gain de fonction
� Effet dominant négatif
Inserm
Conséquence des mutations sur la fonction de la protéine
� Mutations par perte de fonction
� Allèles amorphes (nuls) ou hypomorphes
- Perte totale ou partielle d’expression ou d’activité
Inserm� Retrouvées
- dans la majorité des maladies récessives
- dans les maladies dominantes par haploinsuffisance– Concentration en protéine est critique– Hypercholestérolémie familiale
� Grande hétérogénéité (sauf effet fondateur)
Inserm
Conséquence des mutations sur la fonction de la protéine
� Mutations par gain de fonction
� Allèles hypermorphes
- Expression d’une forme hyperactive de son produit
- Surexpression du gène sauvageInserm- Surexpression du gène sauvage
� Allèles néomorphes
- Code pour une protéine dont la fonction est différente
- Mutations somatiques associées aux cancers
- Plus rarement dans les maladies héréditaires
Inserm
Conséquence des mutations sur la fonction de la protéine
� Mutations par effet dominant négatif
� A la frontière entre perte et gain de fonction
- Allèle antimorphe
- Protéine mutée perd sa fonction et interfère avec la fonction de l’allèle normal Inserm- Protéine mutée perd sa fonction et interfère avec la fonction de l’allèle normal chez les hétérozygotes
- Gènes codant des protéines de structure ou capables de former des homo- ou hétérodimères
Inserm
La nomenclature des mutations
Inserm
Inserm
La nomenclature des mutationsRationnel
� Harmonisation de la façon de dénommer les gènes humains et leurs mutations
� Trop de noms pour la même mutation- IVS3+2T>C, 359+2T>C…
- c.5764C>T, Q1922X…
Inserm� Un seul nom pour des mutations différentes
- W1893X, TGG > TAG ou TGA
� De nouvelles mutations identifiées chaque jour
� Plus de séquençage � plus de complexité
� Risque réel d’erreur en diagnostic
Inserm
La nomenclature des mutations
� Exigence pour une nomenclature qui soit
� Universelle
� Cohérente entre les gènesInserm
http://www.gene.ucl.ac.uk/nomenclature/guidelines.html
� Non équivoque
� Simple
Inserm
Rêgles de base
Stop
5’UTR 3’UTRATG
1 2 3 4 46
Séquence de référenceInserm
n°accession et n° de version
NM_1009944.2
ADNc
1 : A de l’ATG
Numérotation de la
séquence codante
+ ou – pour introns
ADN génomique
1 : 1ère base de la
séquence
Inserm
La nomenclature des mutations
Inserm
� Exemple : le gène PKD1 46 exons
� 51 kb chromosome 16 (2 187 899 à 2 136 711)
Illustrations Alamut v2.3 Interactive Biosoftware
Inserm
La nomenclature des mutations
Partie de l’ADN génomique de l’exon 5g.DNAInserm g.DNA
Partie de l’ADN codant de l’exon 5c.DNA
Partie de la séquence protéique de l’exon 5 p.
A chaque nucléotide correspond une position en ADN génomique, cDNA, Proteine
Inserm
Substitutions nucléotidiques
� Sont notées « > »
Inserm
c.1597p.533g.2.168 843Pos/ATG : 18848Exon 7
c.1597G>T
CAG>TAG Gln > Stop
p.Gln533Ter ou p.Q533* ou p.Q533X
c.1597G>A
CAG>AAG Gln > Lys
p.Gln533Lys ou p.Q533L
Inserm
Acide Aminé Abbréviation AbbréviationNom complet (3 Lettres) (1 lettre)
Alanine Ala AArginine Arg RAsparagine Asn NAspartate Asp D
Au niveau protéique
� 3 facons de nommer les acides aminés
InsermAspartate Asp DCysteine Cys CGlutamate Glu EGlutamine Gln QGlycine Gly GHistidine His HIsoleucine Ile ILeucine Leu LLysine Lys KMethionine Met MPhenylalanine Phe FProline Pro PSerine Ser SThreonine Thr TTyrosine Tyr YTryptophan Trp WValine Val VTermination Ter ou * X
Préférence pour le code à 3 lettres
Inserm
Délétions
� Notées « del » après le nucléotide ou le dernier délété
TCAGCGCCGCACAGCTACGTCTGCGAGCTGCAInserm
c.1576p.533g.2.168 843Pos/ATG : 18848Exon 7
Simples : c.1576del
Multiples : c.1576_1588del
Dans une répétition : (exemple CCGCACAGCT), on choisit la séquence normale la plus longue c.1578_1579del (pas c.1576_1577del)
p.His526Thrfs*32
p.His526Alafs*28
p.His526Glnfs*60
Inserm
Insertions
� Notées « ins » après les nucléotides flanquants
TCAGCGCCGCAC AGCTACGTCTGCGAGCTGCA٧A٧
Inserm
Simples : c.1578_1579insA
Multiples : c.1578_1579insCTA
Dans une répétition : (exemple CCGCACACAGCT), c’est une duplication, on choisit la séquence normale la plus longue c.1578_1579dup (pas c.1576_1577dup)
p.His526Thrfs*32
p.His526Alafs*28
p.Thr504Serfs*14
TCAGCGCCGCAC AGCTACGTCTGCGAGCTGCA٧
c.1578p.526g.2.168 862Pos/ATG : 18829Exon 7
٧
Inserm
Insertions-délétions
� Notées « delins » après le segment délété
TCAGCGCCGCAC AGCTACGTCTGCGAGCTGCA٧A
AC Inserm
c.1578_1579delinsA
TCAGCGCCGCAC AGCTACGTCTGCGAGCTGCA
c.1578p.526g.2.168 862Pos/ATG : 18829Exon 7
AC
Inserm
Mutations d’épissage
� Mutations d’épissage
� Variants introniques- Numérotés en + à partir du début de l’intron et en – à partir de la fin
Inserm
c.7863+2T>G
c.7864-1G>A
L’effet sur la protéine n’étant pas connu, pas de nomenclature protéique
GTG CTG AAC GAG GTGAGTGC….. GCCTGCCCCAG TAC GAG CGG GCC
15 16
15 16 18
AG GT AGGT18
TG17 AG
Inserm
Grands réarrangements
� Grands réarrangements
Stop5’UTR 3’UTR
ATG
1 2 23 24 4626 45Inserm
Bornes non précisées
PKD1dele24-26
PKD2dele10-15
Bornes précisées
c.8791+89_9397+743del
g.87876727_89162895del
Inserm
Les techniques d’analyse
� Maintenant que les mutations et la nomenclature n’ont plus aucun secret…
Inserm
� Quelle sont les techniques d’analyse qui permettent d’identifier ces différents types de mutations ?
Inserm
Les techniques d’analyse
� Le choix de la technique est fonction de ce que l’on veut rechercher
5-10% de grands Inserm70% de substitutions nucléotidiques
20-25% de courtes insertions délétions
réarrangement
Mutations récurrentes ou hétérogénéïté allélique ?
Techniques de screening
Techniques de scanning (balayage)
Inserm
Le séquençage
� Basées sur la PCR de courts fragmentsSubstitutions, petites insertions délétions
1 2 3 4 75 6Inserm
Amplification des régions codantes
Séquençage de l’ADN du patient
Comparaison avec séquence de référence
GGC TTG CAG CACGGC TTG TAG CAC
stop
Substitution hétérozygote
Inserm
Recherche de mutations ponctuelles
� Les techniques basées sur la PCR de courts fragments
� Amplification de courts fragment
� Analyse de la dénaturation ou des courbes de fusion
Inserm
DHPLC HRM
Inserm
Recherches de réarrangements
� Les techniques basées sur la PCR ou le caryotype moléculaire
Par qPCRMLPA, QMPSF
Par hybridation comparativePuce à ADN, CGH Array
Inserm
Inserm
Le NGS
� NGS
Inserm
Inserm
� Maintenant qu’on a tout vu
� Comment comprendre un compte rendu d’analyse génétique
Inserm� Que doit-il contenir ?
Inserm
Le compte rendu d’analyse génétique
� Recommandations
Inserm
Inserm
Le compte rendu d’analyse génétique
� Ce que doit contenir Chaque Compte-rendu
� Partie administrative
- Identité précise du laboratoire avec contacts– Si une partie des analyses a été réalisée ailleurs, cela doit être clairement mentionné
- Titre explicite « Analyse moléculaire du gène xx »
- Date du rapport, pages numérotées
- Nom et adresse du prescripteur Inserm- Nom et adresse du prescripteur
- Signature du biologiste (co-validation et co-signature recommandés »
� Patient
- Nom, prénom, NJF, DDN, sexe (nom sur chaque page si pages multiples
- Nature et date du prélèvement (état si congelé, par ex), date réception
- N° echantillon
� Indication d’étude
- Informations cliniques
- Raisons de l’étude (familial, diagnostic…)
Inserm
Le compte rendu d’analyse génétique
� Ce que doit contenir Chaque Compte-rendu
� Methodologie
- Détail des tests utilisés depuis l’extraction de l’ADN
- Si kit commercial, référence et version
- Analyse génétique : N° de la séquence de référence utilisée pour identifier Inserm- Analyse génétique : N° de la séquence de référence utilisée pour identifier les variants
- Quels exons testés
- Par quelle technique
- Sensibilité du test, si approprié
Inserm
Le compte rendu d’analyse génétique
� Ce que doit contenir Chaque Compte-rendu
� Résultats
- Présentés brièvement sans ambigüité
- Si plusieurs tests, résultats séparés pour chaque test
- Mutation en nomenclature HGVS (autre nomenclature si besoin entre ())Inserm
- Si plus d’un variant, commentaires sur la phase, prenant en compte le mode de transmission
� Interprétation « full and clear interpretation of results »
- Dépend du contexte clinique et de la raison d’étude
- Utilisation d’outils de prédiction bioinfo sous la responsabilité du biologiste
- Données de la littérature, databases spécifiques
- Informations sur l’intérêt des études familiales ou généalogiques dans l’aide à l’interprétation
Inserm
Le compte rendu d’analyse génétique
� Après lecture d’un CR final
� Confirmation ou infirmation diagnostique
� Est-ce que tout a été fait (analyse complète)
Inserm� Si ce n’est pas clair
� Appelez le biologiste
� S’il y a une demande, répondez y
� Etude familiale
� Complément d’informations cliniques
Inserm
Bases de données
Base de données phénotypiques codée
6 chiffres
mode de transmission
1, 2, 6 autosomiques (dates)
3 lié à l’X
4 lié à l’Y
5 mitochondrial
1 symbole
* gène de séquence connueInserm
http://www.ncbi.nlm.nih.gov/omim
Online medelian inheritance in man
* gène de séquence connue
# phenotype multi locus
+ gene de séquence et phenotype connu
% maladie connue, gène inconnu
^ entrée inexistante
Inserm
Bases de données
� Liste des mutations responsables de maladies héréditaires chez l’homme ↗↗
Inserm
http://www.hgmd.org
Human Gene Mutation Database
Inserm
Bases de données
� Exemple :
� ADPKD
Inserm