Diderot Paris Maladies polygéniques/multifactorielles ... · 4.1 –5 millions de sites...
Transcript of Diderot Paris Maladies polygéniques/multifactorielles ... · 4.1 –5 millions de sites...
Maladies polygéniques/multifactorielles
26 novembre 2018 – 13h30-15h30
L3 Médecine – UE5 Génétique Médicale – Paris Diderot
INSERM UMR-S-958Génétique des diabètes
Claire VandiedonckMaitre de Conférences à Paris Diderot
Université Paris DiderotFaculté de MédecineSite Villemin
26/11/2018 L3 Médecine-UE5 Génétique Médicale-Maladies polygéniques/multifactorielles-2018-Vandiedonck C. 1/78
Claire Vandiedonck - Université Paris Diderot
Plan du cours
1. Bases des maladies à hérédité multifactorielle
2. Diversité génétique humaine et déséquilibre de liaison
3. Méthode d’étude de l’hérédité multifactorielle:l’association allélique
4. Bilan des GWAS
26/11/2018 L3 Médecine-UE5 Génétique Médicale-Maladies polygéniques/multifactorielles-2018-Vandiedonck C. 2/78
Claire Vandiedonck - Université Paris Diderot
1. Bases des maladies à hérédité multifactorielle
26/11/2018 L3 Médecine-UE5 Génétique Médicale-Maladies polygéniques/multifactorielles-2018-Vandiedonck C. 3/78
Claire Vandiedonck - Université Paris Diderot
faux sens: remplacement d’un acide aminé par
un autre
non-sens: remplacement d’un acide aminé par
un codon stop => protéine tronquée
épissage: apparition ou disparition d’un site
donneur ou accepteur d’épissage
modification du cadre de lecture
délétion
expansion de triplets
Rappel: maladies monogéniques/mendéliennes
Mutations délétères (variants pathogènes) d’un seul gène
=> dysfonctionnement du gène
étude par:
• analyse de liaison paramétrique puis clonage positionnel
• et/ou Whole Exome Sequencing (WES) voire Whole Genome Sequencing (WGS)
3 modes de transmission mendélienne autosomique dominant 70%
autosomique récessif 25%
récessif lié au sexe 5 %
26/11/2018 L3 Médecine-UE5 Génétique Médicale-Maladies polygéniques/multifactorielles-2018-Vandiedonck C. 4/78
Claire Vandiedonck - Université Paris Diderot
Maladies multifactorielles = Maladies à hérédité complexe
Pas (très rarement) de mutations uniques délétères
De multiples facteurs de susceptibilité: combinaison de plusieurs gènes => maladies POLYGENIQUES
effets de l’environnement
interactions gène x environnement
G E
chorée de Huntington
varicellephénylcétonurie hypertension artérielle
Environnement
Génétique
26/11/2018 L3 Médecine-UE5 Génétique Médicale-Maladies polygéniques/multifactorielles-2018-Vandiedonck C. 5/78
Claire Vandiedonck - Université Paris Diderot
Pourquoi étudier la génétiquedes maladies à hérédité multifactorielle?
Importance des maladies à hérédité complexe en santé publique
prévalence = fréquence dans la population
• cancer• diabète, obésité• maladies cardiovasculaires et AVC• maladies neuropsychiatriques• autoimmunité et inflammation
chronicité
coût des traitements
Objectifs/Enjeux
biologie: comprendre et identifier les mécanismes pathogènes• voies et réseaux de gènes• hétérogénéité de ces maladies
recherche thérapeutique: développer de nouveaux traitements biomarqueurs:
• diagnostic précoce• évolution sévère• prédire la réponse aux traitements
MAIS PAS DE PREDICTION !médecine personnalisée= de précision
26/11/2018 L3 Médecine-UE5 Génétique Médicale-Maladies polygéniques/multifactorielles-2018-Vandiedonck C. 6/78
Claire Vandiedonck - Université Paris Diderot
Notion d’héritabilité
Attention! un trait familial n’est pas obligatoirement génétique (environnement commun)
Héritabilité:
proportion de la variance phénotypique totale due aux effets génétiques
Var(P) = Var(G) + Var(E) + 2 Cov(G, E)
Héritabilité H² = Var(G)/Var(P)
h2=0 pas d’effet génétiqueOU pas de variabilité génétique
h2=1 pas d’effet de l’environementOU pas de variabilité environementale
Disease H2
Alzheimer 79%
Bipolar depression 77%
Breast Cancer 53%
Crohn’s Disease 55%
Schizophrenia 81%
Type I diabetes 80%
Type II diabetes 42%
Exemples d’héritabilité
26/11/2018 L3 Médecine-UE5 Génétique Médicale-Maladies polygéniques/multifactorielles-2018-Vandiedonck C. 7/78
Claire Vandiedonck - Université Paris Diderot
Evaluation des composantes génétique et environnementale
Taux de concordance chez les jumeaux =nb de paires concordantes (les 2 sont atteints / nb total de paires)
si discordance chez MZ => existence de facteurs environnementaux
si concordance MZ > concordance DZ => existence de facteurs génétiques
MZ (%) DZ (%)
diabète de type 1 (T1D) 30-50 6
diabète de type 2 (T2D) 80 30
Infarctus myocarde 19 9
26/11/2018 L3 Médecine-UE5 Génétique Médicale-Maladies polygéniques/multifactorielles-2018-Vandiedonck C. 8/78
monozyogotes
dizygotes
concordance discordance
environnementgénétique
Claire Vandiedonck - Université Paris Diderot
Agents infectieux
Prédisposant
activation polyclonale des lymphocytes: infections chroniques
inflammation associée aux oreillons
réponse anti-virale aux enterovirus : virus cocksackie
tropisme pour les cellules beta du pancreas
mimétisme moléculaire
• protéine virale 2C avec GAD65
• protéine virale VP1 avec IA2
Protecteur
hypothèse de hygiène
modèle murin spontané de diabète= souris NOD (non-obese diabetic):
pathogènes préviennent le diabète => rôle du microbiote
virus
Exemple de facteurs environnementaux dans le DT1
26/11/2018 L3 Médecine-UE5 Génétique Médicale-Maladies polygéniques/multifactorielles-2018-Vandiedonck C. 9/78
Claire Vandiedonck - Université Paris Diderot
Déclenchant
nourriture: lait de vache, gluten
stress
gestation
produits chimiques: pesticides, médicaments
vaccinations?
Aggravant
déficit en vitamine D
tabagisme
Exemple de facteurs environnementaux dans le DT1
26/11/2018 L3 Médecine-UE5 Génétique Médicale-Maladies polygéniques/multifactorielles-2018-Vandiedonck C. 10/78
Claire Vandiedonck - Université Paris Diderot
Evaluation de la composante génétique
Etudes d’excès de cas familiaux -> risque relatif familialComparaison des risques de récurrence des apparentés versus la
proportion de cas dans la population générale
ex: facteur λs (λ siblings) pour les apparents au 1er degré
Risque apparenté au 1er degré
Risque population générale
λs
hypertension 20-30 10 2-3
schizophrénie 5-10 1 5-10
polyarthrite rhumatoïde 2-4 0.2-1 5-10
diabète type 1 6 0.4 15
sclérose en plaques 3-5 0.1 20
lupus érythémateux 2-5 0.2 20-40
spondylarthrite ankylos. 12-22 0.5 40
fente labiale 2-5 0.1 20-5026/11/2018 L3 Médecine-UE5 Génétique Médicale-Maladies polygéniques/multifactorielles-2018-Vandiedonck C. 11/78
Claire Vandiedonck - Université Paris Diderot
PhénotypeSpécificité du phénotypeAge de début parfois tardif
GénotypeMultiplicité des gènesHétérogénéité génétiqueHétérogénéité alléliqueFréquence des allèles morbides
Relation génotype-phénotypeEffet modeste des variantsPleiotropie: effets multiples d’un même variant
=> Problème de puissance pour identifier les variants génétiques prédisposant aux maladies multifactorielles
Complexité de l’étude génotype-phénotypedans les maladies polygéniques
12
3
45
6
12
3
45
6
12
3
45
6
26/11/2018 L3 Médecine-UE5 Génétique Médicale-Maladies polygéniques/multifactorielles-2018-Vandiedonck C. 12/78
Claire Vandiedonck - Université Paris Diderot
PatientsContrôles
Mutations Variantsrares
Variantscommuns
Maladiesmendéliennes
Maladies polygéniquesHypothèse CVCD
= common variantfor common disease
Freq(allèle)
1%
Mutation/variant pathogène ou polymorphisme?
Un continuum des maladies mendéliennes aux maladies polygéniques:
26/11/2018 L3 Médecine-UE5 Génétique Médicale-Maladies polygéniques/multifactorielles-2018-Vandiedonck C. 13/78
Claire Vandiedonck - Université Paris Diderot
Maladies monogéniques versus maladies multifactorielles
monogénique multifactorielle
autre dénomination mendélienne polygénique,à hérédité complexe
prévalence = freq dans la population rare moyenne à forte
agrégation familiale forte faible
nb de gènes causaux 1 * plusieurs
fréquence allèles causaux rare fréquent à rare
pénétrance = proba d’être atteint pour les porteurs des variants
forte faible
=> Méthodes d’analyse différentes
26/11/2018 L3 Médecine-UE5 Génétique Médicale-Maladies polygéniques/multifactorielles-2018-Vandiedonck C. 14/78
Claire Vandiedonck - Université Paris Diderot
2. Diversité génétique humaineet déséquilibre de liaison
26/11/2018 L3 Médecine-UE5 Génétique Médicale-Maladies polygéniques/multifactorielles-2018-Vandiedonck C. 15/78
Claire Vandiedonck - Université Paris Diderot
Génome humain
Génome diploïde (2n)
46 chromosomes (2 x23)
22 paires d’autosomes: chr 1 à chr 22
1 paire de gonosomes = chromosomes sexuels X et Y
ou 2
26/11/2018 L3 Médecine-UE5 Génétique Médicale-Maladies polygéniques/multifactorielles-2018-Vandiedonck C. 16/78
Claire Vandiedonck - Université Paris Diderot
26/11/2018 L3 Médecine-UE5 Génétique Médicale-Maladies polygéniques/multifactorielles-2018-Vandiedonck C. 17/78
polymorphisme = variant = variation héréditaire de l’ADN= cas des marqueurs génétiquesdiversité génétique: + de 80 millions de variants validés
locus = un endroit donné du génome (ex: marqueur M1)
allèle = chaque forme particulière que prend le polymorphisme d’un locus (ex: allèle A et allèle G au marqueur M1)
génotype: le génome humain est diploïde donc deux allèles par locus = génotype (ex: A/A, A/G ou G/G au marqueur M1)
haplotype: séquence d’allèles à des locus voisins situés sur un même chromosome (en phase = en cis)
(ex: haplotype maternel GTC pour M1-M2-M3)
Polymorphisme génétique
M1
M2
M3
A
T
GC
G
T
A G A A
GA
ATTENTIONNe pas confondre chromosomes homologues et brins + et – de la double hélice de l’ADN. Un allèle/génotype/haplotype peut être donné sur le brin + ou sur le brin –
eg un génotype A/C sur le brin + = génotype T/G sur le brin moins!
Claire Vandiedonck - Université Paris Diderot
Types de marqueurs polymorphes
ctgattagcctcacacacacacacacgctcagacgagt
ctgattagcctcacacacacacacacacacacacgctcagacgagt
ctgattagcctcacacacacacacacacacacacacacgctcagacgagt
electrophorèse
n=7
n=11
n=13
Microsatellites
motif de 2-4 bases répétés: ex (CA)n
multi-alléliques: très informatifs
1 tous les 30 kb
base de la 1ère carte de liaison génétique
parfois difficiles à typer
Variations structurales
• Copy Number Variant (CNV) ~20 000
génotypage possible par puces
• subsititutions de bloc
• inversions
Indels
petites insertions/délétion
SNPs: Single Nucleotide Polymorphisms
bi-alléliques…généralement!
typage automatisé par puce
très haute densité, les + nombreux
nouveaux SNPs détectables par séquençage
26/11/2018 L3 Médecine-UE5 Génétique Médicale-Maladies polygéniques/multifactorielles-2018-Vandiedonck C. 18/78
Claire Vandiedonck - Université Paris Diderot
Génoypages de marqueurs polymorphes
Par puces
• par hybridation de l’échantillon sur sondes• détection de la fluoresence selon les allèles• rapide• dépend du contenu: variants connus• SNPs, INDELS ou CNVs
Par séquençage
• Sanger ou Nouvelle Génération (NGS)• nouveaux variants détectés y compris rares• difficile pour les insertions/délétions et variations structurales• coûteux et analyse bioinformatique plus lourde• exhaustif• résolution = 1 base
26/11/2018 L3 Médecine-UE5 Génétique Médicale-Maladies polygéniques/multifactorielles-2018-Vandiedonck C. 19/78
Claire Vandiedonck - Université Paris Diderot
Equilibre de Hardy- Weinberg
Les fréquences alléliques et génotypiques demeurent constantes d’une génération à l’autre
Soit un marqueur polymorphe avec les allèles A et a fréquences alléliques à la génération n et n+1
f(a)=p f(A)=q p+q=1
fréquence génotypiques à la génération n et n+1:
f(aa) = p² f(aA) = 2pq f(AA) = q² p²+2pq+q²=1
Conditions population panmictique = mariages au hasard taille infinie absence de mutations et de sélection
Absence d’équilibre de HW (test de Chi² significatif) mauvaise qualité de génotypage sélection, consanguinité -> importance du choix de la population
26/11/2018 L3 Médecine-UE5 Génétique Médicale-Maladies polygéniques/multifactorielles-2018-Vandiedonck C. 20/78
Claire Vandiedonck - Université Paris Diderot
Projet 1000 Genomes (2008-2015)Séquençage de 1000 individus par technique haut-débit
www.1000genomes.org
2012: fin de la phase pilote, 1092 genomes
2015: fin du projet, 2504 genomes
Recenser les variants génétiques avec une MAF= Minor Allele Frequency >1%
avec séquençage génome entier 7.4 X
Identifier les variants avec une MAF à 0.1% dans les régions codantes
avec séquençage 65.7 X des exons
Explorer ces variations génétiques dans 26 populations d’origines géographiques variées:
Afrique sub-saharienne 661
Asie de l’Est 504
Europe 503
Sud-Américains 347
Asie du Sud 489
Total = 2504 individus
Projets 1K genomes
26/11/2018 L3 Médecine-UE5 Génétique Médicale-Maladies polygéniques/multifactorielles-2018-Vandiedonck C. 21/78
Claire Vandiedonck - Université Paris Diderot
Au total
88 millions de SNPs
la moitié de nouveaux SNPs
dont 24% d’Asie du Sud et 28% d’Afrique
3.6 millions d’indels
60 000 variants structuraux
Genome typique
4.1 – 5 millions de sites polymorphes
99.9% de SNPs et petits indels
2100-2500 variants structuraux
160 CNV~20 millions de bases affectées (0.6% du génome)
la plupart sont rares~64 millions avec MAF <0.5%~12 millions avec MAF <5%
Diversité génétique humaine et projet 1K genomes
26/11/2018 L3 Médecine-UE5 Génétique Médicale-Maladies polygéniques/multifactorielles-2018-Vandiedonck C. 22/78
Claire Vandiedonck - Université Paris Diderot
Variants spécifiques de populations
3% des variants sont:
rares dans la population mondiale (MAF <0.5%)
fréquents dans une population (MAF>5%)
Globalement, plus de variabilité intra-population que inter-populations
26/11/2018 L3 Médecine-UE5 Génétique Médicale-Maladies polygéniques/multifactorielles-2018-Vandiedonck C. 23/78
Claire Vandiedonck - Université Paris Diderot
Détermination de la phase?
1. Analyse familiale 2. Génome haploïde 3. Méthodesprobabilistiquesdans les populations
A A
C C
A G
C T
A G
C T
Génotypes:
SNP1: A / G
SNP2: T / C
A G
T C
A G
C T
ou ?
Phase connue
Plus facile si :plusieurs marqueursmarqueurs informatifsplusieurs générations
directement dans des cellules haploïdes comme les gamètes:
NGS, facilité par long reads, sur chromosomes marqués ou séparés
reconstruction des phases les plus probables:
Algorithme EM(Expectation-Maximization)
Chaines de Markov cachées
26/11/2018 L3 Médecine-UE5 Génétique Médicale-Maladies polygéniques/multifactorielles-2018-Vandiedonck C. 24/78
Claire Vandiedonck - Université Paris Diderot
Haplotype et déséquilibre de liaison
dans une famille dans une population
Déséquilibre de Liaisonà la génération g
dans la population
Haplotypes parentaux et recombinants
26/11/2018 L3 Médecine-UE5 Génétique Médicale-Maladies polygéniques/multifactorielles-2018-Vandiedonck C. 25/78
Claire Vandiedonck - Université Paris Diderot
Le DL: une notion de génétique des populations multi-locus
Les 4 points clés du Déséquilibre de Liaison:
1. associations alléliques préférentielles entre deux locus différents
2. en présence de liaison: les locus sont génétiquement liés
(si les locus ne sont pas liés, on parle de déséquilibre gamétique)
3. détectées à la génération g
4. dans une population
26/11/2018 L3 Médecine-UE5 Génétique Médicale-Maladies polygéniques/multifactorielles-2018-Vandiedonck C. 26/78
Claire Vandiedonck - Université Paris Diderot
Le DL: une notion de génétique des populations centenaire !
further reading:
26/11/2018 L3 Médecine-UE5 Génétique Médicale-Maladies polygéniques/multifactorielles-2018-Vandiedonck C. 27/78
Claire Vandiedonck - Université Paris Diderot
Déséquilibre de liaison (DL) Soient 2 locus A et B liés = sur un même chromosome (note: si chromosomes différents = on parlera de déséquilibre gamétique):
locus A: allèles A et a de fréquence f(A) = p et f(a) = (1-p)
locus B: allèles B et b de fréquence f(B) = q et f(b) = (1-q)
fréquences mesurées dans une population de sujets non apparentés
A
B
a
b
Définition du Déséquilibre de liaison (DL)( = association allélique)
26/11/2018 L3 Médecine-UE5 Génétique Médicale-Maladies polygéniques/multifactorielles-2018-Vandiedonck C. 28/78
Claire Vandiedonck - Université Paris Diderot
Déséquilibre de liaison (DL) Soient 2 locus A et B liés = sur un même chromosome (note: si chromosomes différents = on parlera de déséquilibre gamétique):
locus A: allèles A et a de fréquence f(A) = p et f(a) = (1-p)
locus B: allèles B et b de fréquence f(B) = q et f(b) = (1-q)
fréquences mesurées dans une population de sujets non apparentés
A
B
a
b
A
B
A
b
a
B
a
b
Il existe 4 HAPLOTYPES possibles dans la population:
Définition du Déséquilibre de liaison (DL)( = association allélique)
26/11/2018 L3 Médecine-UE5 Génétique Médicale-Maladies polygéniques/multifactorielles-2018-Vandiedonck C. 29/78
Claire Vandiedonck - Université Paris Diderot
Déséquilibre de liaison (DL) Soient 2 locus A et B liés = sur un même chromosome (note: si chromosomes différents = on parlera de déséquilibre gamétique):
locus A: allèles A et a de fréquence f(A) = p et f(a) = (1-p)
locus B: allèles B et b de fréquence f(B) = q et f(b) = (1-q)
fréquences mesurées dans une population de sujets non apparentés
A
B
a
b
A
B
A
b
a
B
a
b
Fréquencesà l’équilibre:
p q
Il existe 4 HAPLOTYPES possibles dans la population:
p (1- q) (1-p) q (1-p) (1–q)
Définition du Déséquilibre de liaison (DL)( = association allélique)
26/11/2018 L3 Médecine-UE5 Génétique Médicale-Maladies polygéniques/multifactorielles-2018-Vandiedonck C. 30/78
Claire Vandiedonck - Université Paris Diderot
Déséquilibre de liaison (DL) Soient 2 locus A et B liés = sur un même chromosome (note: si chromosomes différents = on parlera de déséquilibre gamétique):
locus A: allèles A et a de fréquence f(A) = p et f(a) = (1-p)
locus B: allèles B et b de fréquence f(B) = q et f(b) = (1-q)
fréquences mesurées dans une population de sujets non apparentés
A
B
a
b
A
B
A
b
a
B
a
b
Fréquencesà l’équilibre:
p q
Il existe 4 HAPLOTYPES possibles dans la population:
p (1- q) (1-p) q (1-p) (1–q)
Il y a déséquilibre de liaison si les allèles des 2 locus ne sont pas associés indépendamment:
D = freq haplotypiques observées – freq à l’équilibre
2 mesures: D’ et r² D’ = 1 (DL complet) si 1 haplotype manquer² = 1 (DL parfait) si seuls deux haplotypes existent
Définition du Déséquilibre de liaison (DL)( = association allélique)
26/11/2018 L3 Médecine-UE5 Génétique Médicale-Maladies polygéniques/multifactorielles-2018-Vandiedonck C. 31/78
Claire Vandiedonck - Université Paris Diderot
Exemple graphique
Equilibre de liaison Désequilibre de liaison
freq (A) = p = 0.6 et freq (a) = 1-p = 0.4freq (B) = q = 0.8 et freq (b) = 1-q = 0.2
freq (AB) = 0.6 x 0.8 = 0.48 ≠ freq (AB) ≅ 0.6 x 0.717 ≅ 0.43 => DAB ≅ 0.43 – 0.48 = -0.05 -> les allèles A et B sont moins souvent associés que ne le voudrait le hasard, cad qu’à l’équilibre
De même , on trouve DaB ≅ 0.05, DAb ≅ 0.05 -> associations en excèset Dab ≅ -0.05 -> associations en défaut
26/11/2018 L3 Médecine-UE5 Génétique Médicale-Maladies polygéniques/multifactorielles-2018-Vandiedonck C. 32/78
Claire Vandiedonck - Université Paris Diderot
A B
Chromosomeancestral
Evolution du DL
26/11/2018 L3 Médecine-UE5 Génétique Médicale-Maladies polygéniques/multifactorielles-2018-Vandiedonck C. 33/78
Claire Vandiedonck - Université Paris Diderot
A B
Chromosomeancestral
A B
A b
a B
Mutations
Evolution du DL
26/11/2018 L3 Médecine-UE5 Génétique Médicale-Maladies polygéniques/multifactorielles-2018-Vandiedonck C. 34/78
Claire Vandiedonck - Université Paris Diderot
A B
Chromosomeancestral
A B
A b
a B
Mutations
A B
A b
a B
Recombinaison
Evolution du DL
26/11/2018 L3 Médecine-UE5 Génétique Médicale-Maladies polygéniques/multifactorielles-2018-Vandiedonck C. 35/78
Claire Vandiedonck - Université Paris Diderot
A B
Chromosomeancestral
A B
A b
a B
Mutations
A B
A b
a B
Recombinaison
A B
A b
a B
a b
Dissipation du DL
Evolution du DL
=> La recombinaison est le principal facteur diminuant le DL
26/11/2018 L3 Médecine-UE5 Génétique Médicale-Maladies polygéniques/multifactorielles-2018-Vandiedonck C. 36/78
Claire Vandiedonck - Université Paris Diderot
A B
Chromosomeancestral
A B
A b
a B
Mutations
A B
A b
a B
Recombinaison
A B
A b
a B
a b
Dissipation du DL
a b
Evolution du DL
=> La recombinaison est le principal facteur diminuant le DL
26/11/2018 L3 Médecine-UE5 Génétique Médicale-Maladies polygéniques/multifactorielles-2018-Vandiedonck C. 37/78
Claire Vandiedonck - Université Paris Diderot
A B
Chromosomeancestral
A B
A b
a B
Mutations
A B
A b
a B
Recombinaison
A B
A b
a B
a b
Dissipation du DL
a b C
Evolution du DL
=> La recombinaison est le principal facteur diminuant le DL
26/11/2018 L3 Médecine-UE5 Génétique Médicale-Maladies polygéniques/multifactorielles-2018-Vandiedonck C. 38/78
Claire Vandiedonck - Université Paris Diderot
Evolution du DL
26/11/2018 L3 Médecine-UE5 Génétique Médicale-Maladies polygéniques/multifactorielles-2018-Vandiedonck C. 39/78
A B
Chromosomeancestral
A B
A b
a B
Mutations
A B
A b
a B
Recombinaison
A B
A b
a B
a b
Dissipation du DL
a b c
=> La recombinaison est le principal facteur diminuant le DL
a b C
Claire Vandiedonck - Université Paris Diderot
Evolution du DL
26/11/2018 L3 Médecine-UE5 Génétique Médicale-Maladies polygéniques/multifactorielles-2018-Vandiedonck C. 40/78
A B
Chromosomeancestral
A B
A b
a B
Mutations
A B
A b
a B
Recombinaison
A B
A b
a B
a b
Dissipation du DL
A B
A b
a B C
a b c
C
C
=> La recombinaison est le principal facteur diminuant le DL
a b C
Claire Vandiedonck - Université Paris Diderot
Evolution du DL
26/11/2018 L3 Médecine-UE5 Génétique Médicale-Maladies polygéniques/multifactorielles-2018-Vandiedonck C. 41/78
A B
Chromosomeancestral
A B
A b
a B
Mutations
A B
A b
a B
Recombinaison
A B
A b
a B
a b
Dissipation du DL
DLa c > DLa b=> La recombinaison est le principal facteur diminuant le DL
A B
A b
a B C
a b c
C
C
a b C
Claire Vandiedonck - Université Paris Diderot
Evolution du DL
26/11/2018 L3 Médecine-UE5 Génétique Médicale-Maladies polygéniques/multifactorielles-2018-Vandiedonck C. 42/78
A B
Chromosomeancestral
A B
A b
a B
Mutations
A B
A b
a B
Recombinaison
A B
A b
a B
a b
Dissipation du DL
DLa c > DLa b
=> mais le DL n’est pas 100% corrélé à la distance physique!=> La recombinaison est le principal facteur diminuant le DL
A B
A b
a B C
a b c
C
C
a b C
Claire Vandiedonck - Université Paris Diderot
Evolution du DL
26/11/2018 L3 Médecine-UE5 Génétique Médicale-Maladies polygéniques/multifactorielles-2018-Vandiedonck C. 43/78
A B
Chromosomeancestral
A B
A b
a B
Mutations
A B
A b
a B
Recombinaison
A B
A b
a B
a b
Dissipation du DL
DLa c > DLa b
Facteurs démographiques: croissance de la population: DL ↘ (en augmentant le nb de recombinaisons) dérive génétiquemélange et migration de populations
Sélection naturelle effet auto-stop epistasie
=> mais le DL n’est pas 100% corrélé à la distance physique!=> La recombinaison est le principal facteur diminuant le DL
A B
A b
a B C
a b c
C
C
a b C
Claire Vandiedonck - Université Paris Diderot
intérêts:1. SNP étiquette = "tagging SNP " -> réduction de la liste des SNPs génotypés
2. imputation des génotypes des variants fréquents et rares à partir de SNPs en DL dans un panel de référence (ex: 1Kgenome ou UK10K)
Les SNPs en r² > 0.8 sont redondants
26/11/2018 L3 Médecine-UE5 Génétique Médicale-Maladies polygéniques/multifactorielles-2018-Vandiedonck C. 44/78
Claire Vandiedonck - Université Paris Diderot
3. Méthode d’étude de l’hérédité multifactorielle: l’association allélique
26/11/2018 L3 Médecine-UE5 Génétique Médicale-Maladies polygéniques/multifactorielles-2018-Vandiedonck C. 45/78
Claire Vandiedonck - Université Paris Diderot
Etudes de liaison
bien adaptées pour variants rares à effets forts => peu adaptées pour maladies multifactorielles= étude de la co-ségrégation des marqueurs avec la maladie d’une génération à l’autre dans des familles = étude des méioses
Liaison => Locuséchantillons = familles
26/11/2018 L3 Médecine-UE5 Génétique Médicale-Maladies polygéniques/multifactorielles-2018-Vandiedonck C. 46/78
Claire Vandiedonck - Université Paris Diderot
Etudes d’association
bien adaptées pour variants frequents à effets faibles = bien adaptées pour maladies multifactorielles= recherche de marqueurs en DL avec le variant causal de la maladie
Association => Allèle
échantillons = cas et contrôles issus d’une population
26/11/2018 L3 Médecine-UE5 Génétique Médicale-Maladies polygéniques/multifactorielles-2018-Vandiedonck C. 47/78
Claire Vandiedonck - Université Paris Diderot
Etude d’association génétique = cartographie par DL
26/11/2018 L3 Médecine-UE5 Génétique Médicale-Maladies polygéniques/multifactorielles-2018-Vandiedonck C. 48/78
Principe association de l’allèle morbideau locus de la maladie avec les allèles des marqueurs voisins (génétiquement liés)
=> l’association détectée est indirecte
Variant causal non génotypéVariant génotypé
DL
Claire Vandiedonck - Université Paris Diderot
Etude d’association génétique
26/11/2018 L3 Médecine-UE5 Génétique Médicale-Maladies polygéniques/multifactorielles-2018-Vandiedonck C. 49/78
Contrôles Cas
Allèle 2 Allèle 2
Allèle 1 Allèle 1
Comparaison des fréquences alléliques entre cas et contrôles avec des contrôles intra-familiaux avec des contrôles pris dans la population générale
Ici: allèle 2 = allèle mineur = associé à la pathologie
Claire Vandiedonck - Université Paris Diderot
Comparaison des fréquences alléliques entre patients et contrôles pour un marqueur donné
non porteur de l’allèle à risque
porteur de l’allèle à risque
Cas Contrôles
test du Chi² à 1ddl sur les observations des comptes des différents allèles
Etude d’association cas / contrôles
cas contrôlesallèle 1 A B
allèle 2 C D
26/11/2018 L3 Médecine-UE5 Génétique Médicale-Maladies polygéniques/multifactorielles-2018-Vandiedonck C. 50/78
Claire Vandiedonck - Université Paris Diderot
Odds Ratio = rapport des côtes de chaque allèle entre cas et contrôles
l’OR est généralement donné pour l’allèle mineur
estimation de l’Odds Ratio et de son IC à 95%
IC 95% = exp [ ln(OR) ± 1.96 [var(lnOR)1/2]
avec var(lnOR) = (1/a1) + (1/a2) + (1/b1) + (1/b2)
Estimation des Odds Ratios
cas contrôlesallèle 1 A B
allèle 2 C D
𝑂𝑅 𝑝𝑜𝑢𝑟 𝑙′𝑎𝑙𝑙è𝑙𝑒 𝑛°1 =(𝑁𝑏 𝐴𝑙𝑙𝑒𝑙𝑒 1
𝑐𝑎𝑠𝑐𝑜𝑛𝑡𝑟ô𝑙𝑒𝑠
)
(𝑁𝑏 𝐴𝑙𝑙𝑒𝑙𝑒 2𝑐𝑎𝑠
𝑐𝑜𝑛𝑡𝑟ô𝑙𝑒𝑠)=(𝐴/𝐵)
(𝐶/𝐷)=𝐴𝑥𝐷
𝐶𝑥𝐵
OR > 1 => allele 1 sur-repésenté prédispose = allèle de risque OR < 1 => allele 1 sous-représenté = allèle protecteur
26/11/2018 L3 Médecine-UE5 Génétique Médicale-Maladies polygéniques/multifactorielles-2018-Vandiedonck C. 51/78
Claire Vandiedonck - Université Paris Diderot
L’allèle associé du marqueur est l’allèle causal (allèle fonctionnel)
allèle causal --> Maladie
L’allèle associé est en déséquilibre de liaison (DL) avec l’allèle causal
Ou c’est un faux positif !
allèle associé ----- allèle causal --> MaladieDL
Interprétation de l’association
26/11/2018 L3 Médecine-UE5 Génétique Médicale-Maladies polygéniques/multifactorielles-2018-Vandiedonck C. 52/78
Claire Vandiedonck - Université Paris Diderot
Etude d’association pangénomique (GWAS)
26/11/2018 L3 Médecine-UE5 Génétique Médicale-Maladies polygéniques/multifactorielles-2018-Vandiedonck C. 53/78
manhattan plot:
-log10(p-value) en function des positions génomiques des SNPs
Zoom sur une région associée
GWAS = Genome-Wide Association StudyPuces de génotypage avec 500 K à 5x106 SNPs
L’association est testée pour chaque SNP
p<5x10-8
norme
internationale
utilisée
Le seuil de décision est corrigé pour les tests multiples par correction de Bonferroni
sur la base de 106 marqueurs
Claire Vandiedonck - Université Paris Diderot
OR=1.2
OR=1.3
OR=1.5
OR=2
Puissance requiert de grands échantillons
=> Nécessité de regroupements au sein de grandsconsortiums
26/11/2018 L3 Médecine-UE5 Génétique Médicale-Maladies polygéniques/multifactorielles-2018-Vandiedonck C. 54/78
Claire Vandiedonck - Université Paris Diderot
2 000 cases for 7 diseases : Bipolar disorder, coronary artery disease, Crohn’s disease, hypertension, rheumatoid arthritis, type I and type II diabetes
3000 controls
Genotyped for the 500 K Affymetrix GeneChip
Le Wellcome Trust Case Control Consortium
26/11/2018 L3 Médecine-UE5 Génétique Médicale-Maladies polygéniques/multifactorielles-2018-Vandiedonck C. 55/78
Claire Vandiedonck - Université Paris Diderot
14000 Patients et 3000 contrôles
Nombreux SNPs associés mais leurs effets sont modestes (OR < 1.5)
Le Wellcome Trust Case Control Consortium
26/11/2018 L3 Médecine-UE5 Génétique Médicale-Maladies polygéniques/multifactorielles-2018-Vandiedonck C. 56/78
Claire Vandiedonck - Université Paris Diderot
Problèmes inhérents aux GWAS
Les populations de cas et contrôles doivent être homogènes
La stratification des populations conduit à des faux positifs =variants de population non associés à la maladie!
Cases Controls
allele1 1 10
allele2 10 100
=> OR=1
Cases Controls
allele1 101 20
allele2 20 101
=> OR=25.2
Cases Controls
allele1 100 10
allele2 10 1
=> OR=1
cases controls
020
4060
8010
0 allele1allele2
cases controls
020
4060
8010
0 allele1allele2
cases controls
020
4060
8010
012
0
Population 1Populations
1+2
Population 2
26/11/2018 L3 Médecine-UE5 Génétique Médicale-Maladies polygéniques/multifactorielles-2018-Vandiedonck C. 57/78
Claire Vandiedonck - Université Paris Diderot
Analyse en composante principale (ACP)
Évaluation de la stratification de la population
-> choix des sujets appartenant
aux même populations
-> utilisation des vecteurs de
l’ACP comme covariables dans
l’analyse d’association
26/11/2018 L3 Médecine-UE5 Génétique Médicale-Maladies polygéniques/multifactorielles-2018-Vandiedonck C. 58/78
Claire Vandiedonck - Université Paris Diderot
Calcul de puissance
Le phénotype étudié doit être homogène et spécifique
La population contrôle Variations de fréquences alléliques avec l’origine géographique ou ethnique sont modestes mais comparables à l’amplitude des effets recherchés=> ACP pour détecter les ‘outliers’
Allèles en équilibre de Hardy-Weinberg chez les contrôles
Prise en compte des multiples tests effectués!!!problème des faux-positifs à cause du grand nombre de testscorrection de Bonferroni: seuil fixé à p=5x10-8
FONDAMENTAL: Reproduire les résultats dans une cohorte indépendante
Précautions à prendre pour un GWAS
26/11/2018 L3 Médecine-UE5 Génétique Médicale-Maladies polygéniques/multifactorielles-2018-Vandiedonck C. 59/78
Claire Vandiedonck - Université Paris Diderot
Réplication des associations indispensable
Essentielle pour confirmer qu’une information est réelle
= même SNP et même allèle de risque
≠ autre allèle dans le même gène
Importance d’utiliser des échantillons de réplication indépendants
crédibilité augmentée si investigateurs multiples
dans le même groupe ethnique initialement
ensuite dans un groupe ethnique différent
idéal mais pas obligatoire car l’allèle peut être population-spécifiqueex: PTPN22*Arg620Trp
associé aux maladies autoimmunes (OR ~1.5-2)
allèle absent dans populations asiatiques
Forest plot
26/11/2018 L3 Médecine-UE5 Génétique Médicale-Maladies polygéniques/multifactorielles-2018-Vandiedonck C. 60/78
Claire Vandiedonck - Université Paris Diderot
Inconvénient du DL pour la cartographie fine
26/11/2018 L3 Médecine-UE5 Génétique Médicale-Maladies polygéniques/multifactorielles-2018-Vandiedonck C. 61/78
Marqueur
génétiqueLocus
de maladie
Principe association de l’allèle morbideau locus de la maladie avec les allèles des marqueurs voisins (génétiquement liés)
=> l’association détectée est indirecte, due au DL!
2 objectifs contradictoires liaison d’une région chromosomique:
atout d’un DL fort localisation fine:
inconvénient d’un DL fort
Variant causal non génotypéVariant génotypé
DL
Claire Vandiedonck - Université Paris Diderot
Comment affiner l’association?
Réduire l’étendue du déséquilibre de liaison augmenter la taille des échantillons
=> plus de recombinaisons
tester l’association dans une autre population
fréquences alléliques différentes
haplotypes plus ou moins étendus selon les populations
Densifier les variants dans la région associée par imputation à partir d’un panel de référence
par séquençage en particulier chez les patients
Recourir à des phénotypesintermédiaires
si possible quantitatifs
(ex: âge de début de la maladie, titres d’anticorps,
taux de lipides, expression des gènes…)26/11/2018 L3 Médecine-UE5 Génétique Médicale-Maladies polygéniques/multifactorielles-2018-Vandiedonck C. 62/78
génotype trait complexe
Claire Vandiedonck - Université Paris Diderot
Identifier ensuite le variant causal de chaque region associée
Edwards, Am J Hum Genet 201326/11/2018 L3 Médecine-UE5 Génétique Médicale-Maladies polygéniques/multifactorielles-2018-Vandiedonck C. 63/78
Claire Vandiedonck - Université Paris Diderot
Approches intégratives pour identifier le variant causal
Hasin, Genome Biol 2017
Claussnitzer M, N Eng J 2015Smemo S, Nature 2014
Exemple: variant au locus FTO associé au Diabète de type 2
-> rôle du variant sur deux gènes distaux
26/11/2018 L3 Médecine-UE5 Génétique Médicale-Maladies polygéniques/multifactorielles-2018-Vandiedonck C. 64/78
Claire Vandiedonck - Université Paris Diderot
4. Bilan des GWAS
26/11/2018 L3 Médecine-UE5 Génétique Médicale-Maladies polygéniques/multifactorielles-2018-Vandiedonck C. 65/78
Claire Vandiedonck - Université Paris Diderot
Published Genome-Wide Associations through 07/2012Published GWA at p≤5X10-8 for 18 trait categories
NHGRI GWA Catalogwww.genome.gov/GWAStudieswww.ebi.ac.uk/fgpt/gwas/
Bilan des GWAS
26/11/2018 L3 Médecine-UE5 Génétique Médicale-Maladies polygéniques/multifactorielles-2018-Vandiedonck C. 66/78
Claire Vandiedonck - Université Paris Diderot
Bilan des GWAS
Plus de 1200 variants associés à 165 traits complexes
Effets le plus souvent très modestes: OR ~ 1.2
Variants causaux rarement identifiés: absence de validation fonctionnelle
Manolio, Nat Rev Gen 2013
26/11/2018 L3 Médecine-UE5 Génétique Médicale-Maladies polygéniques/multifactorielles-2018-Vandiedonck C. 67/78
Claire Vandiedonck - Université Paris Diderot
Effets modestes des variants associés par GWAS
Ex: polyarthrite rhumatoïde
GWAS
26/11/2018 L3 Médecine-UE5 Génétique Médicale-Maladies polygéniques/multifactorielles-2018-Vandiedonck C. 68/78
Claire Vandiedonck - Université Paris Diderot
Forte association ne signifie pas forte prédiction individuelle
Exemple: HLA-B*27 dans la spondylarthrite ankylosante
fort OR =40
présent chez 80-90% des patients mais aussi chez 7% des témoins
3-4% des B27+ de la population générale développent une SPA
20.1%
75.5%
Fraction attribuable du risque
Résiduelle
B27
GWAS 4.3%
Cortes A et al. Nat Genet 2013
encore 75% non expliquée dans la SPA !!!
Héritabilité manquante
26/11/2018 L3 Médecine-UE5 Génétique Médicale-Maladies polygéniques/multifactorielles-2018-Vandiedonck C. 69/78
Claire Vandiedonck - Université Paris Diderot
Bilan des GWAS:on continue avec des échantillons de + en + grands!
26/11/2018 L3 Médecine-UE5 Génétique Médicale-Maladies polygéniques/multifactorielles-2018-Vandiedonck C. 70/78
Claire Vandiedonck - Université Paris Diderot
Génétique des traits complexes : l’hérédité manquante
26/11/2018 L3 Médecine-UE5 Génétique Médicale-Maladies polygéniques/multifactorielles-2018-Vandiedonck C. 71/78
microbiote
interaction G x Gheterogénéité
interactions G x Eépigenetique
variants struturelsvariants rares
Claire Vandiedonck - Université Paris Diderot
Prudence des interprétations des « séquençages privés »
Attention, on ne peut pas
prédire au niveau individuel le
risque de développer ces maladies
sur la base des associations
rapportées, lesquelles sont
populationnelles
26/11/2018 L3 Médecine-UE5 Génétique Médicale-Maladies polygéniques/multifactorielles-2018-Vandiedonck C. 72/78
Claire Vandiedonck - Université Paris Diderot
Quelques succès des GWAS !
Visscher PM et al, AJHG 2017, 101, 5-22
26/11/2018 L3 Médecine-UE5 Génétique Médicale-Maladies polygéniques/multifactorielles-2018-Vandiedonck C. 73/78
Claire Vandiedonck - Université Paris Diderot
Quelques succès des GWAS !
psoriasis associé à l’IL23R => signalisation de la production d’IL17
=> succès du traitement des formes sévères par les anticorps anti-IL17
Langley RG et al, NEJM, 2014
Mease PJ. et al., NEJM 2014
26/11/2018 L3 Médecine-UE5 Génétique Médicale-Maladies polygéniques/multifactorielles-2018-Vandiedonck C. 74/78
Claire Vandiedonck - Université Paris Diderot
Quelques succès des GWAS !
Comprendre l’inefficacité de certains traitements
allèle G du SNP rs1800693 de TNFRSF1A (récepteur du TNF) associé à la sclérose
en plaques conduit à une forme soluble du récepteur avec un effet antagoniste
au TNF similaire au traitement anti-TNF
traitement anti-TNF inefficace dans la sclérose en plaqueGregory AP, Nature, 2012
26/11/2018 L3 Médecine-UE5 Génétique Médicale-Maladies polygéniques/multifactorielles-2018-Vandiedonck C. 75/78
Claire Vandiedonck - Université Paris Diderot
Quelques succès des GWAS !
Mieux ajuster les traitements = médecine personnalisée
CYP2C19 = enzyme impliquée dans le métabolisme du clopidogrel = anti-
aggrégant plaquettaire
allèle rs4244285*2 de CYP2C19 associé à un risque accru d’accident
cardiovasculaire= mauvaise métabolisation du clopidogrel
=> administration du clopidogrel en fonction du génotype pour le SNP
rs4244285 chez les patients atteints de syndrome coronarien aigü
Scott, Clin Pharmacol Ther 2011
26/11/2018 L3 Médecine-UE5 Génétique Médicale-Maladies polygéniques/multifactorielles-2018-Vandiedonck C. 76/78
Claire Vandiedonck - Université Paris Diderot
Polygenic Risk Score (PRS)
Donnerait une prédiction du risque individuel de déveloper le phenotype
PRS = somme des risques des meilleurs allèles de risque des GWAS pondérés par l’amplitude des effets individuels sur le phenotype
PRSj = Σ [βi,discovery * SNPij]
26/11/2018 L3 Médecine-UE5 Génétique Médicale-Maladies polygéniques/multifactorielles-2018-Vandiedonck C. 77/78
Claire Vandiedonck - Université Paris Diderot
Utilité du PRS en médecine personnalisée
bénéfice avéré du traitement par les statines en prevention du risqué d’infarctus du myocarde
Top percentiles= equivalents à un risque monogénique
Monogénique Polygénique
prévalence 1:200 1:20
risque 3.2 3.6
mode de détection
LDL élevés actuellement non diagnostiqués
intervention réduction desLDL+ contrôle des facteurs de risque
habitudes de vie+ statines
Exemple de l’infarctus du myocarde chez les sujets jeunes:
26/11/2018 L3 Médecine-UE5 Génétique Médicale-Maladies polygéniques/multifactorielles-2018-Vandiedonck C. 78/78
Claire Vandiedonck - Université Paris Diderot