Approche pidmiologique Epidmiologie gntique = Branche de
lpidmiologie qui tudie le rle de facteurs gntiques et de leur
interaction avec des facteurs environnementaux dans la survenue de
maladies Khoury et al., Fundamentals of Genetic Epidemiology,
Oxford University Press 1993 Gntique des maladies
multifactorielles
Page 3
Physiopathologie: Meilleure comprhension des mcanismes
molculaires conduisant la maladie Prdiction de risque:
Identification de populations risque de dvelopper maladie, en
fonction de patrimoine gntique Prvention cible (ou Mdecine
personnalise ) Pharmacogntique: Identification de meilleurs
rpondeurs traitement ou dindividus risque accru deffets secondaires
Traitement personnalis McCarthy, Nat Rev Med 2008 Gntique des
maladies multifactorielles: pourquoi?
Page 4
Physiopathologie: Meilleure comprhension des mcanismes
molculaires conduisant la maladie Prdiction de risque:
Identification de populations risque de dvelopper maladie, en
fonction de patrimoine gntique Prvention cible (ou Mdecine
personnalise ) Pharmacogntique: Identification de meilleurs
rpondeurs traitement ou dindividus risque accru deffets secondaires
Traitement personnalis McCarthy, Nat Rev Med 2008 Gntique des
maladies multifactorielles: pourquoi?
Page 5
McCarthy, Nat Rev Genet 2008 Epidemiologie gntique
Physiopathologie Identification de facteurs de susceptibilit
gntique Meilleure comprhension de biologie sous-jacente Nouvelles
Cibles thrapeutiques BiomarqueursPrvention ex: monitorer volution
maladie ex: mise en vidence FDR environnemental
Page 6
McCarthy, Nat Rev Genet 2008 Identification de facteurs de
susceptibilit gntique Meilleure comprhension de biologie
sous-jacente Nouvelles Cibles thrapeutiques BiomarqueursPrvention
ex: monitorer volution maladie ex: mise en vidence FDR
environnemental Epidemiologie gntique Physiopathologie
Page 7
Dcouverte gnes de susceptibilit maladie de Crohn a rvl rle
central autophagie et exposition microbes intestinaux Yano &
Kurata, Nat Immunol 2009 Nouvelles voies pour approches
thrapeutiques Abraham, NEJM 2009; Feero, NEJM 2010 Exemple de la
maladie de Crohn Gne NOD2: dtecteur intracellulaire de
peptidoglycanes bactriens Gne ATG16L1: dirige composants
intracellulaires (microbes) vers lysosomes Targeting the human
microbiome with antibiotics, probiotics, and prebiotics:
gastroenterology enters the metagenomics era. Preidis,
Gastroenterology 2009
Page 8
McCarthy, Nat Rev Genet 2008 Identification de facteurs de
susceptibilit gntique Meilleure comprhension de biologie
sous-jacente Nouvelles Cibles thrapeutiques Biomarqueurs Prvention
ex: monitorer volution maladie ex: mise en vidence FDR
environnemental Epidemiologie gntique Physiopathologie
Page 9
Tabac risque de polyarthrite rhumatode de 1.5 en population
gnrale, mais dun facteur > 20 si certains variants gntiques sur
HLA et PTPN22 sont prsents! Identification de FDR environnementaux
par la gntique Klareskog, Arthritis Rheum 2006 Amish porteurs de
variant gntique sur gne FTO risque obsit sont protgs de obsit par
activit physique Rampersaud, Arch Intern Med 2008; Kilpelinen, PLOS
Med 2011
Page 10
Physiopathologie: Meilleure comprhension des mcanismes
molculaires conduisant la maladie Prdiction de risque:
Identification de populations risque de dvelopper maladie, en
fonction de patrimoine gntique Prvention cible (ou Mdecine
personnalise ) Pharmacogntique: Identification de meilleurs
rpondeurs traitement ou dindividus risque accru deffets secondaires
Traitement personnalis McCarthy, Nat Rev Med 2008 Gntique des
maladies multifactorielles: pourquoi?
Page 11
Cho & Gregersen, NEJM 2011 Ripatti, Lancet 2010
Epidemiologie gntique Prdiction de risque? Dcevant jusquici, car
variants gntiques identifis jusquici = associs augmentation modeste
de risque (OR < 1.5) Mme quand risque relatif plus lev, pour
linstant pas dapplication clinique dans majorit des cas: Allle
Epsilon4 de lApolipoprotine E pour maladie dAlzheimer Allles HLA
pour maladies autoimmunes Combiner Diffrents variants gntiques (
scores de risque ) Variants gntiques + autres biomarqueurs
(circulants, imagerie)
Page 12
Physiopathologie: Meilleure comprhension des mcanismes
molculaires conduisant la maladie Prdiction de risque:
Identification de populations risque de dvelopper maladie, en
fonction de patrimoine gntique Prvention cible (ou Mdecine
personnalise ) Pharmacogntique: Identification de meilleurs
rpondeurs traitement ou dindividus risque accru deffets secondaires
Traitement personnalis McCarthy, Nat Rev Med 2008 Gntique des
maladies multifactorielles: pourquoi?
Page 13
CYP2C19 = enzyme implique dans bioactivation du clopidogrel
Allele CYP2C19*2 du variant gntique rs4244285 = associ risque
dvnements cardiovasculaires Scott, Clin Pharmacol Ther 2011
Pharmacogntique, Exemple FDA / AHA: boxed warning , valuer au cas
par cas Utilisation du Clopidogrel en fonction de gnotype rs4244285
CYP2C19 chez patients traits par angioplastie pour syndrome
coronarien aigu
Page 14
I.Maladies complexes/multifactorielles vs. mendliennes
II.Etudes dassociation gntique vs. analyses de liaison III.Quelques
rappels I.Variation gntique II.Equilibre de Hardy-Weinberg
III.Dsquilibre de liaison IV.Etudes dassociation gntique (EAG)
I.Etudes dassociation sur gnes candidats II.Etudes dassociation
gntique pangnomiques V.Analyse et interprtation des EAG I.Tests
multiples II.Htrognit de population III.Rplication
VI.Caractrisation des signaux identifis, perspectives Gntique des
maladies multifactorielles
Page 15
I.Maladies complexes/multifactorielles vs. mendliennes
II.Etudes dassociation gntique vs. analyses de liaison III.Quelques
rappels I.Variation gntique II.Equilibre de Hardy-Weinberg
III.Dsquilibre de liaison IV.Etudes dassociation gntique (EAG)
I.Etudes dassociation sur gnes candidats II.Etudes dassociation
gntique pangnomiques V.Analyse et interprtation des EAG I.Tests
multiples II.Htrognit de population III.Rplication
VI.Caractrisation des signaux identifis, perspectives Gntique des
maladies multifactorielles
Page 16
Maladies mendliennes Maladies mendliennes (ou monogniques) =
causes par mutation dans un seul gne Trois modes de transmission:
Autosomique dominant Autosomique rcessif Rcessif li lX
Page 17
Maladies complexes ou multifactorielles Maladies ayant de
multiples facteurs de susceptibilit gntiques et facteurs de risque
environnementaux Ne suit pas un mode de transmission mendlien
Diffrentes faon de mesurer contribution de facteurs gntiques:
Hritabilit: proportion de variance phnotypique due effets gntiques
Risque de rcurrence: compare proportion dapparents de cas qui sont
atteints par maladie versus proportion dindividus atteints en
population gnrale
Page 18
I.Maladies complexes/multifactorielles vs. mendliennes
II.Etudes dassociation gntique vs. analyses de liaison III.Quelques
rappels I.Variation gntique II.Equilibre de Hardy-Weinberg
III.Dsquilibre de liaison IV.Etudes dassociation gntique (EAG)
I.Etudes dassociation sur gnes candidats II.Etudes dassociation
gntique pangnomiques V.Analyse et interprtation des EAG I.Tests
multiples II.Htrognit de population III.Rplication
VI.Caractrisation des signaux identifis, perspectives Gntique des
maladies multifactorielles
Page 19
Analyses de liaison (familles): Examiner la co-transmission
dune gnration lautre du phnotype et des allles de marqueurs
gntiques Etudes dassociation gntique (population gnrale,
cas/tmoins): Comparer frquence des variants gntiques, entre
patients et tmoins Outils en pidmiologie gntique Courtesy Dr.
Dupuis
Page 20
Analyses de liaison (familles): Examiner la co-transmission
dune gnration lautre du phnotype et des allles de marqueurs
gntiques plus puissant pour maladies complexes Risch, Science 1996
Etudes dassociation gntique (population gnrale, cas/tmoins):
Comparer frquence des variants gntiques, entre patients et tmoins
Outils en pidmiologie gntique
Page 21
A A/CTGT T C Copie 1 A A/CTGT T C Copie 2 1000 tmoins: CC : n=
10 AC : n= 180 AA : n= 810 1000 patients avec AVC: CC : n= 50 AC :
n= 250 AA : n= 700 Single nucleotide polymorphism (SNP) Etudes
dassociation gntique
Page 22
Un allle est associ un phnotype si sa frquence diffre plus
entre cas et tmoins que par le simple hasard. Cela nimplique PAS
ncessairement un lien de causalit chromosome Phnotype A Variant
gnotyp B Variant causal non observ Dsquilibre de liaison
Association directe (non observe) Association indirecte (observe)
Etudes dassociation gntique
Page 23
I.Maladies complexes/multifactorielles vs. mendliennes
II.Etudes dassociation gntique vs. analyses de liaison III.Quelques
rappels I.Variation gntique II.Equilibre de Hardy-Weinberg
III.Dsquilibre de liaison IV.Etudes dassociation gntique (EAG)
I.Etudes dassociation sur gnes candidats II.Etudes dassociation
gntique pangnomiques V.Analyse et interprtation des EAG I.Tests
multiples II.Htrognit de population III.Rplication
VI.Caractrisation des signaux identifis, perspectives Gntique des
maladies multifactorielles
Page 24
Quelques chiffres ~3 milliards de paires de bases (nuclotides)
dans squence dADN humain 20,000 25,000 gnes: 1.5% du gnome (reste
contient ADN non-codant, dont introns et squences rgulatrices)
Taille variable, de x100 bases > 2 millions de bases 99.9% de la
squence dADN est identique dun individu lautre Portion variable
fait la diffrence
Page 25
Types de variation gntique Single Nucleotide Polymorphism (SNP)
= polymorphisme mononuclotidique Variation individuelle dans
squence nuclotidique Plusieurs millions de SNPs, frq >1% (
Types de variation gntique Single Nucleotide Polymorphism (SNP)
= polymorphisme mononuclotidique Variation individuelle dans
squence nuclotidique Plusieurs millions de SNPs, frq >1% (
Exemples dhypothses a priori conduisant la slection dun gne
candidat: Fonction du gne laisse supposer que pourrait tre impliqu
dans physiopathologie maladie Etudes gne candidat AVC Debette &
Seshadri, Circ Cardiovasc Genet 2009 GenesPolymorphismsOR (IC95%)
PAI-1 (Plasminogen activator inhibitor 1) Catto, 1997rs1799768
(-668/4G>5G)NS Jood, 2005rs1799768NS CPB2 (Carbopeptidase B2,
plasma = Thrombin-activable fibrinolysis inhibitor) Leebeek,
2005-438A>G, 505A>G,1040C>TNS Ladenvall,
2007rs3742264/rs7337140/rs9526136/rs1926447/rs940OR=2.5(1.4-4.4)
PLAT (Plasminogen activator, tissue) Jood, 2005rs2020918NS Yamada,
2006rs2020918NS VKORC1 (vitamin K epoxide reductase complex,
subunit 1) Wang, 2006rs2359612 (2255T>C)OR=1.8(1.3-2.3) Shen,
2007rs2359612OR=1.7(1.4-2.1) Gne de coagulation, hmostase
Page 45
Choix des SNPs: 1-100 par gnes, en fonction de cot et taille
gne SNPs indpendants si possible, i.e. pas en dsquilibre de liaison
SNPs potentiellement fonctionnels: Codant non-synonyme Dans rgion
rgulatrice (promoteur, 3UTR, site de fixation facteur
transcription) Dans intron, site pissage Etudes gne candidat
Page 46
Etudes dassociation gntique pangnomiques = GWAS (genome-wide
association study) Gnotyper un trs grand nombre (500,000-5,000,000)
de variants gntiques distribus sur lensemble des chromosomes PAS
dhypothse a priori sur les loci dintrt Rcemment possible grce au
projet HapMap et aux technologies de gnotypage haut dbit HapMap =
projet international dcrivant les variations gntiques frquentes
dans diffrents groupes ethniques Gnotypage automatis et rapide de
milliers dchantillons, pour des x100,000 SNPs. Zeggini, Nature
Genet 2005 Etudes dassociation gntique
GWAS visant identifier FDR gntiques dAVC (accident vasculaire
crbral) Population: 19,602 individus dorigine europenne Phnotype:
AVC, 1,544 cas incidents SNPs: 2.5 Millions, sur les 22 autosomes
GWAS prsentation rsultats Manhattan plot p = 5 x10 -8 rs11833579
rs12425791 NINJ2 (chr12p13)
Page 50
GWAS visant identifier FDR gntiques dAVC (accident vasculaire
crbral) Population: 19,602 individus dorigine europenne Phnotype:
AVC, 1,544 cas incidents SNPs: 2.5 Millions, sur les 22 autosomes
GWAS prsentation rsultats Manhattan plot p = 5 x10 -8 rs11833579
rs12425791 NINJ2 (chr12p13)
Page 51
Ikram et al., NEJM 2009 GWAS prsentation rsultats Reprsentation
rgionale des associations de SNPs avec AVC (chr 12p13)
Page 52
Zondervan, Nature Protocols 2007 GWAS contraintes logistiques
Trs grands effectifs ncessaires: > 1,000, voire > 10,000 Plus
si variant rare Plus si risque relatif faible Gnes candidat (18 ou
11 SNPs) GWAS (500,000 ou 300,000 SNPs)
Page 53
Zondervan, Nature Protocols 2007 GWAS contraintes logistiques
Trs grands effectifs ncessaires: > 1,000, voire > 10,000 Plus
si variant rare Plus si risque relatif faible Gnes candidat (18 ou
11 SNPs) GWAS (500,000 ou 300,000 SNPs)
Page 54
GWAS contraintes logistiques Supercalculateurs pour analyser
donnes prestige des U.S.A et dAMD http://www.abysse-tech.com Nud de
connexion, travail sur Unix
Page 55
GWAS contraintes logistiques Cot encore levs: ~ 500 Euros pour
gnotyper 1 SNP sur 2000 sujets ~ 400,000 Euros pour un GWAS sur
600,000 SNPs sur 2000 sujets ~ 800,000 Euros pour un GWAS sur
5,000,000 SNPs sur 2000 sujets
Page 56
Gnes candidats Limite analyse rgions slectionnes sur donnes ou
hypothses pralables Avantages: Cote moins cher Ncessite effectifs
moindres Inconvnients: Ne permet pas de dcouvrir de nouveaux gnes,
non suspects Rsultats trs dcevants en moyenne Genome-wide Analyse
de variants rpartis sur lensemble du gnome, sans hypothse pralable
Avantages: Permet de dcouvrir de nouveaux gnes (approche
agnostique) Couvre mieux variation gntique A permis dcouverte x100
gnes Inconvnients: Ncessite trs grands effectifs (collaborations)
Cot lev Infrastructure (supercalculateur) Etudes dassociation
gntique
Page 57
I.Maladies complexes/multifactorielles vs. mendliennes
II.Etudes dassociation gntique vs. analyses de liaison III.Quelques
rappels I.Variation gntique II.Equilibre de Hardy-Weinberg
III.Dsquilibre de liaison IV.Etudes dassociation gntique (EAG)
I.Etudes dassociation sur gnes candidats II.Etudes dassociation
gntique pangnomiques V.Analyse et interprtation des EAG I.Tests
multiples II.Htrognit de population III.Rplication
VI.Caractrisation des signaux identifis, perspectives Gntique des
maladies multifactorielles
Page 58
Tests multiples en tude dassociation gntique Multiples SNPs
Dans un ou plusieurs gnes candidats Genome-wide (500,000 5,000,000
SNPs) Multiples phnotypes Comment en tenir compte dans
interprtation rsultats? Tests multiples
Page 59
H 0 : pas dassociation entre SNP et M Tests multiples Ralit
DcisionH 0 fauxH 0 vrai Rejeter H 0 correctfaux positif Ne pas
rejeter H 0 faux ngatifcorrect = probabilit derreur de type I =
probabilit de rejeter H 0, alors que H 0 = vrai = probabilit de
dclarer une association tort = seuil de significativit pour un seul
test statistique ( = 0.05) = probabilit derreur de type II =
probabilit de ne pas rejeter H 0, alors que H 0 = faux = probabilit
de ne pas dtecter une association qui existe 1- = puissance du
test
Page 60
H 0 : pas dassociation entre SNP et M Tests multiples Ralit
DcisionH 0 fauxH 0 vrai Rejeter H 0 correctfaux positif Ne pas
rejeter H 0 faux ngatifcorrect = probabilit derreur de type I =
probabilit de rejeter H 0, alors que H 0 = vrai = probabilit de
dclarer une association tort = seuil de significativit pour un seul
test statistique ( = 0.05) = probabilit derreur de type II =
probabilit de ne pas rejeter H 0, alors que H 0 = faux = probabilit
de ne pas dtecter une association qui existe 1- = puissance du
test
Page 61
Correction de Bonferroni Si n tests: seuil de significativit =
0.05/n ou garder seuil 0.05 mais multiplier p par n Exemple Testp
Test10.047 Test20.03 Test30.009 Test40.10 Test50.02
Page 62
Correction de Bonferroni Si n tests: seuil de significativit =
0.05/n ou garder seuil 0.05 mais multiplier p par n Exemple Testp
Test10.047 Test20.03 Test30.009 Test40.10 Test50.02 Surcorrige
(conservateur) si tests ne sont pas indpendants, par exemple: SNPs
en dsquilibre de liaison
Page 63
En pratique Bonferroni Autres mthodes: False Discovery Rate,
Permutations Dans GWAS, gnralement seuil fixe p=5x10 -8 Correspond
~ 1 Million de tests indpendants Reflte peu prs la ralit, quelque
soit la densit des puces Pour populations europennes Tests
multiples
Page 64
Il faut tenir compte de la structure de la population Faux
positifs (associations faussement significatives) si stratification
de la population, i.e. si population contient plusieurs
sous-populations diffrant par leur caractristiques gntiques,
notamment frquences allliques Campbell, Nat Genet 2005 Htrognit
ethnique
Page 65
Population 1 Population 2 Allele 2 = 20% in cases and controls
Allele 2 = 60% in cases and controls Population 1 + 2 Allele 2 =
33% in cases and 45% in controls! cases controls
Page 66
Il est donc essentiel de choisir des tmoins de la mme origine
ethnique que les cas autant que possible du mme pays, voire de la
mme rgion Si diffrentes origines gographiques dans population
tudie, on peut: stratifier lanalyse par origine gographique (i.e.
par pays) effectuer une analyse groupe en corrigeant sur la
stratification par des mthodes statistiques (contrle gnomique,
composantes principales) Htrognit ethnique
Page 67
Analyse en composantes principales = applique aux donnes GWAS
(gnotypes pangnomiques) pour infrer des axes continus de variation
gntique Price, Nat Genet 2006
Page 68
Essentielle pour confirmer quune association est relle
Importance dutiliser des chantillons de rplication indpendants
Credibilit augmente quand groupes dinvestigateurs multiples
Rplication +++ Ikram, NEJM 2009 Rplication dans article initial
652/3613 caucasiens 2430 personnes avec 215 AVC incidents
afro-amricains Rplication dans tude asiatique 3784/3102 asiatiques
Matsushita, J Hum Genet 2010
Page 69
Essentielle pour confirmer quune association est relle
Importance dutiliser des chantillons de rplication indpendants
Crdibilit augmente quand groupes dinvestigateurs multiples
Rplication +++ Ikram, NEJM 2009 Rplication dans article initial
652/3613 caucasiens 2430 personnes avec 215 AVC incidents
afro-amricains Rplication dans tude asiatique 3784/3102 asiatiques
Matsushita, J Hum Genet 2010 Rosand, NEJM 2010
Page 70
Calcul deffectif ncessaire doit tenir compte du winners curse
Ltude initiale tend typiquement surestimer la force de lassociation
Mme groupe ethnique initialement Du fait de diffrences en frquence
alllique, dsquilibre de liaison, force de lassociation Extension
dautres groupes ethniques dans un 2 temps: Important pour la
gnralisabilit des rsultats Permet daffiner le signal du fait de
diffrences de dsquilibre de liaison, plus forte densit en SNPs...
Rplication +++
Page 71
Nature 2011; 475:163-165
Page 72
I.Maladies complexes/multifactorielles vs. mendliennes
II.Etudes dassociation gntique vs. analyses de liaison III.Quelques
rappels I.Variation gntique II.Equilibre de Hardy-Weinberg
III.Dsquilibre de liaison IV.Etudes dassociation gntique (EAG)
I.Etudes dassociation sur gnes candidats II.Etudes dassociation
gntique pangnomiques V.Analyse et interprtation des EAG I.Tests
multiples II.Htrognit de population III.Rplication
VI.Caractrisation des signaux identifis, perspectives Gntique des
maladies multifactorielles
Page 73
Refining the signal Ioannidis, Nat Rev Genet 2009 Where is the
causative variant?
Page 74
Refining the signal Ioannidis, Nat Rev Genet 2009 Where is the
causative variant? Resequencing and fine mapping around confirmed
signals
Page 75
Refining the signal Ioannidis, Nat Rev Genet 2009 Where is the
causative gene?
Page 76
Refining the signal Ioannidis, Nat Rev Genet 2009 Where is the
causative gene? Genome annotation Expression quantitative trait
loci Experiments
Page 77
En ~5 ans, GWAS ont identifi des centaines de nouveaux loci
associ avec diverses maladies, avec rplication solide La plupart
dans gnes pralablement non suspects Catalogue online
(http://www.genome.gov/gwastudies ) 71 gnes pour maladie de Crohn
Franke, Nat Genet 2010 38 gnes pour diabte de type 2 Voight, Nat
Genet 2010 25 gnes pour maladie coronaire Shunkert, Nat Genet 2011
12 gnes pour Alzheimer Hollingworth, Nat Genet 2011 4 gnes pour AVC
(problme htrognit) Succs et limites des GWAS
Page 78
Published Genome-Wide Associations through 6/2010, 904
published GWA at p
Page 79
Prdisposition gntique aux AVC ischmiques Risque de et
susceptibilit aux Facteurs de risque traditionnels Influence
mchanismes responsables des sous-types dAVC ischmique HTA Diabte
Hyperchol Obesit Tabac Athrome Maladie petites artres Fibrillation
auriculaire Dissection Predispose to arterial thrombosis Module
tolrance ischmie crbrale ? NINJ2 PITX2, ZFHX2 9p21, HDAC9 ? Other
Gretarsdottir, Ann Neurol 2008 Bellenguez, Nat Genet 2012 Traylor,
Lancet Neurol 2012 Ikram, NEJM 2009
Page 80
En ~5 ans, GWAS ont identifi des centaines de nouveaux loci
associ avec diverses maladies, avec rplication solide La plupart
dans gnes pralablement non suspects Catalogue online
(http://www.genome.gov/gwastudies ) 71 gnes pour maladie de Crohn
23% hritabilit 38 gnes pour diabte de type 2 10% hritabilit 25 gnes
pour maladie coronaire 10% heritabilit 12 gnes pour Alzheimer 4
gnes pour AVC (problme htrognit) Succs et limites des GWAS
Page 81
Variants rares 1000 gnome Squenage exons / genome entier
(ESP-GO, CHARGE-S) Exome chip Copy number variants Segments dADN
prsents en nombre variable de copies Modifications pigntiques
Modulent emballage ADN dans noyau et influencent expression ADN
mitochondrial Perspectives Au-del du GWAS