PLAN DU COURS - Science Calender · • Maladie multifactorielle : – Interaction de multiples...

42
01/05/2014 1 Recherche des facteurs génétiques impliqués dans les maladies fréquentes Dr Gaëtan Lesca / Pr Pascal Roy 17 avril 2014 MSBM de Génétique PLAN DU COURS 1. Définitions, rappel sur les maladies monogéniques 2. Stratégies d’étude des maladies fréquentes 1. Etudes de liaison paramétriques 2. Hypothèse variant fréquent / maladie fréquente 1. Bases génétiques 2. Paires de germains 3. Etudes d’association 3. Hypothèse variant fréquent maladie rare 4. Hypothèse variant rares / maladie fréquente 1. Etude de CNV par CGH-array 2. Recherche de variants par NGS

Transcript of PLAN DU COURS - Science Calender · • Maladie multifactorielle : – Interaction de multiples...

Page 1: PLAN DU COURS - Science Calender · • Maladie multifactorielle : – Interaction de multiples gène + ... • Méthode d’analyse de liaison indépendante ... • Comparaison de

01/05/2014

1

Recherche des facteursgénétiques impliqués dans les

maladies fréquentes

Dr Gaëtan Lesca / Pr Pascal Roy

17 avril 2014

MSBM de Génétique

PLAN DU COURS

1. Définitions, rappel sur les maladies monogéniques

2. Stratégies d’étude des maladies fréquentes1. Etudes de liaison paramétriques

2. Hypothèse variant fréquent / maladie fréquente

1. Bases génétiques

2. Paires de germains

3. Etudes d’association

3. Hypothèse variant fréquent maladie rare

4. Hypothèse variant rares / maladie fréquente

1. Etude de CNV par CGH-array

2. Recherche de variants par NGS

Page 2: PLAN DU COURS - Science Calender · • Maladie multifactorielle : – Interaction de multiples gène + ... • Méthode d’analyse de liaison indépendante ... • Comparaison de

01/05/2014

2

DEFINITIONS

• Maladie monogénique :– Défaut d’un gène

– Obéi aux lois de Mendel (+/- pénétranceincomplète ou liée à l’âge)

– Maladie « rare »

• Maladie multifactorielle :– Interaction de multiples gène +

environnement +/- effet stochastique

– Maladies courantes

MALADIE FAMILIALE / MALADIEGENETIQUE

Une maladie familiale n’est pas forcémentgénétique

Ex :

Alcoolisme, Kuru

Page 3: PLAN DU COURS - Science Calender · • Maladie multifactorielle : – Interaction de multiples gène + ... • Méthode d’analyse de liaison indépendante ... • Comparaison de

01/05/2014

3

MALADIE FAMILIALE / MALADIEMONOGENIQUE

BRCA1 négatif, BRCA2 négatif

Cancer du sein

DID

SEP

Schizophrénie

40

18

50

Fente labiale 30

2

15

5

5

D ’après J. Feingold

MZ DZ

ETUDE DE JUMEAUX

• Comparaison taux de concordance MZ et DZ

• Composante génétique si concordance MZ >> DZ

Page 4: PLAN DU COURS - Science Calender · • Maladie multifactorielle : – Interaction de multiples gène + ... • Méthode d’analyse de liaison indépendante ... • Comparaison de

01/05/2014

4

Maladie deHuntington

Dystrophiemyotoniquede Steinert

Epilepsie

Maladied’Alzheimer

Diabète

Scléroseen plaques

TuberculoseLèpre

RougeoleSIDA

POIDS RELATIF DES FACTEURSGENETIQUES DANS DIFFERENTES

MALADIES

SEP

Epilepsie

Alzheimer

Plusieurs facteurs génétiques exerçantchacun un effet faible + facteurs nongénétiques (viraux, immunitaires…)

Prédominance des facteurs génétiquesmais grande complexité

Quelques gènes exercent un effetmajeur

MODELES D’HEREDITE VARIABLE ENFONCTION DES MALADIES

Autisme Nombreux gènes exerçant un effetvariable

Page 5: PLAN DU COURS - Science Calender · • Maladie multifactorielle : – Interaction de multiples gène + ... • Méthode d’analyse de liaison indépendante ... • Comparaison de

01/05/2014

5

MALADIES FREQUENTES ETFACTEURS GENETIQUES

• Observation pour de récurrencesfamiliales pour de nombreusesmaladies (ex : DNID)

• Risque plus élevé pour les apparentésdu premier degré

STRATEGIES D’ETUDES DESMALADIES MONOGENIQUES

• Clonage fonctionnel :– Maladie > fonction > gène > localisation

– Ex: enzymopathies, drépanocytose

• Clonage positionnel :– Utilisation de marqueurs génétiques

– Pas de nécessité de connaitrepréalablement la fonction

Page 6: PLAN DU COURS - Science Calender · • Maladie multifactorielle : – Interaction de multiples gène + ... • Méthode d’analyse de liaison indépendante ... • Comparaison de

01/05/2014

6

CLONAGE POSITIONNEL

• On connaît le phénotype et un certainnombre de marqueurs génétiques

• On ne connaît pas le gène responsablede la maladie

• Recherche d’une coségrégation entreun marqueur génétique et le phénotypedans une famille

• Plus la ségrégation est bonne et plus lemarqueur est proche du locus du gène

PROJET GENOME HUMAIN

• 1983: liaison RFLP sur chr 4 et maladie deHuntington

• 1987: clonage gène de la mucoviscidose

• 1990: début HGP: établissement de cartesgénétiques avec de nombreux marqueurs

identification de centaines de gènes demaladies monogéniques

• 2003: Séquençage du génome humain (~ 30000 gènes)

Page 7: PLAN DU COURS - Science Calender · • Maladie multifactorielle : – Interaction de multiples gène + ... • Méthode d’analyse de liaison indépendante ... • Comparaison de

01/05/2014

7

ETUDES DE LIAISON

• Marqueurs polymorphes (microsatellites

>> RFLP) répartis sur le génome (~300)

• Grandes familles avec patients et sujetssains

• Le statut clinique des patients doit êtredéfini

• De préférence : affection dominanteavec pénétrance complète

A1

B1

A2

B2

A1

B1

A2

B2

A2

B1B2

A1

Recombinaison (CO)

Gamètes parentaux Gamètes recombinés

Gamètes recombinés

Gamètes parentaux =

TAUX DE RECOMBINAISON

Page 8: PLAN DU COURS - Science Calender · • Maladie multifactorielle : – Interaction de multiples gène + ... • Méthode d’analyse de liaison indépendante ... • Comparaison de

01/05/2014

8

Pénétrances desgénotypes

mm = 1mM = 1

MM : 0

M aM b

m aM c

c md M

a mc M

Z() = LogL()

L(1/2)Vraisemblance de = 1/2(ségrégation indépendante)

Vraisemblance de 0 < < 1/2

CI

METHODE DES LOD-SCORES

METHODE DES LOD-SCORES =TEST PARAMETRIQUE

• Il faut connaître :

– Le mode de transmission

– La pénétrance des génotypes

– Le taux de phénocopie

– Le taux d’hétérozygotie au locus marqueur

Page 9: PLAN DU COURS - Science Calender · • Maladie multifactorielle : – Interaction de multiples gène + ... • Méthode d’analyse de liaison indépendante ... • Comparaison de

01/05/2014

9

PLAN DU COURS

1. Définitions, rappel sur les maladies monogéniques

2. Stratégies d’étude des maladies fréquentes1. Etudes de liaison paramétriques

2. Hypothèse variant fréquent / maladie fréquente

1. Bases génétiques

2. Paires de germains

3. Etudes d’association

3. Hypothèse variant fréquent maladie rare

4. Hypothèse variant rares / maladie fréquente

1. Etude de CNV par CGH-array

2. Recherche de variants par NGS

Méthode des Lod Scores appliquéeaux maladies multifactorielles

•Exemple 1 : Schizophrénie

–Exclusion de tout le génome !!

•Exemple 2 : Tuberculose (Greenwood et al.,

2000)

– Liaison en 2q35 dans une familleamérindienne

– LOD score de 3.81

– NRAMP1

Page 10: PLAN DU COURS - Science Calender · • Maladie multifactorielle : – Interaction de multiples gène + ... • Méthode d’analyse de liaison indépendante ... • Comparaison de

01/05/2014

10

ANALYSE DE LIAISON PARAMÉTRIQUES ETMALADIES MULTIFACTORIELLES

•Faible probabilité de détecter une liaison

•Forte probabilité d’exclure une liaison àtord

– Ex : Kc du sein

•Faux positifs– Ex : Alzheimer et chr 21

• Augmentation du nombre de marqueurs ?

500 000 SNP ?

• Augmentation du nombre de patients ?

Plusieurs centaines voir milliers ?

• Amélioration du phénotypage des patients ?

Erreur de classification (dilution du risque)

Peut-on augmenter l’efficacité desétudes de liaison ?

Page 11: PLAN DU COURS - Science Calender · • Maladie multifactorielle : – Interaction de multiples gène + ... • Méthode d’analyse de liaison indépendante ... • Comparaison de

01/05/2014

11

Contourner le problème par l’étudedes sous-entités mendéliennes

Ex : maladie d’Alzheimer

• Dans certaines familles la maladie estprécoce (<60 ans) et transmise selon unmode AD

• Au moins 3 formes mendéliennes à débutprécoce

• + 2 formes mendéliennes à début tardif

Formes monogéniques de maladied’Alzheimer

• APP (chr 21) : précurseur béta-amyloïde

• Préséniline 1 (chr 14) : gène majeur

• Préséniline 2 (chr 1) : Allemands de laVolga

• …

Page 12: PLAN DU COURS - Science Calender · • Maladie multifactorielle : – Interaction de multiples gène + ... • Méthode d’analyse de liaison indépendante ... • Comparaison de

01/05/2014

12

Contourner le problème par l’étudedes endophénotypes ?

• Endophénotype = phénotype intermédiaire discretobéissant aux lois de Mendel

• Trait neurophysiologique élémentaire égalementprésents chez des apparentés sains

• 2 endophénotypes décrits pour la schizophrénie

– troubles des mouvements de poursuite oculairelents

– troubles du filtrage sensoriel

• Faible diminution de l’onde P50 lors de larépétition du stimulus auditif

• Présente chez 90% des patients et 50% desapparentés au 1er degré

transmission AD

• Endophénotype utilisé pour études de liaison

Endophénotype : schizophrénie ettrouble du filtrage sensoriel

Page 13: PLAN DU COURS - Science Calender · • Maladie multifactorielle : – Interaction de multiples gène + ... • Méthode d’analyse de liaison indépendante ... • Comparaison de

01/05/2014

13

Evolution parallèle des concepts etdes technologies

Hypothèse Stratégie Technologie

Variant fréquent /maladie fréquente

Variant rare /maladie fréquente

Variant rare /maladie rare

• Sib-pairs

• Association

• Association

• Variants de novo

• Association

• Gènes candidat

• GWAS

• CGH-array

• NGS

PLAN DU COURS

1. Définitions, rappel sur les maladies monogéniques

2. Stratégies d’étude des maladies fréquentes1. Etudes de liaison paramétriques

2. Hypothèse variant fréquent / maladie fréquente

1. Bases génétiques

2. Paires de germains

3. Etudes d’association

3. Hypothèse variant fréquent maladie rare

4. Hypothèse variant rares / maladie fréquente

1. Etude de CNV par CGH-array

2. Recherche de variants par NGS

Page 14: PLAN DU COURS - Science Calender · • Maladie multifactorielle : – Interaction de multiples gène + ... • Méthode d’analyse de liaison indépendante ... • Comparaison de

01/05/2014

14

NOTION DE FACTEUR DE RISQUE

• Maladie monogénique :

– Mutations rares, pathogènes

• Maladie multifactorielle :

– Combinaison d’allèles fréquents

– Exerçant chacun un effet modeste

– Ni indispensables ni suffisants

Maladiesmendéliennes

Maladiescomplexes

100

0

0 1 3 x ?… nombre de gènes impliqués

% de varianceexpliquée parchaque gène

Petits échantillons

Grands échantillons

POIDS DES FACTEURS GENETIQUES DANSLES MALADIES MENDELIENNES ET

COMPLEXES

Page 15: PLAN DU COURS - Science Calender · • Maladie multifactorielle : – Interaction de multiples gène + ... • Méthode d’analyse de liaison indépendante ... • Comparaison de

01/05/2014

15

Maladiesdu spectre

Phenocopies

Phénotype =

ce que nous étudions

Génotype =

ce que nous voulonsétudier

Non concordance génotype /phénotype

• Pas de nécessité de connaître le modèlesous-jacent

• Plusieurs approches possibles :

- Eudes de liaison : méthode des paires degermains

- Eudes d’association

METHODES NON PARAMETRIQUES

Page 16: PLAN DU COURS - Science Calender · • Maladie multifactorielle : – Interaction de multiples gène + ... • Méthode d’analyse de liaison indépendante ... • Comparaison de

01/05/2014

16

PLAN DU COURS

1. Définitions, rappel sur les maladies monogéniques

2. Stratégies d’étude des maladies fréquentes1. Etudes de liaison paramétriques

2. Hypothèse variant fréquent / maladie fréquente

1. Bases génétiques

2. Paires de germains

3. Etudes d’association

3. Hypothèse variant fréquent maladie rare

4. Hypothèse variant rares / maladie fréquente

1. Etude de CNV par CGH-array

2. Recherche de variants par NGS

• Méthode d’analyse de liaison indépendantedu modèle

• But = montrer que deux sujets d’une fratriehérité d’un segment chromosomique plusfréquemment que ne le voudrait le hasard

• Moyen = estimation de la proportion d’allèlesidentiques par descendance (IBD)

CII

METHODE DES PAIRES DE GERMAINS(SIB-PAIRS)

Page 17: PLAN DU COURS - Science Calender · • Maladie multifactorielle : – Interaction de multiples gène + ... • Méthode d’analyse de liaison indépendante ... • Comparaison de

01/05/2014

17

a c a b b c b d

a c 2 1 1 0

a d 1 2 0 1

b c 1 0 2 1

b d 0 1 1 2

Situations où les parents sont hétérozygotes pour desallèles différents

IBD = 2 → 4/16 (25%)

IBD = 0 → 4/16 (25%)

IBD = 1 → 8/16 (50%)

ESTIMATION DE L’IBD

2 1 0

1/4 1/2 1/4

60 30 10

HLA et Sclérose en plaques

METHODE DES SIB-PAIRESAPPLIQUEE A LA SEP

Genotype

Distribution théorique

Distribution observée

Page 18: PLAN DU COURS - Science Calender · • Maladie multifactorielle : – Interaction de multiples gène + ... • Méthode d’analyse de liaison indépendante ... • Comparaison de

01/05/2014

18

• Pas de problème de pénétrance

• Problème des phénocopies

• Faible aptitude à démontrer une liaison : requiertl’étude de plusieurs centaines de patients

• Ne permet pas de localiser le gène en causeavec précision

• Peu de « succes stories »

INTERET ET LIMITES DE LA METHODEDES SIB-PAIRS

PLAN DU COURS

1. Définitions, rappel sur les maladies monogéniques

2. Stratégies d’étude des maladies fréquentes1. Etudes de liaison paramétriques

2. Hypothèse variant fréquent / maladie fréquente

1. Bases génétiques

2. Paires de germains

3. Etudes d’association

3. Hypothèse variant fréquent maladie rare

4. Hypothèse variant rares / maladie fréquente

1. Etude de CNV par CGH-array

2. Recherche de variants par NGS

Page 19: PLAN DU COURS - Science Calender · • Maladie multifactorielle : – Interaction de multiples gène + ... • Méthode d’analyse de liaison indépendante ... • Comparaison de

01/05/2014

19

• Comparaison de la fréquence d’un allèle oud’un génotype entre un groupe de patients etun groupe de témoins

• Un allèle est associé à la maladie s’il eststatistiquement plus fréquent chez lesmalades (non apparentés) que chez lestémoins

CIII

UN PRINCIPE SIMPLE

• Substitution d’une base

• Fréquence > 1%

• Toutes les 1200 paires de bases en moyenne

• Intra ou extra génique, codante ou non codante,synonyme ou non

• Le plus souvent bi-allélique

• Génotypage à haut débit possible

LES SNPs(Single Nucleotide Polymorphism)

Page 20: PLAN DU COURS - Science Calender · • Maladie multifactorielle : – Interaction de multiples gène + ... • Méthode d’analyse de liaison indépendante ... • Comparaison de

01/05/2014

20

Association détéctée = 2 possibilités

• l’allèle associé A est un facteur causal direct

= rarement et il faut le démontrer

• l’allèle associé A est en déséquilibre deliaison avec un allèle causal B, c’est à dire :AB A x B

= cas le plus fréquent

NOTION DE DESEQUILIBRE DELIAISON

Association directe

Association indirecte

DESEQUILIBRE DE LIAISON

Page 21: PLAN DU COURS - Science Calender · • Maladie multifactorielle : – Interaction de multiples gène + ... • Méthode d’analyse de liaison indépendante ... • Comparaison de

01/05/2014

21

Indication deliaison (Sib-

airs)

Basefonctionnelle:familles de

gènes, voiesmétaboliques…

Régions conservées(SNP codants,

régions régulatrices)

Signature de sélection(positive ou négative)

Choix descandidats ?

APPROCHE GENE CANDIDAT

• Exemple 1 :

Association d’un polymorphisme du gèneICAM1 avec la SEP dans la populationpolonaise

Non retrouvée dans la population finlandaise

• Exemple 2 :

Polymorphisme du gène SDF1 et résistance àl’infection par HIV

EXEMPLES D’ETUDE GENESCANDIDAT

Page 22: PLAN DU COURS - Science Calender · • Maladie multifactorielle : – Interaction de multiples gène + ... • Méthode d’analyse de liaison indépendante ... • Comparaison de

01/05/2014

22

Spondylarthrite ankylosante

Sclérose en plaques

Polyarthrite rhumatoïde

Diabète type 1

Narcolepsie

B27

DR2

DR4

DR3 ou DR4

DR2

Patients ContrôlesAllèle

9%

43%

33%

24%

33%

90%

93%

86%

81%

>95%

Rôle direct HLA ? Déséquilibre de liaison ?

SYSTÈME HLA ET MALADIESFREQUENTES

• Association ne signifie pas un lien decausalité

Ex : RAA en Angleterre

• Absence d’association avec un SNP n’exclupas un variant important dans le même gène

• Stratification de la population (admixture)

f maladie et allèles ≠ chez patients et témoins

• Problème des tests multiples

Risque de détecter une association liée au hasard enpratiquant divers tests successifs

LIMITE DES ETUDES D’ASSOCIATION

Page 23: PLAN DU COURS - Science Calender · • Maladie multifactorielle : – Interaction de multiples gène + ... • Méthode d’analyse de liaison indépendante ... • Comparaison de

01/05/2014

23

OR=0.27 [0.18-0.40]

Full heritage American indianFréquence haplotype A : 1%Prévalence DNID : 40%

CaucasianFréquence haplotype A : 66%Prévalence DNID : 15%

• Situation rare en pratique

• Ajustement cas/témoins, contrôle internes, test d’ungroupe de marqueurs (ex: panels régionaux français)

(Cardon and Palmer, 2003)

STRATIFICATION DE LA POPULATIONET FAUX POSITIFS

• Augmentation du risque de faux positifs lorsque oneffectue de multiples tests indépendants sur le mêmeéchantillon

• Nécessite de corriger le seuil de significativité (parexemple: correction de Bonferoni) :

p=0.05 pour un test → p=5x10-8 pour un million detests

• Mais les tests ne sont pas toujours indépendants (DL,marqueurs redondants)

CIV

PROBLEME DES TESTS MULTIPLES

Page 24: PLAN DU COURS - Science Calender · • Maladie multifactorielle : – Interaction de multiples gène + ... • Méthode d’analyse de liaison indépendante ... • Comparaison de

01/05/2014

24

• Faux positifs dans la première étude :

Détection de l’association par hasard (erreur de type I)p=0,05 ou p=0,01 non adaptés

nécessité de critères plus stringents

• Faux négatifs dans la deuxième étude :

Absence de puissance statistique (erreur de type II)

nombre insuffisant de patients

• Hétérogénéité des populations à risque (différencesde fréquences allèliques, facteurs environnement…)

CAUSE DE NON REPLICATION D’UNEASOCIATION

• Candidats issus modeles animaux (lignéesconsanguines, cartes synthéniques)

• Phénotypes intermédiaires (ex : densité tissumammaire)

• Enrichir le groupe de patients en formes familiales :intérêt surtout pour allèles rares

• Augmenter la normalité des témoins : “ hypernormalcontrols”

COMMENT AMELIORER LES ETUDESGENE CANDIDAT

Page 25: PLAN DU COURS - Science Calender · • Maladie multifactorielle : – Interaction de multiples gène + ... • Méthode d’analyse de liaison indépendante ... • Comparaison de

01/05/2014

25

• Nécessite une connaissance précise de l’ensembledes SNP et du DL

• Puces à ADN

• Sélectionner un nombre raisonnable de SNP ?

200,000 à 500,000 SNP pour une fréquenceallélique minimale de 5% (x 2 pour les Africains)

Réduction du seuil

Etudes d’association sur le génome entierGWAS (Genome-wide associations studies)

• Projet HapMap : phase I(2005)

• 106 SNP

• Génotype de 270individus

• 4 populations:• 30 Yoruba

• 45 japonais

• 45 Chinois

• 30 Américains (USA)d’origine européene

Page 26: PLAN DU COURS - Science Calender · • Maladie multifactorielle : – Interaction de multiples gène + ... • Méthode d’analyse de liaison indépendante ... • Comparaison de

01/05/2014

26

• Les haplotypes despopulations nonafricaines dériventde sous-groupes d’haplotypes d’origineafricaine et sont engénéral plus longs

• Les populationsafricaines sontlongtemps restéesnumériquement plusimportantes(recombinaisonsplus nombreusessur la durée)

• Phase III (2009), 11 populations:– ASW (African ancestry in Southwest USA)

– CEU (Utah residents with Northern and Western European ancestry fromthe CEPH collection)

– CHD (Chinese in Metropolitan Denver, Colorado)

– CHB (Han Chinese in Beijing, China)

– JPT (Japaese in Tokyo, Japan)

– GIH (Gujarati Indians in Houston, Texas)

– LWK (Luhya in Webuye, Kenya)

– MEX (Mexican ancestry in Los Angeles, California)

– MKK (Maasai in Kinyawa, Kenya)

– TSI (Tuscans in Italy)

– YRI (Yoruba in Ibadan, Nigeria). [1]

Page 27: PLAN DU COURS - Science Calender · • Maladie multifactorielle : – Interaction de multiples gène + ... • Méthode d’analyse de liaison indépendante ... • Comparaison de

01/05/2014

27

Pharoah et al., 2004

• Pour mettre enévidence uneassociation, pour unepuissance de 90%

• Pour des allèlesdominants

Effectif requis en fonction du risquerelatif estimé

« The missing Heritability »

• Diabète (Zeggini et al., 2008):

– 10128 patients et 53975 contrôles

– 18 SNPs expliquent 6% de l’augmentationde risque

• Schizophrénie (Shi et al., 2009):

– Méta-analyse 8008 patients et 19077contrôles

– 7 SNPs avec OR <1.3

Page 28: PLAN DU COURS - Science Calender · • Maladie multifactorielle : – Interaction de multiples gène + ... • Méthode d’analyse de liaison indépendante ... • Comparaison de

01/05/2014

28

PLAN DU COURS

1. Définitions, rappel sur les maladies monogéniques

2. Stratégies d’étude des maladies fréquentes1. Etudes de liaison paramétriques

2. Hypothèse variant fréquent / maladie fréquente

1. Bases génétiques

2. Paires de germains

3. Etudes d’association

3. Hypothèse variant fréquent maladie rare

4. Hypothèse variant rares / maladie fréquente

1. Etude de CNV par CGH-array

2. Recherche de variants par NGS

• Certains allèles de susceptibilité pourraient être desvariants rares (>1%)

• Leur rareté serait due à leur origine récente

• Seront faiblement corrélé à des SNP fréquents

• Variant 1100delC du gène CHEK2 (Meijers-Heijboer etal., 2002) :

f = 1% dans population et 5% dans 718 familles Kcsein (p=0,00000003)

HYPOTHESE VARIANT RARE /MALADIE FREQUENTE

Page 29: PLAN DU COURS - Science Calender · • Maladie multifactorielle : – Interaction de multiples gène + ... • Méthode d’analyse de liaison indépendante ... • Comparaison de

01/05/2014

29

PLAN DU COURS

1. Définitions, rappel sur les maladies monogéniques

2. Stratégies d’étude des maladies fréquentes1. Etudes de liaison paramétriques

2. Hypothèse variant fréquent / maladie fréquente

1. Bases génétiques

2. Paires de germains

3. Etudes d’association

3. Hypothèse variant fréquent maladie rare

4. Hypothèse variant rares / maladie fréquente

1. Etude de CNV par CGH-array

2. Recherche de variants par NGS

HYPOTHESE VARIANT RARE /MALADIE RARE

• Variants rares et exerçant un effetfonctionnel pourraient expliquer unepart importante de la prédisposition(CNVs, indels, SNPs…)

• Variants fréquents : effet modulateur(rôle des mêmes variants dans desmaladies différentes ?)

Page 30: PLAN DU COURS - Science Calender · • Maladie multifactorielle : – Interaction de multiples gène + ... • Méthode d’analyse de liaison indépendante ... • Comparaison de

01/05/2014

30

HYPOTHESE VARIANT RARE /MALADIE RARE

• Situation plus proche des maladiesmendéliennes (pénétrance incomplète)

• Grande hétérogénéité génétiquepourrait expliquer une partie del’incohérence des études de liaisondans les maladies courantes (ex:schizophrénie, autisme)

• Problème des populations contrôles

PERTE

GAIN

Extraction

Digestion

Marquage

Hybridation

Révélation

Analyse desrapports defluorescence

Mise en évidence d’anomalieschromosomiques déséquilibrées

(résolution 50 kb)

Hybridation génomique comparative(CGH array)

Page 31: PLAN DU COURS - Science Calender · • Maladie multifactorielle : – Interaction de multiples gène + ... • Méthode d’analyse de liaison indépendante ... • Comparaison de

01/05/2014

31

CNV ET AUTISME / SCHIZOPHRENIE

• Stefanson, 2008: 2160 patients, Stone, 2008: 3391 patients, Weiss,751 familles

• Mutation de novo : faible transmission à la descendance

• démontrer la causalité du CNV et sa contribution à l’incidence de lamaladie ?

Référence Maladie locus Type Taille F patients F population OR

Weiss, 2008 Autisme 16p11.2 Del de novo 593 1% 1 x 10-4 100

Weiss, 2008 Autisme 16p11.2 Dup de novo 593 0.5% 3 x 10-4 16

Stefansson, 2008

Stone, 2008

Schizophrénie 1q21.1 Del de novo 1350 0.3% 2 x 10-4 15

Stefansson, 2008

Stone, 2008

Schizophrénie 15q13.3 Del de novo 1580 0.2% 2 x 10-4 12

Stefansson, 2008 Schizophrénie 15q11.1 Del de novo 470 0.5% 0.2% 2.7

McCarroll et al., 2008

CNV et autisme (Bucan et al., 2010)

• 912 familles multiplex et 1488 témoins

• 150 loci dont 27 seulement chez patients

• Replication: 859 cas et 1051 témoins

Page 32: PLAN DU COURS - Science Calender · • Maladie multifactorielle : – Interaction de multiples gène + ... • Méthode d’analyse de liaison indépendante ... • Comparaison de

01/05/2014

32

Haplo-insuffisanceCNV

CNV

CNV

Mutation récessivepour la schizophrénie

Mutation récessivepour l’épilepsie

CNVs et prédisposition à différentstroubles neurodeveloppementaux

PLAN DU COURS

1. Définitions, rappel sur les maladies monogéniques

2. Stratégies d’étude des maladies fréquentes1. Etudes de liaison paramétriques

2. Hypothèse variant fréquent / maladie fréquente

1. Bases génétiques

2. Paires de germains

3. Etudes d’association

3. Hypothèse variant fréquent maladie rare

4. Hypothèse variant rares / maladie fréquente

1. Etude de CNV par CGH-array

2. Recherche de variants par NGS

Page 33: PLAN DU COURS - Science Calender · • Maladie multifactorielle : – Interaction de multiples gène + ... • Méthode d’analyse de liaison indépendante ... • Comparaison de

01/05/2014

33

STRATEGIES D’IDENTIFICATION DES GENESIMPLIQUES EN PATHOLOGIE PAR NGS

Gilissen et al. 2012

Etude de gènecandidats

STRATEGIES D’IDENTIFICATION DES GENESIMPLIQUES EN PATHOLOGIE PAR NGS

Gilissen et al. 2012

Recherche dedouble hits (CNV,

mutations)

Page 34: PLAN DU COURS - Science Calender · • Maladie multifactorielle : – Interaction de multiples gène + ... • Méthode d’analyse de liaison indépendante ... • Comparaison de

01/05/2014

34

Projet « 1000 genomes »

• Séquençage >1000 individusappartenant à 7 populationsdifférentes

• 15 x 106 SNPs (fréquence allèlemineur entre 1 et 5%)

• 1 million indel, 20.000 CNV

• But : nouvelle vague de GWAS,études familiales, corrélationsgénotype phénotype

http://www.1000genomes.org/

NHLBI Exome Sequencing Project(ESP)

• To discover novel genes andmechanisms contributing to heart, lungand blood disorders by pioneering theapplication of next-generationsequencing of the protein codingregions.

• 7 universités USAhttp://evs.gs.washington.edu/EVS/

Page 35: PLAN DU COURS - Science Calender · • Maladie multifactorielle : – Interaction de multiples gène + ... • Méthode d’analyse de liaison indépendante ... • Comparaison de

01/05/2014

35

SHANK2 et autisme (Leblond et al. 2012)

• Identification de 2CNVs de novoincluant SHANK2

• Criblage 827patients et 1090contrôles

• 40 variantsidentifiés

• Acides aminés plusconservés chez lespatients

SHANK2 et autisme (Leblond et al. 2012)

Page 36: PLAN DU COURS - Science Calender · • Maladie multifactorielle : – Interaction de multiples gène + ... • Méthode d’analyse de liaison indépendante ... • Comparaison de

01/05/2014

36

SHANK2 et autisme« Genetic buffering »

STRATEGIES D’IDENTIFICATION DES GENESIMPLIQUES EN PATHOLOGIE PAR NGS

Gilissen et al. 2012

Recherche demutation de novopar trios ou quads

Page 37: PLAN DU COURS - Science Calender · • Maladie multifactorielle : – Interaction de multiples gène + ... • Méthode d’analyse de liaison indépendante ... • Comparaison de

01/05/2014

37

Mutations de novo et autisme(O’Roak et al., 2012)

• Exome chez 200 trios• 248 mutation de novo dont 120 « sévères »

et 33 tronquantes (hors CNVs)• Quelques événements récurrents ou

impliqués dans maladies mendéliennes• Excès allèle paternel• Grande hétérogénéité des bases génétiques

de l’autisme ?• Interaction potentielles entre certains gènes

(networks)

Mutations de novo et autisme(Krumm et al., 2014)

• 6 études Exome trios et quads, autisme et déficienceintellectuelle

• SNV tronquants de novo pourraient contribuer à 10-15% despatients

• Fréquence mutations de novo par génération:• CNV ≈ 0.02• SNV ≈ 1

Page 38: PLAN DU COURS - Science Calender · • Maladie multifactorielle : – Interaction de multiples gène + ... • Méthode d’analyse de liaison indépendante ... • Comparaison de

01/05/2014

38

Mutation disruptives récurrentes dansl’autisme et la déficience intellectuelle

• Grande nombre de gènes

• Quelques récurrents dansplusieurs études

• Pas de variants tronquants dansESP pour CHD8, GRIN2B etDYRK1A

Krumm etal., 2014

Estimations de la proportion demutations de novo dans ASD/ID

Krumm et al., 2014

Page 39: PLAN DU COURS - Science Calender · • Maladie multifactorielle : – Interaction de multiples gène + ... • Méthode d’analyse de liaison indépendante ... • Comparaison de

01/05/2014

39

Estimations de la proportion demutations de novo dans ASD/ID

Krumm et al., 2014

Réseaux d’interaction entre gènes

• CHD8:Chromodomainhelicase DNAbinding protein 8

• CTNNB1 : beta-catenin

• SurexpressionCTNNB1 chezsouris :macrocephaly

Page 40: PLAN DU COURS - Science Calender · • Maladie multifactorielle : – Interaction de multiples gène + ... • Méthode d’analyse de liaison indépendante ... • Comparaison de

01/05/2014

40

Mutations de novo et pathologie(de Ligt et al., 2013)

Relation entre taille des gènes impliqués(mutational target) et fréquence de la

maladie

Gilissen etal., 2011

Dans le cas des maladies causées par des mutations de novo

Page 41: PLAN DU COURS - Science Calender · • Maladie multifactorielle : – Interaction de multiples gène + ... • Méthode d’analyse de liaison indépendante ... • Comparaison de

01/05/2014

41

Conclusion : évolution des stratégiesd’étude des maladies fréquentes

Singleton etal., 2010

3 ’

Met/Val

129 200

Glu/Lys

5 ’

• Glu200Lys : formes autosomiques dominantes

• Allèles codon 129 associés au risque de maladie deCreutzfeld-Jacob sporadique

Gène mendélien et facteur de risqueEx : gène de la protéine prion

Page 42: PLAN DU COURS - Science Calender · • Maladie multifactorielle : – Interaction de multiples gène + ... • Méthode d’analyse de liaison indépendante ... • Comparaison de

01/05/2014

42

Gènes mendéliens et facteurs derisque

• GBA (glucocerebrosidase):

– Maladie de Gaucher : mutations homozygotes ouhétérozygotes composites

– Susceptibilité maladie de Parkinson : mutationshétérozygotes

• ATM:

– Ataxie-télangiectasie : mutation homozygotes ouhétérozygotes composites

– Susceptibilité Kc du sein chez les porteuseshétérozygotes