Master SDVS - Mention Biologie Santé UE : Analyse génomique et génétique chez les organismes...

56
Master SDVS - Mention Biologie Santé Master SDVS - Mention Biologie Santé UE : Analyse génomique et génétique UE : Analyse génomique et génétique chez les organismes eucaryotes chez les organismes eucaryotes Architecture génétique des caractères quantitatifs - cartographie génétique et détection de QTL - Pierre-François Bert ( Pierre-François Bert ( [email protected] [email protected] ) )

Transcript of Master SDVS - Mention Biologie Santé UE : Analyse génomique et génétique chez les organismes...

Page 1: Master SDVS - Mention Biologie Santé UE : Analyse génomique et génétique chez les organismes eucaryotes UE : Analyse génomique et génétique chez les organismes.

Master SDVS - Mention Biologie SantéMaster SDVS - Mention Biologie Santé

UE : Analyse génomique et génétique UE : Analyse génomique et génétique chez les organismes eucaryoteschez les organismes eucaryotes

Architecture génétique des caractères quantitatifs

- cartographie génétique et détection de QTL -

Pierre-François Bert (Pierre-François Bert ([email protected]@bordeaux.inra.fr) )

Page 2: Master SDVS - Mention Biologie Santé UE : Analyse génomique et génétique chez les organismes eucaryotes UE : Analyse génomique et génétique chez les organismes.

Définitions

* Locus (pl: locus; loci en anglais) : Un locus définit l'emplacement d'un allèle ou d'un gène sur un chromosome ou la carte le représentant.

* Allèle : on nomme allèle une variante donnée d’un locus (nucléotide ou par extension gène) au sein d'une espèce.

* Polymorphisme : Les mutations modifient la séquence nucléotidique de la molécule d'ADN. Pour de nombreux locus (gènes ou marqueurs génétiques), il existe plusieurs allèles répandus dans les populations constituant l'espèce : c'est le polymorphisme génique ou polyallélisme.

* Une carte génétique est un alignement linéaire de la position relative de locus (gènes et marqueurs génétiques) sur un chromosome et les distances entre eux, basé sur les fréquences de recombinaison.

I - Introduction

Page 3: Master SDVS - Mention Biologie Santé UE : Analyse génomique et génétique chez les organismes eucaryotes UE : Analyse génomique et génétique chez les organismes.

Définitions

* Un locus à effets quantitatifs ou de caractère quantitatif (abrégé en QTL pour quantitative trait locus) est un locus où la variation allélique est associée à la variation d’un caractère quantitatif (= caractère polygénique).

* Génotype : ensemble des gènes d‘un individu.

* Phénotype : caractéristiques d'un individu dans un milieu donné. -> Résultat du dialogue génotype - milieu

* Milieu : Ensemble des causes non génétiques de la variation (contrôlés = macro milieu et non contrôlés = micro milieu)

* Pléiotropie : Un simple allèle peut induire plusieurs effets phénotypiques apparemment indépendants.

* Epistasie : phénomène au cours duquel un gène altère l'effet d'un autre.

I - Introduction

Page 4: Master SDVS - Mention Biologie Santé UE : Analyse génomique et génétique chez les organismes eucaryotes UE : Analyse génomique et génétique chez les organismes.

Pourquoi s’intéresse-t-on aux variations génétiques ?

-> Peuvent servir pour l’identification génétique par empreintes génétiques (identification, sélection, traçabilité …)

-> Peuvent servir pour décrire les caractéristiques génétiques d’une population (Niveau de diversité, Structure de la diversité, Flux de gènes, Sélection…)

-> Peuvent servir à la gestion des ressources génétiques

-> Peuvent être à l’origine de la variation phénotypique de caractères d’intérêts agronomiques, de maladies génétiques simples ou complexes

I - Introduction

Page 5: Master SDVS - Mention Biologie Santé UE : Analyse génomique et génétique chez les organismes eucaryotes UE : Analyse génomique et génétique chez les organismes.

Caractères qualitatifs :sexe, état matrimonial, niveau d'instruction,

nationalité, profession, statut juridique de l'activité, commune (du lieu) de résidence, département (du lieu) de naissance,…

Les modalités de caractères qualitatifs sont des mots masculin, célibataire, CAP, français, mécanicien automobile, salarié, Strasbourg, Bas-Rhin, …

Caractères quantitatifs :âge au décès, nombre d'enfants, rang de naissance,

revenu mensuel en Francs, ancienneté du logement, …Les modalités de caractères quantitatifs sont des

nombres 75 ans révolus, 5 enfants, 3ème enfant, 8500 francs, 32 ans

I - Introduction

Distinction entre les caractères dits "quantitatifs" et les caractères "qualitatifs"

Page 6: Master SDVS - Mention Biologie Santé UE : Analyse génomique et génétique chez les organismes eucaryotes UE : Analyse génomique et génétique chez les organismes.

Variations discrètes :

Nombre fini de modalités différentes souvent faible

Ex : Groupe sanguin ABOAspect lisse ou ridé des grainsCouleur de pelage animal, de pétales de fleursRésistance à des maladies

Caractère qualitatif quand regroupement en classes génotypiques

Relation phénotype/génotype simpleEffet allélique : phénotype "sauvage"/phénotype "mutant"

(cf. Lois de Mendel)

I - Introduction

Distinction entre les caractères dits "quantitatifs" et les caractères "qualitatifs".

Page 7: Master SDVS - Mention Biologie Santé UE : Analyse génomique et génétique chez les organismes eucaryotes UE : Analyse génomique et génétique chez les organismes.

Variations continues :

Répartition continue dans une gamme de valeurs (mesures)

Ex : Taille, poids,Diabète de type 2Pression sanguineQuantité de lait produitRésistance à des maladies

Caractère dit quantitatif quand risques d‘erreur de classification

Relation phénotype/génotype ambiguë

La génétique quantitative rend compte de l‘hérédité de ces caractères

I - Introduction

Distinction entre les caractères dits "quantitatifs" et les caractères "qualitatifs"

Page 8: Master SDVS - Mention Biologie Santé UE : Analyse génomique et génétique chez les organismes eucaryotes UE : Analyse génomique et génétique chez les organismes.

GENETIQUE QUANTITATIVE

La Plupart des caractères d’intérêt agronomique sont quantitatifs

La génétique quantitative traite avec les phénotypes et fait la déduction des bases génétiques sous-jacentes

Étudie des bases génétiques (hérédité) de la variation des caractères quantitatifs

Bases génétiques de la variation continue

I - Introduction

Page 9: Master SDVS - Mention Biologie Santé UE : Analyse génomique et génétique chez les organismes eucaryotes UE : Analyse génomique et génétique chez les organismes.

I - Introduction

Bases génétiques de la variation continue

Page 10: Master SDVS - Mention Biologie Santé UE : Analyse génomique et génétique chez les organismes eucaryotes UE : Analyse génomique et génétique chez les organismes.

151-160 161-170 171-180 181-190 191-200

200

400

600

0151-154

159-161

… … 196-200

50

100

200

0

151 200

5

10

15

0

taille

nom

bre

Taille de 1 000 étudiants. Source : Castel, 1916

-> Distribution continue

-> Distribution normale

-> transformation mathématique

I - Introduction

5 classes 18 classes

155-158

Valeurs individuelles

Bases génétiques de la variation continue

Page 11: Master SDVS - Mention Biologie Santé UE : Analyse génomique et génétique chez les organismes eucaryotes UE : Analyse génomique et génétique chez les organismes.

I - Introduction

Bases génétiques de la variation continue

La distribution de la variation suit une loi normale

Page 12: Master SDVS - Mention Biologie Santé UE : Analyse génomique et génétique chez les organismes eucaryotes UE : Analyse génomique et génétique chez les organismes.

150

100

50

0

n P1 Sx = 1.5 P2 Sx = 2.2Individus P1, P2 et F1 génétiquement Identiques

Variance d’origine environnementale

Variance en F2 évoque une ségrégation de plusieurs gènes

Ségrégation à plusieurs locus

F1 Sx = 2.8100

50

n

0

F2 Sx = 6.4100

50

n

Longueur de la corolle de N. langiflora – East 1915)

34 40 46 52 58 64 70 76 82 88 94 100mm

150

100

50

nRésultats théoriques attendus pour un polymorphisme à 1 seul locus ( ¼ P1; ½ F1; ¼ P2)

II- Mise en évidence des facteurs de la variation génétique

Page 13: Master SDVS - Mention Biologie Santé UE : Analyse génomique et génétique chez les organismes eucaryotes UE : Analyse génomique et génétique chez les organismes.

Taux de survie à une dose de DDT chez la drosophile. Les individus observés comportent

diverses combinaisons de chromosomes, décrites pour les chromosomes X, 2 et 3, respectivement :

Source : Crow, 1957.

-> Les locus responsables des variations des

caractères quantitatifs ont des effets qui se

cumulent.

c = chromosome originaire de la lignée de contrôles = chromosome originaire de la lignée sélectionnée pour la résistance au DDT.

II- Mise en évidence des facteurs de la variation génétique

Page 14: Master SDVS - Mention Biologie Santé UE : Analyse génomique et génétique chez les organismes eucaryotes UE : Analyse génomique et génétique chez les organismes.

-> L’existence d’un gène majeur n’exclut pas celle d’autres gènes induisant des variations pour le

caractère étudié.

Poids à 60 jours (en g) de 50 souris mâles issues d’une lignée sélectionnée pour de faibles poids.

Source : King, 1950.

II- Mise en évidence des facteurs de la variation génétique

Page 15: Master SDVS - Mention Biologie Santé UE : Analyse génomique et génétique chez les organismes eucaryotes UE : Analyse génomique et génétique chez les organismes.

* Nombre de génotypes différents pour 1 locus et K allèles

* Nombre de génotypes différents pour L locus et K allèles

Nombre de génotypes possibles selon les nombres de locus et d’allèles par locus.

II- Mise en évidence des facteurs de la variation génétique

Page 16: Master SDVS - Mention Biologie Santé UE : Analyse génomique et génétique chez les organismes eucaryotes UE : Analyse génomique et génétique chez les organismes.

La valeur d’un génotype est la somme des valeurs apportées par chaque allèle. A chaque locus, 2 allèles de même

fréquence, l’un apportant une valeur nulle et l’autre une valeur de 1 : la valeur des

génotypes va donc de 0 (homozygotes « 0 » à tous les locus) à 2 fois le nombre de locus (homozygotes « 1 » à

tous les locus).On ne considère pas ici d’effet de milieu.

Distribution des valeurs selon le nombre de locus

II- Mise en évidence des facteurs de la variation génétique

Page 17: Master SDVS - Mention Biologie Santé UE : Analyse génomique et génétique chez les organismes eucaryotes UE : Analyse génomique et génétique chez les organismes.

Ces facteurs peuvent alors être traités comme des locus génétique simple c‘est à dire des QTL

34 40 46 52 58 64 70 76 82 88 94 100

150

100

50

0

n P1

Sx = 1.5

P2

Sx = 2.2

34 40 46 52 58 64 70 76 82 88 94 100

150

100

50

0

n F1

Sx = 2.8

34 40 46 52 58 64 70 76 82 88 94 100

150

100

50

0

nF2

Sx = 6.4

mm

Transgressifs

0.2

0.3

0.5

2. et des effets du milieu contribuant à la variation.

1. Influence de plusieurs locus en ségrégation

Pas d'entorses à la génétique mendélienne en supposantF

réqu

ence

s gé

noty

piqu

es

Valeurs phénotypiques

Valeurs phénotypiques

Fré

quen

ces

géno

typi

ques

Valeurs phénotypiques

Valeurs phénotypiques

1 gène 2 gènes

4 gènes 6 gènes

0.4

0.1

0.1

0.2

0.4

0.3

II- Mise en évidence des facteurs de la variation génétique

Page 18: Master SDVS - Mention Biologie Santé UE : Analyse génomique et génétique chez les organismes eucaryotes UE : Analyse génomique et génétique chez les organismes.

+ effets non génétiques

2 locus 4 locus plusieurs locus

1 locus

1:2:1

II - Mise en évidence des facteurs de variation génétique

L’ hypothèse multifactorielle

"les variations observées des caractères quantitatifs sont imputables aux ségrégations à plusieurs locus et aux

facteurs du milieu".

Hypothèse multifactorielle concilie la nature discontinue de l’hérédité mendélienne et la continuité des caractères quantitatifs et la normalité de leur

distribution.

Page 19: Master SDVS - Mention Biologie Santé UE : Analyse génomique et génétique chez les organismes eucaryotes UE : Analyse génomique et génétique chez les organismes.

L’action du génotype et du micro-milieu

III - Mise en évidence des facteurs de la variation liés au milieu

Le phénotype présente une distribution continue… sous entends l’effet sur le caractère de nombreux gènes et de

facteurs de l’environnement

P = G + E + G×ELe milieu

- environnement (climat, traitements, alimentation ...)- état physiologique (poids, age, grossesse ...)- observateur (protocole, précision, erreurs ...)

* Facteurs de milieu :- macro milieu (contrôlé)

fortes variations sur l'ensemble des individus (engrais , traitement pharmaco, lieu de test... )

- micro milieu (non contrôlé) faibles variations entre les individus (micro hétérogénéité du sol, fertilité... ).

Page 20: Master SDVS - Mention Biologie Santé UE : Analyse génomique et génétique chez les organismes eucaryotes UE : Analyse génomique et génétique chez les organismes.

Héritabilité

L’héritabilité au sens large est donc une proportion : c’est la part de variance phénotypique qui est

d’origine génétique.

Action du micro-milieu

III - Mise en évidence des facteurs de la variation liés au milieu

Page 21: Master SDVS - Mention Biologie Santé UE : Analyse génomique et génétique chez les organismes eucaryotes UE : Analyse génomique et génétique chez les organismes.

1

G1

G3

2

G2

P

Valeur phénotypique

milieu3 1

G1

G3

2

G2

P

Valeur phénotypique

milieu3

1

G1

G3

2

G2

P

Valeur phénotypique

milieu3 1

G1

G3

2

G2

P

Valeur phénotypique

milieu3

Absence d’effet milieu Additivité des effets milieux et génotypes

Interaction G x E avec effet d’échelle Interaction G x E modification des classements

Variations importantes sur les caractèresConséquences pour l’amélioration des espèces domestiques :-> Quel est le meilleur génotype dans un milieu donné ?-> Dans quel milieu pratiquer la sélection ?

Interactions génotype x milieu

III - Mise en évidence des facteurs de la variation liés au milieu

Page 22: Master SDVS - Mention Biologie Santé UE : Analyse génomique et génétique chez les organismes eucaryotes UE : Analyse génomique et génétique chez les organismes.

Années 1920: Fisher et Wright naissance de la génétique quantitative : branche statistique de la génétique basée sur les principes fondamentaux de Mendel.

"Existence d’un grand nombre de gènes à effets faibles"

Années 50: Premières applications pratiques Années 60 et 70: Développement sur pedigree complexes

Années 1980: La cartographie des QTL a pu devenir une réalité principalement grâce à la disponibilité de marqueurs moléculaires et de l’informatique.

Années 1990: Mort de la génétique quantitative ? En fait l’idée simple que ces caractères étaient

contrôlés par un nombre infini de gènes à effet faible et cumulatif est abandonnée.

IV - Mise en évidence des QTL

Page 23: Master SDVS - Mention Biologie Santé UE : Analyse génomique et génétique chez les organismes eucaryotes UE : Analyse génomique et génétique chez les organismes.

280 mg 560 mg

Colored seed coat

Uncolored see coat

qualitative trait : seed coat color

quantitative trait :mean weight of the seeds

F1 hybrid with colored seed cot

VARIETY A

VARIETY B

selfing

mean weight (mg)

frequency in the F2

1/4

3/4colored

uncolored

338

390

La première expérience de détection de QTL: SAX (1923)

IV - Mise en évidence des QTL

Page 24: Master SDVS - Mention Biologie Santé UE : Analyse génomique et génétique chez les organismes eucaryotes UE : Analyse génomique et génétique chez les organismes.

locus Cpourpre

QTL weight

chromosome QTL = Quantitative Trait LocusGelderman, 1975

« locus controling part of the phenotypic variation of a quantitative traits»

QUANTITATIVE

QUALITATIVE

IV - Mise en évidence des QTL

Payne (1918) : chromosome X in drosophila contains genetic factors controlling bristle number.

Lindstrom (1924) : linkage between a locus controling tomato fruit color and a genetic factor controling fruit size.

Smith (1937) : color of the flower and size of the corolla in tobacco

Page 25: Master SDVS - Mention Biologie Santé UE : Analyse génomique et génétique chez les organismes eucaryotes UE : Analyse génomique et génétique chez les organismes.

Rappel : Qu’est ce qu’un QTL?

Un QTL (quantitative trait locus) est un locus génétique qui affecte un caractère qui est mesuré sur une échelle quantitative.

Les caractères quantitatifs sont typiquement affectés par plus d’un gène et aussi par l’environnement.

Les QTL correspondent à des segments plus ou moins grands qui peuvent contenir plusieurs gènes.

IV - Mise en évidence des QTL

Page 26: Master SDVS - Mention Biologie Santé UE : Analyse génomique et génétique chez les organismes eucaryotes UE : Analyse génomique et génétique chez les organismes.

Il y a-t-il une association entre le génotype au marqueur et le phénotype du caractère quantitatif ?

V - Principes et méthodes de détection de QTL

La mise en évidence et la localisation des QTL se fait par rapport à des marqueurs génétiques (moléculaires):

on relie le polymorphisme des marqueurs aux variations d’un caractère quantitatif à travers une descendance en ségrégation

de parents de génotype connu.

si co-ségrégation entre les allèles à certains marqueurs et les valeurs observées pour le caractère quantitatif

détermination de locus dont le polymorphisme induit des variations sur le caractère étudié (des QTL)

Page 27: Master SDVS - Mention Biologie Santé UE : Analyse génomique et génétique chez les organismes eucaryotes UE : Analyse génomique et génétique chez les organismes.

Et dans la pratique ?

V - Principes et méthodes de détection de QTL

Pour chaque individu de la descendance il faut : . déterminer le génotype d’un ensemble de marqueur distribués sur le génome cf. cartographie génétique

. mesurer la valeur du caractère quantitatif étudié pour chaque individu

Morphologic markers Molecular markers

Individuals number

performance

Mesures du caractère

Page 28: Master SDVS - Mention Biologie Santé UE : Analyse génomique et génétique chez les organismes eucaryotes UE : Analyse génomique et génétique chez les organismes.

V - Principes et méthodes de détection de QTL

1 2 …...n

12

34

indiv 1 2 … n

M1 0 1 1

M2 1 0 1

M3 0 1 1

M4 0 1 1

Caractère

3,7 4,1 3,9 4,2

Matrice de données

Il faut rechercher par méthodes statistique les locus marqueurs dont le génotype est corrélé au caractère et estimer les paramètres génétiques de l’action des QTL détectés. Ceci

-> soit en analyse marqueur par marqueur

-> soit en prenant en compte conjointement 2 ou plusieurs marqueurs

Et dans la pratique ?

Page 29: Master SDVS - Mention Biologie Santé UE : Analyse génomique et génétique chez les organismes eucaryotes UE : Analyse génomique et génétique chez les organismes.

a

a

a

A

aA

A

a

A

AA

a

QTL1

QTL1

QTL1

QTL1

QTL1

QTL1

QTL2

QTL2

QTL2

QTL2

QTL2

QTL2

F1

F2

Analyse sur simple marqueur

Tri des individus pour leur génotype (aa; aA; AA) au QTL

Si différence significative entre moyennes phénotypiques observées

Effets des 2 allèles au QTL sont suffisamment différents pour avoir des conséquences détectables.

V - Principes et méthodes de détection de QTL

Page 30: Master SDVS - Mention Biologie Santé UE : Analyse génomique et génétique chez les organismes eucaryotes UE : Analyse génomique et génétique chez les organismes.

Une corrélation entre la dose d’allèles M2 et la valeur du caractère indique l’existence d’un QTL du caractère au

voisinage du marqueur

Analyse sur simple marqueur

Comparaison des moyennes phénotypiques entre les classes génotypiques

un QTL un QTL

Relation entre le polymorphisme de chaque locus marqueur et la valeur du caractère quantitatif considéré chez les descendants de parents de génotype connu (ici F2)

Pas de QTL

M1M1 M1M2 M2M2

V - Principes et méthodes de détection de QTL

Page 31: Master SDVS - Mention Biologie Santé UE : Analyse génomique et génétique chez les organismes eucaryotes UE : Analyse génomique et génétique chez les organismes.

Analyse sur simple marqueur

Analyse de variance (ANOVA) ou test de Student

Relation entre le génotype de chaque locus marqueur et la valeur du caractère quantitatif considéré

• Classifie la descendance par marqueur génotypique• Compare les moyennes phénotypiques entre classes alléliques (test t ou test F)• Test significatif = marqueur lié au QTL • Différence entre les moyennes = estimation de l’effet du QTL

Conditions d’application d’une ANOVA : Normalité intra-classe et homogénéité des variances

V - Principes et méthodes de détection de QTL

Page 32: Master SDVS - Mention Biologie Santé UE : Analyse génomique et génétique chez les organismes eucaryotes UE : Analyse génomique et génétique chez les organismes.

aa aA AA

Mise en évidence des liaisons marqueur / QTL

Le test de liaison consiste à savoir si les moyennes des 3 classes sont différentes entre elles.

Si différences significatives le locus affecte le caractère quantitatif : il y a un QTL.

La détection dépend :-> de l’ampleur des différences entre moyennes de classes-> de la variation intra-classe qui dépend

- de l’effet du milieu- de l’effectif par classe- de la variation due aux autres locus intervenant

Les individus d’un même génotype marqueur suivent une loi normale

V - Principes et méthodes de détection de QTL

Page 33: Master SDVS - Mention Biologie Santé UE : Analyse génomique et génétique chez les organismes eucaryotes UE : Analyse génomique et génétique chez les organismes.

Analyse sur simple marqueur

si la valeur Fobs > Fthéo Ho rejetée

"effet significatif du facteur génotype au marqueur" 

Présence d’un QTL * Nombre de classes génotypiques du marqueur :

- 3 classes en F2 - marqueur codominant ANOVA 1

- 2 Classes en BC, HD, RIL ou F2 - dominant Test t

Source de variation ddl CM F

Variation totale = SCET

N – 1 CMT = SCET / N – 1

Variation inter (liée au facteur génotype)

= SCEF

r – 1 CMF = SCEF / r – 1

Fobs = CMF / CMRVariation intra = résiduelle =

SCER

N – r CMR = SCER / N - r

(r – 1) (N – r)

V - Principes et méthodes de détection de QTL

Page 34: Master SDVS - Mention Biologie Santé UE : Analyse génomique et génétique chez les organismes eucaryotes UE : Analyse génomique et génétique chez les organismes.

Avantages et inconvénients de l’analyse sur marqueur unique

• Avantages :Ne nécessite pas de carte de liaison génétique Utilise des programmes statistiques simples (Excel , SAS…)Méthode "robuste" aux écarts à la normalité

• Inconvénients :Si 1 QTL n’est pas localisé exactement au

marqueur alors entre moyennes SCEF R²

A l’intérieur de chaque catégorie de marqueur, il y a toujours une forte proportion de variance – sans cette variance l’effet des QTL serait mieux estimé

Une part de cette variance peut résulter de l’effet d’autres QTL qui ségrègent dans d’autres régions du génome

V - Principes et méthodes de détection de QTL

Page 35: Master SDVS - Mention Biologie Santé UE : Analyse génomique et génétique chez les organismes eucaryotes UE : Analyse génomique et génétique chez les organismes.

nécessite une carte génétique

Cartographie d'intervalle :

- "Simple Interval mapping ou SIM„Méthode des LOD score et de régression linéaire

- "Composite interval mapping ou CIM" Méthode des LOD score et de régression linéaire faisant intervenir des co facteurs

Méthode d’analyse multi locus

V - Principes et méthodes de détection de QTL

Page 36: Master SDVS - Mention Biologie Santé UE : Analyse génomique et génétique chez les organismes eucaryotes UE : Analyse génomique et génétique chez les organismes.

La cartographie d’intervalle simple(Simple Interval Mapping)

La cartographie d’intervalle est similaire en forme à l’analyse sur l’association à un seul locus, le locus cible est remplacé par une position dans un intervalle cible

Basée sur l’hypothèse qu’il au + 1 QTL dans l’intervalle entre les 2 marqueurs G et D liés avec un taux de recombinaison r.

L’effet attendu d’un QTL hypothétique à cette position est estimée à partir des génotypes aux locus marqueurs flanquant l’intervalle.

G DR

R1 R2Q

Modèle d’Intervalle Mapping

V - Principes et méthodes de détection de QTL

Page 37: Master SDVS - Mention Biologie Santé UE : Analyse génomique et génétique chez les organismes eucaryotes UE : Analyse génomique et génétique chez les organismes.

La méthode du LOD score (Lander et Botstein, 1989)

Calcule en chaque position du groupe de liaison, sur une fenêtre de n cM, le logarithme décimal du rapport de vraisemblance

LOD = log10 =

où µ, a, d et ² représentent les estimations des paramètres de moyenne, d’additivité, de dominance et de variance

* LOD seuil = correction de la valeur du risque α en fonction du nombre d’intervalles entre deux marqueurs (M), suivant la relation α’=1-(1-α)1/M * I.C = LOD max - 1

L (µ, 0, 0, ²)^ ^L (µ, a, d, ²)^ ^ ^ ^

^ ^ ^ ^

fonction de vraisemblance sous l’hypothèse de présence d’un QTL

fonction de vraisemblance sous l’hypothèse d’absence de QTL (où a et d sont nulles)

V - Principes et méthodes de détection de QTL

Page 38: Master SDVS - Mention Biologie Santé UE : Analyse génomique et génétique chez les organismes eucaryotes UE : Analyse génomique et génétique chez les organismes.

Courbe de LOD en fonction de la position sur le groupe de liaison

I.C de position du QTL = 15cM Intervalle de confiance = LODmax- 1

V - Principes et méthodes de détection de QTL

Page 39: Master SDVS - Mention Biologie Santé UE : Analyse génomique et génétique chez les organismes eucaryotes UE : Analyse génomique et génétique chez les organismes.

La cartographie d’intervalle composite(Composite Interval Mapping)

Cofacteur : - marqueurs du génome - QTL préalablement détectés

Permet de contrôler le bruit de fond (genetic background)

Réduit la probabilité de détecter des QTL “fantôme”

V - Principes et méthodes de détection de QTL

Page 40: Master SDVS - Mention Biologie Santé UE : Analyse génomique et génétique chez les organismes eucaryotes UE : Analyse génomique et génétique chez les organismes.

La méthode de régression linéaire (Haley et Knott, 1992)

À chaque position dans un intervalle donné, la meilleure estimation est celle qui minimise le CMR

Présence d’un QTL testée par : F(x) = CMQ / CMR F(x) = loi Fisher F (1, N-2) ; N nb d’individus

. CMQ Carré moyen associé à l’effet du marqueur (1 ddl)

. CMR Carré moyen résiduel (N – 2 ddl)

Équivalente en terme de puissance / méthode EMV

Estimation des paramètres du modèle par la méthode des moindres carrés :

V - Principes et méthodes de détection de QTL

Page 41: Master SDVS - Mention Biologie Santé UE : Analyse génomique et génétique chez les organismes eucaryotes UE : Analyse génomique et génétique chez les organismes.

Paramètres influençant la détection des QTL

* Choix des parents pour la population - Distance génétique

si distance détection des QTL à effets faibles

* Taille de la population analysée

si N , puissance de test (QTL à effets faibles détectables) I.C. sur la position du QTL * Nombre de marqueurs

si distance moyenne entre 2 marqueurs est faible (<10cM) I.C. du QTL

* Précision de l’expérimentation

= part de la variabilité phénotypique d’origine génétique

h²SL= ²g /²p -> si h²SL QTL à effets faibles détectables

V - Principes et méthodes de détection de QTL

Page 42: Master SDVS - Mention Biologie Santé UE : Analyse génomique et génétique chez les organismes eucaryotes UE : Analyse génomique et génétique chez les organismes.

Mesure de l’effet d’un QTL

Chaque QTL en ségrégation contribue à une part de la variation phénotypique totale

Part de la variation expliquée quantifiée par le R²

R² = SCEF / SCET = SCEF / (SCEF + SCER)

Ex : si R² = 0.2 20% de la variation phénotypique due au QTL

Rq : * si marqueur non lié strictement au QTL

La entre moyennes La SCEF (variation due au génotype au marqueur)

Le R²

VI - Paramètres définissant l’action d’un QTL

Page 43: Master SDVS - Mention Biologie Santé UE : Analyse génomique et génétique chez les organismes eucaryotes UE : Analyse génomique et génétique chez les organismes.

Effet allélique

I. La dominance: Détectée dans les populations F2 etCalculée par: Heterozygous – [(P1+P2)/2]

Une valeur positive reflète une valeur des hétérozygotes qui dépasse la valeur moyenne des parents

Une valeur négative reflète une valeur des hétérozygotes qui est inférieure à la valeur moyenne des parents

II. L’additivité : effet des homozygotesCalculée par : (Homozygotes P1 – Homozygotes P2)/2Un effet positif reflète une augmentation de la valeur du caractère de l’homozygote P1Un effet négatif reflète une augmentation de la valeur du caractère de l’homozygote P2

Signe de a allèle favorable

VI - Paramètres définissant l’action d’un QTL

Page 44: Master SDVS - Mention Biologie Santé UE : Analyse génomique et génétique chez les organismes eucaryotes UE : Analyse génomique et génétique chez les organismes.

0 1

Valeur du caractère

Génotype (dose d’allèle M2)

m22

m11 + m22

2

m11

a

2

0 1

m22

m11 + m22

2

m11

d a

2

0 1

m22

m11 + m22

2

m11

d a

2

0 1

m22

m11 + m22

2

m11

da

2superdominance

|d/a| > 0

dominance partielle 0 < |d/a| > 1

additivité |d/a| = 0

dominance complète|d/a| = 1

Effet additif a et degré de dominance d

M1M1 M1M2 M2M2 M1M1 M1M2 M2M2

M1M1 M1M2 M2M2 M1M1 M1M2 M2M2

VI - Paramètres définissant l’action d’un QTL

Page 45: Master SDVS - Mention Biologie Santé UE : Analyse génomique et génétique chez les organismes eucaryotes UE : Analyse génomique et génétique chez les organismes.

Comment décrire un QTL ?

Trait QTL Interval Chr Lengtha Positionb

Allelic effectc LODd R2 (%)e

RRL QAlRr1.1 RG406-RZ252 1 6.5 6.0 0.100 (O) 2.4 9.0 QAlRr3.1 CDO1395-RG391 3 0.6 0.0 0.167 (O) 8.3 24.9 QAlRr7.1 RZ629-RG650 7 29.8 18.0 0.126 (O) 5.4 22.5 QalRr8.1 RG28-RM223 8 31.0 18.0 0.104 (O) 2.5 20.8 QAlRr9.1 RM201-WALI7 9 10.0 8.0 0.109 (O) 2.6 9.9

R² total 70.8

VI - Paramètres définissant l’action d’un QTL

Page 46: Master SDVS - Mention Biologie Santé UE : Analyse génomique et génétique chez les organismes eucaryotes UE : Analyse génomique et génétique chez les organismes.

Distribution du nombre de QTL détectés dans un croisement

Kearsey et Farquhar, 1998

176 combinaisons expérience/caractère

4 QTL détectés en moyenne dans un croisement pour un caractère

Le nombre de QTL que l’on peut détecter dans une population est limité par la taille de la population

puissance de détection

VI - Caractéristiques sur les analyses QTL

Page 47: Master SDVS - Mention Biologie Santé UE : Analyse génomique et génétique chez les organismes eucaryotes UE : Analyse génomique et génétique chez les organismes.

Distribution des effets des QTL

Kearsey et Farquhar, 1998

Du fait des variations environnementales et de l’échantillonnage d’un nombre fini d’individus par population :

Les QTL de faible effet ne sont pas détectésLes effets des QTL détectés sont surestimés

VI - Caractéristiques sur les analyses QTL

Page 48: Master SDVS - Mention Biologie Santé UE : Analyse génomique et génétique chez les organismes eucaryotes UE : Analyse génomique et génétique chez les organismes.

MAPMAKER/QTL Model Interval mapping Population F2, BC, RIL, DHL Computer platform PC window Contact Eric Lander

([email protected])

QTL cartographer Model Composite interval mapping Population F2, BC Computer platform Mac, PC window Contact Christopher Basten

([email protected])

MAPQTL Model Interval mapping Population F2, BC, RIL, DHL, Heterozygous

F1 Computer platform Mac, PC Contact Johan van Ooijen

([email protected])

Map manager QTL Model Interval mapping using regression Population F2, BC Computer platform Mac, PC Contact Kenneth Manly

([email protected])

Qgene Model Linear regression Population F2, BC Computer platform Mac Contact James Nelson ([email protected])

Quelques logiciels disponibles pour l’analyse de QTL

Page 49: Master SDVS - Mention Biologie Santé UE : Analyse génomique et génétique chez les organismes eucaryotes UE : Analyse génomique et génétique chez les organismes.

Application de l’utilisation des marqueurs en génétique

quantitative:

SELECTION ASSISTEE PAR MARQUEURS

Construction de génotypes Prédiction de la valeur d’amélioration

Page 50: Master SDVS - Mention Biologie Santé UE : Analyse génomique et génétique chez les organismes eucaryotes UE : Analyse génomique et génétique chez les organismes.

Association entre les allèles aux marqueurs et les variation du caractère

Nombre d’individus

performance

+

1 2 …...n

12

34

indiv 1 2 … n

M1 0 1 1

M2 1 0 1

M3 0 1 1

M4 0 1 1

Mn

0 1 Marker

allele

Marker

allele

Yes

0 1

No

Recherche de QTL impliqués dans la hauteur

Page 51: Master SDVS - Mention Biologie Santé UE : Analyse génomique et génétique chez les organismes eucaryotes UE : Analyse génomique et génétique chez les organismes.

5

Hauteur 1

6Hauteur 2

Hauteur 3

7

Hauteur 4

8

Hauteur 5

Cartographie de QTL impliqués dans la hauteur

Page 52: Master SDVS - Mention Biologie Santé UE : Analyse génomique et génétique chez les organismes eucaryotes UE : Analyse génomique et génétique chez les organismes.

Micro- densitometrie

Propriétés physiques + papetières

rigidimètre

MOE

Angle du fil du boisComposition chimique

NIRSProtocole AFOCEL

Branchaison

Dissection de la variable étudiée en ses composantes

Page 53: Master SDVS - Mention Biologie Santé UE : Analyse génomique et génétique chez les organismes eucaryotes UE : Analyse génomique et génétique chez les organismes.

11

10

CW9L

STD .D

RW5.9

9LD4E

CW9L

coarceness

Zero span

HI8688

12

LD4L

CW9L

CW9L

CW9E

MFA9L

CW4L

LD4E

Zero span

LD9L

LD9L

F length

coarceness

Curve index

STD .D

Rw10.14

HI8993

Page 54: Master SDVS - Mention Biologie Santé UE : Analyse génomique et génétique chez les organismes eucaryotes UE : Analyse génomique et génétique chez les organismes.

functional CG :lignin biosynthesis genes

COOH

OH

OH

COSCoA COSCoACOSCoA

H

L- phenylalanine

3

21

6

54

NH2

CH2OH

OCH3OH

CH3O

CH2OH

OH

CH2OH

OCH3OH

p- coumaryl alcohol conif eryl alcohol sinapyl alcohol

H (hydroxyphenyl)

G (Guaiacyl)

S (Sinapyl)

CH2 OH

OCH3OH

HO

5- OH conif eryl alcohol

5- OH G (5- hydroxyguaiacyl)

A f

COSCoA

OHOCH3OH

COSCoA

OCH3OH

?

eruloyl- CoA 5- OH f eruloyl- CoA

COOH

OH

OCH3

COOH

OH

OCH3OH

COOH

OH

OCH3CH3O

OCH3OH

CH3O

sinapoyl- CoA

COOH

OH

OH

p- coumaroyl- CoA caf f eoyl- Co

COOHCOOH

OHO

CHO

OH

CHO

OCH3OH

CH3O

p- coumaraldehyde conif eraldehyde sinapaldehyde

CHO

OCH3OH

HO

5- OH conif eraldehyde

CHO

OH

OCH3

PAL COMT

CCoAOMT

4CL

COMT

CCoAOMT

4CL 4CL 4CL4CL

CCR CCRCCRCCR

CAD CAD CAD CAD

C3HC4H F5H

CCoA3H

Page 55: Master SDVS - Mention Biologie Santé UE : Analyse génomique et génétique chez les organismes eucaryotes UE : Analyse génomique et génétique chez les organismes.

Co-localisation candidate genes / QTL

CCR and PAL on E. urophylla linkage group n°6

0

2

4

6

8

10

12

1

11

21

31

41

51

61

71

81

91

10

1

11

1

12

1

13

1

14

1

Genetic Distance (cM)

LOD

sco

re

PAL+ CCR-

Score threshold

Lignin contents

S / G ratio

Page 56: Master SDVS - Mention Biologie Santé UE : Analyse génomique et génétique chez les organismes eucaryotes UE : Analyse génomique et génétique chez les organismes.

La sélection assistée par marqueurs