Download - Cartographie génétique cartes génétiques. 1- Quest-ce quune carte de liaison génétique? 2- De quoi a ton besoin pour construire une carte génétique? 3-

Cartographie génétique cartes génétiques

1- Qu’est-ce qu’une carte de liaison génétique?

2- De quoi a t’on besoin pour construire une carte génétique?

3- Pourquoi construire une carte de liaison génétique?

Carte génétique

Représentation du génome, sur laquelle sont placés des repères ou marqueurs, dont on connaît les positions relatives (locus) sur des groupes de liaison

Marqueur M1

Position: locus

groupe de liaison chromosomeensemble des locus liés

2. Déterminer la position relative de chaque marqueur (distance génétique)

1. Couvrir les chromosomes de marqueurs

Chromosomes

Groupes de liaisons génétiques

La notion de carte génétique remonte à 1913, avec les travaux de Morgan et Sturtevant. Publient la première carte génétique du chromosome X avec la position respective de 3 gènes évaluée par le pourcentage de recombinaison .

La cartographie génétique est établie grâce aux cartes de liaison: plus deux gènes seront proches sur le chromosome, moins ils auront de chance d'être séparés (recombinés) au cours de la méïose.

Il est possible de localiser et d'étudier des gènes présentant un intérêt physiologique ou pathologique particulier sans disposer de données de séquençage

Centimorgan (cM)

Utilisé pour la 1ère fois par Morgan et Sturtevant en 1913.

Unité de mesure de la distance sur la carte génétique. Lors de la méiose, des marqueurs situés sur un même chromosome peuvent être séparés s'il se produit un crossing-over dans la région qui les sépare.

La probabilité qu'un tel évènement se produise est proportionnelle à la distance qui sépare ces marqueurs.

Crossing over

La fréquence de recombinaison reflète les distances entre marqueurs

Le Taux de recombinaison () détermine la distance entre 2 loci.

Plus la distance est grande, plus la probabilité d’un crossing-over est élevée

1 cM = 1 crossing-over pour 100 méioses

Principes de la construction d’une carte génétique

1. Création d’une descendance en

ségrégation

2. Caractérisation moléculaire des individus

de la descendance

3. Utilisation d’outils d’analyse statistique et

de méthodes de calculs mathématiques

Création d’une famille en ségrégation

• Choix des parents :

- maximiser les chances d’obtenir du polymorphisme moléculaire dans la descendance

Espèces autogames: lignées pures n’ayant aucun ancêtre commun,

croisements interspécifiques (pêcher x amandier)

-phénotypes contrastés qui permettent d’évaluer les effets génétiques pour les locus impliqués dans l’expression des caractères d’intérêt agronomique

Descendances utilisables en cartographie

• F2 : autofécondation d’un hybride F1

• BC (backcross ou croisement en retour) : F1 x P1

• HD (haploïdes doublés): issus d’androgénèse ou de gynogénèse

• Bulk F3 : dérivés d’individus F2 par une autofécondation

• Lignées recombinantes : dérivées des individus F2 par 5 à 6 générations d’autofécondation sans sélection

• Hybrides: F1, G1

• Population issue de pollinisation libre chez les espèces allogames (arbres forestiers)

Le choix d’un type de descendance

• Dépend des contraintes biologiques de l’espèce

• HD, LR : lignées fixées, copies identiques de chaque plant peuvent être obtenues et analysées, bonne précision sur la mesure des caractères quantitatifs

• BC et F2 les plus utilisées, rapides à obtenir mais chaque individu est unique Pb si caractères quantitatifs affectés par le milieu Ceci n’est pas un problème chez les ligneux qui

peuvent se multiplier végétativement

Meilleur précision avec une F2 qu’avec une F1 ou un BC :

deux fois plus d’évènements méiotiques exploitables

Il faut 2 x + d’individus en BC qu’en F2 pour obtenir la même précision sur r car il y a eu 2 méioses efficaces en F2

Ritter et al . 1990

Information du taux de recombinaison (r):Degré de précision sur l’estimation de r ( inverse de la variance de r) en fonction du type de ségrégation

taux de recombinaison (r)

Info

rmati

on

• Descendance F2: une carte de l’hybride F1

• Descendance F1 : deux cartes; une carte pour chaque

parentune carte consensus possible



ségrégation


de la descendance



QU'EST-CE QU'UN MARQUEUR?

• Caractère phénotypique facilement détectable et à déterminisme génétique simple

• Notion peu récente :

marqueurs morphologiques,..inconvénients : peu nombreux

peuvent s’exprimer tardivement

Marqueurs moléculaires• Marqueurs protéiques

-Isoenzymes-Protéines totales...

marqueurs non neutres• Marqueurs ADN

-RFLP-RAPD-AFLP...

Avantages: très nombreux, non destructifs, nécessitent peu de matériel végétal. Indépendance du milieu, du stade de développement, marqueurs neutres...

polymorphe: présenter différents allèles identifiables

codominants >> dominants

site unique dans le génome

transportables

ayant une fonction

coût le plus bas possible

Qu’est-ce qu’un bon marqueur dans une optique de cartographie?

Marqueurs moléculaires

• RAPD• RFLP• MICROSATELLITES• SCAR• EST : CAPS , SSCP• SNP

L’étude des marqueurs

• Identifier les marqueurs polymorphes

• Tester les marqueurs sur la descendance génotypage: détermination des allèles pour chaque individus

• Déterminer le type de ségrégation

• Vérifier la distorsion des marqueurs (ségrégation mendélienne)

F2

HM1 : +/-

M2: a1/a2

Ségrégation dans la descendance F2

M1: 3/4 [+], 1/4 [-]

M2: 1/4 a1/a1, 1/2 a1/a2, 1/4 a2/a2

P1M1: +/- ou +/+

M2 : a1 /a1 ou a1/a2

P2M1: -/- ou +/-

M2 : a2/a2 ou a1/a2

M1 dominantM2 codominant

F1:Double pseudo-testcrossex : marqueurs dominants

P1M1: Hétérozygote +/-M2 : Homozygote -/-

Descendance F1ségrégation 1/1

P2M1: Homozygote -/-

M2 : Hétérozygote +/-

Cartographie P1M1

Cartographie P2M2

P1M1 : a1/a2M2 : a1/a1

Descendance F1ségrégation 1/1

P2M1: a3/a4M2 :a2/a3

Cartographie P1

M1

Cartographie P2

M1M2

Marqueurs ponts

F1:Double pseudo-testcrossex : marqueurs codominants



ségrégation


de la descendance



1. Tester la ségrégation de chaque marqueur: hérédité mendélienne

2. Test de liaisons: identification des groupes de liaisons

3. Ordonner les marqueurs au sein des groupe de liaisons

4. Estimer la distance entre les marqueurs

5. Saturer la carte

Test du 2 pour vérifier la ségrégation mendélienne

Hérédité mendélienne (hérédité monogénique) : caractérise la transmission de

caractères due à une mutation dans un seul gène. appliqué à chaque marqueur

1/1 : marqueurs codominants et dominant pour BC, HD

1/2/1 : marqueurs codominants dans une F21/3 : marqueurs dominants dans une F2

Exemple: pour un BC de N individus et un marqueur dominant nombre d’individus avec la bande, observé : O1, attendu : E1=N/2

nombre d’individus sans la bande, observé : O0, attendu : E0=N/2

2 = (O1 - E1)2

E1

+(O0 – E0)2

E0

(O1 – O0)2

N= 2 (1ddl) = 3,84

pour un risque = 0.05

Tableau des différentes ségrégations observées pour une F1

PARENT 1

P1 PARENT 2

P2 HYBRIDES P1 x P2

Ségrégation du

marqueur MARQUEURS

1

2

Codominants

3

AB [A,B] AA [A] AB [A,B]

CD [CD] AB [A,B] AB [A,B]

AC AD BC BD [AC] [AD] [BC] [BD] ¼ ¼ ¼ ¼ AA AB [A] [A,B] ½ ½ AA AB BB [A] [A,B] [B,B] ¼ ½ ¼

1.1.1.1

1.1

1.2.1

4

Aa [A]

aa [a]

Aa aa [A] [a] ½ ½

1.1

Dominants

5

Aa [A]

Aa [A]

AA Aa aa [A] [A] [a] ½ ¼ ¼ ¾

1.3

PARENT 1

P1 PARENT 2

P2 HYBRIDES P1 x P2

Ségrégation du

marqueur MARQUEURS

1

2

Codominants

3

AB [A,B] AA [A] AB [A,B]

CD [CD] AB [A,B] AB [A,B]

AC AD BC BD [AC] [AD] [BC] [BD] ¼ ¼ ¼ ¼ AA AB [A] [A,B] ½ ½ AA AB BB [A] [A,B] [B,B] ¼ ½ ¼

1.1.1.1

1.1

1.2.1

4

Aa [A]

aa [a]

Aa aa [A] [a] ½ ½

1.1

Dominants

5

Aa [A]

Aa [A]

AA Aa aa [A] [A] [a] ½ ¼ ¼ ¾

1.3

Distorsion de ségrégationSégrégation non Mendélienne

observées souvent dans des descendances de croisements interspécifiques

origine biologique : - liaison du marqueur avec un locus

d’incompatibilité- gènes de létalité à l’état récessif- réarrangements chromosomiques- appariements non homologues

origine statistique : - échantillonnage trop faible

Comment savoir si deux locus sont liés?

Cas de 2 locus L et M dans un croisement entre deux lignée pures: HD

Parent 1: LL MMParent 2: ll mmF1: LlMmLignées HDFréquences observées

• Locus L et M indépendants: tous les gamètes ont la même fréquence Nb de gamètes parentaux = Nb de gamètes recombinés

• Locus L et M liés (CO):

Nb de gamètes parentaux ≠Nb de gamètes recombinés

Hypothèse à tester

Gamètes produitsLMlmLM lm Lm lMLM lm Lm lM a b c d

Gamètesparentaux

Gamètes recombinés

Test de liaisons entre deux marqueurs

Test de liaisons : test de 2

Permet d’évaluer l’ajustement des effectifs observés aux effectifs théoriques

Hypothèse à tester H0: Nb de gamètes parentaux = Nb de gamètes recombinés

2 (1ddl)= (théoriques - parentaux)2 + (théoriques - recombinés )2

théoriques théoriques

2 (1ddl)= (n/2 – a - b)2 + (n/2 – c - d )2

n/2 n/2

Intensité de la liaison?

Calculer du taux de recombinaison

nb. gamètes recombinés nb. gamètes totaux

(en %) 0 < r< 50r = 0 locus totalement liésr = 50 locus indépendants

r =

r est lié à la distance séparant les 2 locus:Plus grande est cette distance, plus grande est la probabilité de

CO

Il n’est pas toujours possible de savoir quels sont les gamètes parentaux et les gamètes recombinés si la phase de marqueur est inconnu (coupling ou respusion). Pour la connaître il faut disposer

des parents voire des grand parents

En cas de liaisons:

Nb de gamètes parentaux > Nb de gamètes recombinés

Notion de coupling et repulsion2 locus A et B avec 2 allèles codominants

1 individus: 4 gamètes possibles A1 B1, A1 B2, A2 B1, A2 B2

2 situations possibles

4 gamètes même probabilité

A et B sont sur des paires de chromosomes différents

A et B sont sur la même paires de chromosomes

2 cas possibles

A1 et B1 sont sur le même chromosome de la paire, on dit que A1 et B1 sont en "coupling« , ou ils sont sur des

chromosomes différent : répulsion

Ex: A1 et B1 sont en coupling

A2 B2 C2

Génotypes parentaux

A1 B2

A2 B1

C2

C1

A1 B1

A2 B2

C2

C1

A1 B1

A2 B2

C1

C2

Méiose: appariement des bivalents et crossing-over

A2 B1 C1

A1 B2 C2

Type 2 :

Type 1 :

A2 B2 C1

A1 B1 C2

Type 3 :

Type 4 :

A1 B1 C1

A2 B2 C2

Type 5 :

Type 6 :

Gamètes parentales et recombinantes

A1 B1 C1

A

N

Type 1 +2

N

Type 1 + 2 + 3 + 4

B

C

r B

N

Type 3 +t4

Estimation de r par la méthode du LOD score

(Morton 1955, Allard 1956)

Intérêt: dans le cas de certaines populations, le calcul de r n’est pas possible directement (cas des populations avec plus de 4 classes génotypiques

Principe : Calcul d’un rapport de vraisemblance ou LOD score (logarithm of the odds ratio)

LOD score = log10 du rapport des 2 hypothèses (liaison/non liaison)

LOD= log10 (Proba liaison)

(Proba indépendance)

eL(r) LOD = log10 ---------

eL(r0)

L()

L(0)

maximum de vraisemblance évaluée à r

maximum de vraisemblance évaluée à r0= 0.5

LOD = 3 : L’existence d’une liaison est 1000 fois plus probable que l’absence d’une liaison

m1, …, mt : effectifs théoriques des individus dans les classes de ségrégation 1,….,t,

a1,…., at : nb d’individus observé dans ces classes

Vraisemblance L= a1 log (m1) + ……. + at log (mt)

Maximiser la vraisemblance: annuler la dérivée par rapport à r

dL /dr = a1 [dlog (m1)/dr] + ……. + at [dlog (mt)/dr]= 0

Estimation du taux de recombinaison r dans le cas d’un BC

AABB x aabbP1 P2

AaBbF1

x aabb

AaBb aabbBC aAbb aaBbEffectifs théoriques

Effectifs observés a b c d

n (1-r)/2 n (1-r)/2nr/2 nr/2

n: nb total d’ind.

r = (b+c)/n

dL /dr = a1 [dlog (m1)/dr] + ……. + at [dlog (mt)/dr]= 0

dL /dr = a [dlog (n (1-r)/2)/dr] + b [dlog (nr)/2)/dr] + c [dlog (nr)/2)/dr] d [dlog (n (1-r)/2 )/dr]= 0

Recombinaison entre A et B mais pas entre B et C Recombinaison entre B et C mais pas entre A et B

Fonctions de cartographie

Les fonctions de cartographie transforment la fréquence de recombinaison r pour la transformer en distances, qui elles, sont additives d (centiMorgan, cM)

• Fonction de Haldane (1919) : répartition aléatoire des crossing–overs (pas d’interférence) c=1

d = -1/2 log (1-2 r)

• Fonction de Kosambi (1944) :tient compte des phénomènes d’interférence, C arbitrairement fixé à 2r

d = 1/4 log (1+ 2 r/1-2 r)

• Fonction de Morgan: suppose qu’il ni a pas de double CO, interférence complète d=r

Fonction de Kosambi tient compte des phénomènes d’interférence # Fonction de Haldane pas

d’interférence

Logiciels de cartographie

• LINKAGE 1 (Suiter et al. 1983)• MAPMAKER (Lander et al. 1987)• GMENDEL (Lui et Knapp 1990)• JOINMAP (Stam 1993)• CarthaGene

Saturation d’une carte génétique

Carte saturée quand :

Le nombre de groupes de liaisons est égal au nombre haploïde de chromosome de l’espèce

Tout marqueur ajouté à la carte est lié génétiquement à l’un des groupes

Nb de marqueurs nécessaires (n) pour qu’un pourcentage P de marqueurs ne soit éloigné de plus de m cM d’un autre

marqueur sur un génome de taille L

n = ln (1-P) / ln (1-2m/L) Beckmann et Soller 1983

Utilisation des cartes génétiquesIdentifier les régions du génome contrôlant un caractère agronomique

Marqueurs liés à un caractère agronomique: sélection assistée par marqueurs (SAM)

Cartographie fine: clonage positionnel de gènes

Localiser des régions impliquées dans des caractères complexes : QTL

Comparaison des cartes: étude de synténieOrganisation des génomes (ancêtre commun) Prédiction de localisation de gènes

Etablir des ponts d'ancrage pour la carte physique.

Etudier certaines particularités de la méiose, variation de fréquence des recombinaisons : en fonction du sexe, de la région du génome La carte génétique de la femme est plus grande que celle de l'homme (40%): évènements de recombinaison à la méiose sont plus fréquents chez la F (régions centromériques).

2322332232132-23*EMPA001

43443-4434444443*eAC_CA2

232--32232122223*CPPCT24a

55-55555551555-5*CPSCT008

4343434434444443*eAC_CAG11

4343344434444443*pCT_CAT3

2323322132212323*MDH1

2323322132212323*UDP96018

2323322132212323*CPPCT10a

4344344434-44343*PacD51

23253241322-2323*PCC8

2-23322132212323*AG36

2-2-322132212323*AC24

2222322132212323*FG83

2222322132412323*AG109

208 164 80 symbols 1=A 2=H 3=B 5=C 4=D data type f2 intercross

Fichiers de cartographie (ex: Mapmaker)

Marqueurs

Individus 1

************************************************************************* Output from: Sun Oct 03 14:06:44 2005 ** ** MAPMAKER/EXP ** (version 3.0b) ** *************************************************************************

data from 'JFTQTL10.TXT' are loaded F2 intercross data (208 individuals, 164 loci)'photo' is on: file is 'JF10.PHO'

3> seq allsequence #1= all

4> group 5.0Linkage Groups at min LOD 5.00, max Distance 50.0

group1= 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 2728 29 30 31 32 33 34 35 36 37 38 -------group2= 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 -------group3= 57 58 59 60 61 62 63 64 65 66 67 68 -------group4= 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 -------group5= 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110111 112 113 114 115 116 117 118 119 120 121 122 123 -------group6= 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141142 143 144 145 146 147 148 -------group7= 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 -------

Définition des groupes de liaison

7> map================================================Map: Markers Distance 1 AG109 1.5 cM 2 FG83 2.6 cM 3 AC24 0.0 cM 4 AG36 0.0 cM 5 PCC8 3.6 cM 6 PacD51 4.1 cM 7 CPPCT10a 2.0 cM 8 UDP96018 2.9 cM 9 MDH1 2.0 cM 10 pCT_CAT3 7.7 cM 11 eAC_CAG1 1.2 cM 12 CPSCT008 3.6 cM 13 CPPCT24a 4.7 cM 14 eAC_CA2 6.3 cM 15 EMPA001 0.8 cM 16 AG116 4.9 cM 17 CPPCT032 1.0 cM 18 ECUP5331 0.9 cM 19 CPPCT10c 1.4 cM 20 BPPCT21a 0.7 cM 21 AG25c 0.7 cM 22 eAA_CAA2 1.4 cM 23 PaCITA18 0.7 cM 24 PC26 0.7 cM 25 eAC_CAT2 0.4 cM 26 eAA_CA1 0.3 cM 27 CC9 0.0 cM 28 eAC_CAG1 3.6 cM 29 AC47 1.5 cM 30 AC32 3.9 cM 31 AG9 20.9 cM 32 BPPCT21b 4.5 cM 33 PC7 9.3 cM 34 pms67 29.7 cM 35 UDP98022 1.2 cM 36 BPPCT028 1.3 cM 37 M15a 1.5 cM 38 eAGA_CAT ---------- 133.5 cM 38 markers log-likelihood= -615.16

cent func koscentimorgan function: Kosambi

6> seq 1-38sequence #2= 1-38

Calcul des distances entre

marqueurs