Cartographie génétique cartes génétiques
1- Qu’est-ce qu’une carte de liaison génétique?
2- De quoi a t’on besoin pour construire une carte génétique?
3- Pourquoi construire une carte de liaison génétique?
Carte génétique
Représentation du génome, sur laquelle sont placés des repères ou marqueurs, dont on connaît les positions relatives (locus) sur des groupes de liaison
Marqueur M1
Position: locus
groupe de liaison chromosomeensemble des locus liés
2. Déterminer la position relative de chaque marqueur (distance génétique)
1. Couvrir les chromosomes de marqueurs
Chromosomes
Groupes de liaisons génétiques
La notion de carte génétique remonte à 1913, avec les travaux de Morgan et Sturtevant. Publient la première carte génétique du chromosome X avec la position respective de 3 gènes évaluée par le pourcentage de recombinaison .
La cartographie génétique est établie grâce aux cartes de liaison: plus deux gènes seront proches sur le chromosome, moins ils auront de chance d'être séparés (recombinés) au cours de la méïose.
Il est possible de localiser et d'étudier des gènes présentant un intérêt physiologique ou pathologique particulier sans disposer de données de séquençage
Centimorgan (cM)
Utilisé pour la 1ère fois par Morgan et Sturtevant en 1913.
Unité de mesure de la distance sur la carte génétique. Lors de la méiose, des marqueurs situés sur un même chromosome peuvent être séparés s'il se produit un crossing-over dans la région qui les sépare.
La probabilité qu'un tel évènement se produise est proportionnelle à la distance qui sépare ces marqueurs.
Crossing over
La fréquence de recombinaison reflète les distances entre marqueurs
Le Taux de recombinaison () détermine la distance entre 2 loci.
Plus la distance est grande, plus la probabilité d’un crossing-over est élevée
1 cM = 1 crossing-over pour 100 méioses
Principes de la construction d’une carte génétique
1. Création d’une descendance en
ségrégation
2. Caractérisation moléculaire des individus
de la descendance
3. Utilisation d’outils d’analyse statistique et
de méthodes de calculs mathématiques
Création d’une famille en ségrégation
• Choix des parents :
- maximiser les chances d’obtenir du polymorphisme moléculaire dans la descendance
Espèces autogames: lignées pures n’ayant aucun ancêtre commun,
croisements interspécifiques (pêcher x amandier)
-phénotypes contrastés qui permettent d’évaluer les effets génétiques pour les locus impliqués dans l’expression des caractères d’intérêt agronomique
Descendances utilisables en cartographie
• F2 : autofécondation d’un hybride F1
• BC (backcross ou croisement en retour) : F1 x P1
• HD (haploïdes doublés): issus d’androgénèse ou de gynogénèse
• Bulk F3 : dérivés d’individus F2 par une autofécondation
• Lignées recombinantes : dérivées des individus F2 par 5 à 6 générations d’autofécondation sans sélection
• Hybrides: F1, G1
• Population issue de pollinisation libre chez les espèces allogames (arbres forestiers)
Le choix d’un type de descendance
• Dépend des contraintes biologiques de l’espèce
• HD, LR : lignées fixées, copies identiques de chaque plant peuvent être obtenues et analysées, bonne précision sur la mesure des caractères quantitatifs
• BC et F2 les plus utilisées, rapides à obtenir mais chaque individu est unique Pb si caractères quantitatifs affectés par le milieu Ceci n’est pas un problème chez les ligneux qui
peuvent se multiplier végétativement
Meilleur précision avec une F2 qu’avec une F1 ou un BC :
deux fois plus d’évènements méiotiques exploitables
Il faut 2 x + d’individus en BC qu’en F2 pour obtenir la même précision sur r car il y a eu 2 méioses efficaces en F2
Ritter et al . 1990
Information du taux de recombinaison (r):Degré de précision sur l’estimation de r ( inverse de la variance de r) en fonction du type de ségrégation
taux de recombinaison (r)
Info
rmati
on
• Descendance F2: une carte de l’hybride F1
• Descendance F1 : deux cartes; une carte pour chaque
parentune carte consensus possible
Principes de la construction d’une carte génétique
1. Création d’une descendance en
ségrégation
2. Caractérisation moléculaire des individus
de la descendance
3. Utilisation d’outils d’analyse statistique et
de méthodes de calculs mathématiques
QU'EST-CE QU'UN MARQUEUR?
• Caractère phénotypique facilement détectable et à déterminisme génétique simple
• Notion peu récente :
marqueurs morphologiques,..inconvénients : peu nombreux
peuvent s’exprimer tardivement
Marqueurs moléculaires• Marqueurs protéiques
-Isoenzymes-Protéines totales...
marqueurs non neutres• Marqueurs ADN
-RFLP-RAPD-AFLP...
Avantages: très nombreux, non destructifs, nécessitent peu de matériel végétal. Indépendance du milieu, du stade de développement, marqueurs neutres...
polymorphe: présenter différents allèles identifiables
codominants >> dominants
site unique dans le génome
transportables
ayant une fonction
coût le plus bas possible
Qu’est-ce qu’un bon marqueur dans une optique de cartographie?
Marqueurs moléculaires
• RAPD• RFLP• MICROSATELLITES• SCAR• EST : CAPS , SSCP• SNP
L’étude des marqueurs
• Identifier les marqueurs polymorphes
• Tester les marqueurs sur la descendance génotypage: détermination des allèles pour chaque individus
• Déterminer le type de ségrégation
• Vérifier la distorsion des marqueurs (ségrégation mendélienne)
F2
HM1 : +/-
M2: a1/a2
Ségrégation dans la descendance F2
M1: 3/4 [+], 1/4 [-]
M2: 1/4 a1/a1, 1/2 a1/a2, 1/4 a2/a2
P1M1: +/- ou +/+
M2 : a1 /a1 ou a1/a2
P2M1: -/- ou +/-
M2 : a2/a2 ou a1/a2
M1 dominantM2 codominant
F1:Double pseudo-testcrossex : marqueurs dominants
P1M1: Hétérozygote +/-M2 : Homozygote -/-
Descendance F1ségrégation 1/1
P2M1: Homozygote -/-
M2 : Hétérozygote +/-
Cartographie P1M1
Cartographie P2M2
P1M1 : a1/a2M2 : a1/a1
Descendance F1ségrégation 1/1
P2M1: a3/a4M2 :a2/a3
Cartographie P1
M1
Cartographie P2
M1M2
Marqueurs ponts
F1:Double pseudo-testcrossex : marqueurs codominants
Principes de la construction d’une carte génétique
1. Création d’une descendance en
ségrégation
2. Caractérisation moléculaire des individus
de la descendance
3. Utilisation d’outils d’analyse statistique et
de méthodes de calculs mathématiques
1. Tester la ségrégation de chaque marqueur: hérédité mendélienne
2. Test de liaisons: identification des groupes de liaisons
3. Ordonner les marqueurs au sein des groupe de liaisons
4. Estimer la distance entre les marqueurs
5. Saturer la carte
Test du 2 pour vérifier la ségrégation mendélienne
Hérédité mendélienne (hérédité monogénique) : caractérise la transmission de
caractères due à une mutation dans un seul gène. appliqué à chaque marqueur
1/1 : marqueurs codominants et dominant pour BC, HD
1/2/1 : marqueurs codominants dans une F21/3 : marqueurs dominants dans une F2
Exemple: pour un BC de N individus et un marqueur dominant nombre d’individus avec la bande, observé : O1, attendu : E1=N/2
nombre d’individus sans la bande, observé : O0, attendu : E0=N/2
2 = (O1 - E1)2
E1
+(O0 – E0)2
E0
(O1 – O0)2
N= 2 (1ddl) = 3,84
pour un risque = 0.05
Tableau des différentes ségrégations observées pour une F1
PARENT 1
P1 PARENT 2
P2 HYBRIDES P1 x P2
Ségrégation du
marqueur MARQUEURS
1
2
Codominants
3
AB [A,B] AA [A] AB [A,B]
CD [CD] AB [A,B] AB [A,B]
AC AD BC BD [AC] [AD] [BC] [BD] ¼ ¼ ¼ ¼ AA AB [A] [A,B] ½ ½ AA AB BB [A] [A,B] [B,B] ¼ ½ ¼
1.1.1.1
1.1
1.2.1
4
Aa [A]
aa [a]
Aa aa [A] [a] ½ ½
1.1
Dominants
5
Aa [A]
Aa [A]
AA Aa aa [A] [A] [a] ½ ¼ ¼ ¾
1.3
PARENT 1
P1 PARENT 2
P2 HYBRIDES P1 x P2
Ségrégation du
marqueur MARQUEURS
1
2
Codominants
3
AB [A,B] AA [A] AB [A,B]
CD [CD] AB [A,B] AB [A,B]
AC AD BC BD [AC] [AD] [BC] [BD] ¼ ¼ ¼ ¼ AA AB [A] [A,B] ½ ½ AA AB BB [A] [A,B] [B,B] ¼ ½ ¼
1.1.1.1
1.1
1.2.1
4
Aa [A]
aa [a]
Aa aa [A] [a] ½ ½
1.1
Dominants
5
Aa [A]
Aa [A]
AA Aa aa [A] [A] [a] ½ ¼ ¼ ¾
1.3
Distorsion de ségrégationSégrégation non Mendélienne
observées souvent dans des descendances de croisements interspécifiques
origine biologique : - liaison du marqueur avec un locus
d’incompatibilité- gènes de létalité à l’état récessif- réarrangements chromosomiques- appariements non homologues
origine statistique : - échantillonnage trop faible
Comment savoir si deux locus sont liés?
Cas de 2 locus L et M dans un croisement entre deux lignée pures: HD
Parent 1: LL MMParent 2: ll mmF1: LlMmLignées HDFréquences observées
• Locus L et M indépendants: tous les gamètes ont la même fréquence Nb de gamètes parentaux = Nb de gamètes recombinés
• Locus L et M liés (CO):
Nb de gamètes parentaux ≠Nb de gamètes recombinés
Hypothèse à tester
Gamètes produitsLMlmLM lm Lm lMLM lm Lm lM a b c d
Gamètesparentaux
Gamètes recombinés
Test de liaisons entre deux marqueurs
Test de liaisons : test de 2
Permet d’évaluer l’ajustement des effectifs observés aux effectifs théoriques
Hypothèse à tester H0: Nb de gamètes parentaux = Nb de gamètes recombinés
2 (1ddl)= (théoriques - parentaux)2 + (théoriques - recombinés )2
théoriques théoriques
2 (1ddl)= (n/2 – a - b)2 + (n/2 – c - d )2
n/2 n/2
Intensité de la liaison?
Calculer du taux de recombinaison
nb. gamètes recombinés nb. gamètes totaux
(en %) 0 < r< 50r = 0 locus totalement liésr = 50 locus indépendants
r =
r est lié à la distance séparant les 2 locus:Plus grande est cette distance, plus grande est la probabilité de
CO
Il n’est pas toujours possible de savoir quels sont les gamètes parentaux et les gamètes recombinés si la phase de marqueur est inconnu (coupling ou respusion). Pour la connaître il faut disposer
des parents voire des grand parents
En cas de liaisons:
Nb de gamètes parentaux > Nb de gamètes recombinés
Notion de coupling et repulsion2 locus A et B avec 2 allèles codominants
1 individus: 4 gamètes possibles A1 B1, A1 B2, A2 B1, A2 B2
2 situations possibles
4 gamètes même probabilité
A et B sont sur des paires de chromosomes différents
A et B sont sur la même paires de chromosomes
2 cas possibles
A1 et B1 sont sur le même chromosome de la paire, on dit que A1 et B1 sont en "coupling« , ou ils sont sur des
chromosomes différent : répulsion
Ex: A1 et B1 sont en coupling
A2 B2 C2
Génotypes parentaux
A1 B2
A2 B1
C2
C1
A1 B1
A2 B2
C2
C1
A1 B1
A2 B2
C1
C2
Méiose: appariement des bivalents et crossing-over
A2 B1 C1
A1 B2 C2
Type 2 :
Type 1 :
A2 B2 C1
A1 B1 C2
Type 3 :
Type 4 :
A1 B1 C1
A2 B2 C2
Type 5 :
Type 6 :
Gamètes parentales et recombinantes
A1 B1 C1
A
N
Type 1 +2
N
Type 1 + 2 + 3 + 4
B
C
r B
N
Type 3 +t4
Estimation de r par la méthode du LOD score
(Morton 1955, Allard 1956)
Intérêt: dans le cas de certaines populations, le calcul de r n’est pas possible directement (cas des populations avec plus de 4 classes génotypiques
Principe : Calcul d’un rapport de vraisemblance ou LOD score (logarithm of the odds ratio)
LOD score = log10 du rapport des 2 hypothèses (liaison/non liaison)
LOD= log10 (Proba liaison)
(Proba indépendance)
eL(r) LOD = log10 ---------
eL(r0)
L()
L(0)
maximum de vraisemblance évaluée à r
maximum de vraisemblance évaluée à r0= 0.5
LOD = 3 : L’existence d’une liaison est 1000 fois plus probable que l’absence d’une liaison
m1, …, mt : effectifs théoriques des individus dans les classes de ségrégation 1,….,t,
a1,…., at : nb d’individus observé dans ces classes
Vraisemblance L= a1 log (m1) + ……. + at log (mt)
Maximiser la vraisemblance: annuler la dérivée par rapport à r
dL /dr = a1 [dlog (m1)/dr] + ……. + at [dlog (mt)/dr]= 0
Estimation du taux de recombinaison r dans le cas d’un BC
AABB x aabbP1 P2
AaBbF1
x aabb
AaBb aabbBC aAbb aaBbEffectifs théoriques
Effectifs observés a b c d
n (1-r)/2 n (1-r)/2nr/2 nr/2
n: nb total d’ind.
r = (b+c)/n
dL /dr = a1 [dlog (m1)/dr] + ……. + at [dlog (mt)/dr]= 0
dL /dr = a [dlog (n (1-r)/2)/dr] + b [dlog (nr)/2)/dr] + c [dlog (nr)/2)/dr] d [dlog (n (1-r)/2 )/dr]= 0
Recombinaison entre A et B mais pas entre B et C Recombinaison entre B et C mais pas entre A et B
Fonctions de cartographie
Les fonctions de cartographie transforment la fréquence de recombinaison r pour la transformer en distances, qui elles, sont additives d (centiMorgan, cM)
• Fonction de Haldane (1919) : répartition aléatoire des crossing–overs (pas d’interférence) c=1
d = -1/2 log (1-2 r)
• Fonction de Kosambi (1944) :tient compte des phénomènes d’interférence, C arbitrairement fixé à 2r
d = 1/4 log (1+ 2 r/1-2 r)
• Fonction de Morgan: suppose qu’il ni a pas de double CO, interférence complète d=r
Fonction de Kosambi tient compte des phénomènes d’interférence # Fonction de Haldane pas
d’interférence
Logiciels de cartographie
• LINKAGE 1 (Suiter et al. 1983)• MAPMAKER (Lander et al. 1987)• GMENDEL (Lui et Knapp 1990)• JOINMAP (Stam 1993)• CarthaGene
Saturation d’une carte génétique
Carte saturée quand :
Le nombre de groupes de liaisons est égal au nombre haploïde de chromosome de l’espèce
Tout marqueur ajouté à la carte est lié génétiquement à l’un des groupes
Nb de marqueurs nécessaires (n) pour qu’un pourcentage P de marqueurs ne soit éloigné de plus de m cM d’un autre
marqueur sur un génome de taille L
n = ln (1-P) / ln (1-2m/L) Beckmann et Soller 1983
Utilisation des cartes génétiquesIdentifier les régions du génome contrôlant un caractère agronomique
Marqueurs liés à un caractère agronomique: sélection assistée par marqueurs (SAM)
Cartographie fine: clonage positionnel de gènes
Localiser des régions impliquées dans des caractères complexes : QTL
Comparaison des cartes: étude de synténieOrganisation des génomes (ancêtre commun) Prédiction de localisation de gènes
Etablir des ponts d'ancrage pour la carte physique.
Etudier certaines particularités de la méiose, variation de fréquence des recombinaisons : en fonction du sexe, de la région du génome La carte génétique de la femme est plus grande que celle de l'homme (40%): évènements de recombinaison à la méiose sont plus fréquents chez la F (régions centromériques).
2322332232132-23*EMPA001
43443-4434444443*eAC_CA2
232--32232122223*CPPCT24a
55-55555551555-5*CPSCT008
4343434434444443*eAC_CAG11
4343344434444443*pCT_CAT3
2323322132212323*MDH1
2323322132212323*UDP96018
2323322132212323*CPPCT10a
4344344434-44343*PacD51
23253241322-2323*PCC8
2-23322132212323*AG36
2-2-322132212323*AC24
2222322132212323*FG83
2222322132412323*AG109
208 164 80 symbols 1=A 2=H 3=B 5=C 4=D data type f2 intercross
Fichiers de cartographie (ex: Mapmaker)
Marqueurs
Individus 1
************************************************************************* Output from: Sun Oct 03 14:06:44 2005 ** ** MAPMAKER/EXP ** (version 3.0b) ** *************************************************************************
data from 'JFTQTL10.TXT' are loaded F2 intercross data (208 individuals, 164 loci)'photo' is on: file is 'JF10.PHO'
3> seq allsequence #1= all
4> group 5.0Linkage Groups at min LOD 5.00, max Distance 50.0
group1= 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 2728 29 30 31 32 33 34 35 36 37 38 -------group2= 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 -------group3= 57 58 59 60 61 62 63 64 65 66 67 68 -------group4= 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 -------group5= 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110111 112 113 114 115 116 117 118 119 120 121 122 123 -------group6= 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141142 143 144 145 146 147 148 -------group7= 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 -------
Définition des groupes de liaison
7> map================================================Map: Markers Distance 1 AG109 1.5 cM 2 FG83 2.6 cM 3 AC24 0.0 cM 4 AG36 0.0 cM 5 PCC8 3.6 cM 6 PacD51 4.1 cM 7 CPPCT10a 2.0 cM 8 UDP96018 2.9 cM 9 MDH1 2.0 cM 10 pCT_CAT3 7.7 cM 11 eAC_CAG1 1.2 cM 12 CPSCT008 3.6 cM 13 CPPCT24a 4.7 cM 14 eAC_CA2 6.3 cM 15 EMPA001 0.8 cM 16 AG116 4.9 cM 17 CPPCT032 1.0 cM 18 ECUP5331 0.9 cM 19 CPPCT10c 1.4 cM 20 BPPCT21a 0.7 cM 21 AG25c 0.7 cM 22 eAA_CAA2 1.4 cM 23 PaCITA18 0.7 cM 24 PC26 0.7 cM 25 eAC_CAT2 0.4 cM 26 eAA_CA1 0.3 cM 27 CC9 0.0 cM 28 eAC_CAG1 3.6 cM 29 AC47 1.5 cM 30 AC32 3.9 cM 31 AG9 20.9 cM 32 BPPCT21b 4.5 cM 33 PC7 9.3 cM 34 pms67 29.7 cM 35 UDP98022 1.2 cM 36 BPPCT028 1.3 cM 37 M15a 1.5 cM 38 eAGA_CAT ---------- 133.5 cM 38 markers log-likelihood= -615.16
cent func koscentimorgan function: Kosambi
6> seq 1-38sequence #2= 1-38
Calcul des distances entre
marqueurs
Top Related