Cours de Génétique Des Populations_ECUE1

114
U.E. : Niveau : Master 1 Responsable : Dr GNANGBE Félix Laboratoire de Génétique GENETIQUE DES POPULATIONS

Transcript of Cours de Génétique Des Populations_ECUE1

Page 1: Cours de Génétique Des Populations_ECUE1

U.E. :

Niveau : Master 1

Responsable : Dr GNANGBE Félix

Laboratoire de Génétique

GENETIQUE DES POPULATIONS

Page 2: Cours de Génétique Des Populations_ECUE1

TABLE DES MATIÈRES Page

ECUE 1 : POLYMORPHISME ET STRUCTURE GENETIQUE DESPOPULATIONS

CHAPITRE I : INTRODUCTION A LA GENETIQUE DES POPULATIONS 5

I- BREF RAPPEL HISTORIQUE 5II- NOTIONS DE DIVERSITE PHENOTYPIQUE ET DE VARIABILITE GENETIQUE DES POPULATIONS 6

III- NOTION DE POPULATION 7IV- NOTION DE METAPOPULATION 7V- LES METHODES ET LES OBJECTIFS DE LA GENETIQUE DES POPULATIONS 9

CHAPITRE II : LE POLYMORPHISME ET LA STRUCTURE GENETIQUE DES POPULATIONS NATURELLES 11

I- LE POLYMORPHISME 11

I-1 Définition du polymorphisme 11

I-2 Les marqueurs de polymorphisme 13

I-2-1 Les marqueurs sérologiques chez l’homme : les groupes sanguins 14

I-2-1-1 Le système ABO 14

I-2-1-2 Le système Rhésus 15

I-2-1-3 Le système MN 17

I-2-1-3 Le système HLA 17

I-2-2 Les marqueurs enzymatiques 18

a) Les enzymes monomériques 18

b) Les enzymes dimériques monogéniques 19

c) Les enzymes dimériques digéniques 20

I-2-3 Les marqueurs RFLP 21I-2-4 Les marqueurs d’ADN mitochondrial 23I-2-5 Les marqueurs RAPD (Random Amplification of Polymorphic DNA) 24

I-2-6 Les marqueurs AFLP (Amplified Fragment Length Polymorphism) 24I-2-7 Les marqueurs microsatellites 25I-2-8 Les marqueurs SNP (Single Nucleotid Polymorphisms) 26

1

Page 3: Cours de Génétique Des Populations_ECUE1

I-2-9 Les marqueurs chromosomiques 27

II- LA STRUCTURE GENETIQUE DES POPULATIONS 28

II-1 Définition de la Structure génotypique par un locus à deux allèles 29

II-2 Définition de la structure génique (structure allélique) en un locus biallélique 29

II-3 Définition de la structure génique en un locus polyallélique 30

III- LA DISTANCE GENETIQUE ENTRE DEUX POPULATIONS 31

CHAPITRE III : INFLUENCE DES SYSTEMES DE CROISEMENTS SUR LA STRUCTURE GENETIQUE DES POPULATIONS 33

I- DEFINITION DES MODELES 33

II- LE MODELE DE LA PANMIXIE : LOI DE HARDY-WEINBERG 36

II-1 Cas d’un locus autosomique biallélique 36

II-1-1 Les fréquences géniques sont identiques dans les deux sexes 36

II-1-2 Les fréquences géniques diffèrent d’un sexe à l’autre 38II-2 Cas d’un locus autosomique multiallélique avec égalité des fréquences géniques dans les deux sexes. 40

II-3 Cas d’un locus biallélique lié au sexe 41

II-3-1 Les fréquences géniques sont égales dans les 2 sexes. 41

II-3-2 Les fréquences géniques diffèrent d’un sexe à l’autre 41

II-4 Introduction au modèle à plusieurs locus 45

II-4-1 Notion de déséquilibre de liaison 46

II-4-2 Expression formalisée du déséquilibre de liaison 46II-4-3 Evolution du déséquilibre de liaison sous les restrictions de HARDY-WEINBERG 48

II-4-4 Les causes possibles d’un déséquilibre de liaison 53

II-5 Les Conséquences de la Loi de HARDY-WEINBERG 53

II-5-1 Détermination de la fréquence des gènes récessifs 53II-5-2 Détermination de la fréquence des types de croisements et de lafréquence des génotypes dans leurs progénitures 54

III- LE MODELE DE L’HOMOGAMIE 54

III-1 L’homogamie génotypique positive totale 55

III-1-1. Etude d’un cas particulier 55

III-1-2 Etude d’un cas général avec coefficient de corrélation gamétique 56

III-2 L’homogamie génotypique positive partielle de taux ε (HGPP) 60

III-3 L’homogamie phénotypique positive totale 63

2

Page 4: Cours de Génétique Des Populations_ECUE1

III-3-1 Etude d’un cas particulier 63

III-3-2 Etude du cas général avec coefficient de corrélation gamétique 64

III-4 L’homogamie phénotypique positive partielle de taux ε 69

IV- LE MODELE DE L’ENDOGAMIE OU CONSANGUINITE 70

IV-1 Position du problème 70

IV-2 Coefficient de consanguinité individuel f ou coefficient de parenté. 71IV-3 Détermination des fréquences génotypiques dans la descendance d’uncroisement consanguin 76

IV-4 L’indice de fixation 77

IV-5 Les effets de la consanguinité 78

IV-6 Les modes de croisements systématiques 79

3

Page 5: Cours de Génétique Des Populations_ECUE1

ECUE 1 : POLYMORPHISME ET STRUCTURE GENETIQUE DES POPULATIONS

4

Page 6: Cours de Génétique Des Populations_ECUE1

CHAPITRE I : INTRODUCTION A LA GENETIQUE DES POPULATIONS

I- BREF RAPPEL HISTORIQUE

Dans son ouvrage "Philosophie zoologique" paru en 1809, Lamarck défend l’idée que les être vivants, loin d’être immuables peuvent évoluer. Bien que le principe fondamental de l’évolution du vivant ait été énoncé, son explication par Lamarck à travers le processus de la descendance par l’hérédité des caractères acquis se révélera totalement erronée. Un demi-siècle plus tard, soit en 1859, Charles Darwin publie son ouvrage "L’Origine des espèces au moyen de la sélection naturelle ou la lutte pour l’existence dans la nature" dans lequel il développe les idées maîtresses qui fonderont la théorie moderne de l’évolution biologique. Mais à cette époque, l’idée d’évolution, qui n’était pas du tout récente, est aussi partagée par un autre scientifique anglais, Alfred Wallace. C’est avec lui que Darwin présente en 1858, devant la Linnean Society, une communication intitulée "Sur la tendance des espèces à former des variétés, et sur le maintien des variétés et des espèces par des moyens naturels de la sélection".Pour Darwin, les changements qui interviennent dans les formes du vivant peuvent s’expliquer par de lentes et graduelles modifications, conservées par la sélection naturelle. Sur le plan scientifique, si le concept de l’évolution biologique est admis, ses mécanismes font cependant naître des controverses. Francis Galton (cousin de Darwin) s’affiche comme le défenseur d’une évolution par variations discontinues. Il est considéré comme le fondateur de la biométrie pour laquelle il reçoit l’aide du mathématicien Karl Pearson, l’inventeur du test Khi-2. Il faut rappeler que l’ensemble de ces débats se déroule dans l’ignorance des mécanismes de l’hérédité puisque les lois de Mendel, pourtant découvertes en 1866, sont restées dans l’oubli jusqu’à leur redécouverte au début du XXème siècle.Pendant la première moitié de ce XXème siècle, on voit se greffer sur la théorie mendélienne de l’hérédité et sur la théorie darwinienne de l’évolution par sélection naturelle, un formalisme mathématique élaboré par A. Fisher, S. Haldane et S. Wright. Cette modélisation a donné naissance à la « Théorie synthétique de l’évolution », appelée encore « synthèse néo-darwinienne », dont le plus grand défenseur du T. Dobzhansky.Cette théorie fédère le rôle des mutations qui font apparaître des gènes nouveaux (facteurs de l’hérédité) dans les populations naturelles et le rôle de la sélection naturelle qui intervient pour trier les gènes les uns par rapport aux autres en fonction de la valeur adaptative qu’ils confèrent aux caractères des individus qui les portent.

5

Page 7: Cours de Génétique Des Populations_ECUE1

L’évolution biologique est donc à concevoir non pas au niveau des individus mais plutôt à celui de la population entière qui recèle beaucoup plus de gènes.Ainsi prend forme, parallèlement, la théorie mathématique de la génétique des populations fondée sur le concept des fréquences des divers allèles d’un gène dans la population. Mais cette théorie, en plein essor dans la première moitié du XX ème

siècle, était tout de même limitée dans ses applications par le manque de marqueurs génétiques. En effet, les études sur l’évolution biologique étaient jusqu’alors menées au niveau phénotypique.En utilisant la technique de l’électrophorèse des protéines sur de grands échantillons, Harris Hubby et Lewontin montrent, en 1966, que les variants mis en évidence présentent une ségrégation mendélienne. Par ailleurs, cette technique révèle l’existence d’une variabilité génétique extraordinaire, ce qui était jusqu’alors insoupçonné dans les populations naturelles.Les analyses moléculaires qui permettent la comparaison des séquences d’acides aminés dans les protéines et des séquences de nucléotides dans les acides nucléiques ont rendu possible l’application d’une nouvelle approche mathématique. En effet, cette convergence a permis l’élaboration d’une théorie d’évolution des gènes dont le japonais Motoo Kimura est le principal artisan. C’est sous le nom de "Théorie neutraliste de l’évolution" qu’est popularisée la théorie selon laquelle les changements évolutifs moléculaires et le polymorphisme sont essentiellement dus à des mutations. Celles-ci sont presqu’assez neutres vis-à-vis de la sélection naturelle pour que leurs comportement et devenir soient principalement régis par les mutations et dérive génétique aléatoire. Ce bref rappel historique montre à quel point l’évolution biologique, dans son explication, demeure toujours un sujet à controverse.

II- NOTIONS DE DIVERSITE PHENOTYPIQUE ET DE VARIABILITE GENETIQUE DES POPULATIONS

La diversité phénotypique est l’une des propriétés générales des populations naturelles. De cette observation est née l’expression récente de « biodiversité ». Dans toute population, les individus présentent, pour la plupart des caractères, des phénotypes très différents. Dans l’espèce humaine par exemple, on connaît une grande diversité de taille, de poids, de la forme du corps, de la couleur et de la texture des cheveux, de la couleur de la peau, des yeux, et de bien d’autres traits ou aptitudes physiques et psychologiques.

6

Page 8: Cours de Génétique Des Populations_ECUE1

Dans la plupart des populations naturelles, la diversité phénotypique résulte des différences entre les génotypes des individus ; ce sont ces différences entre les génotypes individuels qu’on appelle variabilité génétique. La variabilité génétique se manifeste par la présence de plusieurs allèles à chaque locus. Diverses techniques (l’électrophorèse des protéines par exemple) permettent de révéler cette variabilité.

III- NOTION DE POPULATION

Intuitivement, le mot « population » est utilisé pour désigner un groupe d’organismes appartenant à la même espèce. Mais il est nécessaire de clarifier ce concept dans le cadre de la génétique des populations. En génétique des populations, ce mot désigne un groupe d’individus de la même espèce vivant dans une zone géographique suffisamment restreinte pour que tout membre de la population puisse se croiser avec tout autre (à condition, bien sûr, qu’ils soient de sexes opposés). La définition précise d’une telle communauté est difficile et varie d’une espèce à l’autre ; il existe presque toujours une certaine structuration géographique des espèces parce que la répartition des individus dans l’espace ne se fait pas au hasard. Les membres d’une espèce sont rarement répartis de façon homogène ; il y a presque toujours des regroupements ou des agrégations : une structuration en troupeau, en hordes, en bandes, etc. La subdivision de la population est souvent provoquée par la structuration du milieu en zones favorables à l’habitat et zones défavorables. La population humaine par exemple, se regroupe ou s’agglomère dans des villes et des villages, à l’écart des déserts et des montagnes.En génétique des populations, c’est à ces unités locales de croisements qu’on s’intéresse car à l’intérieur de celles-ci les fréquences alléliques varient de façon systématique. En fin de compte, ces variations interviennent sur l’évolution des caractères adaptatifs. Les unités locales de croisement sont souvent appelées populations locales ou dèmes. Elles constituent les unités de base de la génétique des populations et sont aussi parfois appelées populations mendéliennes car les lois de Mendel s’y appliquent.

IV- NOTION DE METAPOPULATION

C’est un ensemble de populations en déséquilibre démographique, interconnectées par des événements de migration (flux géniques), surtout à la faveur d’événements de recolonisation lors des extinctions locales consécutives à des perturbations

7

Page 9: Cours de Génétique Des Populations_ECUE1

écologiques. Certains auteurs considèrent cet ensemble comme une population et les populations qui le composent comme des sous-populations, populations locales ou dèmes. A l’image de ce qui se passe classiquement dans les populations individuelles, la métapopulation suit une dynamique sous l’influence de processus démographiques (migration, goulots démographiques, extinction, recolonisation) ; c’est-à-dire qu’il y a des échanges de migrants entre populations (ou sous-populations ou dèmes) ; des populations (ou sous-populations ou dèmes) qui apparaissent ; et des populations (ou sous-populations ou dèmes) qui disparaissent (voir schéma ci-dessous).

Exemple de dynamique au niveau d’une métapopulation

8

Page 10: Cours de Génétique Des Populations_ECUE1

V- LES METHODES ET LES OBJECTIFS DE LA GENETIQUE DES POPULATIONS

Parmi les disciplines biologiques, la génétique des populations est particulière en ce sens que l’analyse et la réflexion théoriques ont largement précédé la description et l’expérimentation.La démarche théorique consiste, dans la cadre d’un modèle, à mettre en équation le jeu des différents facteurs. On peut ainsi prédire quelle doit être la structure génétique d’une population dans des conditions données et quelle évolution doit entraîner un changement défini de ces conditions. Les difficultés de l’expérimentation sont évidentes. La principale est le facteur temps. Les évolutions des populations sont des phénomènes lents qui nécessitent une observation prolongée sur un grand nombre de générations. Dès l’origine le matériel de choix a été et demeure la Drosophile. A partir de 1933, L’Héritier et Teissier ont conçu des cages à populations (démomètres) permettant une étude au laboratoire de populations de quelques milliers de mouches pendant plusieurs dizaines de générations. Ils ont été ainsi à même d’éprouver la théorie. Les simulations sur ordinateur sont depuis venues compléter et relayer les cages à populations.L’observation des populations naturelles s’est pendant longtemps heurtée à l’obstacle de "la fiabilité des marqueurs de polymorphisme". En effet, la plupart des caractères phénotypiques dont la variabilité est immédiatement perceptible ont d’une part un déterminisme génétique complexe et d’autre part sont sensibles à l’influence des conditions du milieu. Une partie de la variabilité est purement phénotypique (c’est-à-dire non corrélée au génotype). Il a fallu attendre le développement de la biologie moléculaire pour disposer de techniques permettant une étude efficace. Ainsi, les techniques d’électrophorèse des protéines d’une part, et des acides nucléiques (ADN) digérés aux enzymes de restriction d’autre part, ont permis aux chercheurs de disposer d’un grand nombre de marqueurs fiables et stables. En observant la variabilité au niveau des produits primaires de l’action des gènes (polymorphisme antigénique et enzymatique) et même au niveau de l’ADN lui-même, on obtient une image non biaisée de la variabilité génétique.Comme objectifs, la génétique des populations se propose :

1- de décrire la structure génétique des populations naturelles, ce qui implique le dénombrement des différents allèles présents à chaque locus, l’estimation de leurs fréquences respectives ainsi que celle des fréquences des différentes combinaisons de gènes (génotypes haploïdes et diploïdes) ;

9

Page 11: Cours de Génétique Des Populations_ECUE1

2- d’apprécier le rôle respectif des facteurs dont l’interaction engendre la structure actuellement observée. Ces facteurs sont :

- les modalités de la rencontre et de la fusion des gamètes, c’est-à-dire les modalités précises du système de croisement,

- la mécanique chromosomique méiotique,- les mutations,- les migrations, c’est-à-dire le passage d’individus d’une

population à une autre de la même espèce,- la sélection, ce qui englobe l’ensemble des facteurs qui font

que l’importance de la contribution d’un reproducteur à la génération suivante dépend de son génotype,

- l’effectif de la population

3- de prévoir quelles modifications d’un pool génique seront provoquées par la variation des facteurs qui viennent d’être énumérés et par là même d’élucider les mécanismes de l’évolution biologique.

10

Page 12: Cours de Génétique Des Populations_ECUE1

CHAPITRE II : LE POLYMORPHISME ET LA STRUCTURE GENETIQUE DES POPULATIONS NATURELLES

I- LE POLYMORPHISME

I-1 Définition du polymorphisme

Sous l’influence du phénomène de la mutation, un gène donné peut se présenter sous plusieurs formes alléliques. Ce fait important détermine les généticiens des populations à raisonner en termes de fréquences alléliques. Le concept de fréquence allélique sous-tend l’idée de polymorphisme génétique.Le polymorphisme génétique est défini comme étant la coexistence de plusieurs allèles en un locus. Par opposition, un locus pour lequel on ne trouve qu’un seul allèle est dit "monomorphe". Il convient d’ajouter que les allèles doivent être en fréquences du même ordre de grandeur et qu’il ne doit pas y avoir un allèle très prédominant. Dans la pratique, les généticiens se fixent un seuil, c’est-à-dire "un critère de polymorphisme" : le polymorphisme génétique est la coexistence dans une même population de deux allèles ou plus en un locus, le plus fréquent d’entre eux ne dépassant pas la fréquence de 0,95. Certains auteurs se fixent un seuil moins sévère de 0,99. Ce seuil, bien que fixé arbitrairement, sert tout de même à attirer l’attention sur les gènes dont la variabilité est répandue ; Ces critères sont choisis aussi pour être compatibles avec l’étude d’un nombre raisonnable d’individus (de l’ordre de la centaine).Dans toutes les grandes populations, des allèles rares existent pour la plupart des gènes. Un allèle est dit rare lorsque sa fréquence dans la population est inférieure à 0,5 % ; entre 1 et 2 individus sur 1000 sont hétérozygotes pour un gène rare à n’importe quel locus (selon Harris et Hopkinson en 1972, à l’issue d’une étude électrophorétique de protéines codées pour 43 locus chez 250 000 européens). Beaucoup d’allèles rares sont défavorables et on suppose que leur maintien dans les populations ne peut être dû qu’à des mutations récurrentes. Ce type de polymorphisme qui résulte d’un équilibre entre la sélection naturelle et la mutation est appelé cryptopolymorphisme. Le polymorphisme génétique, tel que nous l’avons défini dans ce paragraphe, ne concerne que les gènes qui ont une fréquence trop élevée pour être uniquement expliquée par des mutations récurrentes vers des allèles nocifs. On exclut donc le cryptopolymorphisme.En toute rigueur, la définition du polymorphisme suppose qu’il y a coexistence d’allèles différents pour un locus donné au sein de la même population. L’existence

11

Page 13: Cours de Génétique Des Populations_ECUE1

d’allèles différents dans des populations différentes ne constitue pas, à proprement parler, un cas de polymorphisme (on doit parler plutôt, dans ce cas, de polytypisme).Le polymorphisme est un fait d’observation courante : la couleur des yeux, des cheveux, les groupes sanguins chez l’homme ainsi que la taille ou la musculature, ou encore la couleur du pelage chez les chats, sont des exemples parmi tant d’autres. La plupart des différences que nous constatons entre les individus se ramènent à des cas de polymorphisme génétique, même s’il n’est pas toujours facile de préciser les unités génétiques en cause.Or ce fait banal constitue, à bien y réfléchir, un paradoxe flagrant : si le moteur de l’évolution est bien la sélection naturelle, comme Darwin l’a proposé, nous devrions nous attendre à ce que la structure héréditaire qui se reproduit le plus efficacement soit la seule à subsister à terme. Une population ne devrait donc comporter généralement qu’un allèle à chaque locus, à la mutation près.Aussi, une explication possible, lorsque nous nous trouvons en face de gènes polymorphes, est que la sélection n’agisse pas : il s’agirait d’un polymorphisme neutre (un polymorphisme et des allèles sont dites neutres sélectivement si le remplacement d’un allèle par un autre ne modifie pas les valeurs sélectives des individus qui les possèdent). Toutefois, dans ce cas, la dérive génétique doit opérer, et nous verrons qu’elle aboutit, elle aussi, à l’homogénéité.Pour expliquer l’existence au sein des populations d’une diversité sous contrôle génétique, nous ne pouvons échapper au dilemme :

- soit il existe un mécanisme sélectif responsable du maintien du polymorphisme : c’est l’hypothèse "sélectionniste" ;

- soit les gènes polymorphes sont neutres mais alors la population n’est pas à l’équilibre : c’est l’hypothèse "neutraliste".

Remarque :L’estimation du taux de polymorphisme de la population est notée (à ne pas

confondre avec qui est l’estimation de la fréquence allélique).

L’estimation du taux d’hétérozygotie individuelle de la population pour un locus

donné est notée

12

Page 14: Cours de Génétique Des Populations_ECUE1

Le taux d’hétérozygotie moyenne de la population est noté

I-2 Les marqueurs de polymorphisme

Jusqu’à une époque assez récente, les exemples de polymorphisme que l’on pouvait donner portaient le plus souvent sur des caractères morphologiques. Peu de gènes avaient été identifiés avec précision et il y avait généralement, entre les gènes analysés et leur expression, une grande distance en termes de complexité des mécanismes biologiques mis en jeu.Quelques rares exemples étaient cependant bien étudiés comme les groupes sanguins chez l’homme.Depuis les années 1960, on dispose d’un moyen de quantifier l’importance du polymorphisme au niveau même des produits des gènes grâce à la technique d’électrophorèse des protéines (marqueurs antigéniques et enzymatiques). Un intérêt particulier de cette technique est qu’elle révèle aussi les locus non polymorphes, contrairement aux méthodes génétiques classiques.

Plus récemment, le développement des techniques de biologie moléculaire a permis d’aborder l’étude du polymorphisme au niveau de l’ADN lui-même. Ainsi, une technique comme la mise en évidence du polymorphisme dans les sites de restriction de l’ADN peut être utilisée. On a pu, grâce à celle-ci, révéler une large variabilité entre individus pour le nombre et la position de divers sites de restriction (on parle de "Polymorphisme de Longueur de Fragments de Restriction", ou plus couramment, selon l’abréviation anglaise de RFLP). Ce polymorphisme concerne tout le génome, y comprises et surtout les portions non codantes qui n’étaient pas accessibles par l’étude des protéines.Encore plus récemment, avec les avancées de la biologie moléculaire, une technique dite PCR (acronyme anglais de "Polymerase Chain Reaction" ; en français "réaction en chaîne par polymérase") a été mise au point en 1985 par Karry Mullis (prix Nobel de chimie 1993). C'est une technique d'amplification génique, c'est-à-dire qu'elle permet de repérer un fragment d'ADN ou de gène précis, même présent en quantité infime dans un mélange, puis de le multiplier rapidement. Ainsi la PCR a

13

Page 15: Cours de Génétique Des Populations_ECUE1

permis de développer de nouveaux marqueurs de l’ADN, à savoir les marqueurs microsatellites, marqueurs AFLP, marqueurs RAPD. A ces marqueurs, il faut ajouter ceux qui sont mis en évidence par séquençage ; ce sont les marqueurs d’ADN mitochondrial et les marqueurs de dernière génération appelés SNP (pour Single Nucleotide Polymorphism) ou « SNIP », également étudié par séquençage ou par la technique des biopuces à ADN.

I-2-1 Les marqueurs sérologiques chez l’homme : les groupes sanguins

Les antigènes de surface des hématies spécifient les groupes sanguins chez l’homme. Les antigènes peuvent être de nature protéique ou polysaccharidique. Ils sont génétiquement déterminés. Un même gène peut spécifier plusieurs antigènes : le produit de la traduction d’un gène (protéine) pouvant porter plusieurs motifs antigéniques. De même, un antigène peut être spécifié par plusieurs gènes : un motif antigénique pouvant résulter de l’association des produits de la traduction de plusieurs gènes. Lorsque l’antigène est protéique, le gène le spécifie directement. Lorsque l’antigène est un oligosaccharide, les gènes spécifient les enzymes qui catalysent la liaison des sucres.Les systèmes de groupes sanguins, dont la découverte du premier (système ABO) remonte au début du XXème siècle, se comptent aujourd’hui par dizaines chez l’homme. Nous ne considérerons ici que quelques uns.

I-2-1-1 Le système ABO

Il existe deux antigènes dont la structure chimique est connue ; il s’agit de chaînes oligosaccharidiques branchées fixées sur un polypeptide. Les antigènes A et B ne diffèrent que par le sucre terminal : galactosamine (A) ou galactose (B). A ces deux antigènes correspondent chez l’homme quatre phénotypes diploïdes, c’est-à-dire quatre groupes sanguins :

groupe sanguin AB = [AB] : présence simultanée des 2 antigènes,groupe sanguin A = [A] : présence de A absence de B,groupe sanguin B = [B] : présence de B absence de A,groupe sanguin O = [O] : absence des 2 antigènes A et B.

L’analyse génétique par l’étude des généalogies révèle, en particulier, que les individus [AB] ne produisent que deux types de gamètes : les uns portent le

14

Page 16: Cours de Génétique Des Populations_ECUE1

déterminant génétique de l’antigène A mais pas celui de B, les autres celui de l’antigène B mais pas celui de A.Formellement, l’hypothèse d’une série de 3 gènes allèles A, B et O rend compte des ségrégations observées. L’allèle A spécifie l’antigène A, l’allèle B l’antigène B. L’allèle O est muet. Corrélativement à cette hypothèse :

- le phénotype [AB] correspond au génotype hétérozygote

- le phénotype [A] correspond aux génotypes et

- le phénotype [B] correspond aux génotypes et

- le phénotype [O] correspond au génotype .

Le polymorphisme génétique au locus AB est général dans toutes les populations humaines. Les fréquences des 3 allèles A, B et O varient d’une population à l’autre mais aucun allèle n’est jamais trop rare. L’allèle O est presque toujours le plus fréquent. C’est parmi les indiens d’Amérique que les allèles A et B sont les plus rares. L’allèle B est plus fréquent dans les populations asiatiques (0,17) qu’européennes (0,06).

Remarques :1- Les antigènes du système ABO sont ubiquitaires car on les trouve non seulement sur les érythrocytes mais aussi sur les leucocytes, plaquettes et même sur les cellules épidermiques desquamées par le fœtus dans le liquide amniotique, permettant le groupage prénatal.2- Chez 78 % des individus dits "sécréteurs", des antigènes de groupes ABO hydrosolubles sont mis en évidence dans certaines sécrétions : salive, sucs digestifs, sueur, larmes, urine, lait, sperme. Le caractère sécréteur ou non sécréteur est lié à un couple de gènes allèles Se/se, indépendant du locus du système ABO et situé sur un autre chromosome. Le génotype récessif homozygote entraîne la "non sécrétion" chez les sujets qui le possèdent.

I-2-1-2 Le système Rhésus

En 1939 Levine, chez une femme qui venait de mettre au monde un enfant mort-né atteint « d’érythroblastose fœtale », note un choc transfusionnel à la perfusion du sang de son mari, pourtant ABO compatible. Le sérum de la femme contenait un

15

AB=

BB=

BO=

AA=

AO=

OO=

sese=

Page 17: Cours de Génétique Des Populations_ECUE1

anticorps actif contre les globules rouges de l’enfant, du mari et de 85 % des sujets pris au hasard.L’année suivante, Landsteiner et Wiener obtiennent chez des lapins immunisés avec des hématies de Macacus rhesus un sérum agglutinant 85 % des hématies de sujets pris au hasard.On a montré que les anticorps présents chez cette femme ont la même spécificité, c’est-à-dire reconnaissent le même antigène que ceux qu’un lapin fabrique à la suite de l’injection d’hématies du singe Rhésus. Cet antigène a donc été appelé Rhésus. C’est pourquoi l’anticorps trouvé chez la femme a été nommé anticorps anti-rhésus ; les sujets qui le possèdent sont dits Rh+, et Rh- ceux qui en sont dépourvus.Selon Fisher et Race, le système Rhésus est génétiquement déterminé par 3 locus très fortement liés sur le bras court du chromosome 1. Ces locus portent chacun deux allèles (D et d pour le premier, C et c pour le second et, E et e pour le dernier). Les allèles C et c sont codominants tout comme E et e. Par contre, D est dominant sur d qui n’est pas immunogène. D est de loin le meilleur immunogène. L’antigène codé par D n’est autre que le facteur Rhésus standard. Le posséder est nécessaire et suffisant pour être considéré comme Rh+. C’est pourquoi on raisonne généralement comme si le système Rhésus n’est déterminé que par un couple d’allèles D/d (avec D dominant et d récessif).Le tableau I présente les 8 haplotypes (combinaisons alléliques dans les gamètes) du système Rhésus et leurs fréquences.

Tableau I : Haplotypes du système Rhésus selon Fisher et Race

Phénotypes Haplotypes Fréquences approximatives

Sujets Rh+

DCE 0,002DCe 0,420DcE 0,140Dce 0,026

Sujets Rh-

dCE 0,000dCe 0,010dcE 0,012dce 0,390

La maladie hémolytique du nouveau-né qui consiste en la lyse des hématies se produit lorsqu’une mère Rh-, donc dd, met au monde un enfant Rh+, Dd. Cela peut se produire lorsque les couples sont :

soit ♀dd x ♂DD ==> 100 % d’enfants Dd

16

Page 18: Cours de Génétique Des Populations_ECUE1

soit ♀dd x ♂Dd ==> 50 % d’enfants DdLa maladie ne frappe que 6 % des nouveau-nés Dd dont la mère est dd. En absence de soins, elle est mortelle 3 fois sur 4. Seulement 5 % des nouveau-nés malades sont le produit d’une première grossesse. En principe, les hématies du fœtus et par conséquent les antigènes D ne franchissent par le placenta et ne peuvent donc pas provoquer de réaction immunitaire chez la mère. Le contact peut se produire lors de l’accouchement de telle sorte que la mère se trouvera immunisée lors d’une grossesse ultérieure (les anticorps franchissent le placenta).

I-2-1-3 Le système MN

Le système de groupes sanguins MN est génétiquement déterminé par un locus à 2 allèles M et N codominants. Trois groupes sanguins sont donc exprimés corrélativement aux 3 génotypes possibles :MM ==> phénotype [M] = groupe MMN ==> phénotype [MN] = groupe MNNN ==> phénotype [N] = groupe N

I-2-1-3 Le système HLA

Comme les érythrocytes, les cellules nucléées possèdent à leur surface des antigènes qui provoquent la production d’anticorps hémagglutinants. Ces antigènes représentent le système d’histocompatibilité à l’origine des phénomènes de rejet des allogreffes et des allergies.Le système HLA (Human Leucocyte A) est génétiquement contrôlé par plusieurs locus ayant en commun la faculté d’être polyalléliques et codominants. Il suffit qu’un sujet présente un allèle sur l’un de ses deux chromosomes homologues n° 6 pour que l’on détecte le produit du gène sur la membrane de la cellule. Selon Klein, les gènes de cette région peuvent être groupés en trois classes :

- classe I : couple de gènes HLA-A, B et C- classe II : couple de gènes HLA-A, et DR- classe III : elle concerne les composants du complément : C2, C3 et C4 (le

complément représente avec les anticorps l’élément essentiel du système humoral de défense contre les agents infectieux ; il active la lyse cellulaire, bactérienne ou virale).

17

Page 19: Cours de Génétique Des Populations_ECUE1

Sur le plan pratique, lors d’une greffe, les produits géniques de la classe I servent de cible pour tous les agents naturels cytotoxiques (lymphocytes et anticorps) ; les gènes de la classe II codent l’activation de la première réaction du « non soi ».

I-2-2 Les marqueurs enzymatiques

Les enzymes sont des protéines catalytiques qui peuvent être fonctionnelles sous la forme d’une seule chaîne polypeptidique (enzymes monomériques) ou de deux chaînes polypeptidiques ou plus (enzymes polymériques). Les enzymes polymériques peuvent donc être dimériques, trimériques, tétramériques, etc.Le caractère amphotère des protéines permet leur séparation dans un champ électrique uniforme en fonction de leur charge électrique.Si une mutation génique a pour conséquence le remplacement, dans la structure de la protéine codée, d’un acide aminé basique (ex : acide aspartique, acide glutamique) par un acide aminé acide (ex : arginine, lysine) et vice versa, elle entraînera une modification de la charge nette de la protéine concernée. Or, si des protéines codées par les différents allèles d’un même gène (isoenzymes ou isozymes) diffèrent entre elles par la charge électrique, elles pourront être dissociées par la technique d’électrophorèse. Si, pour un système enzymatique donné, des allèles différents du ou des gènes qui le code(ent) sont présents chez un individu, ils seront tous révélés à travers le profil enzymatique électrophorétique. Ainsi, dans une population naturelle donnée d’une espèce donnée, si tous les individus ont le même génotype pour le système enzymatique étudié (par exemple la malate déshydrogénase ou MDH), l’électrophorèse ne conduira qu’à un seul profil enzymatique, quelle que soit la taille de l’échantillon analysé. Par contre, si des génotypes différents sont représentés dans cette population, l’électrophorèse permettra de les mettre tous en évidence à travers des profils enzymatiques polymorphes à condition que la taille de l’échantillon analysé soit grande. Dans ce cas, on parle de polymorphisme électrophorétique. Il est important de faire remarquer aussi que pour un génotype donné, le profil enzymatique révélé par électrophorèse dépend à la fois de la structure fonctionnelle de l’enzyme étudiée, du nombre d’allèles actifs et du nombre de locus en jeu.

a) Les enzymes monomériquesSi une enzyme monomérique est codée par un locus à 3 allèles actifs S1, S2 et

S3, l’électrophorèse conduira à six profils enzymatiques correspondant aux six

18

Page 20: Cours de Génétique Des Populations_ECUE1

génotypes possibles S1S1, S2S2, S3S3, S1S2, S1S3 et S2S3, s’ils sont tous présents dans l’échantillon analysé (Figure 1).

Figure 1 : Profil électrophorétique d’une enzyme monomérique codée par un locus à 3 allèles actifs S1, S2 et S3.

b) Les enzymes dimériques monogéniquesSi une enzyme dimérique est codée par un locus à 3 allèles actifs S1, S2 et S3,

l’électrophorèse conduira à six profils enzymatiques correspondant aux six génotypes possibles S1S1, S2S2, S3S3, S1S2, S1S3, S2S3 s’ils sont tous présents dans l’échantillon analysé (figure 2). Ici, il convient de distinguer les bandes homomères (homodimères) formées par l’association de deux chaînes polypeptidiques codées par le même allèle, d’une part, des bandes hétéromères (hétérodimères) formées par l’association de deux chaînes polypeptidiques codées par des allèles différents, d’autre part. Chez l’hétérozygote, la bande hétérodimère se positionne entre les 2 bandes des homodimères.

Figure 2 : Profil électrophorétique d’une enzyme dimérique codée par un locus à 3 allèles actifs S1, S2 et S3.

19

Page 21: Cours de Génétique Des Populations_ECUE1

c) Les enzymes dimériques digéniquesSi une enzyme dimérique est codée par deux locus à 2 allèles chacun (S1 et

S2 pour l’un, F1 et F2 pour l’autre) tous actifs, l’électrophorèse conduira à neuf profils enzymatiques correspondant aux neuf génotypes possibles, s’ils sont tous présents dans l’échantillon analysé. Le profil électrophorétique du double hétérozygote dépend de l’activité des dimères hétérogénétiques (dimères formés par l’association de 2 chaînes polypeptidiques codées chacune par un allèle de chaque locus : S1F1, S1F2, S2F1 et S2F2). Le double hétérozygote présentera un profil à 10 bandes dans le cas où les dimères hétérogénétiques sont actifs (figure 3).

Figure 3 : Profil électrophorétique d’une enzyme dimérique codée par 2 locus à 2 allèles chacun avec hétérodimères hétérogénétiques actifs.

1 = S1S1F1F1 4 = S1S2F1F1 7 = S2S2F1F1

2 = S1S1F1F2 5 = S1S2F1F2 8 = S2S2F1F2

3 = S1S1F2F2 6 = S1S2F2F2 9 = S2S2F2F2

20

Page 22: Cours de Génétique Des Populations_ECUE1

Remarque : Si une enzyme est codée par un locus à deux allèles dont un seul est actif, l’autre étant muet, l’hétérozygote présente le même profil électrophorétique à une bande que l’homozygote pour l’allèle actif, que l’enzyme soit monomérique ou polymérique. L’homozygote pour l’allèle muet ne présente pas de bande. Tout se passe comme si on se trouvait dans un cas de dominance/récessivité, et la distinction entre l’homozygote pour l’allèle actif et l’hétérozygote ne peut se faire qu’à travers des test-cross ou des autofécondations si cela est possible.

I-2-3 Les marqueurs RFLP 

On peut révéler les polymorphismes des molécules d’ADN en utilisant des enzymes de restriction qui coupent les molécules d’ADN en des points précis de la séquence de nucléotides appelés sites de restriction. Par exemple, l’enzyme Eco RI coupe l’ADN en des sites qui comportent la séquence des 6 nucléotides GAATTC.

L’enzyme AluI coupe l’ADN en des sites qui comportent la séquence des quatre nucléotides AG CT.

La plupart des enzymes de restriction utilisées dans les études des populations ont des sites de restriction soit de quatre, soit de six nucléotides. Comme les enzymes, les fragments de restriction peuvent être séparés par électrophorèse. Mais contrairement aux enzymes, la reconnaissance des fragments d’ADN nécessite des techniques particulières. Celle qu’on utilise le plus souvent est un transfert selon la méthode de Southern. La procédure de transfert de Southern est la suivante :

21

Page 23: Cours de Génétique Des Populations_ECUE1

1)- les fragments d’ADN issus de la digestion sont séparés par électrophorèse puis transférés et fixés sur une membrane de nitrocellulose ou de nylon.2)- la membrane est placée dans une solution contenant une sonde radioactive qui se fixe sur les molécules homologues d’ADN attachées à la membrane.3)-après lavage, la membrane est exposée au contact d’un film photographique où apparaissent des bandes sombres inscrites par les désintégrations radioactives de la sonde.Les polymorphismes qu’entraînent la présence ou l’absence de sites de restriction sont en fait des polymorphismes de la longueur des fragments de restriction (RFLP) puisque cette longueur est modifiée. Il suffit donc d’avoir des fragments d’ADN clonés pour mettre en évidence des RFLP ; ces derniers sont répartis à travers le génome et sont répandus chez presque tous les organismes.Les RFLP présentent un grand intérêt en génétique des populations humaines en servant à la fois pour la cartographie du génome et pour le marquage des maladies génétiques.

Exemple :Soient 2 chromosomes homologues A et a (chaque chromosome correspond en fait à une molécule d’ADN)

Les traits sur les chromosomes indiquent les sites de restriction.Pour les 3 combinaisons génotypiques AA, Aa et aa nous aurons :

22

Page 24: Cours de Génétique Des Populations_ECUE1

Profils ou diagrammes électrophorétiques de restriction des 3 génotypes :

I-2-4 Les marqueurs d’ADN mitochondrial

L'ADN mitochondrial (ADNmt) possède un avantage majeur par rapport à l'ADN nucléaire : il est transmis d'une génération à l'autre uniquement par la mère (mitochondries présentes dans le cytoplasme de l'œuf) et limite la recombinaison génétique (sauf exception). Ainsi, contrairement aux séquences chromosomiques pouvant être affectées par les événements de recombinaison (crossing-overs), la différence entre deux séquences d'ADNmt peut être interprétée comme la conséquence de la mutation seulement. Il a aussi été montré récemment que le manque d'efficacité des mécanismes de réparation de l'ADNmt, accélérait son évolution (par mutation) comparée au reste du génome. Certaines séquences à l'intérieur de la région de contrôle (région non codante) de l'ADNmt, évoluent encore plus rapidement et la large diversité génétique observée à ces séquences permet des études très fines de phylogénie. Enfin, l'ADNmt est facilement amplifié car les séquences d'initiations (« amorces » ou « primers ») sont quasiment les mêmes pour toutes les espèces. Ces marqueurs permettent d’étudier la génétique des populations sous forme "haploïde" ; on parle d’haplotypes. Certaines critiques ont toutefois été apportées à l'utilisation de cet ADN, notamment sur le rôle potentiel de la sélection sur son mode d'évolution. En effet, vu la faible taille du génome mitochondrial, la fixation de mutations avantageuses dans les séquences codantes de l'ADNmt pourrait influencer la fréquence des allèles des zones dites neutres par le phénomène d'auto-stop (« hitchhiking ») ou déséquilibre de liaison (situation dans laquelle deux allèles sont plus fréquemment associés que ne le voudrait le hasard). D'autre part, des tests de neutralité ont permis de montrer

23

Page 25: Cours de Génétique Des Populations_ECUE1

que la distribution des mutations de l'ADNmt n'était pas en accord avec celle attendue par rapport à un modèle neutre.

I-2-5 Les marqueurs RAPD (Random Amplification of Polymorphic DNA)

Les RAPD (en français amplification aléatoire d’ADN polymorphe) utilisent l'amplification (par la technique PCR) de fragments non codants d'ADN pour mettre en évidence la diversité génétique inter individuelle. Les amorces des RAPDs (les séquences qui permettent la reconnaissance et l'amplification de l'ADN) sont de petites tailles (environ 10pb) et non spécifiques. Les amorces vont donc se fixer de manière aléatoire dans le génome. Le nombre et la taille des segments amplifiés permettent de mettre en évidence les différences entre les individus. Bien que d'un coût peu élevé et permettant de mettre en évidence une large variabilité en un faible nombre de réactions, cette technique à un défaut majeur : sa faible reproductibilité d'une réaction à l'autre et plus généralement d'un laboratoire à un autre. D'autre part, il s'agit d'une technique dite dominante, ne permettant pas de mettre en évidence si un individu est homozygote ou non à un locus donné.

I-2-6 Les marqueurs AFLP (Amplified Fragment Length Polymorphism)

La technique des AFLP (Polymorphisme de longueur des fragments d'amplification) est fondée sur la mise en évidence conjointe de polymorphisme de sites de restriction et de polymorphisme d'hybridation d'une amorce de séquence arbitraire. L'ADN est soumis à une digestion par des enzymes de restriction. Les tailles des fragments obtenus sont dépendantes des enzymes utilisées. Ensuite, il y a addition aux extrémités des fragments de restriction d'adaptateurs nucléotidiques spécifiques des enzymes de restriction utilisées. Ils sont de séquences connues. Les fragments sont ensuite amplifiés par PCR, en utilisant comme amorce un oligonucléotide complémentaire de la séquence de l'adaptateur, prolongé de quelques nucléotides arbitraires (de 1 à 3) appelés bases débordantes. Seuls sont amplifiés les fragments possédant les bases complémentaires de ces bases arbitraires. Il s'agit donc d'amorces sélectives permettant de réduire le nombre de fragments amplifiés à une centaine : sans ces séquences débordantes, il y aurait amplification de milliers de fragments. Les bandes sont visualisées par électrophorèse sur gel d’acrylamide. Le principal avantage de la technique AFLP est, comme les RAPD, la relative facilité de la mise au point des marqueurs qui ne demande pas de connaissance a priori du

24

Page 26: Cours de Génétique Des Populations_ECUE1

génome de l'espèce étudiée. Mais contrairement aux RAPD, cette méthode montre une reproductibilité élevée, mais nécessite un ADN de très bonne qualité. Cette technique est relativement peu utilisée dans les études sur la diversité génétique.

I-2-7 Les marqueurs microsatellites

Les microsatellites (ou SSR : simple sequence repeats, ou SSRP : simple sequence repeat polymorphisme ou STR : short tandem repeats) sont sans doute les marqueurs les plus employés dans les études de suivi de la diversité génétique. Les microsatellites sont des séquences d'ADN non codantes composées de motifs de 1 à 6 nucléotides (mono-, di-, tri-, tétra-nucléotides ou d’hexa-nucléotides ; au-delà de cette limite on parle de minisatellites) qui se répètent en tandem, de 10 à 60 fois voire un peu plus, et qui sont disséminées dans l'ensemble du génome aussi bien chez les eucaryotes que chez les procaryotes.

Exemple d’allèles microsatellites :- microsatellite à motif di-nucléotidique répété 6 fois (TG)6 : TGTGTGTGTGTG- microsatellite à motif tétra-nucléotidique répété 3 fois (GCCA)3 : GCCAGCCAGCCA

Bien que présents dans la plupart des organismes, les microsatellites sont répartis de manière irrégulière dans le génome. Leur nombre varie aussi d'un taxon à l'autre. Les marqueurs microsatellites sont largement utilisés en génétique des populations. Leur très fort taux de mutation (de l’ordre de 10-6 à 10-2) les rend hautement variables. Leur grande diversité facilite la discrimination précise des individus ou des groupes d’individus, de même que les mesures de distances génétiques. Bien que les microsatellites soient non codants, certains auteurs ont proposé qu'ils jouent un rôle dans la régulation et le fonctionnement des gènes. Les microsatellites ont aussi été associés aux effets de la virulence pathogène de certains micro-organismes. Lors de l'analyse des microsatellites, une phase importante est l'amplification de la quantité d'ADN par la méthode de la PCR. Un avantage des microsatellites est leur co-dominance, c’est-à-dire que les deux états alléliques différents présents dans un génome diploïde sont amplifiés. Par ailleurs, ces marqueurs sont jugés sélectivement neutres, jusqu’à preuve du contraire.

(i) Polymorphisme de longueur

25

Page 27: Cours de Génétique Des Populations_ECUE1

Un allèle d’un locus microsatellite est identifié après amplification par PCR et migration électrophorétique, comparativement à un témoin (marqueur) de taille connu. Les allèles du marqueur microsatellite sont constitués par le nombre de répétition dont les variations entraînent des différences de taille entre ces allèles. Ces variations sont produites par des mutations correspondant à des insertions ou délétions d’un ou plusieurs motifs au cours de la réplication de l’ADN. Bien que, de manière générale, la technique de PCR soit très précise, certaines erreurs peuvent se produire qui vont affecter les mesures de la diversité génétique. Ces erreurs sont d'autant plus probables que la qualité de l'ADN est mauvaise et/ou ancienne. Généralement deux types d'erreurs sont décrits :

- la non amplification d'un des brins de l'ADN : les allèles nuls ou «allelic drop-out» (non amplification d'un des allèles à un locus donné chez un individu hétérozygote) avec pour conséquence une sous-estimation de la diversité ;

- l’erreur d'amplification de l'ADN (techniquement appelée décalage de la fenêtre de lecture) entraîne une surestimation de la diversité en générant des allèles qui n'existent pas.

(ii) Intérêts des microsatellites en génétique des populationsLes microsatellites sont des outils de choix pour :- étudier les espèces autogames et clonales- caractériser le système reproducteur des populations naturelles- étudier l'influence des régimes de reproduction sur la structure génétique- étudier les modalités de perte de sexualité et la variation des taux

d'autofécondation.

I-2-8 Marqueurs SNP (Single Nucleotid Polymorphisms)

Avec les SNP ou « SNIP », l'étude de la diversité se fait sur des sites caractérisés par une seule paire de base, avec deux états, homozygote ou hétérozygote, possibles. Il s’agit d’un polymorphisme génétique lié à des mutations ponctuelles isolées : polymorphisme d'un seul nucléotide (polymorphisme nucléotidique). C’est un type de variation stable de la séquence d'ADN génomique, portant sur une seule base, toutes les 100 à 300 bases environ du génome. Les SNP sont très nombreux dans le génome ; chez les humains, ils représenteraient 90 % de la variation génétique. Leur taux de mutation lent (10-9 à 10-8) les rendrait plus aptes à des études de phénomènes à long terme. Beaucoup de SNP n'ont pas d'implication fonctionnelles mais ils définissent un locus unique dans le génome et sont

26

Page 28: Cours de Génétique Des Populations_ECUE1

polymorphes. Les SNP se trouvant dans les régions codantes (SNPc) et dans les régions régulatrices des gènes sont particulièrement intéressants pour réaliser la cartographie des maladies multifactorielles (étude d'association de gènes candidats impliqués dans ces maladies).

I-2-9 Les marqueurs chromosomiques

Une hétérogénéité génétique existe également au niveau des chromosomes à travers des variations qu’on observe dans leur structure et/ou leur nombre. On parle alors de remaniements chromosomiques structuraux et/ou de variations chromosomiques numériques. Chez des organismes comme la Drosophile où il existe des chromosomes polytènes géants dans les glandes salivaires larvaires, il est très aisé d’observer ces remaniements chromosomiques structuraux. Ils consistent en des inversions, des délétions (ou déficiences), des translocations simples, des translocations réciproques et des duplications. Ainsi, dans les populations californiennes de Drosophila pseudoobscura coexistent trois structures du chromosome N°3 différant par des inversions. Elles ont été appelées standard (ST), Arrowhead (AR) et Chiricahua (CH). Par exemple, dans un échantillon de 345 mouches prélevées au hasard dans l’une de ces populations, on a noté la composition suivante :

STST = 36 STAR = 108ARAR = 81 STCH = 30CHCH = 9 ARCH = 81

Les remaniements chromosomiques structuraux existent aussi dans les populations humaines. Par exemple, une délétion du bras court du chromosome N°5 est responsable d’une maladie appelée maladie du cri du chat ; une translocation réciproque entre le chromosome N°14 et le chromosome N°21 est responsable du mongolisme (trisomie 21) par translocation ou mongolisme héréditaire.En ce qui concerne les variations chromosomiques numériques, elles consistent en des aneuploïdies (nullisomie, monosomie, trisomie, etc.) ou en des euploïdies (polyploïdies = triploïdie, tétraploïdie, pentaploïdie, etc.). Dans les populations humaines, on note la présence d’une monosomie du chromosome sexuel X chez les femelles responsable du syndrome de Turner et une disomie du même chromosome chez les mâles à l’origine du syndrome de Klinefelter.

27

Page 29: Cours de Génétique Des Populations_ECUE1

Les variations polyploïdes, quant à elles, sont peu fréquentes dans le règne animal où l’état diploïde est la règle (mâles haploïdes des hyménoptères, souches triploïdes parthénogénétiques des pucerons). Elles sont beaucoup plus fréquentes dans le règne végétal dans l’évolution duquel elles ont certainement joué un grand rôle.

II- LA STRUCTURE GENETIQUE DES POPULATIONS

Dans une population d’un organisme haploïde, la proportion d’individus portant un allèle donné fournit directement la fréquence de cet allèle dans la population. Dans ce cas, fréquence génotypique et fréquence génique (on dit aussi fréquence allélique) se confondent. Mais dans les populations d’organismes diploïdes (ce sont ces populations auxquelles nous nous intéressons principalement), les gènes sont associés par paire dans les individus ; il est alors nécessaire de distinguer deux choses pour définir la structure génétique de la population au locus considéré : Les "fréquences génotypiques" qui représentent les proportions des différents gé-

notypes dans la population au locus considéré.

Les "fréquences géniques" (dites aussi "fréquences alléliques") qui représentent les proportions des différents allèles dans la population au locus considéré.

C’est l’ensemble de ces paramètres qui permet de décrire la structure génétique des populations.La connaissance de la structure génique est très importante pour le généticien des populations car c’est d’abord l’évolution des fréquences des gènes qui est significative pour l’évolution biologique : la population est vue comme un "pool de gènes", "un stock de gènes" dont la composition est susceptible d’évoluer, les individus n’étant que des porteurs transitoires de ces gènes.Si la connaissance de la structure génotypique permet de déduire facilement celle de la structure génique, le passage inverse est impossible sans hypothèse supplémentaire ; en effet, avec les mêmes fréquences alléliques, on peut avoir des structures génotypiques très différentes selon que les gènes homologues sont associés dans les individus plutôt entre gènes semblables (on a surtout des homozygotes) ou plutôt entre gènes différents (on a surtout des hétérozygotes). Ainsi, une population avec 50 % de gènes A et 50 % de gènes a peut être constituée uniquement d’homozygotes AA et aa dans les mêmes proportions, ou uniquement d’hétérozygotes Aa, ou de diverses proportions de ces 3 génotypes.D’autre part, lorsque plusieurs gènes sont impliqués dans l’évolution d’un caractère, il est nécessaire de connaître la structure génétique à chaque locus. Mais cela ne

28

Page 30: Cours de Génétique Des Populations_ECUE1

suffit pas car d’autres paramètres seront nécessaires pour décrire la façon dont les gènes de locus différents sont associés dans les individus. Ainsi, si nous savons qu’une population contient 50 % d’individus AA et 50 % de aa à un premier locus, et 50 % d’individus BB et 50 % de bb à un second locus, la structure génétique est parfaitement définie à chacun de ces locus. Mais cela ne nous dit pas si la population contient des individus AABB et aabbb, ou AAbb et aaBB, ou les quatre génotypes et en quelles proportions. C’est pourquoi les modèles qui étudient l’évolution de la structure génétique à plusieurs locus font appel à davantage de paramètres et sont très complexes.

II-1 Définition de la Structure génotypique pour un locus à deux allèles

Elle se fait par la détermination des fréquences dans la population des différents génotypes au locus considéré. Cela n’est possible que si l’on peut reconnaître les différents génotypes à ce locus, par leur phénotype (variation discontinue, pas de dominance) ou par l’examen de leurs descendances.Dans une population diploïde, considérons un locus à deux allèles codominants A1 et A2 par rapport auquel on analyse un échantillon de N individus prélevés au hasard. Soient x, y et z les fréquences absolues (on dit aussi les effectifs) des trois génotypes A1A1, A1A2, et A2A2 respectivement.

 ;

 ;

 ;

avec x +y + z = N.

II-2 Définition de la structure génique (structure allélique) en un locus biallélique

Elle se fait par la détermination de l’ensemble des fréquences des allèles au locus considéré. Si nous gardons l’exemple du locus du paragraphe précédent et si nous désignons par p et q les fréquences relatives des deux allèles A1 et A2

respectivement, alors nous aurons :

29

Page 31: Cours de Génétique Des Populations_ECUE1

avec

II-3 Définition de la structure génique en un locus polyallélique

Soit un locus avec les allèles A1, A2, …, Ai, …, An en fréquences p1, p2 ….pi, ….pn

respectivement. Désignons par AiAi les génotypes homozygotes et AiAj les génotypes hétérozygotes (i < j).Si kAiAi est le nombre d’individus de chaque génotype homozygote et kA iAj le nombre d’individus de chaque génotype hétérozygote, alors nous aurons :

Remarque :Ces formules de détermination des fréquences génotypiques et alléliques sont toujours vraies : elles n’impliquent aucune supposition sur le régime de reproduction ou l’existence ou non de pressions évolutives.En général l’échantillonnage ne porte que sur une fraction de la population (entité elle-même généralement mal définie dans ses limites). Les fréquences calculées

30

Page 32: Cours de Génétique Des Populations_ECUE1

comme dans les paragraphes II-1, II-2, et II-3 à partir d’un échantillon sont des estimateurs corrects des fréquences de la population.On peut déterminer la fréquence d’un allèle donné avec un intervalle de confiance :

si p est la fréquence réelle de l’allèle dans la population et son estimation à partir

de l’échantillon de taille N, alors l’intervalle de confiance de p est :

est une valeur donnée par la table de la loi normale centrée et réduite.

III- LA DISTANCE GENETIQUE ENTRE DEUX POPULATIONS

La distance génétique qui sépare deux populations est le reflet du degré de différenciation génétique qui existe entre elles. Plus précisément, il sera question dans ce paragraphe de différenciation allélique. Par exemple, si le polymorphisme de deux populations A et B est étudié par rapport à plusieurs systèmes enzymatiques, de nombreux locus seront impliqués. Tous les allèles de chaque locus seront identifiés et leurs fréquences estimées pour chacune des populations. Considérons l’un de ces locus et définissons les paramètres suivants :

= fréquence de l’allèle i au locus considéré dans la population A.

= fréquence de l’allèle i au locus considéré dans la population B.

= probabilité d’avoir deux fois le même allèle i si on effectue deux tirages non

exhaustifs dans la population A.

= Probabilité d’avoir deux fois le même allèle i si on effectue deux tirages non

exhaustifs dans la population B.

= Probabilité d’avoir deux fois le même allèle i si on effectue un tirage dans la

population A et un autre tirage dans la population B.

 ;  ;

On appelle coefficient d’identité ou indice de ressemblance le paramètre IAB défini par la relation :

31

Page 33: Cours de Génétique Des Populations_ECUE1

- Si au locus considéré les deux populations A et B ont la même structure allélique, alors IAB = 1- Si au locus considéré les deux populations A et B n’ont aucun allèle en commun, alors IAB = 0Au lieu d’un seul locus, si on en avait considéré plusieurs, on aurait obtenu des valeurs moyennes pour les paramètres précédents et on les aurait notées :

 ;  ; et

Selon Nei, la distance génétique qui sépare les populations A et B est donnée par la relation :

- Si A et B présentent la même composition allélique pour les locus étudiés, DA-B = 0 ;

- Si A et B n’ont aucun allèle en commun,

32

Page 34: Cours de Génétique Des Populations_ECUE1

CHAPITRE III : INFLUENCE DES SYSTEMES DE CROISEMENTS SUR LA STRUCTURE GENETIQUE DES POPULATIONS

Dans ce chapitre, il sera surtout question de déterminer l’effet des croisements qui se produisent dans une population sur les fréquences relatives des génotypes qui contiennent les allèles d’un gène polymorphe. Les fréquences de tous les divers croisements possibles définissent les relations mathématiques qui lient fréquences alléliques et fréquences génotypiques. Généralement ces relations mathématiques sont déduites de modèles de population.

I- DEFINITION DES MODELES

Un modèle consiste en une simplification volontaire d’une situation complexe en vue d’éliminer les détails superflus pour s’intéresser seulement à l’essentiel de la question. En génétique des populations, nous devons tenir compte de facteurs tels que la taille de la population, les modes de croisements, la répartition géographique des individus, les mutations, les migrations et la sélection. Le but final est de comprendre les effets combinés de tous ces facteurs et d’autre encore ; mais ceux-ci sont si nombreux et interagissent de façon si complexe qu’ils ne peuvent être pris en considération tous à la fois. On imagine alors des situations plus simples dans lesquelles il est possible d’identifier les facteurs les plus importants et de négliger les autres.Un type de modèle utilisé fréquemment en génétique des populations est le modèle mathématique qui consiste en un ensemble d’hypothèses décrivant les relations mathématiques entre des quantités mesurées ou mesurables (les paramètres) dans un système ou un processus. Les modèles mathématiques sont toujours plus simples que les situations réelles qu’ils sont censés expliquer. Dans l’idéal, un modèle devrait inclure toutes les caractéristiques essentielles du système et exclure tous les aspects superflus. La qualité ou l’utilité d’un modèle dépend souvent du degré d’approximation de cet idéal.En bref, un modèle est, en quelque sorte, une analogie. Comme toutes les analogies, sa validité se situe seulement entre certaines limites, et au-delà de ces limites, cela devient trompeur ou même absurde.L’un des modèles mathématiques les plus importants en génétique des populations est le modèle à générations non chevauchantes : ce modèle se rapporte à des populations présentant un cycle reproductif très simple dans lequel les individus de

33

Page 35: Cours de Génétique Des Populations_ECUE1

chaque génération meurent avant la naissance des membres de la génération suivante (figure 4).

Figure 4 : Modèle à générations non chevauchantes (cas d’une plante annuelle par exemple).

Rigoureusement, ce modèle s’applique seulement à certains insectes à vie courte ou à des plantes annuelles qui ont de courtes périodes de croissance. Ce type de population hypothétique avec son cycle de reproduction simple est utilisé en génétique des populations comme une première approximation de populations aux cycles de reproduction plus complexes.Comme nous le verrons bientôt, les calculs des fréquences génotypiques théoriques basés sur ce modèle conviennent pour la plupart des utilisations, et ce sont souvent des approximations satisfaisantes même pour les populations dont les cycles de reproduction sont longs et complexes comme l’espèce humaine.

Dans le développement de ce cours de génétique des populations qui va suivre, nous n’utiliserons que le modèle à générations non chevauchantes.Plusieurs modes de croisements peuvent être utilisés dans le cadre de ce modèle car la structure génotypique de la population à une génération donnée dépend en partie de la loi d’union des gamètes deux à deux à la génération précédente pour former les zygotes.Un des plus simples et des plus importants modes de croisement est la panmixie ; les croisements s’effectuent au hasard pour les génotypes considérés. En panmixie, la probabilité qu’un individu se croise avec un autre d’un génotype donné est égale à la fréquence de ce génotype dans la population.Il est important de garder à l’esprit qu’un croisement peut être au hasard pour certains caractères mais, en même temps, non aléatoire pour d’autres. Chez les êtres humains par exemple, les croisements semblent au hasard pour les groupes

34

Page 36: Cours de Génétique Des Populations_ECUE1

sanguins, les phénotypes des isozymes (ou allozymes), les polymorphismes des RFLP, et pour de nombreux autres caractères ; mais les croisements ne se produisent pas au hasard pour d’autres traits comme la couleur de la peau et la taille.La panmixie est le mode de croisement le plus répandu dans la plupart des populations naturelles, mais certains écarts à la panmixie peuvent être considérables.Quand le choix du conjoint est basé sur le phénotype, on dit qu’il y a homogamie phénotypique. Elle est dite positive quand les individus ont tendance à choisir un conjoint dont le phénotype est identique au leur. Dans le cas de l’homogamie phénotypique négative, les individus ont tendance à choisir un conjoint dont le phénotype est différent du leur. Evidemment, même en panmixie, certains couples de conjoints présentent des phénotypes identiques ou différents ; l’homogamie décrit seulement des situations dans lesquelles les phénotypes des conjoints sont plus souvent identiques ou plus souvent différents que ce qu’on attendrait en panmixie.Dans la nature, il existe de nombreux exemples d’homogamie phénotypique positive ; c’est ce qu’on observe chez les plantes à floraison précoce qui se croisent entre elles tout comme les plantes à floraison tardive.Même dans les populations humaines il existe une tendance à l’homogamie phénotypique pour les traits comme la taille, le quotient intellectuel (dans le seul sens de niveau d’études), et aussi pour des critères socio-économiques.L’homogamie phénotypique négative quant à elle est beaucoup plus rare. Chez les végétaux, un exemple bien connu est celui des primevères où il existe une hétérostylie ; deux types de fleurs se rencontrent dans la plupart des populations, en proportions à peu près égales : le type brévistylé avec un style court et de grandes étamines et le type longistylé avec un style long et des étamines courtes. Les polynisations ne se font que de manière croisée.D’autre part, quand le choix du conjoint est basé sur le génotype, on dit qu’il y a homogamie génotypique ; elle peut être positive ou négative.Dans tous les cas d’homogamie, lorsque l’ensemble de la population est soumis au même mode de reproduction, on parle d’homogamie totale ; l’homogamie est partielle si une partie seulement de la population la pratique.Par ailleurs, lorsque les croisements n’impliquent que des conjoints apparentés, on dit qu’il y a consanguinité ou endogamie. Contrairement à l’homogamie qui n’implique que les gènes sur lesquels est basé le choix du conjoint (et les gènes qui leur sont liés), la consanguinité concerne tous les gènes.Le tableau II donne les principaux systèmes de croisements avec leurs caractéristiques.

35

Page 37: Cours de Génétique Des Populations_ECUE1

Tableau II : Caractéristiques des modes de croisement.

Modes de croisements Caractéristiques

PanmixieLes conjoints se croisent au hasard indépendamment de leurs phénotypes et leurs génotypes

Homogamie positiveLes phénotypes ou les génotypes des conjoints se ressemblent plus que par simple hasard

Homogamie négativeLes phénotypes et les génotypes des conjoints sont plus différents que par simple hasard

Endogamie ou consanguinité Les conjoints sont apparentés

II- LE MODELE DE LA PANMIXIE : LOI DE HARDY-WEINBERG

Comme nous venons de le signaler, lorsque la probabilité de rencontre et de fusion de deux gamètes de génotypes X1 et X2 est uniquement déterminée par la fréquence de ces génotypes dans la population de gamètes, on dit que la population est panmictique.

II-1 Cas d’un locus autosomique biallélique

II-1-1 Les fréquences géniques sont identiques dans les deux sexes

Envisageons un locus autosomique où coexistent deux allèles A1 et A2 ; par rapport à ce locus, il y a deux génotypes haploïdes A1 et A2, et par conséquent deux classes de gamètes. Soient pn et qn leurs fréquences respectives à une génération donnée que nous noterons Gn (avec pn + qn = 1). Si la probabilité de fusion de deux gamètes est uniquement déterminée par leur fréquence (panmixie), les fréquences des trois classes de zygotes possibles seront :

Il est facile de montrer que cette structure de population est une structure d’équilibre stable si les conditions suivantes sont remplies :

1) Absence de mutations

36

Page 38: Cours de Génétique Des Populations_ECUE1

2) Absence de sélection : les différents génotypes haploïdes (A1 et A2) et di-ploïdes (A1A1, A1A2 et A2A2) ont la même viabilité et la même fécondité, on dit qu’ils ont la même valeur sélective.

3) Absence de migrations (les émigrations et les immigrations sont négligeables).

4) Effectif de la population théoriquement infini (absence de dérive génétique).

En effet, compte-tenu du déroulement de la méiose, les hétérozygotes A1A2

produisent deux types de gamètes A1 et A2 en proportions égales, soit

Après la méiose, donc à la génération suivante (Gn+1), les fréquences des génotypes haploïdes A1 et A2 sont les suivantes :Pour A1 =pn+1 = p2

n (contribution des homozygotes A1A1) + pnqn

(contribution des hétérozygotes A1A2) = pn (pn+qn) = pn

Pour A2 =qn+1 =q2n (contribution des homozygotes A2A2) + pnqn (contribution des

hétérozygotes A1A2) = qn (pn + qn) = qn

Ainsi donc pn+1 = pn et qn+1 = qn

En absence de sélection sur la phase haploïde et de mutations, les fréquences des gamètes A1 et A2 sont celles des produits méiotiques A1 et A2. Leur fusion au hasard redonnera les trois classes de zygotes avec des fréquences p2

n, 2pnqn et q2n.

En absence de sélection sur la phase diploïde, les fréquences des adultes reproducteurs diploïdes seront égales à celles des zygotes.Ces considérations que nous venons de voir ont été développées simultanément et indépendamment au début du 20ème siècle par un biologiste anglais du nom de HARDY et un biologiste autrichien du nom de WEINBERG.En généralisant on a donc : Pn+1 =pn = p et qn+1 = qn = qD’où la structure p2, 2pq, q2 appelée structure génotypique de HARDY- WEINBERG ou structure d’équilibre panmictique.La loi de HARDY- WEINBERG, dans sa forme actuelle, s’énonce comme suit : "Dans une population diploïde isolée d’effectif illimité non soumise à la sélection et dans laquelle il n’y a pas de mutation, les fréquences géniques restent constantes ; si les croisements sont panmictiques, les fréquences génotypiques se déduisent directement des fréquences géniques et elles restent aussi constantes".

37

Page 39: Cours de Génétique Des Populations_ECUE1

II-1-2 Les fréquences géniques diffèrent d’un sexe à l’autre

Envisageons le cas d’un locus autosomique à deux allèles A1 et A2 dans une population diploïde prise à une génération quelconque Gn avec une inégalité des fréquences alléliques dans les deux sexes.La structure gamétique de la génération (Gn) est donc :

pn♀ A1 et qn

♀A2 chez les femelles (pn♀ + qn

♀ = 1)pn

♂ A1 et qn♂ A2 chez les mâles (pn

♂ + qn♂ = 1)

La structure génotypique panmictique zygotique et au niveau des adultes reproducteurs à la génération suivante (Gn+1) sera :

pn♂pn

♀A1 A1

(pn♂qn

♀ + pn♀qn

♂) A1A2

qn♂qn

♀A2 A2

Les fréquences géniques (ou fréquences gamétiques) après la méiose des adultes reproducteurs de Gn+1 sont :

pn+1 = pn♂pn

♀ + (pn♂qn

♀ + pn♀qn

♂)

Sachant que qn♀ = 1 – pn

♀ et qn♂ = 1 – pn

♂, en remplaçant qn♀ et qn

♂ par ces valeurs nous aurons :

Pn+1 = (pn♂ + pn

♀) et qn+1 = (qn♂ + qn

♀)

Ainsi après une seule génération de reproduction panmictique, l’équilibre génétique est restauré, c'est-à-dire que les fréquences deviennent identiques dans les 2 sexes et la structure devient panmictique à la deuxième génération. En effet :

p♂n+1 = p♀

n+1 = pn+1 = pq♂

n+1 = q♀n+1 = qn+1 = q

D’où p2A1A1, 2pqA1A2 et q2A2A2 à partir de la deuxième génération (Gn+2).

L’équilibre panmictique pour un locus autosomique à 2 allèles appelle quelques remarques :

38

Page 40: Cours de Génétique Des Populations_ECUE1

1) Il permet d’établir une relation entre les fréquences des génotypes haploïdes et diploïdes de sorte qu’il est possible de déduire graphiquement les unes des autres (figure 5).

Comme le montre la figure 5, la fréquence maximale des hétérozygotes est .

Elle est obtenue lorsque les deux allèles sont également fréquents (p = q =

). Par ailleurs, les arcs de parabole y = p2, y = q2 sont respectivement tangents à l’axe des abscisses lorsque p = 0 (q = 1) ou q = 0 (p = 1).Autrement dit, lorsqu’un gène est rare dans une population, il y est essentielle-ment présent à l’état hétérozygote. Si ce gène est récessif, il passera inaper-

çu. Lorsque p est petit,  ; par exemple si

p =0,01 (10-2) il y aura dans la population 200 fois plus d’hétérozygotes A1A2

que d’homozygotes A1A1.

2) Il permet de déterminer la vitesse d’atteinte de l’équilibre. En effet, si une po-pulation s’écarte accidentellement de sa structure d’équilibre, celui-ci se réta-blit en une génération si les fréquences des génotypes diploïdes sont demeu-rées égales dans les deux sexes et en deux générations si ce n’est pas le cas. Le retour à la position d’équilibre à la suite d’un écart est donc extrêmement rapide.

39

Page 41: Cours de Génétique Des Populations_ECUE1

Figure 5 : Relation entre les fréquences génotypiques et les fréquences alléliques dans une population soumise à la loi de HARDY-WEINBERG.

II-2 Cas d’un locus autosomique multiallélique avec égalité des fréquences géniques dans les deux sexes.

S’il coexiste à un locus autosomique n allèles dont les fréquences sont respectivement p1, p2….. pi ……. pn, il existe dans une population diploïde à

l’équilibre panmictique génotypes diploïdes, soit n génotypes homozygotes

dont les fréquences sont p21, p2

2, …, p2i, …, p2

n et génotypes hétérozygotes

tels que Ai Aj dont les fréquences sont de type 2pipj.

Exemple : Si nous avons un locus autosomique à 4 allèles A1, A2, A3 et A4 de fréquences p1, p2, p3 et p4 dans les deux sexes, la structure génotypique panmictique de la population sera la suivante :

40

Page 42: Cours de Génétique Des Populations_ECUE1

soit 10 génotypes diploïdes possible avec 4 homozygotes et 6 hétérozygotes.

II-3 Cas d’un locus biallélique lié au sexe

II-3-1 Les fréquences géniques sont égales dans les 2 sexes.

Envisageons le modèle d’un locus lié au sexe avec 2 allèles B1 et B2 de fréquences pn et qn respectivement à une génération quelconque Gn. La structure génotypique panmictique de la population zygotique et de la population des adultes reproducteurs à la génération suivante (Gn+1) est la suivante :

Chez les femelles : p2nB1B1, 2pnqnB1B2, q2

nB2B2

Chez les mâles : pn , qn

II-3-2 Les fréquences géniques diffèrent d’un sexe à l’autre

Dans ce cas, la structure génotypique de la population gamétique à la génération n (Gn) est :

Chez les femelles :pn

♀ B1 et qn♀B2 (avec pn

♀ + qn♀ = 1)

Chez les mâles :pn

♂ B1 et qn♂ (avec pn

♂ + qn♂ = 1)

A la génération suivante (Gn+1), la structure génotypique de la population zygotique et de la population des adultes reproducteurs est la suivante :

Chez les femelles :pn

♂pn♀ B1B1 , (pn

♂qn♀ + pn

♀qn♂) B1B2, et qn

♂qn♀B2B2

Chez les mâles :pn

♀ , qn♀

41

B1 B2

B1 B2

Page 43: Cours de Génétique Des Populations_ECUE1

Il est aisé de montrer que la structure de la population gamétique à Gn+1 est :

Chez les femelles :

p♀n+1 = (pn

♂ + pn♀) et q♀

n+1 = (qn♂ + qn

♀)

Chez les mâles :p♂

n+1 = pn♀ et q♂

n+1 = qn♀

Dans cette situation, comment évoluent les fréquences géniques dans chaque sexe au cours des générations ? Il est plus judicieux de suivre cette évolution chez les femelles car la connaissance de la structure génotypique gamétique chez les femelles à une génération donnée permet de déduire celle des mâles à la génération suivante. Calculons l’écart Δp♀ = p♀

n+1 - pn♀

Δp♀ = p♀n+1 - pn

♀ = (pn♂ + pn

♀) - pn♀ = (pn

♂ - pn♀)

Δp♀ = p♀n+1 - pn

♀ = (pn♀ - pn

♂)

En remplaçant pn♂ par p♀

n-1, on obtient :

p♀n+1 - pn

♀ = (pn♀ - p♀

n-1)

pn♀ - p♀

n-1 = (p♀n-1 - p♀

n-2)

p♀n-1 - p♀

n-2 = (p♀n-2 - p♀

n-3)

p2♀ - p1

♀ = (p1♀ - p0

♀)

La résolution de cette récurrence se fait en multipliant les termes de part et d’autre de l’égalité et on obtient alors :

p♀n+1 - pn

♀ = (p1♀ - p 0

♀)

En remplaçant p1♀ par (p0

♂ + p0♀) cette relation devient :

p♀n+1 - pn

♀ = [ (p0♂ - p 0

♀)]

42

Page 44: Cours de Génétique Des Populations_ECUE1

De même nous pouvons écrire que :

pn♀ - p♀

n-1 = [ (p0♂ - p 0

♀)]

p♀n-1 - p♀

n-2 = [ (p0♂ - p 0

♀)]

p2♀ - p1

♀ = [ (p0♂ - p 0

♀)]

p1♀ - p0

♀ = [ (p0♂ - p 0

♀)] = 1 x [ (p0♂ - p 0

♀)]

La résolution de cette récurrence s’obtient en additionnant les termes de chaque côté de l’égalité ; ainsi,

p♀n+1 – p0

♀ = x (p0♂ - p 0

♀)

Si on pose que = X,

calculons alors X qui donne la relation suivante :

X =

Calculons maintenant

X - X = X = ==> X =

En remplaçant X par sa valeur on obtient :

p♀n+1 – p0

♀ = x (p0♂ - p 0

♀)

= (p0♂ - p 0

♀)

p♀n+1 = p0

♀ + [(p0♂ - p 0

♀) ]

p♀n+1 = p0

♀ + [(p0♂ - p 0

♀) - (p0♂ - p 0

♀) ]

p♀n+1 = (3p0

♀ + p0♂ - p 0

♀) – (p0♂ - p 0

♀)

43

Page 45: Cours de Génétique Des Populations_ECUE1

p♀n+1 = (2p0

♀ + p0♂) – (p0

♂ - p 0♀)

On peut donc écrire aussi que :

pn♀ = (2p0

♀ + p0♂) – (p0

♂ - p 0♀)

pn♀ (2p0

♀ + p0♂) = p0

♀ + p0♂

Ainsi donc, quand le nombre de générations (n) augmente indéfiniment, la fréquence

de B1 chez les femelles (pn♀) tend vers sa valeur d’équilibre égale à (2p0

♀ + p0♂).

Quand l’équilibre est atteint, les fréquences géniques dans les 2 sexes s’égalent et on retrouve la structure génotypique diploïde panmictique.On peut étudier aussi les fluctuations de l’écart entre les fréquences géniques des 2 sexes au cours des générations. Pour l’allèle B1, il s’agit d’étudier par exemple l’évolution de l’écart E = p♀ - p♂. A la génération n, nous noterons cet écart En. Nous aurons donc :

En = pn♀ - pn

♂ = (p♂n-1 + p♀

n-1) - p♀n-1

En = (p♂n-1 - p♀

n-1) = (p♀n-1 - p♂

n-1)

En = (p♀n-1 - p♂

n-1) = En-1

En-1 = (p♀n-2 - p♂

n-2) = En-2

En-2 = (p♀n-3 - p♂

n-23) = En-3

E1 = (p0♀ - p0

♂) = E0

Pour résoudre cette récurrence il suffit de multiplier les termes de chaque côté de l’égalité. On obtient alors :

Remarque   :A la suite d’un écart, la position d’équilibre n’est atteinte que d’une manière asymptotique. La différence entre la fréquence d’équilibre d’un génotype et la

44

Page 46: Cours de Génétique Des Populations_ECUE1

fréquence existante (observée) est réduite de moitié à chaque génération. Le retour à une situation proche de la structure d’équilibre est donc néanmoins rapide.

II-4 Introduction au modèle à plusieurs locus

Soit deux locus où coexistent deux allèles pour chacun : A1 et A2 puis B1 et B2 avec des fréquences respectives pn, qn et rn, sn à une génération donnée Gn. La fréquence d’équilibre d’un génotype ne dépendant que des fréquences des gènes qui le constituent, nous aurons à la génération suivante (Gn+1) pour les deux locus considérés à la fois :p2

nr2n A1A1B1B1 2p2

nrnsnA1A1B1B2

p2ns2

n A1A1B2B2 2q2nrnsnA2A2B1B2

q2nr2

n A2A2B1B1 2pnqnr2nA1A2B1B1

q2ns2

n A2A2B2B2 2pnqns2nA1A2B2B2

4pnqnrnsnA1A2B1B2

Le point important est que cette structure d’équilibre est la même, que les gènes soient indépendants ou génétiquement liés.Toutefois, l’existence d’une liaison influe très fortement sur la vitesse d’atteinte de l’équilibre comme nous le verrons plus loin. Dans le cas de deux locus autosomaux portés par des chromosomes différents, la structure génotypique d’équilibre est atteinte au maximum en deux générations.La structure génotypique panmictique que nous venons de présenter relativement aux deux locus à 2 allèles chacun semble indiquer que les allèles d’un locus donné, par exemple A1 et A2, s’associent au hasard à ceux de l’autre locus B1 et B2. En réalité il n’en est pas toujours ainsi car il peut arriver que des allèles de gènes différents ne s’associent pas au hasard.

II-4-1 Notion de déséquilibre de liaison

Quand les allèles de gènes différents s’associent au hasard, la fréquence d’un gamète portant une combinaison particulière d’allèles est égale au produit des fréquences de ces allèles. Dans ce cas, pour notre exemple à deux locus, les quatre types de gamètes et leurs fréquences seraient pnrn A1B1 ; pnsn A1B2 ; qnrn A2B1 et qnsn A2B2.

45

Page 47: Cours de Génétique Des Populations_ECUE1

Les gènes qui sont associés au hasard sont dits en équilibre de liaison et les gènes non associés au hasard sont dits en déséquilibre de liaison.

II-4-2 Expression formalisée du déséquilibre de liaison

Pour faciliter la compréhension de ce qui va suivre, désignons maintenant les fréquences de A1 et A2 par et respectivement, et les fréquences de B1 et B2

par et respectivement à une génération quelconque Gn. Parmi les quatre combinaisons gamétiques possibles A1B1, A1B2, A2B1 et A2B2 que peut produire un individu hétérozygote pour les deux gènes, considérons l’une d’entre elles (par exemple A1B1) et raisonnons :Si nous désignons par la fréquence réelle du gamète A1B1, deux situations peuvent se présenter :- Soit que les allèles des deux gènes s’associent au hasard (équilibre de liaison), et alors nous aurons = x  ;- Soit que les allèles des deux gènes ne s’associent pas au hasard (déséquilibre de liaison), et nous aurons dans ce cas = x ±DSi nous admettons arbitrairement que la fréquence réelle de A1B1 est :A1B1 = = x + D, alors D = – x

Le paramètre D ainsi défini est appelé déséquilibre de liaison de la population pour les deux locus considérés. Il représente donc un écart à l’association aléatoire des allèles de deux gènes différents. La connaissance des fréquences alléliques et du paramètre D suffit donc au calcul des fréquences gamétiques dans la population. Déterminons donc les fréquences des trois autres combinaisons gamétiques.

Pour la Combinaison A 1B2 :Pour calculer la fréquence des gamètes A1B2, il suffit de se rappeler que l’en-semble des gamètes portant A1 est en fréquence  ; donc :

Pour la Combinaison A 2B1 :Le même raisonnement nous permet d’écrire que :

46

Page 48: Cours de Génétique Des Populations_ECUE1

Pour la Combinaison A 2B2 :De même nous pouvons écrire que :

Il faut faire remarquer que le signe du paramètre D est une question de convention et il est donc sans importance. Ce paramètre est aussi appelé déséquilibre gamétique puisqu’il est défini à partir des fréquences gamétiques.Par ailleurs, nous concevons intuitivement que le déséquilibre de liaison puisse être maximal lorsque la connaissance d’un allèle à un locus permet de prédire à coup sûr l’allèle de l’autre locus auquel il sera associé ; en d’autres termes, le paramètre D est maximal lorsqu’il n’existe dans la population que deux des quatre combinaisons gamétiques pour les deux gènes ; par exemple lorsqu’il n’existe que A1B1 et A2B2 ou A1B2 et A2B1.

Dans ce cas

Le paramètre D fluctue entre et ( ≤ D ≤ ) selon que les gamètes

représentés sont A1B1 et A2B2 ou A1B2 et A2B1

II-4-3 Evolution du déséquilibre de liaison sous les restrictions de HARDY-WEINBERG

Quand une population est sous les restrictions de H-W, l’équilibre de liaison entre les gènes finit par être atteint. Cependant, cet équilibre de liaison est atteint progressivement, et parfois très lentement. A1A2B1B2

47

Page 49: Cours de Génétique Des Populations_ECUE1

L’équilibre de liaison est atteint avec une vitesse qui dépend des proportions relatives

des divers types de gamètes qui peuvent être produits par un individu hétérozygote

aux deux locus. En effet, celui-ci, s’il est de génotype , produira des gamètes

parentaux A1B1 et A2B2 ainsi que des gamètes recombinés A1B2 et A2B1. Si au

contraire son génotype est , il fabriquera des gamètes parentaux A 1B2 et A2B1

ainsi que des gamètes recombinés A1B1 et A2B2.

Si nous désignons le taux de recombinaison entre les deux gènes par le paramètre r,

alors nous savons que chaque gamète parental a pour fréquence et chaque

gamète recombiné la fréquence . Le paramètre r est < 1 et compris entre 0 et 0,5

(0 ≤ r ≤ 0,5). Le taux de recombinaison entre deux gènes dépend de la position des gènes sur le chromosome. S’ils se trouvent sur des chromosomes différents, le taux de recombinaison r =0,5 ; ce qui signifie que les quatre types de gamètes sont produits en proportions égales. Si les deux gènes sont sur le même chromosome, le taux de recombinaison dépend de la distance qui les sépare.Dans ce cas r =0 si les deux gènes sont très proches l’un de l’autre au point qu’ils ne peuvent recombiner par crossing-over et r = 0,5 si les deux gènes sont très éloignés l’un de l’autre au point qu’ils ont autant de chance de recombiner que de ne pas recombiner.Le taux de recombinaison entre les gènes est un paramètre important en génétique des populations parce que la vitesse avec laquelle l’équilibre de liaison est atteint dépend de sa valeur. Pour mieux percevoir l’effet de la recombinaison sur l’approche de l’équilibre de liaison, raisonnons à partir du modèle suivant :Soit une population fondatrice (population à la génération de départ = G0) dans laquelle il existe un déséquilibre de liaison D0. Considérons dans cette population le même modèle à deux locus avec deux allèles chacun comme précédemment. Toutes les hypothèses de H-W étant satisfaites, les fréquences géniques resteront constantes au cours des générations. Mais qu’en sera-t-il du déséquilibre de liaison ?Prenons la combinaison gamétique A1B1 et suivons l’évolution de sa fréquence au cours du temps.A la génération gamétique Gn, la fréquence réelle de ce gamète est . Ce gamète peut avoir été produit à la suite de deux évènements qui s’excluent mutuellement : - Soit que A1B1 a été produit parce que le chromosome portant les deux gènes n’a pas subi de recombinaison (probabilité = 1 - r) ; dans ce cas parmi les chromosomes de cette nature la fréquence de A1B1 est la même que dans la génération précédente

48

A1 B1

A2 B2

A1 B2

A2 B1

Page 50: Cours de Génétique Des Populations_ECUE1

( ). Donc la probabilité pour que le gamète A1B1 soit produit de cette

manière = (1 - r) ( ).

- Soit que A1B1 a été produit parce que le chromosome portant les deux gènes a subi

une recombinaison (probabilité = r) ; dans ce cas parmi les chromosomes de cette

nature la fréquence de A1B1 est simplement égale à la fréquence des génotypes

dans la génération précédente et cette fréquence est égale à

car les croisements se font au hasard (le point d’interrogation en indice signifie

n’importe quel allèle du gène). Donc la probabilité pour que le gamète A1B1 soit

produit de cette deuxième manière = (voir encadré ci-dessous).

49

A1 B?

A? B1

Page 51: Cours de Génétique Des Populations_ECUE1

50

Page 52: Cours de Génétique Des Populations_ECUE1

Finalement, à la génération gamétique Gn, la fréquence du gamète

.

Pour suivre l’évolution du déséquilibre de liaison au cours des générations, résolvons cette équation de la manière suivante : On peut donc écrire que :

En multipliant les termes de chaque côté de l’égalité on obtient ou la

relation de Li. Comme 1 - r < 1, (1 - r)n tend alors vers zéro quand n devient grand, mais la vitesse avec laquelle (1 - r)n tend vers zéro dépend de r ; plus r est proche de zéro, plus la vitesse est lente (figure 6)

Remarque :En terme de fréquences gamétiques, le paramètre D satisfait à la relation

. L’équilibre est atteint pour D = 0. Dans la plupart des populations naturelles d’organismes sexués sauf en cas de consanguinité élevée, provoquée par l’autofécondation par exemple, les valeurs de D sont typiquement zéro ou proches de zéro (indiquant un équilibre de liaison) à moins que les gènes ne soient liés de façon très proche.

51

Page 53: Cours de Génétique Des Populations_ECUE1

Figure 6 : Cas de deux loci. Evolution vers l’état d’équilibre. L’écart initial à l’équilibre (D) diminue au cours des générations. Cette évolution est fonction du pourcentage de recombinaison (r) entre les deux loci étudiés.

52

Page 54: Cours de Génétique Des Populations_ECUE1

II-4-4 Les causes possibles d’un déséquilibre de liaison

Certains facteurs peuvent être à l’origine d’un déséquilibre gamétique :1) Si une population donnée provient d’un mélange récent d’au moins deux

autres populations qui avaient des compositions gamétiques très différentes, celle-ci sera le siège de déséquilibres de liaison qui disparaîtront progressive-ment.

2) La sélection gamétique peut aussi induire des déséquilibres de liaison. On conçoit intuitivement que ce puisse être le cas si, par exemple les combinai-sons A1B1 et A2B2 sont meilleures aux combinaisons A1B2 et A2B1.

3) Le phénomène de l’"auto-stop génique" peut conduire aussi à des déséqui-libres de liaison (un gène défavorable peut quand-même se reprendre dans une population s’il est fortement lié à un autre gène très favorable).

4) Le simple hasard dans une population d’effectif limité peut induire aussi des déséquilibres de liaison.

II-5 Les Conséquences de la Loi de HARDY-WEINBERG

II-5-1 Détermination de la fréquence des gènes récessifs

Lorsque les hypothèses de HARDY-WEINBERG sont satisfaites dans une population (donc une population panmictique en équilibre), la fréquence des individus de phénotype récessif permet de déduire la fréquence de l’allèle récessif dans cette population. Par exemple, nous savons que chez l’homme l’albinisme est un phénotype lié à une mutation récessive. Si dans une population donnée 1 individu sur 10 000 est albinos, la fréquence du gène albinos se détermine de la façon suivante :Soit a le gène albinos et q sa fréquence ; sous les hypothèses de HARDY-WEINBERG :

53

Page 55: Cours de Génétique Des Populations_ECUE1

II-5-2 Détermination de la fréquence des types de croisements et de la fréquence des génotypes dans leurs progénitures

Considérons l’exemple d’un locus autosomique à deux allèles A1 et A2 de fréquences respectives p et q. la structure génotypique d’une population diploïde en équilibre panmictique est p2A1B1, 2pqA1A2 et q2A2A2. Dans le tableau III nous indiquons tous les types de croisements possibles et la structure génotypique de leurs progénitures en conditions de panmixie.

Tableau III : Fréquences des types de croisements et fréquences des génotypes dans leurs progénitures dans une population en équilibre panmictique.

Les types de croisements

Fréquences des types de croisements

Fréquence des génotypes dans les progénitures

A1A1 A1A2 A2A2

A1A1 x A1A1 p2 x p2 = p4 P4 0 0A1A1 x A2A2 2 (p2 x q2) = 2p2q2 0 2p2q2 0A1A1 x A1A2 2(p2 x 2pq) = 4p3q 2p3q 2p3q 0A2A2 x A2A2 q2 x q2 = q4 0 0 q4

A2A2 x A1A2 2(q2 x 2pq) = 4pq3 0 2pq3 2pq3

A1A2 x A1A2 2pq x 2pq = 4p2q2 p2q2 2p2q2 p2q2

Σ (p2 + 2pq + q2)2 = 1 p2 2pq q2

III- LE MODELE DE L’HOMOGAMIE

L’homogamie est un système de croisement couramment utilisé en sélection animale et végétale. Chez les animaux, l’insémination artificielle se pratique après un choix préférentiel des géniteurs à partir de critères bien définis. Chez les végétaux on observe la même tendance car la production d’hybrides se fait après un choix phénotypique des parents.L’homogamie étant un système de croisement non panmictique, les fréquences génotypiques seront modifiées au cours des générations contrairement aux fréquences alléliques qui continueront de rester constantes. En effet, par rapport aux conditions de la loi de HARDY-WEINBERG, seul le système de croisement change ici mais les autres conditions restent satisfaites.

54

Page 56: Cours de Génétique Des Populations_ECUE1

III-1 L’homogamie génotypique positive totale

L’homogamie génotypique est possible lorsque, pour un locus à deux allèles, la distinction phénotypique des trois génotypiques possibles est aisée (cas d’allèles codominants). Dans le cas d’allèles dominants, cela devient pratiquement impossible.L’homogamie génotypique positive totale s’observe dans les populations de plantes autogames strictes comme c’est le cas chez les plantes cléistogames (dont la fleur ne s’ouvre pas à maturité).

III-1-1. Etude d’un cas particulier

Considérons le modèle d’un locus autosomal à deux allèles codominants A 1 et A2. Admettons que la population fondatrice (G0) n’est constituée que d’individus hétérozygotes A1A2. Sous l’homogamie génotypique positive totale (HGPT) la

première génération (G1) sera constituée de .

A la deuxième génération (G2), chaque génotype se croisant toujours par lui-même, nous aurons :

Finalement la population G2 sera constituée de . De cette

évolution des fréquences génotypiques, nous déduisons que la fréquence des

hétérozygotes à la nième génération (Gn) que nous désignerons par Hn est égale à .

On s’aperçoit intuitivement que --> zéro quand n augmente (n --> ∞). On en

conclut que l’homogamie génotypique positive totale est un système de croisement très efficace pour éliminer les génotypes hétérozygotes d’une population.

III-1-2 Etude d’un cas général avec coefficient de corrélation gamétique

55

Page 57: Cours de Génétique Des Populations_ECUE1

Considérons deux allèles A1 et A2, de fréquences p et q, d’un locus autosomal dans une population d’organisme diploïde. Attribuons aux gamètes la valeur arbitraire 1 ou 0, selon qu’ils apportent l’allèle A1 ou A2. Appelons g et g’ les deux gamètes qui s’unissent pour former un zygote. Le coefficient de corrélation gamétique s’écrit :

Ce coefficient est classiquement estimé par l’expression :

Vérifions que dans le cas de la panmixie, ce coefficient est nul. A1 → 1 et A2 → 0 ===>

Pour les 3 génotypes diploïdes nous aurons :A1A1 → g =1 ; g’ = 1 et fréquence = p2

A1A2 → g = 1 ; g’ = 0 et fréquence = 2pqA2A2 → g = 0 ; g’ = 0 et fréquence = q2

Le numérateur de est donc :

Le dénominateur de étant positif, est évidemment nul.Dans un système de croisement non panmictique, les deux tirages de gamètes nécessaires pour réaliser un génotype ne sont plus indépendants. On peut alors représenter cette situation par un modèle où les zygotes formés résultent soit d’un choix entre les gamètes (probabilité C), soit d’une rencontre au hasard de ces gamètes (probabilité 1 - C). On démontre que c est identique à la valeur absolue du coefficient de corrélation gamétique . dans le cas de l’homogamie positive et de la

56

Page 58: Cours de Génétique Des Populations_ECUE1

consanguinité, on peut écrire C = , avec > 0 ; c représente exactement ici le coefficient de corrélation gamétique. Dans le cas de l’homogamie négative, on aura C = - , avec < 0.Puisque nous nous trouvons dans le cas de l’homogamie génotypique positive totale, établissons la structure génotypique d’une population soumise à un tel régime de croisement. Choisissons l’un quelconque des trois génotypes (par exemple A1A1) et raisonnons :A une génération quelconque que nous noterons Gn, avec un coefficient de corrélation gamétique de la population = Cn, la probabilité de réalisation du génotype A1A1 a deux origines exclusives :

1) Un gamète portant A1 (qui a une probabilité p dans la population des gamètes) s’unira obligatoirement avec un gamète A1 (probabilité Cn) ; cette éventualité a donc une probabilité Cnp de se produire.

2) Un gamète portant A1 (probabilité p) s’unira au hasard (probabilité 1 - Cn) à un autre gamète A1 (probabilité p) ; cette éventualité a une probabilité (1 - cn)p2

de se produire.Finalement la probabilité de réalisation de A1A1 est égale à :Cnp + (1 - Cn)p2 = p2 + Cnpq.Un raisonnement analogue nous conduit à la probabilité de réalisation de A2A2 = Cnq + (1 - cn)q2 = q2 + Cnpq.Quant au génotype A1A2, sa réalisation ne peut provenir que de la rencontre au hasard (probabilité 1 - Cn) des gamètes A1 (probabilité p) et A2 (probabilité q) ; d’où la probabilité de A1A2 = 2pq (1 - Cn).La structure génotypique de la population à Gn est donc :

Cette formulation montre parfaitement les écarts par rapport à l’équilibre de HARDY-WEINBERG. Pour suivre l’évolution des fréquences génotypiques de la population au cours des générations sous l’homogamie génotypique positive totale, désignons par Dn, Hn et Rn les fréquences relatives des génotypes A1A1, A1A2 et A2A2 à Gn, et par Dn+1, Hn+1 et Rn+1 les fréquences de ces mêmes génotypes à la génération suivante (Gn+1). Sous ce régime de reproduction, les relations qui lient les fréquences des génotypes de Gn à celles des génotypes de Gn+1 sont :

57

Page 59: Cours de Génétique Des Populations_ECUE1

En remplaçant les termes par leurs valeurs nous avons :

Les fréquences géniques p et q restant constantes au cours des générations, l’évolution de la structure génotypique de la population ne dépend que de l’évolution du paramètre c. il suffit donc d’établir une relation entre Cn et Cn+1 pour voir comment évoluent les fréquences génotypiques sous l’homogamie génotypique positive totale. Pour cela, raisonnons à partir de l’un des 3 génotypes, soit A1A1 par exemple :

En résolvant cette équation on obtient :

Pour voir comment évolue c, on détermine l’écart

A l’équilibre,

On peut écrire ( est la valeur du coefficient de corrélation

gamétique à l’équilibre).

58

Page 60: Cours de Génétique Des Populations_ECUE1

 ; donc sous l’homogamie génotypique positive totale,

la structure génotypique de la population évolue vers un état d’équilibre caractérisé par C = 1.La structure génotypique d’équilibre sous ce régime de reproduction est :

Ainsi, si une population initiale (n = 0) était panmictique (C0 = 0) et si l’homogamie génotypique positive totale est alors pratiquée de manière irréversible, à terme, la population ne comprendra que les génotypes homozygotes. Le tableau IV donne la variation du coefficient de corrélation gamétique au cours des générations dans une telle population et la figure 7 la vitesse d’élimination des hétérozygotes.

Figure 7 : Homogamie total. Vitesse d’élimination des hétérozygotes Dans le cas de l’homogamie phénotypique positive total. Dans le cas de l’homogamie génotypique positive totale

59

Page 61: Cours de Génétique Des Populations_ECUE1

Tableau IV : Variation du coefficient de corrélation gamétique dans une population initialement panmictique et soumise à une homogamie génotypique positive totale.

Générations 0 1 2 3 4 5 - - - n - - -

C C0 C1 C2 C3 C4 C5 - - - Cn - - - C

Valeurs de C 0 - - - 1 - - - - 1

III-2 L’homogamie génotypique positive partielle de taux ε (HGPP)

On étudie ici une population de structure génotypique semblable à la précédente mais en supposant qu’une fraction ε se reproduit par homogamie et donc une fraction (1- ε) par panmixie.En raisonnant comme précédemment, on peut établir les récurrences suivantes pour les fréquences des trois génotypes :

La composante panmictique de la fréquence de chaque génotype est donnée par

, et . Contrairement au

régime de reproduction précédent, ici les hétérozygotes ne sont pas totalement éliminés à l’équilibre. En effet, si nous désignons par la fréquence des hétérozygotes à l’équilibre, on aura :

Etudions l’écart à l’équilibre. Soit  :

60

Page 62: Cours de Génétique Des Populations_ECUE1

Il apparaît ainsi une récurrence qu’on peut résoudre de la manière suivante :

En multipliant les termes de chaque côté de l’égalité, on obtient :

Il existe donc dans le cas de l’homogamie génotypique positive partielle un état d’équilibre pour le quel la fréquence des hétérozygotes est différente de zéro, mais plus faible que dans une population totalement panmictique (figure 8).En remarquant que où désigne le coefficient de corrélation gamétique de la population à l’équilibre, on établit :

La structure génotypique à l’état d’équilibre d’une population soumise à une homogamie génotypique positive partielle de taux ε est donc :

61

Page 63: Cours de Génétique Des Populations_ECUE1

Figure 8 : Homogamie partielle. Evolution vers l’état d’équilibre pour différents taux d’homogamie (Ɛ).

Dans le cas de l’homogamie phénotypique positive partielle. Dans le cas de l’homogamie génotypique positive partielle

62

Page 64: Cours de Génétique Des Populations_ECUE1

Exercice de TD :

Démontrez qu’on peut obtenir encore en établissant la relation de

récurrence qui lie les coefficients de corrélation gamétique de deux générations successives, puis en calculant la valeur de C qui annule (c’est-à-dire ).

III-3 L’homogamie phénotypique positive totale

III-3-1 Etude d’un cas particulier

Considérons le même modèle d’un locus autosomal à deux allèles A1 et A2, avec cette fois A1 dominant sur A2, dans une population d’organisme diploïde. A une génération de départ G0, admettons que cette population est composée de 100% d’hétérozygotes A1A2. Etudions alors l’évolution d’une telle population si elle est soumise systématiquement à une homogamie phénotypique positive.La structure génotypique de la population après une génération de reproduction (G1)

est :

Au plan phénotypique, la G1 est composée de . Pour

déterminer les structures génotypique et phénotypique de la population à G2, il faut réaliser qu’on a deux types de croisements :

Contribution de à la structure de G2

Pour savoir l’apport de ce type de croisement à G2, il est judicieux de déterminer la composition gamétique dans la sous-population [A1] de G1. Pour cela, il faut se

rappeler que dans de G1 nous avons A1A1 et A1A2 ; d’où la fréquence des

gamètes portant A1 dans [A1] de G1 est égale à ( + x ) = et la fréquence des

gamètes portant A2 dans [A1] de G1 est égale à . La contribution des croisements

[A1] X [A1] à la structure de G2 s’obtient en faisant :

63

Page 65: Cours de Génétique Des Populations_ECUE1

Contribution de à la structure de G2

Les croisements [A2] X [A2] donnant 100% de A2A2, leur contribution à G2 est égale à

.

En définitive, en faisant le bilan des deux apports, les structures génotypique et phénotypique de la population à G2 seront :

Pour passer de G2 à G3 on tient le même raisonnement et on montre ainsi que G3 est

composée de .

Dans ce cas particulier, si nous désignons par Hn la fréquence des hétérozygotes à

une génération quelconque Gn, nous aurons la relation de récurrence

Comme l’homogamie génotypique positive totale, l’homogamie phénotypique positive totale conduit inéluctablement à l’élimination des hétérozygotes mais avec une vitesse beaucoup plus lente (fig.7)Dans l’exemple du cas particulier que nous venons de considérer dans ces deux modes de croisement, à G10 (n = 10), nous aurons, dans le premier cas,

, et dans le deuxième,

III-3-2 Etude du cas général avec coefficient de corrélation gamétique

Considérons une population diploïde ayant initialement (à G0) une structure totalement panmictique p2A1A1, 2pqA1A2 et q2A2A2. En admettant A1 dominant sur A2, la structure phénotypique panmictique de cette population est :[A1] = p2 + 2pq = p (1+q)[A2] = q2

64

Page 66: Cours de Génétique Des Populations_ECUE1

Si à partir de G0 cette population est soumise systématiquement à une homogamie phénotypique positive totale, sa structure génotypique et phénotypique à une génération quelconque (Gn) sera :

Avec p et q représentant les fréquences de A1 et A2 respectivement, et Cn le coefficient de corrélation gamétique de la population à Gn. on peut simplifier la fréquence du phénotype dominant [A1] et obtenir :[A1] = p2 + Cnpq + (1-Cn) 2pq = p2-Cnpq + 2pq =

= p[p + 2q - Cnq] = p[1 + q - Cnq] = p[1 + q (1 - Cn)]

[A1] = p[1 + q(1 - Cn)]

Pour déterminer la structure génotypique de la population à Gn+1, il faut déterminer l’apport des croisements [A1] X [A1] d’une part, et celui des croisements [A2] X [A2] d’autre part.

Contribution des croisements [A1] X [A1] à la structure de Gn+1

Dans [A1] de Gn, les fréquences génotypiques sont :

Si nous désignons par p’ et q’ les fréquences des gamètes portant A1 et des gamètes portant A2 respectivement dans la sous-population [A1] de Gn, nous aurons :

La contribution des croisements [A1] X [A1] dans la structure génotypique finale de Gn+1 est donc :

65

Page 67: Cours de Génétique Des Populations_ECUE1

Contribution des croisements [A2] X [A2] à la structure de Gn+1

Ces croisements donnant 100% de génotypes A2A2, leur contribution à Gn+1 est [q2 + Cnpq] x 100% = (q2 + Cnpq) A2A2

En faisant le bilan des contributions des deux types de croisements, la structure génotypique de la population à Gn+1 est :

Pour suivre l’évolution de la structure génotypique de la population sous l’homogamie phénotypique positive totale avec coefficient de corrélation gamétique, il suffit d’établir une relation de récurrence entre les coefficients de corrélation gamétique de deux générations successives. Pour cela, considérons par exemple le génotype hétérozygote A1A2 ; à Gn+1, sa fréquence peut s’écrire :

66

Page 68: Cours de Génétique Des Populations_ECUE1

Pour déterminer la valeur de c à l’équilibre, calculons .

A l’équilibre, ( est la valeur du coefficient de corrélation gamétique à l’équilibre).

 ; le numérateur de s’annule pour .

La structure génotypique de la population à l’état d’équilibre sera donc :

Détermination de la fréquence des hétérozygotes à une génération donnée sous l’homogamie phénotypique positive totale

Cela revient à déterminer Hn ; or nous avions déjà établi que :

67

Page 69: Cours de Génétique Des Populations_ECUE1

Pour résoudre cette récurrence, on additionne les termes de chaque côté de l’égalité et on obtient :

(Fig. 7)

Exercice de TD :Soit une population initialement panmictique avec deux allèles A1 et A2 à un locus autosomal, ayant les fréquences respectives p = 0,7 et q = 0,3. Quelle est la fréquence des hétérozygotes dans cette population après 10 générations de reproduction par homogamie phénotypique positive totale ?

68

Page 70: Cours de Génétique Des Populations_ECUE1

III-4 L’homogamie phénotypique positive partielle de taux ε

Si nous gardons le même modèle génétique que dans le cas précédent, à une génération quelconque (Gn), la structure génotypique d’une population soumise à une homogamie phénotypique positive partielle de taux ε sera :

A la génération suivante (Gn+1) la structure génotypique de la population sera la suivante :

Pour étudier la variation du coefficient de corrélation gamétique en vue de déterminer la structure génotypique de la population à l’équilibre, raisonnons à partir du génotype hétérozygote de Gn+1.Nous savons qu’à Gn+1, la fréquence de A1A2 est aussi égale à (1 - Cn+1)2pq d’où :

En remplaçant p’, q’ et [A1] par leurs valeurs (voir paragraphe précédent), on obtient :

69

Page 71: Cours de Génétique Des Populations_ECUE1

On remarque que la relation de récurrence de C est la même que pour l’homogamie phénotypique positive totale, multipliée par le taux ε d’homogamie de la population.Etablissons alors la variation de ce coefficient :

Le dénominateur de étant ici toujours positif, son signe dépend de celui du numérateur.Pour Cn = 0, le numérateur est égal à εq, donc positif.Pour Cn = 1, le numérateur est égal à ε-1, donc négatif.Il existe alors une valeur de Cn qui annule , et qui correspond à une valeur d’équilibre pour la population. Cette valeur d’équilibre du coefficient de corrélation gamétique sera fournie par la racine comprise entre 0 et 1 de l’équation du second degré en  :

A l’équilibre, les fréquences de chaque génotype seront :

L’homogamie phénotypique positive partielle n’est donc pas un obstacle au maintien du polymorphisme dans les populations (fig. 8).

IV- LE MODELE DE L’ENDOGAMIE OU CONSANGUINITE

IV-1 Position du problème

Une union est dite endogame ou encore consanguine lorsque les ancêtres sont communs aux deux conjoints. La notion de consanguinité est donc une notion relative. Elle se réfère à l’existence d’ancêtres communs dans les quelques générations précédentes.Nous verrons que l’influence des ancêtres communs éloignés est négligeable.

70

Page 72: Cours de Génétique Des Populations_ECUE1

La consanguinité peut être une conséquence automatique de la faiblesse de l’effectif d’une population.Elle peut être liée aussi au faible pouvoir de déplacement des individus (consanguinité de position chez les escargots). Elle est régulière dans certaines espèces (espèces autofécondées chez les plantes). Elle est évitée ou au contraire recherchée pour des raisons religieuses ou économiques dans l’espèce humaine.

IV-2 Coefficient de consanguinité individuel f ou coefficient de parenté.

Le fait qu’un individu I soit issu d’une union consanguine a pour conséquence que les deux gènes allèles qu’il porte à un locus peuvent être les copies d’un même gène présent chez un ancêtre commun, copies qui lui ont été transmises l’une par son père, l’autre par sa mère. On dit alors que ces deux allèles sont "identiques par hérédité".Tout individu I issu d’une union consanguine peut être caractérisé par un coefficient de consanguinité individuel (fI) qui est égal à la probabilité que deux de ses gènes allèles soient identiques par hérédité.Autrement dit, ce coefficient est égal à la proportion de ses locus où il possède deux allèles identiques par hérédité.Deux individus P et M sont dits apparentés si et seulement s’ils ont au moins un ancêtre commun.Un individu consanguin est donc un individu qui est né d’une union entre apparentés.La probabilité que 2 individus apparentés aient 2 gènes identiques par hérédité (plus précisément lorsqu’on en tire au hasard un chez chacun) est appelé coefficient de parenté de ces 2 individus. Ce coefficient a été défini pour la première fois par MALECOT en 1948. Le coefficient de parenté de deux individus P et M est noté ФPM.

Si P et M sont les parents directs de I, alors ФPM = fI.

Estimation de fI

Considérons la généalogie suivante :

71

Page 73: Cours de Génétique Des Populations_ECUE1

I est issu d’une union consanguine puisque ses parents P et M ont un ancêtre commun A. Soient e1 et e2 les deux allèles de I à un locus quelconque, a1 et a2 les deux allèles de A à ce même locus. Quelle est la probabilité que e1 et e2 proviennent de A ?Soit e1 l’allèle transmis à I par P. Il y a une chance sur 2 qu’il provienne de C, 1 sur 4 de B et 1 sur 8 de A. De même il y a une chance sur 2 que e 2 transmis à I par M provienne de D et 1 sur 4 qu’il provienne de A.

La probabilité que e1 et e2 proviennent de A est donc . Plus

généralement, elle est égale à , ‘n’ étant le nombre de maillons de la chaîne qui

relie P à M en passant par A.

Ceci étant, quelle est la probabilité que e1 et e2 soient identiques par hérédité ? ou

bien e1 et e2 sont l’un et l’autre des copies de a1 (probabilité = ), ils sont forcément

identiques (probabilité = 1).

Ou bien l’un est une copie de a1, l’autre de a2 (probabilité = ). La probabilité qu’ils

soient identiques par hérédité est par définition fA, coefficient de consanguinité individuel de A.La probabilité, si e1 et e2 provenant de A, soient identiques par hérédité est donc :

72

Page 74: Cours de Génétique Des Populations_ECUE1

En définitive, il faut que les 2 allèles homologues d’un locus que I a reçus de P et M

proviennent d’abord de A (probabilité = ) et qu’ils soient en plus identiques

(probabilité = ) pour estimer le coefficient de consanguinité individuel de I.

Finalement :

Si A n’est pas issu d’une union consanguine, alors . On a alors .

Si P et M ont plusieurs ancêtres communs, f I est la somme des termes correspondant à chaque ancêtre :

Remarques : (important)

1- Si on a plusieurs voies P-A-M par lesquelles P et M ont pu recevoir 2 gènes identiques de A, il faut en tenir compte dans le calcul de fI.

On appelle chaîne de parenté la voie P-A-M par laquelle deux gènes identiques de A sont transmis à P et M.2- Une chaîne de parenté relie toujours les 2 parents de I en passant par l’ancêtre commun.3- Une chaîne de parenté change une seule fois de direction dans l’échelle des temps au niveau de l’ancêtre commun.4- Une chaîne de parenté ne peut pas passer deux fois par le même individu.5- Deux chaînes de parenté sont différentes dès qu’elles ont au moins un maillon différent.

Exemple 1 :Calcul du coefficient de consanguinité individuel d’un enfant I de simples cousins germains.

73

Page 75: Cours de Génétique Des Populations_ECUE1

2 des 4 grands parents de I appartenant à la même fratrie, P et M sont cousins germains.Les ancêtres communs à P et M sont A et B.Nous aurons donc :

fI/A : on a une seule chaîne de parenté qui est P-C-A-D-M =>

 ; en admettant que A n’est pas consanguin, on a

d’où

fI/B : On a une seule chaîne de parenté qui est P-C-B-D-M =>

 ; en admettant que B n’est pas consanguin, on a

d’où

Finalement,  

Conclusion : 1 locus sur 16 pris au hasard sera identique par hérédité

Exemple 2 :Calcul du coefficient de consanguinité individuel d’un enfant I issu d’une famille représentée par la généalogie suivante :

74

Page 76: Cours de Génétique Des Populations_ECUE1

Les ancêtres communs de P et M sont E, F et G

fI/E : On a 2 chaînes de parenté qui sont P-H-F-E-G-J-M et P-H-G-E-F-J-M

E étant consanguin,

fI/F : On a une seule chaîne de parenté qui est P-H-F-J-M.

fI/G : on a une seule chaîne de parenté qui est P-H-G-J-M :

75

Page 77: Cours de Génétique Des Populations_ECUE1

Finalement,

EXERCICE DE TD :Calculez le coefficient de consanguinité individuel d’un enfant I dont les parents P et M sont double cousins germains.

IV-3 Détermination des fréquences génotypiques dans la descendance d’un croisement consanguin

Considérons dans une certaine population d’organisme diploïde un locus autosomal à deux allèles e1 et e2 dont les fréquences sont p et q respectivement (p + q = 1) Soit fI le coefficient de consanguinité de tout individu issu d’une union consanguine quelconque dans cette population. Si nous considérons la descendance de l’un de ces croisements consanguins, quelle y sera la distribution des 3 génotypes e1e1, e1e2

et e2e2 ?

Prenons par exemple le génotype e1e1 :

Sa formation peut se faire de deux manières qui s’excluent mutuellement :

1) Ou bien les 2 gamètes qui ont fusionné pour donner ce génotype portent des gènes identiques au même locus (probabilité = f I), dans ce cas un seul tirage de gamète suffit (probabilité = p). La probabilité d’avoir e1e1 par cette éventualité est fIxp.

2) Ou bien les 2 gamètes qui ont fusionné pour donner e1e1 portent des gènes non identiques au même locus (probabilité = 1 - fI), dans ce cas deux tirages de gamètes sont nécessaires (probabilité = p2). La probabilité d’avoir ce génotype par cette deuxième éventualité est égale à (1 - fI)p2.Finalement, la fréquence de e1e1 dans la descendance de l’union consanguine considérée est : e1e1 = p2(1 - fI) + fIp = p2 + fIpq.Un raisonnement analogue nous permet de déterminer les fréquences des deux autres génotypes :e1e2 = (1 - fI)2pqe2e2 = q2(1 - fI) + fIq = q2 + fIpq

76

Page 78: Cours de Génétique Des Populations_ECUE1

IV-4 L’indice de fixation

En gardant le même modèle génétique d’un locus autosomal à 2 allèles e1 et e2, appelons H la fréquence réelle des hétérozygotes e1e2 dans la population. Si pour ce locus les croisements se font au hasard dans la population, la fréquence des génotypes hétérozygotes devrait être 2pq selon la loi de HARDY-WEINBERG, mais pour généraliser, nous appellerons Ht l’hétérozygotie obtenue pour les croisements au hasard. On définit l’indice de fixation ou coefficient de consanguinité de la

population par la relation

En termes biologiques, F mesure la diminution de l’hétérozygotie par rapport à une population de mêmes fréquences alléliques où les croisements se font au hasard.Comme Ht = 2pq, la fréquence réelle des génotypes hétérozygotes dans la population consanguine peut s’exprimer en fonction de F soit :

H = Ht - HtF = Ht(1 - F) = 2pq(1 - F).

On peut aussi déterminer les fréquences des génotypes homozygotes e1e1 et e2e2 en fonction de F. Supposons que la fréquence réelle du génotype e1e1 soit D. Comme la

fréquence de e1 = p, nous devons avoir . Or H = (1 – F)2pq, donc

De même, si nous désignons par R la fréquence réelle de e2e2, nous obtenons :

R = q2 + Fpq

Ainsi, on peut exprimer la structure génotypique d’une population consanguine en fonction des fréquences alléliques et du coefficient de consanguinité F de la population :

77

Page 79: Cours de Génétique Des Populations_ECUE1

La structure génotypique de la population ainsi définie est appelée structure de Wright. Quelle que soit la structure génotypique d’une population, elle peut toujours se mettre sous cette forme :

(1 - F)(p2 + 2pq + q2) + F(p+q)

Si dans une population donnée on admet que la consanguinité est le seul facteur qui

induit l’écart par rapport à la structure de HARDY-WEINBERG, alors  ;

Yi = fréquence des individus de la population ayant un coefficient de consanguinité individuelles fi.

IV-5 Les effets de la consanguinité

L’effet principal de la consanguinité est la diminution de l’hétérozygotie au profit de l’homozygotie. Dans les populations totalement consanguines, l’hétérozygotie est très faible, voire nulle. C’est ce qu’on observe dans les populations d’espèces autogames strictes ou dans les populations issues de croisements frère-sœur sur de nombreuses générations.Nous savons que tous les pools géniques contiennent des allèles récessifs létaux ou semi-létaux.L’augmentation de l’homozygotie due à la consanguinité doit s’accompagner d’une augmentation de la létalité périnatale ainsi que d’une augmentation de la fréquence d’individus peu viables et/ou porteurs de tares plus ou moins graves. C’est ce qu’on observe généralement dans les populations humaines et dans les populations végétales allofécondées soumises à la consanguinité.Pour les populations humaines, on dispose de deux méthodes pour apprécier les effets de la consanguinité :

1) On recense les couples consanguins, on détermine la fréquence des "tarés" parmi leurs descendants puis on la compare à la fréquence observée parmi les descendants d’un lot témoin de couples non consanguins. Le meilleur témoin est constitué par les descendants des frères et sœurs des couples consanguins qui n’ont pas eux-mêmes contracté d’union consanguine et qui sont restés dans les mêmes conditions de milieu.

2) L’autre méthode consiste à recenser les individus tarés et à déterminer la proportion de ceux qui sont issus d’une union consanguine ; cette proportion est

78

Page 80: Cours de Génétique Des Populations_ECUE1

ensuite comparée à celle observée dans l’ensemble de la population. Là encore se pose le problème du choix judicieux de l’échantillon témoin.C’est très probablement cette augmentation de la fréquence d’apparition des tares causées par des gènes récessifs qui est responsable du tabou qui frappe les unions les plus consanguins dans la plupart des sociétés humaines.

Remarque :Dans la mesure où la valeur sélective de l’hétérozygote est supérieure à celle des homozygotes (cf. chapitre 4), un facteur comme la consanguinité qui tend à diminuer le taux d’hétérozygotie est défavorable.

IV-6 Les modes de croisements systématiques

Quand on élève des animaux ou qu’on cultive des plantes, il est souvent intéressant de connaître la rapidité avec laquelle le coefficient de consanguinité s’accroît quand on maintient une lignée avec un mode de croisement systématique comme l’autofécondation (homogamie génotypique positive totale) répétée, les croisements frère-sœur ou les rétrocroisements (back-cross) avec des souches standard. Dans le cas de l’autofécondation, on peut calculer le coefficient de consanguinité de la

population à la génération n(Fn) par la relation : puisqu’on a un seul

maillon et un seul individu dans ce maillon.En faisant apparaître le terme 1 - Fn ou indice panmictique, on obtient :

79

Page 81: Cours de Génétique Des Populations_ECUE1

En multipliant les termes de chaque côté de l’égalité on obtient :

F0 est le coefficient de consanguinité de la population à la génération initiale.

Exemple :Quand F0 = 0 (cas d’une population initiale composée de 100% d’hétérozygotes), on aura :

Beaucoup de plantes parmi lesquelles des plantes cultivées comme le soja, la tomate, le sorgho, l’aubergine, le riz, le blé… se reproduisent par autofécondation prédominante. Chez ces plantes, chaque individu est donc hautement homozygote. On peut donc dire que les espèces de plantes autofécondées sont constituées par la juxtaposition de lignées homozygotes génétiquement distinctes les unes des autres puisque les allèles se fixent ou se perdent au hasard.

80

Page 82: Cours de Génétique Des Populations_ECUE1

Il est très important de faire remarquer que même si l’autofécondation est prédominante chez ces espèces, celle-ci s’accompagne d’un certain taux de reproduction croisée qui assure un flux d’échanges génétiques ainsi que le maintien d’un certain niveau d’hétérozygotie résiduelle.Chez le riz et la tomate, le taux d’allofécondation est de 0,03 ; il est de 0,1 chez le blé et le haricot et de 0,3 chez le tabac et le colza.

Il faut noter, pour terminer avec ce paragraphe, que les croisements frère-sœur conduisent à l’homozygotie moins rapidement que l’autofécondation. Par exemple la fréquence des hétérozygotes à la génération n(Hn) est, dans le cas des croisements

frère-sœur, égale à :  ;

Au lieu de pour l’autofécondation.

La figure 9 présente quelques exemples d’augmentation théorique du coefficient de consanguinité pour les croisements systématiques.

Figure 9 : Augmentation théorique du coefficient de consanguinité F pour des modes systématique de croisement : autofécondation, croisements frère-sœur, croisements demi-frère-sœur et rétrocroisements répétés

81