0100 1101 0101 0101 0101 0100 1010 1010 1000 1011 0101 0010 1010 1110 0011 Structuration des...

45
01001 10101 01010 10101 01001 01010 10100 01011 01010 01010 10111 00011 Structuration des génomes par sélection indirecte de la variabilité mutationnelle Une approche de modélisation et de simulation Carole Knibbe Laboratoire PRISMa Laboratoire BF2I (UMR INRA-INSA 203) 01001 10101 01010 10101 01001 01010 10100 01011 01011 11101 10

Transcript of 0100 1101 0101 0101 0101 0100 1010 1010 1000 1011 0101 0010 1010 1110 0011 Structuration des...

Page 1: 0100 1101 0101 0101 0101 0100 1010 1010 1000 1011 0101 0010 1010 1110 0011 Structuration des génomes par sélection indirecte de la variabilité mutationnelle.

010011010101010101010100101010101000101101010010101011100011

Structuration des génomes par sélection indirectede la variabilité mutationnelle

Une approche de modélisation

et de simulation

Carole Knibbe

Laboratoire PRISMa

Laboratoire BF2I (UMR INRA-INSA 203)

0100110101010101010101001010101010001011010111110110

Page 2: 0100 1101 0101 0101 0101 0100 1010 1010 1000 1011 0101 0010 1010 1110 0011 Structuration des génomes par sélection indirecte de la variabilité mutationnelle.

2

Des génomes structurellement très différents

Homo sapiens

~3 milliards de paires de bases (pb)~25 000 gènes

Neisseria meningitidis (bactérie)

~2 millions de pb~2 000 gènes

Herpes HSV-1 (virus)

~150 000 pb~100 gènes

0 kb 150 kb50 kb 100 kb

0 kb 150 kb50 kb 100 kb

0 kb 150 kb50 kb 100 kb

Zoom sur un segment de 150 000 pb...

Homo sapiens

~3 milliards de pb~25 000 gènes

Page 3: 0100 1101 0101 0101 0101 0100 1010 1010 1000 1011 0101 0010 1010 1110 0011 Structuration des génomes par sélection indirecte de la variabilité mutationnelle.

3

Quels sont les mécanismes évolutifs qui ont façonné ces génomes ?

Génotype :variation(mutations)

Phénotype :sélection

Sélection (indirecte) d’un certain niveau de variation

Biais mutationnels :

« Chez l’Homme, il se produit spontanément plus d’insertions que de délétions, ce qui fait croître le génome »

Coûts sélectifs directs :

« Pour un virus ou une bactérie, un grand génome est désavantageux, donc le génome tend à devenir plus compact »

Influence sur l’organisation du génome ?

Page 4: 0100 1101 0101 0101 0101 0100 1010 1010 1000 1011 0101 0010 1010 1110 0011 Structuration des génomes par sélection indirecte de la variabilité mutationnelle.

4

Problématique biologique

La sélection du niveau de variation peut-elle favoriser un certain type d’organisation du génome ?

Ce mécanisme peut-il réguler la quantité d’ADN non-codant ?

Difficultés expérimentales– Effet à long terme– Effet difficile à isoler

Recours à la modélisation…

Page 5: 0100 1101 0101 0101 0101 0100 1010 1010 1000 1011 0101 0010 1010 1110 0011 Structuration des génomes par sélection indirecte de la variabilité mutationnelle.

5

Enjeu méthodologique

Génotype :variation(mutations)

Phénotype :sélection

Sélection (indirecte) d’un certain niveau

de variation

Algorithmes évolutionnaires (problèmes d’optimisation)

population, sélection

structure du génome, mutations

Modèles neutralistes (évolution de séquences réelles)

structure du génome, mutations

phénotype, sélection

Page 6: 0100 1101 0101 0101 0101 0100 1010 1010 1000 1011 0101 0010 1010 1110 0011 Structuration des génomes par sélection indirecte de la variabilité mutationnelle.

Le modèle aevol

Page 7: 0100 1101 0101 0101 0101 0100 1010 1010 1000 1011 0101 0010 1010 1110 0011 Structuration des génomes par sélection indirecte de la variabilité mutationnelle.

7

Le modèle aevol

fonction biologique

degré de possibilité

Protéome PhénotypeGénome

fonction biologique

degré de possibilité

transcription traduction

interactions protéiques

Optimum environnemental

Capacités fonctionnelles globales

distribution de possibilité de la protéine

m w

H = e.h

Mutations SélectionReproduction

degré de possibilité

fonction biologique

Page 8: 0100 1101 0101 0101 0101 0100 1010 1010 1000 1011 0101 0010 1010 1110 0011 Structuration des génomes par sélection indirecte de la variabilité mutationnelle.

8

Évolution de la population

- mutations ponctuelles- petites insertions- petites délétions

- translocations- inversions- duplications- grandes délétions

W ≈ N . prob(reproduction)

≈ N . f (écart phén.-envir.)

N individus

Initialisation aléatoire

Calcul des phénotypes

Comparaison à l’environnement :

nombres de reproductions

Reproductionsavec mutationsen moyenne,

uL par reproduction

Page 9: 0100 1101 0101 0101 0101 0100 1010 1010 1000 1011 0101 0010 1010 1110 0011 Structuration des génomes par sélection indirecte de la variabilité mutationnelle.

9

Film de l’évolution le long de la lignée « gagnante »

Quelques générations

plus tard…

Acquisition de fonction

par duplication-divergence

Page 10: 0100 1101 0101 0101 0101 0100 1010 1010 1000 1011 0101 0010 1010 1110 0011 Structuration des génomes par sélection indirecte de la variabilité mutationnelle.

10

Atouts de l’approche

Met en jeu simultanément :– une organisation génomique biologiquement interprétable

et libre d’évoluer– l’action de la sélection au niveau du phénotype

Connaissance exhaustive :– des relations de parenté – des séquences ancestrales– des mutations fixées

Code source libre d’accès (C++)

Page 11: 0100 1101 0101 0101 0101 0100 1010 1010 1000 1011 0101 0010 1010 1110 0011 Structuration des génomes par sélection indirecte de la variabilité mutationnelle.

11

Limites

Temps de calcul, taille mémoire

contraintes sur les valeurs des paramètres

Gestion simple de la population

Modélisation abstraite des aspects fonctionnels

Pas d’échelle de temps individuelle– Pas de processus de développement– Pas de régulation– Pas de plasticité phénotypique

Page 12: 0100 1101 0101 0101 0101 0100 1010 1010 1000 1011 0101 0010 1010 1110 0011 Structuration des génomes par sélection indirecte de la variabilité mutationnelle.

Expériences… in silico

Page 13: 0100 1101 0101 0101 0101 0100 1010 1010 1000 1011 0101 0010 1010 1110 0011 Structuration des génomes par sélection indirecte de la variabilité mutationnelle.

13

Perturber la variabilité, observer l’évolution structurelle du génome

Taux de mutationpar paire de bases (u)

Structure du génome(nombre de gènes, quantité de non-codant…)

Poids du gène muté dans le phénotype(aire du triangle)

Nombre de mutations « efficaces » (touchant les gènes)

Impact des mutations « efficaces »

Variabilité globaledu phénotype

?

Page 14: 0100 1101 0101 0101 0101 0100 1010 1010 1000 1011 0101 0010 1010 1110 0011 Structuration des génomes par sélection indirecte de la variabilité mutationnelle.

14

Plan d’expérience

Taux de mutation u : – 6 valeurs testées, entre 5.10-6 et 2.10-4 par paire de bases

Intensité de la sélection c :– 4 valeurs de c testées

3 répétitions pour chaque couple (u, c)

W = nb de reproductions

rang dans la populationmeilleurmoins bon

c = 0,9900 : sélection intense

c = 0,9995 : sélection faible

Page 15: 0100 1101 0101 0101 0101 0100 1010 1010 1000 1011 0101 0010 1010 1110 0011 Structuration des génomes par sélection indirecte de la variabilité mutationnelle.

15

Taux de mutation élevé : 2.10-4 / pb Taux de mutation faible : 5.10-6 / pb

Peu de gènes

Peu de non codant

Beaucoup de gènes

Beaucoup de non codant

Page 16: 0100 1101 0101 0101 0101 0100 1010 1010 1000 1011 0101 0010 1010 1110 0011 Structuration des génomes par sélection indirecte de la variabilité mutationnelle.

16

Taux de mutation (échelle log.)

No

mb

re d

e g

ènes

(éc

hel

le lo

g.)

Taux de mutation (échelle log.)

Qu

anti

té d

e n

on

co

dan

t (é

chel

le lo

g.)

La taille du génome dépend du taux de mutation

bactérie

levure

champignon

3 virus

Données biologiques(Drake, 1991)

Page 17: 0100 1101 0101 0101 0101 0100 1010 1010 1000 1011 0101 0010 1010 1110 0011 Structuration des génomes par sélection indirecte de la variabilité mutationnelle.

17

Sélection indirecte d’un niveau de variabilité constant

Taux de mutation (échelle log.)

Grands génomes

Petits génomes

Prob. de se reproduire à l’identique (Fν)

Page 18: 0100 1101 0101 0101 0101 0100 1010 1010 1000 1011 0101 0010 1010 1110 0011 Structuration des génomes par sélection indirecte de la variabilité mutationnelle.

18

La quantité de non-codant comme levier d’ajustement de la variabilité mutationnelle

Le niveau de variabilité dépend effectivement de la quantité de non-codant

Probabilité que le descendant soit « neutre »

(soit pas de mutation, soit uniquement des mutations neutres)

Probabilité qu’une mutation soit neutre

Page 19: 0100 1101 0101 0101 0101 0100 1010 1010 1000 1011 0101 0010 1010 1110 0011 Structuration des génomes par sélection indirecte de la variabilité mutationnelle.

19

La quantité de non-codant comme levier d’ajustement de la variabilité mutationnelle

Probabilité que le descendant soit « neutre »

Probabilité qu’une mutation soit neutre

Mutations ponctuelles

Inversions

Translocations

Duplications, délétions

Quantité de non-codant (échelle log.) Quantité de non-codant (échelle log.)

A taux de mutation égal,

lorsque l’effet des grandes délétions et duplications est pris en compte,

plus de non-codant = plus de variabilité mutationnelle

Page 20: 0100 1101 0101 0101 0101 0100 1010 1010 1000 1011 0101 0010 1010 1110 0011 Structuration des génomes par sélection indirecte de la variabilité mutationnelle.

20

Intensité de sélection et niveau de variation optimal

Taux de mutation (échelle log.)

Pro

b. d

e se

rep

rod

uir

e à

l’id

enti

qu

e (F

ν)

Sélection intense,W ≈ 10 descendants :

Fν W ≈ 1 desc. identique

Sélection moyenne,W ≈ 2 descendants :

FνW ≈ 1 desc. identique

Taux de mutation (échelle log.)

No

mb

re d

e d

esce

nd

ants

iden

tiq

ues

(F

νW)

Fν est telle que

FνW ≈ 1 descendant neutre

Page 21: 0100 1101 0101 0101 0101 0100 1010 1010 1000 1011 0101 0010 1010 1110 0011 Structuration des génomes par sélection indirecte de la variabilité mutationnelle.

21

Conclusions de l’expérience

La quantité de non-codant…

– augmente la variabilité du phénotype– n’évolue pas « au hasard »– évolue vers une valeur qui permet de produire ~1 descendant neutre

Cela reflète la persistance des lignées qui, simultanément …– sont bien adaptées à l’environnement– transmettent fidèlement leur information génétique (robustesse)– explorent d’autres phénotypes par mutation (« evolvabilité »)

Page 22: 0100 1101 0101 0101 0101 0100 1010 1010 1000 1011 0101 0010 1010 1110 0011 Structuration des génomes par sélection indirecte de la variabilité mutationnelle.

22

Robustesse des conclusions

Autres formes d’environnement

Autres méthodes de sélection

Découplage des taux de mutation

Autre façon de choisir les bornes des réarrangements

Les principes mis en évidence restent valides

W = f (écart phénotype –envir.)

uloc ≠ urearr

Page 23: 0100 1101 0101 0101 0101 0100 1010 1010 1000 1011 0101 0010 1010 1110 0011 Structuration des génomes par sélection indirecte de la variabilité mutationnelle.

23

Perturber la variabilité mutationnelle, observer l’évolution structurelle du génome

Taux de mutationpar paire de bases

Structure du génome(nombre de gènes, quantité de non-codant…)

Poids du gène muté dans le phénotype(aire du triangle)

Nombre de mutations « efficaces »

Impact des mutations « efficaces »

Variabilité globaledu phénotype

Page 24: 0100 1101 0101 0101 0101 0100 1010 1010 1000 1011 0101 0010 1010 1110 0011 Structuration des génomes par sélection indirecte de la variabilité mutationnelle.

24

Perturber la variabilité mutationnelle, observer l’évolution structurelle du génome

La quantité de non-codant dépend aussi de l’organisation du protéome

Taux de mutationpar paire de bases

Structure du génome(nombre de gènes, quantité de non-codant…)

Poids du gène muté dans le phénotype(aire du triangle)

Nombre de mutations « efficaces »

Impact des mutations « efficaces »

Variabilité globaledu phénotype

Page 25: 0100 1101 0101 0101 0101 0100 1010 1010 1000 1011 0101 0010 1010 1110 0011 Structuration des génomes par sélection indirecte de la variabilité mutationnelle.

Conclusions et perspectives

Page 26: 0100 1101 0101 0101 0101 0100 1010 1010 1000 1011 0101 0010 1010 1110 0011 Structuration des génomes par sélection indirecte de la variabilité mutationnelle.

26

Conclusions

Un nouveau modèle qui combine… – réarrangements génomiques– sélection au niveau du phénotype

Trois leçons : ne pas raisonner uniquement en termes…– de valeur sélective : la variabilité comme autre clé du succès évolutif– de biais mutationnels et de coûts sélectifs directs : pressions indirectes – de mutations locales : rôle majeur des grands réarrangements

Une explication pour les données de Drake (1991)– rôle du nombre de gènes et du non-codant dans la

variabilité du phénotype– sélection (indirecte) d’un niveau constant de variabilité

Page 27: 0100 1101 0101 0101 0101 0100 1010 1010 1000 1011 0101 0010 1010 1110 0011 Structuration des génomes par sélection indirecte de la variabilité mutationnelle.

27

Perspectives

Utiliser aevol tel quel pour des problématiques connexes :– Variabilité de l’environnement– Influence de la recombinaison– Influence des « bottlenecks »

Étendre le modèle– Affiner les mécanismes de réarrangement– Laisser les génomes coder leurs taux de mutation– Modéliser les phénomènes de régulation de l’expression des gènes

Validation expérimentale

Page 28: 0100 1101 0101 0101 0101 0100 1010 1010 1000 1011 0101 0010 1010 1110 0011 Structuration des génomes par sélection indirecte de la variabilité mutationnelle.

28

Du protéome au phénotype

protéines activatrices

protéines inhibitrices

OU OU

fonctions réalisables

fonctions réprimées

fonctions réalisables et non réprimées=

capacités fonctionnelles

ET

NON

Page 29: 0100 1101 0101 0101 0101 0100 1010 1010 1000 1011 0101 0010 1010 1110 0011 Structuration des génomes par sélection indirecte de la variabilité mutationnelle.

29

Du protéome au phénotype

Page 30: 0100 1101 0101 0101 0101 0100 1010 1010 1000 1011 0101 0010 1010 1110 0011 Structuration des génomes par sélection indirecte de la variabilité mutationnelle.

30

taille du génome

Proportion de bases touchées

0,5

0

1

Page 31: 0100 1101 0101 0101 0101 0100 1010 1010 1000 1011 0101 0010 1010 1110 0011 Structuration des génomes par sélection indirecte de la variabilité mutationnelle.

31

Évolution du nombre de gènes et de la quantité de non-codant

Page 32: 0100 1101 0101 0101 0101 0100 1010 1010 1000 1011 0101 0010 1010 1110 0011 Structuration des génomes par sélection indirecte de la variabilité mutationnelle.

32

Mutations fixées

Page 33: 0100 1101 0101 0101 0101 0100 1010 1010 1000 1011 0101 0010 1010 1110 0011 Structuration des génomes par sélection indirecte de la variabilité mutationnelle.

33

Influence de la forme de l’environnement

Page 34: 0100 1101 0101 0101 0101 0100 1010 1010 1000 1011 0101 0010 1010 1110 0011 Structuration des génomes par sélection indirecte de la variabilité mutationnelle.

34

Influence respective des différents taux de mutation

Page 35: 0100 1101 0101 0101 0101 0100 1010 1010 1000 1011 0101 0010 1010 1110 0011 Structuration des génomes par sélection indirecte de la variabilité mutationnelle.

35

Expériences réalisées avec une sélection « fitness proportionate » (1)

Page 36: 0100 1101 0101 0101 0101 0100 1010 1010 1000 1011 0101 0010 1010 1110 0011 Structuration des génomes par sélection indirecte de la variabilité mutationnelle.

36

Expériences réalisées avec une sélection « fitness proportionate » (2)

On retrouve bien la « règle »

FνW ≈ 1

Page 37: 0100 1101 0101 0101 0101 0100 1010 1010 1000 1011 0101 0010 1010 1110 0011 Structuration des génomes par sélection indirecte de la variabilité mutationnelle.

37

Le non-codant s’ajuste aussi en fonction de l’effet des mutations dans les gènes

Page 38: 0100 1101 0101 0101 0101 0100 1010 1010 1000 1011 0101 0010 1010 1110 0011 Structuration des génomes par sélection indirecte de la variabilité mutationnelle.

38

Le non-codant s’ajuste aussi en fonction de l’effet des mutations dans les gènes

Invariant = perte moyenne de fitness par réplication

Page 39: 0100 1101 0101 0101 0101 0100 1010 1010 1000 1011 0101 0010 1010 1110 0011 Structuration des génomes par sélection indirecte de la variabilité mutationnelle.

39

environnement

Quels sont les mécanismes évolutifs qui ont façonné ces génomes ?

Génotypes = informations génétiques reçues par les embryons

Phénotypes

Développement

Reproduction

« Chez telle espèce, il se produit spontanément plus de délétions que d’insertions »

« Chez telle espèce, un génome plus compact apporte un avantage sélectif »

Mutation ponctuelleInsertionDélétion

Mutations Sélection

Page 40: 0100 1101 0101 0101 0101 0100 1010 1010 1000 1011 0101 0010 1010 1110 0011 Structuration des génomes par sélection indirecte de la variabilité mutationnelle.

40

Simuler l’évolution de la population…

temps

ind

ivid

us

Page 41: 0100 1101 0101 0101 0101 0100 1010 1010 1000 1011 0101 0010 1010 1110 0011 Structuration des génomes par sélection indirecte de la variabilité mutationnelle.

41

… puis retrouver la lignée « gagnante »

temps

ind

ivid

us

Page 42: 0100 1101 0101 0101 0101 0100 1010 1010 1000 1011 0101 0010 1010 1110 0011 Structuration des génomes par sélection indirecte de la variabilité mutationnelle.

42

Fν sélectionnée = 1/W

Intensité de la sélection

Nombre max. de reproductions (W)

Nombre de gènes et quantité de non codant sélectionnés

Produire 1 descendant neutre

Taux de mutation par base

Page 43: 0100 1101 0101 0101 0101 0100 1010 1010 1000 1011 0101 0010 1010 1110 0011 Structuration des génomes par sélection indirecte de la variabilité mutationnelle.

43

Sélection indirecte d’un certain niveau de variation

mutations trop fréquentes : extinction de la lignée

mutation favorable

pas de mutation :impasse évolutive

générations

Variabilité élevée(reproduction à l’identique peu probable)

Variabilité moyenne

Variabilité très faible(reproduction à l’identique très probable)

3b

Page 44: 0100 1101 0101 0101 0101 0100 1010 1010 1000 1011 0101 0010 1010 1110 0011 Structuration des génomes par sélection indirecte de la variabilité mutationnelle.

44

Transcription

...110...010...011011101000101110011100111011010001...10110010010..

.

...001...101...100100010111010001100011000100101110...01001101101..

.

Séquence promotrice

Séquence terminatriceRégion transcrite

Comparaison

100...010

Séquence consensus

Niveau d’expression e

7b

Page 45: 0100 1101 0101 0101 0101 0100 1010 1010 1000 1011 0101 0010 1010 1110 0011 Structuration des génomes par sélection indirecte de la variabilité mutationnelle.

45

Traduction

Signal de « start »

Signal de « stop »Séquence codante (gène)

...110...010...011011101000101110011100111011010001...10110010010..

.

...001...101...100100010111010001100011000100101110...01001101101..

.

Code génétique

000 START

001 STOP

100 M0

101 M1

010 W0

011 W1

110 H0

111 H1

STARTM1 H0 W1 M0 H1 W1 M0 STOP

m :

w :

h :

100

11

01

Code « Gray »

Valeur réelle

0.86

0.02

0.33

Conversion en entier puis

normalisation

fonction biologique

degré de possibilité

m = 0,86 w = 0,02

H = 0,33e

fonction biologique

degré de possibilité

m w

H = e.h

7c