0100 1101 0101 0101 0101 0100 1010 1010 1000 1011 0101 0010 1010 1110 0011 Structuration des...

Post on 03-Apr-2015

148 views 0 download

Transcript of 0100 1101 0101 0101 0101 0100 1010 1010 1000 1011 0101 0010 1010 1110 0011 Structuration des...

010011010101010101010100101010101000101101010010101011100011

Structuration des génomes par sélection indirectede la variabilité mutationnelle

Une approche de modélisation

et de simulation

Carole Knibbe

Laboratoire PRISMa

Laboratoire BF2I (UMR INRA-INSA 203)

0100110101010101010101001010101010001011010111110110

2

Des génomes structurellement très différents

Homo sapiens

~3 milliards de paires de bases (pb)~25 000 gènes

Neisseria meningitidis (bactérie)

~2 millions de pb~2 000 gènes

Herpes HSV-1 (virus)

~150 000 pb~100 gènes

0 kb 150 kb50 kb 100 kb

0 kb 150 kb50 kb 100 kb

0 kb 150 kb50 kb 100 kb

Zoom sur un segment de 150 000 pb...

Homo sapiens

~3 milliards de pb~25 000 gènes

3

Quels sont les mécanismes évolutifs qui ont façonné ces génomes ?

Génotype :variation(mutations)

Phénotype :sélection

Sélection (indirecte) d’un certain niveau de variation

Biais mutationnels :

« Chez l’Homme, il se produit spontanément plus d’insertions que de délétions, ce qui fait croître le génome »

Coûts sélectifs directs :

« Pour un virus ou une bactérie, un grand génome est désavantageux, donc le génome tend à devenir plus compact »

Influence sur l’organisation du génome ?

4

Problématique biologique

La sélection du niveau de variation peut-elle favoriser un certain type d’organisation du génome ?

Ce mécanisme peut-il réguler la quantité d’ADN non-codant ?

Difficultés expérimentales– Effet à long terme– Effet difficile à isoler

Recours à la modélisation…

5

Enjeu méthodologique

Génotype :variation(mutations)

Phénotype :sélection

Sélection (indirecte) d’un certain niveau

de variation

Algorithmes évolutionnaires (problèmes d’optimisation)

population, sélection

structure du génome, mutations

Modèles neutralistes (évolution de séquences réelles)

structure du génome, mutations

phénotype, sélection

Le modèle aevol

7

Le modèle aevol

fonction biologique

degré de possibilité

Protéome PhénotypeGénome

fonction biologique

degré de possibilité

transcription traduction

interactions protéiques

Optimum environnemental

Capacités fonctionnelles globales

distribution de possibilité de la protéine

m w

H = e.h

Mutations SélectionReproduction

degré de possibilité

fonction biologique

8

Évolution de la population

- mutations ponctuelles- petites insertions- petites délétions

- translocations- inversions- duplications- grandes délétions

W ≈ N . prob(reproduction)

≈ N . f (écart phén.-envir.)

N individus

Initialisation aléatoire

Calcul des phénotypes

Comparaison à l’environnement :

nombres de reproductions

Reproductionsavec mutationsen moyenne,

uL par reproduction

9

Film de l’évolution le long de la lignée « gagnante »

Quelques générations

plus tard…

Acquisition de fonction

par duplication-divergence

10

Atouts de l’approche

Met en jeu simultanément :– une organisation génomique biologiquement interprétable

et libre d’évoluer– l’action de la sélection au niveau du phénotype

Connaissance exhaustive :– des relations de parenté – des séquences ancestrales– des mutations fixées

Code source libre d’accès (C++)

11

Limites

Temps de calcul, taille mémoire

contraintes sur les valeurs des paramètres

Gestion simple de la population

Modélisation abstraite des aspects fonctionnels

Pas d’échelle de temps individuelle– Pas de processus de développement– Pas de régulation– Pas de plasticité phénotypique

Expériences… in silico

13

Perturber la variabilité, observer l’évolution structurelle du génome

Taux de mutationpar paire de bases (u)

Structure du génome(nombre de gènes, quantité de non-codant…)

Poids du gène muté dans le phénotype(aire du triangle)

Nombre de mutations « efficaces » (touchant les gènes)

Impact des mutations « efficaces »

Variabilité globaledu phénotype

?

14

Plan d’expérience

Taux de mutation u : – 6 valeurs testées, entre 5.10-6 et 2.10-4 par paire de bases

Intensité de la sélection c :– 4 valeurs de c testées

3 répétitions pour chaque couple (u, c)

W = nb de reproductions

rang dans la populationmeilleurmoins bon

c = 0,9900 : sélection intense

c = 0,9995 : sélection faible

15

Taux de mutation élevé : 2.10-4 / pb Taux de mutation faible : 5.10-6 / pb

Peu de gènes

Peu de non codant

Beaucoup de gènes

Beaucoup de non codant

16

Taux de mutation (échelle log.)

No

mb

re d

e g

ènes

(éc

hel

le lo

g.)

Taux de mutation (échelle log.)

Qu

anti

té d

e n

on

co

dan

t (é

chel

le lo

g.)

La taille du génome dépend du taux de mutation

bactérie

levure

champignon

3 virus

Données biologiques(Drake, 1991)

17

Sélection indirecte d’un niveau de variabilité constant

Taux de mutation (échelle log.)

Grands génomes

Petits génomes

Prob. de se reproduire à l’identique (Fν)

18

La quantité de non-codant comme levier d’ajustement de la variabilité mutationnelle

Le niveau de variabilité dépend effectivement de la quantité de non-codant

Probabilité que le descendant soit « neutre »

(soit pas de mutation, soit uniquement des mutations neutres)

Probabilité qu’une mutation soit neutre

19

La quantité de non-codant comme levier d’ajustement de la variabilité mutationnelle

Probabilité que le descendant soit « neutre »

Probabilité qu’une mutation soit neutre

Mutations ponctuelles

Inversions

Translocations

Duplications, délétions

Quantité de non-codant (échelle log.) Quantité de non-codant (échelle log.)

A taux de mutation égal,

lorsque l’effet des grandes délétions et duplications est pris en compte,

plus de non-codant = plus de variabilité mutationnelle

20

Intensité de sélection et niveau de variation optimal

Taux de mutation (échelle log.)

Pro

b. d

e se

rep

rod

uir

e à

l’id

enti

qu

e (F

ν)

Sélection intense,W ≈ 10 descendants :

Fν W ≈ 1 desc. identique

Sélection moyenne,W ≈ 2 descendants :

FνW ≈ 1 desc. identique

Taux de mutation (échelle log.)

No

mb

re d

e d

esce

nd

ants

iden

tiq

ues

(F

νW)

Fν est telle que

FνW ≈ 1 descendant neutre

21

Conclusions de l’expérience

La quantité de non-codant…

– augmente la variabilité du phénotype– n’évolue pas « au hasard »– évolue vers une valeur qui permet de produire ~1 descendant neutre

Cela reflète la persistance des lignées qui, simultanément …– sont bien adaptées à l’environnement– transmettent fidèlement leur information génétique (robustesse)– explorent d’autres phénotypes par mutation (« evolvabilité »)

22

Robustesse des conclusions

Autres formes d’environnement

Autres méthodes de sélection

Découplage des taux de mutation

Autre façon de choisir les bornes des réarrangements

Les principes mis en évidence restent valides

W = f (écart phénotype –envir.)

uloc ≠ urearr

23

Perturber la variabilité mutationnelle, observer l’évolution structurelle du génome

Taux de mutationpar paire de bases

Structure du génome(nombre de gènes, quantité de non-codant…)

Poids du gène muté dans le phénotype(aire du triangle)

Nombre de mutations « efficaces »

Impact des mutations « efficaces »

Variabilité globaledu phénotype

24

Perturber la variabilité mutationnelle, observer l’évolution structurelle du génome

La quantité de non-codant dépend aussi de l’organisation du protéome

Taux de mutationpar paire de bases

Structure du génome(nombre de gènes, quantité de non-codant…)

Poids du gène muté dans le phénotype(aire du triangle)

Nombre de mutations « efficaces »

Impact des mutations « efficaces »

Variabilité globaledu phénotype

Conclusions et perspectives

26

Conclusions

Un nouveau modèle qui combine… – réarrangements génomiques– sélection au niveau du phénotype

Trois leçons : ne pas raisonner uniquement en termes…– de valeur sélective : la variabilité comme autre clé du succès évolutif– de biais mutationnels et de coûts sélectifs directs : pressions indirectes – de mutations locales : rôle majeur des grands réarrangements

Une explication pour les données de Drake (1991)– rôle du nombre de gènes et du non-codant dans la

variabilité du phénotype– sélection (indirecte) d’un niveau constant de variabilité

27

Perspectives

Utiliser aevol tel quel pour des problématiques connexes :– Variabilité de l’environnement– Influence de la recombinaison– Influence des « bottlenecks »

Étendre le modèle– Affiner les mécanismes de réarrangement– Laisser les génomes coder leurs taux de mutation– Modéliser les phénomènes de régulation de l’expression des gènes

Validation expérimentale

28

Du protéome au phénotype

protéines activatrices

protéines inhibitrices

OU OU

fonctions réalisables

fonctions réprimées

fonctions réalisables et non réprimées=

capacités fonctionnelles

ET

NON

29

Du protéome au phénotype

30

taille du génome

Proportion de bases touchées

0,5

0

1

31

Évolution du nombre de gènes et de la quantité de non-codant

32

Mutations fixées

33

Influence de la forme de l’environnement

34

Influence respective des différents taux de mutation

35

Expériences réalisées avec une sélection « fitness proportionate » (1)

36

Expériences réalisées avec une sélection « fitness proportionate » (2)

On retrouve bien la « règle »

FνW ≈ 1

37

Le non-codant s’ajuste aussi en fonction de l’effet des mutations dans les gènes

38

Le non-codant s’ajuste aussi en fonction de l’effet des mutations dans les gènes

Invariant = perte moyenne de fitness par réplication

39

environnement

Quels sont les mécanismes évolutifs qui ont façonné ces génomes ?

Génotypes = informations génétiques reçues par les embryons

Phénotypes

Développement

Reproduction

« Chez telle espèce, il se produit spontanément plus de délétions que d’insertions »

« Chez telle espèce, un génome plus compact apporte un avantage sélectif »

Mutation ponctuelleInsertionDélétion

Mutations Sélection

40

Simuler l’évolution de la population…

temps

ind

ivid

us

41

… puis retrouver la lignée « gagnante »

temps

ind

ivid

us

42

Fν sélectionnée = 1/W

Intensité de la sélection

Nombre max. de reproductions (W)

Nombre de gènes et quantité de non codant sélectionnés

Produire 1 descendant neutre

Taux de mutation par base

43

Sélection indirecte d’un certain niveau de variation

mutations trop fréquentes : extinction de la lignée

mutation favorable

pas de mutation :impasse évolutive

générations

Variabilité élevée(reproduction à l’identique peu probable)

Variabilité moyenne

Variabilité très faible(reproduction à l’identique très probable)

3b

44

Transcription

...110...010...011011101000101110011100111011010001...10110010010..

.

...001...101...100100010111010001100011000100101110...01001101101..

.

Séquence promotrice

Séquence terminatriceRégion transcrite

Comparaison

100...010

Séquence consensus

Niveau d’expression e

7b

45

Traduction

Signal de « start »

Signal de « stop »Séquence codante (gène)

...110...010...011011101000101110011100111011010001...10110010010..

.

...001...101...100100010111010001100011000100101110...01001101101..

.

Code génétique

000 START

001 STOP

100 M0

101 M1

010 W0

011 W1

110 H0

111 H1

STARTM1 H0 W1 M0 H1 W1 M0 STOP

m :

w :

h :

100

11

01

Code « Gray »

Valeur réelle

0.86

0.02

0.33

Conversion en entier puis

normalisation

fonction biologique

degré de possibilité

m = 0,86 w = 0,02

H = 0,33e

fonction biologique

degré de possibilité

m w

H = e.h

7c