Paysages de Fitness et Neutralité

Post on 03-Jan-2016

17 views 1 download

description

Paysages de Fitness et Neutralité. Philippe Collard pc@unice.fr Projet TEA Laboratoire I3S Université de Nice-Sophia Antipolis/CNRS. Paysages de Fitness et Neutralité. Origine Biologique du concept de neutralité Neutralité = ? Comment mesurer la neutralité ? - PowerPoint PPT Presentation

Transcript of Paysages de Fitness et Neutralité

1

Paysages de Fitness et Neutralité

Philippe Collardpc@unice.fr

Projet TEA

Laboratoire I3S

Université de Nice-Sophia Antipolis/CNRS

2

Paysages de Fitness et Neutralité

1. Origine Biologique du concept de neutralité

2. Neutralité = ?

3. Comment mesurer la neutralité ?

4. Les paysages de fitness sont-ils neutres ?

5. Des modèles pour étudier la neutralité

6. Comment exploiter le concept de neutralité?

3

Origines Biologiques Théorie neutraliste de l’évolution

Kimura 1983

Evolution moléculaireCorrespondance génotype/phénotype très

redondanteLarge proportion de mutations sélectivement neutresMoteur principal de l'évolution ?

sélection adaptative rôle des forces stochastiques (dérive génétique)

Dans la nature les populations ne sont pas fixées sur un optimum local

4

Neutralité =Redondance + Opérateur neutre

Ensemble de neutralité (ES)– Ensemble de génotypes d’iso-fitness

Réseau de neutralité (RN)– Connections intra ES par opérateur neutre

RN de taille suffisamment importante «Portes» entre les RNUne large proportion du paysage peut être

approchée par exploration d’un réseauAugmente la probabilité d’atteindre un niveau de

fitness donnée à partir d’une pop aléatoire

5

Du Grimpeur au Nageur …

Ou comment s’échapper d’un optimum local grâce aux mutations ?

6

Marche adaptative sur un paysage de fitness avec neutralité

Succession de phases1. Gain de fitness

2. Dérive aléatoire

7

Neutralité et dynamique évolutionniste

Longues périodes de stabilité (phénotypique)– Dérive dans un réseau de neutralité– Effet d’un opérateur neutre (mutation)

Ponctuées par de rapide augmentation de fitness – Découverte inopinée d’un meilleur mutant– Effet de mutation adaptative rare

Mutation = opérateur neutre ?Rôle du croisement ?Convergence prématurée !

8

Intérêt de la neutralité pour la recherche ou l’optimisation

Donne un moyen de maintenir une certaine diversité génotypique sans risque de perdre les fitness

Potentialité pour s’échapper de certains optima locaux

9

Comment mesurer la neutralité ?

Redondance– Nombre et Taille des RN– Distribution des génotypes selon la fitness (DOS)

Connectivité– intra RN

• Proportion de mutations neutres vs. Fitness• nombre de mutations neutres par génotype (neutral

degree) (Barnett)

– inter RN• Percolation (théorie des graphes)• Taux d’innovation (neutral random walks)• Evolvability (Smith 2002)

10

Densité d’Etats

Distribution des configurations selon les valeurs de fitness

Représente la taille des ensembles d’iso-fitness

Indique la probabilité d’atteindre un niveau de fitness donné

Distribution Normale (binomiale)– Unitation, Paysage NK– SAT, max-CSP, TSP

11

DOS : Paysage NKN=16 K=12

12

Intérêts et Limites du D.O.S

Mesure indépendante du voisinagecodage, voisinage, opérateur

Permet de « situer » une population initiale aléatoire

La « queue » de la distribution est un indice de difficulté

Extension : prise en compte le dynamique – Distribution des Coûts de Processus (Hao &

Belaidouni)

13

Les paysages académiquessont-ils neutres ?

Fonctions de De Jong– Redondance induite par la modalité

Redondance– Unitation : redondance– NK : redondance

Redondance + Mutation neutre– Royal Road

14

Fonction Royal Road(Holland, Forrest, Mitchell 95)

N = 3 blocs * 10 bits

sopt=111111111111111111111111111111 3

s3 =********************1111111111 +1

s2 =**********1111111111********** +1

s1 =1111111111******************** +1

4 réseaux de neutralité– fitness 3 : 1– fitness 2 : ~ 3.103

– fitness 1 : ~ 3.106

– fitness 0 : ~ 109

15

Fonction Royal Road Crutchfield & al. 99

MutationPositive (adaptative) : rare

1111101111********************

Négative (délétère) : rare1111111111********************

Neutre : les plus fréquentes1000000001********************

Pop 250Probabilité de mutation 0.005

16

Fonction Royal Roadfitness vs. générations

17

Fonction Royal RoadPopulation vs. générations

Population=(P0,P1,P2,P3)

Pi = proportion de chaînes de fitness i

18

Les paysages « réels » sont-ils neutres ?

Evolution of neural network controllers in robotic

Silicon chip electronic circuit evolution (FPGA) (Harvey ICES96)

Circuit de reconnaissance de la parole (Thompson 2001)

19

Des modèles pour étudier la Neutralité

Modèle basé sur les fonctions Royal Road– Labyrinthe en Terrasses

Modèle basé sur les paysages NK (random)– NKp ‘probabilistic NK’– NKq ‘quantised NK’

20

Terraced Labyrinth fitness function Crutchfield & al. 99

Fitness déterminée par un arbre

Nœud : réseau de neutralité– Schéma– Fitness associée

Constellation : zone de transition– mutuellement exclusives sur un même nœud

Branche : portail entre réseaux adjacents– instanciation d’une constellation

Sous-nœud : réseau de meilleure fitness– spécialisation de schéma

21

Labyrinthe en terrasses

*************** 1

00000**********

2

00000**111*****

4

00000**111**110

6

000001011100110

8

11111**********

3

11111***0101101

4

11111***1100010

5

111110000101101

7

111110011100010

6

22

Labyrinthe en terrasseset mutations

Mutation adaptative– rare– Contrôlée par la taille des constellations

Mutation neutre– Fréquente (muter sur une constellation)– diminue quand la fitness augmente

Mutation délétère– augmente avec la fitness– 1 seule mutation peut « ramener » à la racine

23

Des modèles pour étudier la Neutralité

Modèle basé sur les fonctions Royal Road– Labyrinthe en Terrasses

Modèle basé sur les paysages NK (random)– NKp ‘probabilistic NK’– NKq ‘quantised NK’

24

Paysages NKKauffman 1993

N = longueur du chromosomeK = degré d’épistasieFitness additive

– des contributions de chaque gène

– Contribution d’un gène dépend• Allèle du gène• Allèles de K autres gènes

– K=0 : fitness linéaire (smooth landscape)– K=N-1 : fitness aléatoire (rugged landscape)

25

•DOS binomiale•Mutations neutres très rares

Paysages NK : K=2Kauffman 1993

26

Paysages NKp Barnett 1998

Paysages NK + neutralitép=probabilité qu’une contribution soit nulle

• p=0 : paysage NK (pas de neutralité)• P=1 : paysage plat

La probabilité qu’une mutation soit neutre augmente avec p

27

Paysages NKp : K=2Barnett 1998

28

DOS : N=16 K=12 p=0.8

29

NKp : proportions des mutations neutresN. Geard & al. (CEC 2002)

30

Innovation le long d’un RNHuynen 1996, Barnett 1998

On comptabilise le nombre de phénotypes « innovants » rencontrés dans le voisinage du chemin aléatoire neutre (neutral walks) sur le RN

31

N=20 K=4 pop=1000 mutation=0.001

p=0

p=0.99

32

Paysages NKq Newman & Engelhardt 1997

Les contributions à la fitness sont des entiers dans [0..q] (quantised NK)

Intuitivement on construit un paysage NK en « terrasses »

La probabilité qu’une mutation soit neutre diminue avec q

Le nombre de réseaux de neutralité augmente exponentielle avec N

Percolation dans les plus grands réseaux de neutralité

33

Paysages NKq : K=2 q=2Newman & Engelhardt 1997

34

DOS : N=16 K=12 q=2

35

NKq : proportion des mutations neutresN. Geard & al. (CEC 2002)

36

Comparaisons : NKp, NKqN. Geard & al. (CEC 2002)

Distribution des mutations neutres– Quand la fitness augmente :

• Le nombre de mutations négatives augmente• Le nombre de mutations positives diminue

– NKp• Le nombre de mutations neutres diminue avec la fitness

– NKq• Le nombre de mutations neutres est maximum pour la

fitness moyenne

37

Meilleure fitness atteinte vs. NeutralitéN=20 K=4

Random hill-climber– moyenné sur 10 simulations

Stratégie : – sélectionner un 1-mutant au hasard– jusqu’à trouver une meilleure solution– ou une solution équivalente

Le processus de recherche s’arrête sur un réseau de neutralité qui ne percolate pas

38

Meilleure fitness atteinte vs. NeutralitéN=20 K=4

q

39

Comment exploiter le concept de neutralité en Evolution artificielle ?

Etudier la neutralité intrinsèque– Redondance (DOS)– Connectivité (intra/inter)

Neutralité synthétique– Introduire de la redondance

• codage• bruit dans le calcul de la fitness• Méta codage (stratégies d’évolution)

– Concevoir des opérateurs neutres• Exploiter les symétries

40

Neutralité synthétique

Spécifique– Choix du codage– Choix des opérateurs

• Neutre• Recombinaison

Indépendante du problème– Neutralité synthétique minimale

41

Voyageur de commerce24 villes concentriques

Concevoir un Opérateur neutre – Exploiter les symétries du

problème

– « Compatible » avec le croisement (PMX)

42

Voyageur de commerceOpérateur neutre et Symétrie

43

Voyageur de commercesolution optimale

44

Neutralité synthétique

Spécifique– Choix du codage– Choix des opérateurs

• Neutre• recombinaison

Indépendante du problème– Neutralité synthétique minimale

45

Neutralité synthétique minimale P. Collard & al. (EA 99)

Dualité : neutralité synthétique minimale

Mapping génotype/phénotype

f : RMapping étendu

F : {0,1}x R

F(0x) = f(x)

F(1x) = f(x)

46

Neutralité synthétique minimale

Redondance F : {0,1} * R F(x)=F(x)

Invariance de la Densité d’Etats

Contraction de la distance Hammingd(0000,1111)= d(00000,10000)=1

d(0000,0011)= /2 d(00000,11100)= /2

Opérateur neutre : mirroringx x

47

Neutralité synthétique minimale Etude expérimentale

200 bits100 chromosomes1000 générationsMutation 0.5 par chromosomeMirroring 0.02Croisement 0.7Tournoi

48

Trajectoire du centroïdesans neutralité

49

Neutralité synthétique d’ordre 1Trajectoire du centroïde

50

Neutralité synthétique d’ordre 1Mean/max fitness

51

Neutralité synthétique d’ordre 1Proportion cumulée des génotypes

52

Conclusion

Peu de résultats théoriques ou empiriques sur la structure des paysages neutres

Résultats sur des paysages simples ou idéalisés

Etudier le rôle du croisementEtudier la neutralité intrinsèqueConcevoir des opérateurs neutres

53

Conclusion

Tthere is still a fundamental lack of both empirical data and theoretical understanding concerning the structure of neutral landscapes

Many of the analytical results have been obtained from simplified or idealised landscapes

The extent to which these results apply to the more complex landscapes likely to be found in real world problems has not yet been demonstrated

The goal of this study was to broaden knowledge of landscapes with neutrality by investigating structural properties of the NKp landscape model (Barnett 1997, 1998) and the NKq landscape model (based on Newman & Engelhardt 1997) using Kauffman’s original NK model for comparison. Initially, Kauffman’s simulations pertaining to NK landscapes were replicated. Next, these simulations were extended to the neutral NKp and NKq landscapes. A series of comparative simulations were carried out to investigate the performance of several different search algorithms on a variety of neutral and non-neutral landscapes.

Finally, a simulation was developed to investigate the role of crossover in maintaining genetic diversity in a population evolving on a neutral landscape. It was found that hill-climbing algorithms are generally capable of finding better individual solutions, but population-based algorithms tend to find higher average solutions. It was also found that crossover allows a population on a neutral landscape to maintain a much higher level of genetic diversity on a neutral layer than a population using mutation alone

Furthermore, populations using crossover suffer a less dramatic loss of diversity when a new fitness level is discovered, and recover diversity more rapidly.

54

55

Paysages NKpBarnett 1998

‘Probabilistic NK’Capture some of the lethal mutations in

biologyLe paramètre de neutralité p a peu

d’effet sur la corrélation

56

Distributions des mutations neutresN. Geard & al. (CEC 2002)

57

Epistasie vs. Neutralité

Mesurer l’effet d’une mutation sur le fitness– Principe de causalité– Effet neutre

Expérience en Robotique (T. Smith 2002)

– Ajouter de la neutralité et Diminuer l’épistasie favorise l’évolution

58

Frozen accidents

*************** 1

00000**********

2

00000**111*****

4

00000**111**110

6

000001011100110

8

11111**********

3

11111***0101101

4

11111***1100010

5

111110000101101

7

111110011100010

6

59

Concevoir des Opérateurs neutres

Unitation / Inversion

000111000111

000000111111

Inversion / croisement

000111000111 000111111111

000000111111 000000000111

60

Questions

Echantillonnage pour le dosStratégie d’évolutionSmith 2002 evolvability