Paysages de Fitness et Neutralité

60
1 Paysages de Fitness et Neutralité Philippe Collard [email protected] Projet TEA Laboratoire I3S Université de Nice-Sophia Antipolis/CNRS

description

Paysages de Fitness et Neutralité. Philippe Collard [email protected] Projet TEA Laboratoire I3S Université de Nice-Sophia Antipolis/CNRS. Paysages de Fitness et Neutralité. Origine Biologique du concept de neutralité Neutralité = ? Comment mesurer la neutralité ? - PowerPoint PPT Presentation

Transcript of Paysages de Fitness et Neutralité

Page 1: Paysages de Fitness et Neutralité

1

Paysages de Fitness et Neutralité

Philippe [email protected]

Projet TEA

Laboratoire I3S

Université de Nice-Sophia Antipolis/CNRS

Page 2: Paysages de Fitness et Neutralité

2

Paysages de Fitness et Neutralité

1. Origine Biologique du concept de neutralité

2. Neutralité = ?

3. Comment mesurer la neutralité ?

4. Les paysages de fitness sont-ils neutres ?

5. Des modèles pour étudier la neutralité

6. Comment exploiter le concept de neutralité?

Page 3: Paysages de Fitness et Neutralité

3

Origines Biologiques Théorie neutraliste de l’évolution

Kimura 1983

Evolution moléculaireCorrespondance génotype/phénotype très

redondanteLarge proportion de mutations sélectivement neutresMoteur principal de l'évolution ?

sélection adaptative rôle des forces stochastiques (dérive génétique)

Dans la nature les populations ne sont pas fixées sur un optimum local

Page 4: Paysages de Fitness et Neutralité

4

Neutralité =Redondance + Opérateur neutre

Ensemble de neutralité (ES)– Ensemble de génotypes d’iso-fitness

Réseau de neutralité (RN)– Connections intra ES par opérateur neutre

RN de taille suffisamment importante «Portes» entre les RNUne large proportion du paysage peut être

approchée par exploration d’un réseauAugmente la probabilité d’atteindre un niveau de

fitness donnée à partir d’une pop aléatoire

Page 5: Paysages de Fitness et Neutralité

5

Du Grimpeur au Nageur …

Ou comment s’échapper d’un optimum local grâce aux mutations ?

Page 6: Paysages de Fitness et Neutralité

6

Marche adaptative sur un paysage de fitness avec neutralité

Succession de phases1. Gain de fitness

2. Dérive aléatoire

Page 7: Paysages de Fitness et Neutralité

7

Neutralité et dynamique évolutionniste

Longues périodes de stabilité (phénotypique)– Dérive dans un réseau de neutralité– Effet d’un opérateur neutre (mutation)

Ponctuées par de rapide augmentation de fitness – Découverte inopinée d’un meilleur mutant– Effet de mutation adaptative rare

Mutation = opérateur neutre ?Rôle du croisement ?Convergence prématurée !

Page 8: Paysages de Fitness et Neutralité

8

Intérêt de la neutralité pour la recherche ou l’optimisation

Donne un moyen de maintenir une certaine diversité génotypique sans risque de perdre les fitness

Potentialité pour s’échapper de certains optima locaux

Page 9: Paysages de Fitness et Neutralité

9

Comment mesurer la neutralité ?

Redondance– Nombre et Taille des RN– Distribution des génotypes selon la fitness (DOS)

Connectivité– intra RN

• Proportion de mutations neutres vs. Fitness• nombre de mutations neutres par génotype (neutral

degree) (Barnett)

– inter RN• Percolation (théorie des graphes)• Taux d’innovation (neutral random walks)• Evolvability (Smith 2002)

Page 10: Paysages de Fitness et Neutralité

10

Densité d’Etats

Distribution des configurations selon les valeurs de fitness

Représente la taille des ensembles d’iso-fitness

Indique la probabilité d’atteindre un niveau de fitness donné

Distribution Normale (binomiale)– Unitation, Paysage NK– SAT, max-CSP, TSP

Page 11: Paysages de Fitness et Neutralité

11

DOS : Paysage NKN=16 K=12

Page 12: Paysages de Fitness et Neutralité

12

Intérêts et Limites du D.O.S

Mesure indépendante du voisinagecodage, voisinage, opérateur

Permet de « situer » une population initiale aléatoire

La « queue » de la distribution est un indice de difficulté

Extension : prise en compte le dynamique – Distribution des Coûts de Processus (Hao &

Belaidouni)

Page 13: Paysages de Fitness et Neutralité

13

Les paysages académiquessont-ils neutres ?

Fonctions de De Jong– Redondance induite par la modalité

Redondance– Unitation : redondance– NK : redondance

Redondance + Mutation neutre– Royal Road

Page 14: Paysages de Fitness et Neutralité

14

Fonction Royal Road(Holland, Forrest, Mitchell 95)

N = 3 blocs * 10 bits

sopt=111111111111111111111111111111 3

s3 =********************1111111111 +1

s2 =**********1111111111********** +1

s1 =1111111111******************** +1

4 réseaux de neutralité– fitness 3 : 1– fitness 2 : ~ 3.103

– fitness 1 : ~ 3.106

– fitness 0 : ~ 109

Page 15: Paysages de Fitness et Neutralité

15

Fonction Royal Road Crutchfield & al. 99

MutationPositive (adaptative) : rare

1111101111********************

Négative (délétère) : rare1111111111********************

Neutre : les plus fréquentes1000000001********************

Pop 250Probabilité de mutation 0.005

Page 16: Paysages de Fitness et Neutralité

16

Fonction Royal Roadfitness vs. générations

Page 17: Paysages de Fitness et Neutralité

17

Fonction Royal RoadPopulation vs. générations

Population=(P0,P1,P2,P3)

Pi = proportion de chaînes de fitness i

Page 18: Paysages de Fitness et Neutralité

18

Les paysages « réels » sont-ils neutres ?

Evolution of neural network controllers in robotic

Silicon chip electronic circuit evolution (FPGA) (Harvey ICES96)

Circuit de reconnaissance de la parole (Thompson 2001)

Page 19: Paysages de Fitness et Neutralité

19

Des modèles pour étudier la Neutralité

Modèle basé sur les fonctions Royal Road– Labyrinthe en Terrasses

Modèle basé sur les paysages NK (random)– NKp ‘probabilistic NK’– NKq ‘quantised NK’

Page 20: Paysages de Fitness et Neutralité

20

Terraced Labyrinth fitness function Crutchfield & al. 99

Fitness déterminée par un arbre

Nœud : réseau de neutralité– Schéma– Fitness associée

Constellation : zone de transition– mutuellement exclusives sur un même nœud

Branche : portail entre réseaux adjacents– instanciation d’une constellation

Sous-nœud : réseau de meilleure fitness– spécialisation de schéma

Page 21: Paysages de Fitness et Neutralité

21

Labyrinthe en terrasses

*************** 1

00000**********

2

00000**111*****

4

00000**111**110

6

000001011100110

8

11111**********

3

11111***0101101

4

11111***1100010

5

111110000101101

7

111110011100010

6

Page 22: Paysages de Fitness et Neutralité

22

Labyrinthe en terrasseset mutations

Mutation adaptative– rare– Contrôlée par la taille des constellations

Mutation neutre– Fréquente (muter sur une constellation)– diminue quand la fitness augmente

Mutation délétère– augmente avec la fitness– 1 seule mutation peut « ramener » à la racine

Page 23: Paysages de Fitness et Neutralité

23

Des modèles pour étudier la Neutralité

Modèle basé sur les fonctions Royal Road– Labyrinthe en Terrasses

Modèle basé sur les paysages NK (random)– NKp ‘probabilistic NK’– NKq ‘quantised NK’

Page 24: Paysages de Fitness et Neutralité

24

Paysages NKKauffman 1993

N = longueur du chromosomeK = degré d’épistasieFitness additive

– des contributions de chaque gène

– Contribution d’un gène dépend• Allèle du gène• Allèles de K autres gènes

– K=0 : fitness linéaire (smooth landscape)– K=N-1 : fitness aléatoire (rugged landscape)

Page 25: Paysages de Fitness et Neutralité

25

•DOS binomiale•Mutations neutres très rares

Paysages NK : K=2Kauffman 1993

Page 26: Paysages de Fitness et Neutralité

26

Paysages NKp Barnett 1998

Paysages NK + neutralitép=probabilité qu’une contribution soit nulle

• p=0 : paysage NK (pas de neutralité)• P=1 : paysage plat

La probabilité qu’une mutation soit neutre augmente avec p

Page 27: Paysages de Fitness et Neutralité

27

Paysages NKp : K=2Barnett 1998

Page 28: Paysages de Fitness et Neutralité

28

DOS : N=16 K=12 p=0.8

Page 29: Paysages de Fitness et Neutralité

29

NKp : proportions des mutations neutresN. Geard & al. (CEC 2002)

Page 30: Paysages de Fitness et Neutralité

30

Innovation le long d’un RNHuynen 1996, Barnett 1998

On comptabilise le nombre de phénotypes « innovants » rencontrés dans le voisinage du chemin aléatoire neutre (neutral walks) sur le RN

Page 31: Paysages de Fitness et Neutralité

31

N=20 K=4 pop=1000 mutation=0.001

p=0

p=0.99

Page 32: Paysages de Fitness et Neutralité

32

Paysages NKq Newman & Engelhardt 1997

Les contributions à la fitness sont des entiers dans [0..q] (quantised NK)

Intuitivement on construit un paysage NK en « terrasses »

La probabilité qu’une mutation soit neutre diminue avec q

Le nombre de réseaux de neutralité augmente exponentielle avec N

Percolation dans les plus grands réseaux de neutralité

Page 33: Paysages de Fitness et Neutralité

33

Paysages NKq : K=2 q=2Newman & Engelhardt 1997

Page 34: Paysages de Fitness et Neutralité

34

DOS : N=16 K=12 q=2

Page 35: Paysages de Fitness et Neutralité

35

NKq : proportion des mutations neutresN. Geard & al. (CEC 2002)

Page 36: Paysages de Fitness et Neutralité

36

Comparaisons : NKp, NKqN. Geard & al. (CEC 2002)

Distribution des mutations neutres– Quand la fitness augmente :

• Le nombre de mutations négatives augmente• Le nombre de mutations positives diminue

– NKp• Le nombre de mutations neutres diminue avec la fitness

– NKq• Le nombre de mutations neutres est maximum pour la

fitness moyenne

Page 37: Paysages de Fitness et Neutralité

37

Meilleure fitness atteinte vs. NeutralitéN=20 K=4

Random hill-climber– moyenné sur 10 simulations

Stratégie : – sélectionner un 1-mutant au hasard– jusqu’à trouver une meilleure solution– ou une solution équivalente

Le processus de recherche s’arrête sur un réseau de neutralité qui ne percolate pas

Page 38: Paysages de Fitness et Neutralité

38

Meilleure fitness atteinte vs. NeutralitéN=20 K=4

q

Page 39: Paysages de Fitness et Neutralité

39

Comment exploiter le concept de neutralité en Evolution artificielle ?

Etudier la neutralité intrinsèque– Redondance (DOS)– Connectivité (intra/inter)

Neutralité synthétique– Introduire de la redondance

• codage• bruit dans le calcul de la fitness• Méta codage (stratégies d’évolution)

– Concevoir des opérateurs neutres• Exploiter les symétries

Page 40: Paysages de Fitness et Neutralité

40

Neutralité synthétique

Spécifique– Choix du codage– Choix des opérateurs

• Neutre• Recombinaison

Indépendante du problème– Neutralité synthétique minimale

Page 41: Paysages de Fitness et Neutralité

41

Voyageur de commerce24 villes concentriques

Concevoir un Opérateur neutre – Exploiter les symétries du

problème

– « Compatible » avec le croisement (PMX)

Page 42: Paysages de Fitness et Neutralité

42

Voyageur de commerceOpérateur neutre et Symétrie

Page 43: Paysages de Fitness et Neutralité

43

Voyageur de commercesolution optimale

Page 44: Paysages de Fitness et Neutralité

44

Neutralité synthétique

Spécifique– Choix du codage– Choix des opérateurs

• Neutre• recombinaison

Indépendante du problème– Neutralité synthétique minimale

Page 45: Paysages de Fitness et Neutralité

45

Neutralité synthétique minimale P. Collard & al. (EA 99)

Dualité : neutralité synthétique minimale

Mapping génotype/phénotype

f : RMapping étendu

F : {0,1}x R

F(0x) = f(x)

F(1x) = f(x)

Page 46: Paysages de Fitness et Neutralité

46

Neutralité synthétique minimale

Redondance F : {0,1} * R F(x)=F(x)

Invariance de la Densité d’Etats

Contraction de la distance Hammingd(0000,1111)= d(00000,10000)=1

d(0000,0011)= /2 d(00000,11100)= /2

Opérateur neutre : mirroringx x

Page 47: Paysages de Fitness et Neutralité

47

Neutralité synthétique minimale Etude expérimentale

200 bits100 chromosomes1000 générationsMutation 0.5 par chromosomeMirroring 0.02Croisement 0.7Tournoi

Page 48: Paysages de Fitness et Neutralité

48

Trajectoire du centroïdesans neutralité

Page 49: Paysages de Fitness et Neutralité

49

Neutralité synthétique d’ordre 1Trajectoire du centroïde

Page 50: Paysages de Fitness et Neutralité

50

Neutralité synthétique d’ordre 1Mean/max fitness

Page 51: Paysages de Fitness et Neutralité

51

Neutralité synthétique d’ordre 1Proportion cumulée des génotypes

Page 52: Paysages de Fitness et Neutralité

52

Conclusion

Peu de résultats théoriques ou empiriques sur la structure des paysages neutres

Résultats sur des paysages simples ou idéalisés

Etudier le rôle du croisementEtudier la neutralité intrinsèqueConcevoir des opérateurs neutres

Page 53: Paysages de Fitness et Neutralité

53

Conclusion

Tthere is still a fundamental lack of both empirical data and theoretical understanding concerning the structure of neutral landscapes

Many of the analytical results have been obtained from simplified or idealised landscapes

The extent to which these results apply to the more complex landscapes likely to be found in real world problems has not yet been demonstrated

The goal of this study was to broaden knowledge of landscapes with neutrality by investigating structural properties of the NKp landscape model (Barnett 1997, 1998) and the NKq landscape model (based on Newman & Engelhardt 1997) using Kauffman’s original NK model for comparison. Initially, Kauffman’s simulations pertaining to NK landscapes were replicated. Next, these simulations were extended to the neutral NKp and NKq landscapes. A series of comparative simulations were carried out to investigate the performance of several different search algorithms on a variety of neutral and non-neutral landscapes.

Finally, a simulation was developed to investigate the role of crossover in maintaining genetic diversity in a population evolving on a neutral landscape. It was found that hill-climbing algorithms are generally capable of finding better individual solutions, but population-based algorithms tend to find higher average solutions. It was also found that crossover allows a population on a neutral landscape to maintain a much higher level of genetic diversity on a neutral layer than a population using mutation alone

Furthermore, populations using crossover suffer a less dramatic loss of diversity when a new fitness level is discovered, and recover diversity more rapidly.

Page 54: Paysages de Fitness et Neutralité

54

Page 55: Paysages de Fitness et Neutralité

55

Paysages NKpBarnett 1998

‘Probabilistic NK’Capture some of the lethal mutations in

biologyLe paramètre de neutralité p a peu

d’effet sur la corrélation

Page 56: Paysages de Fitness et Neutralité

56

Distributions des mutations neutresN. Geard & al. (CEC 2002)

Page 57: Paysages de Fitness et Neutralité

57

Epistasie vs. Neutralité

Mesurer l’effet d’une mutation sur le fitness– Principe de causalité– Effet neutre

Expérience en Robotique (T. Smith 2002)

– Ajouter de la neutralité et Diminuer l’épistasie favorise l’évolution

Page 58: Paysages de Fitness et Neutralité

58

Frozen accidents

*************** 1

00000**********

2

00000**111*****

4

00000**111**110

6

000001011100110

8

11111**********

3

11111***0101101

4

11111***1100010

5

111110000101101

7

111110011100010

6

Page 59: Paysages de Fitness et Neutralité

59

Concevoir des Opérateurs neutres

Unitation / Inversion

000111000111

000000111111

Inversion / croisement

000111000111 000111111111

000000111111 000000000111

Page 60: Paysages de Fitness et Neutralité

60

Questions

Echantillonnage pour le dosStratégie d’évolutionSmith 2002 evolvability