Web viewrÉpublique algÉrienne dÉmocratique et populaireministÈre de...

12
RÉPUBLIQUE ALGÉRIENNE DÉMOCRATIQUE ET POPULAIRE MINISTÈRE DE L’ENSEIGNEMENT SUPÉRIEUR ET DE LA RECHERCHE SCIENTIFIQUE Université des Sciences et de la Technologie d’Oran U.S.T.O. Faculté des Sciences Département d’Informatique MIAS Master 2 Option : RFIA Sous-direction de : Professeur M. BENYETTOU Préparé par : Les Algorithmes 0

Transcript of Web viewrÉpublique algÉrienne dÉmocratique et populaireministÈre de...

Page 1: Web viewrÉpublique algÉrienne dÉmocratique et populaireministÈre de l’enseignement supÉrieur et de la recherche scientifique université des sciences et de

RÉPUBLIQUE ALGÉRIENNE DÉMOCRATIQUE ET POPULAIRE

MINISTÈRE DE L’ENSEIGNEMENT SUPÉRIEUR ET DE LA RECHERCHE

SCIENTIFIQUE Université des Sciences et de la Technologie d’Oran

U.S.T.O. Faculté des Sciences

Département d’InformatiqueMIAS

Master 2Option : RFIA

Sous-direction de : Professeur M. BENYETTOU

Préparé par :

Melle. SEHAILIA Lamia

Année Universitaire : 2012/201

Les Algorithmes Génétiques

0

Page 2: Web viewrÉpublique algÉrienne dÉmocratique et populaireministÈre de l’enseignement supÉrieur et de la recherche scientifique université des sciences et de

Table des matièresIntroduction...........................................................................................................................................2

Historique...............................................................................................................................................2

Définition................................................................................................................................................2

Domaine d’application...........................................................................................................................3

Exemple d’application............................................................................................................................3

Avantages et inconvenient.....................................................................................................................5

Conclusion..............................................................................................................................................7

Référence bibliographique.....................................................................................................................8

1

Page 3: Web viewrÉpublique algÉrienne dÉmocratique et populaireministÈre de l’enseignement supÉrieur et de la recherche scientifique université des sciences et de

Introduction

Depuis plusieurs années, on note un intérêt marqué pour l'étude de la grammaire de la vie, la génétique. Un des objectifs de cette vaste discipline est d'établir une carte des gènes impliqués dans la transmission des caractères héréditaires. L'évolution des connaissances et des outils technologiques dans ce domaine va de pair avec l'élaboration d'outils statistiques permettant d'analyser les données recueillies en laboratoire. Ainsi,plusieurs méthodes statistiques de cartographie génétique ont été développées. Certaines d'entre elles reposent toutefois sur des hypothèses peu réalistes quant à la forme que prennent les échantillons ou les modèles biologiques impliqués.

plusieurs méthodes statistiques de cartographie génétique ont été développées. Certaines d'entre elles reposent toutefois sur des hypothèses peu réalistes quant à la forme que prennent les échantillons ou les modèles biologiques impliqués.

Historique

Fin des années 50, début des années 60 il ya eu tentatives pour engrener la science et son l'évolution. En 1975-John H. Holland, l'adaptation au naturel et des systèmes artificiels; livre de référence.1985-Première conférence intelligence algorithme génétique.Conception des aéronefs, la planification, calcul symbolique, Goldberg, David E. Algorithmes génétiques en recherche, Optimisation, Apprentissage et Addison-Wesley, Reading, MA, 1989.Hollande, John H. Adaptation in Natural and Artificial Systèmes. MIT Press, 1992. Koza, John R.. Programmation génétique: la programmation des ordinateurs à l'aide de la sélection naturelle. MIT Press, 1992. John H. Holland. Ordre cachée: Comment adaptation ; En Pays-Bas, la modélisation des écosystèmes (1995). Construit complexité. Addison-Wesley, 1995.Mitchell, Melanie. Une Introduction aux algorithmes génétiques.MIT Press, 1996. Haupt, Randy L., et Sue Ellen Haupt Pratique génétiquealgorithmes. John Wiley & Sons, 1998. Stephanie Forrest. Les algorithmes génétiques. Dans l'ordinateur Science et Engineering Handbook, CRC Press, 1997, 557-571. Banzhaf, Wolfgang et al. Programmation Génétique – Une Introduction. Morgan Kaufmann, 1998. Goldberg, David E. La conception de l'innovation: Leçons à partir compétentes et les algorithmes génétiques. Kluwer,2001.[1] Genetic Algorithms—Some History

Définition

Un algorithme génétique est une technique de programmation qui imite l'évolution biologique comme une stratégie de résolution de problèmes. Face à un problème spécifique à résoudre, l'entrée à l'AG est un ensemble de solutions possibles à ce problème, codé d'une certaine façon, et une métrique appelée une fonction de remise en forme qui permet à chaque candidat d'être évalués

2

Page 4: Web viewrÉpublique algÉrienne dÉmocratique et populaireministÈre de l’enseignement supÉrieur et de la recherche scientifique université des sciences et de

quantitativement. Ces candidats peuvent être des solutions déjà connues de travailler, dans le but de l'AG étant de les améliorer, mais le plus souvent ils sont générés au hasard.

L'AG évalue ensuite chaque candidat en fonction de la fonction de remise en forme. Dans un bassin de candidats générés aléatoirement, bien sûr, la plupart ne fonctionnent pas du tout, et ceux-ci seront supprimés. Toutefois, par hasard, quelques-uns qui pourrait être prometteuse - ils peuvent montrer une activité, même si la seule activité faible et imparfaite, pour résoudre le problème.

Ces candidats prometteurs sont conservés et autorisé à reproduire. Les copies multiples sont faites d'entre eux, mais les copies ne sont pas parfaits, les changements aléatoires sont introduits pendant le processus de copie. Ces descendants numérique, puis passez à la prochaine génération, la formation d'un nouveau bassin de solutions candidates, et sont soumis à un deuxième cycle d'évaluation de fitness. Ces solutions candidates qui ont été aggravées, ou pas fait mieux, par les changements de leur code sont à nouveau supprimées, mais encore une fois, par hasard, les variations aléatoires introduites dans la population peut avoir amélioré certaines personnes, les transformant en une meilleure, plus complète ou solutions plus efficaces à ce problème à la main. Là encore, ces personnes gagnantes sont sélectionnées et copiées dans la prochaine génération avec des changements aléatoires, et le processus se répète. On s'attend à ce que la forme moyenne de la population augmentera à chaque tour, et ainsi de suite en répétant ce processus pour des centaines ou des milliers de tours, des solutions très bonnes à ce problème peuvent être découverts.

Domaine d’application

Les algorithmes génétiques ont été largement utilisés dans le cadre de l’extraction de connaissances.

On les retrouve dans toutes les tâches principales. Leur application en sélection d’attributs a surtout été réalisée en optimisation mono-objectif à l’aide de méthodes enveloppantes notamment avec le classifier K-Nearest-Neighbor, avec un réseau de neurones ou avec des tables de décisions euclidiennes. En optimisation multi-objectif, les travaux sont plus rares. Leur application à la sélection d’attributs pour le clustering est relativement peu fréquente.

Les algorithmes génétiques sont régulièrement utilisés pour réaliser une tâche de clustering. Les Différents algorithmes proposés diffèrent aussi bien par l’approche de clustering utilisée que par leur application à des données réelles. Ainsi il existe des travaux ayant comme approche la méthode des médusoïdes, la méthode des Kmeans , ou une approche hiérarchique. Les applications sont diversifiées : données spatiales, données d’expression génique et de données de biopuces.

Exemple d’application

Cet exemple est dû à Goldberg (1989). Il consiste à trouver le maximum de la fonction f(x) = x sur l'intervalle [0, 31] où x est un entier naturel.

On a 32 valeurs possibles pour x on choisit donc un codage discret sur 5 bits : on obtient donc la séquence 0,1,1,0,1 pour 13, la séquence 1,1,0,0,1 pour 25, etc...

On initialise la population initiale de manière aléatoire et on fixe sa taille à 4 individus. On définit simplement la fitness comme étant la valeur de x, vu qu'on en cherche la valeur maximum

3

Page 5: Web viewrÉpublique algÉrienne dÉmocratique et populaireministÈre de l’enseignement supÉrieur et de la recherche scientifique université des sciences et de

sur l'intervalle [0, 31] plus la valeur de x sera élevée plus on se rapprochera du maximum de la fonction identité et donc plus la fitness sera grande. Soit la population initiale suivante :

Individu Séquence Fitness %du total

1 01011 11 18.62 10011 19 32.23 00101 5 8.54 11000 24 40.7

total 59 100

On opte pour une sélection par la méthode la loterie biaisée :

1er trim=14%2e trim=32,2%3e trim=40,7%4e trim=8,5%

Cette figure représente ->l’application de la méthode de sélection de la loterie biaisée sur la population

On fait tourner la roue 4 fois de suite, en général on fait tourner n / 2 fois, soit 2 fois dans ce cas, mais le nombre 2 étant trop petit on décide de la faire tourner 4 fois. On obtient la nouvelle population :

individu sequence1 110002 001013 110004 01011

On applique l'opérateur de croisement en utilisant un seul point de crossover. Normalement chaque couple donne 2 enfants qu'on ajoute à notre nouvelle population P' la faisant passer de n / 2

Une population initiale

Figure: individus sélectionnés par la méthode de la loterie biaisée

4

Page 6: Web viewrÉpublique algÉrienne dÉmocratique et populaireministÈre de l’enseignement supÉrieur et de la recherche scientifique université des sciences et de

individus à n individu, mais vu que dans le cas de notre exemple nous avons déjà atteint nos n individus, les 2 enfants du couple remplaceront leurs parents.

Deux couples sont formés de manière aléatoire :• couple 1 : l'individu 2 avec l'individu 3• couple 2 : l'individu 1 avec l'individu 4.Les point de crossover sont eux aussi tirer au hasard.

On obtient le résultat suivant :parents enfants00101 0101101011 0010111000 0101101011 11000

Cette figure représente résultat de l'application de l'opérateur de croisement avec un point de crossover sur les individus sélectionnés par la loterie biaisée

On applique l'opérateur de mutation qui choisit de manière aléatoire si on doit faire une mutation et sur quel locus la faire :

Individu Séquence Fitness %du total

1 11011 27 382 00101 5 73 01111 15 21.14 11000 24 33.8

Total 71 100

Cette figure représente la nouvelle population après application des différents opérateurs en une seule génération le maximum est passé de 24 à 27, et la fitness globale de la population a relativement augmentée pour passer de 59 à 71. On s'arrête ici pour cet exemple mais dans la réalité on continuera à engendrer des générations successives jusqu'à obtenir le maximum global : 31.

Avantages et inconvénients

D’abord, les algorithmes génétiques sont coûteux en temps de calcul, puisqu’ils manipulent plusieurs solutions simultanément. C’est le calcul de la fonction de performance qui est le plus pénalisant, et on optimise généralement l’algorithme de façon à éviter d’évaluer trop souvent cette fonction.

Ensuite, l’ajustement d’un algorithme génétique est délicat. L’un des problèmes les plus caractéristiques est celui de la dérive génétique, qui fait qu’un bon individu se met, en l’espace de quelques générations, à envahir toute la population. On parle dans ce cas de convergence prématurée, qui revient à lancer à une recherche locale autour d’un minimum… qui n’est pas forcément l’optimum attendu. Les méthodes de sélection proportionnelle peuvent en particulier favoriser ce genre de dérive. Un autre problème surgit lorsque les différents individus se mettent à

5

Page 7: Web viewrÉpublique algÉrienne dÉmocratique et populaireministÈre de l’enseignement supÉrieur et de la recherche scientifique université des sciences et de

avoir des performances similaires : les bons éléments ne sont alors plus sélectionnés, et l’algorithme ne progresse plus.

Le choix d’une représentation « intelligente » pour permettre un remplacement générationnel efficace est un autre aspect de la question, et l’efficacité d’un algorithme génétique dépend beaucoup de la façon dont on opère le croisement des individus. Ainsi, dans le cas du problème du voyageur de commerce, on peut envisager d’apparier selon la méthode des coupures, telles que nous l’avons vu plus haut. Considérons les deux tournées suivantes, et opérons une coupure entre la troisième et la quatrième ville, puis inversons les gènes :

Parent 1 : A – F – B – C – E – D Parent 2 : C – B – A – F – D – E On obtient alors les successeurs : Enfant 1 : A – F – B – C – D – E Enfant 2 : C – B – A – F – E – D Ici, des trajets initiaux, on n’a gardé que les trois premières villes (A – F – B), et on a placé dans

l’enfant 1 les villes qui ne sont pas présentes dans la première partie (C – D – E), dans l'ordre où elles apparaissent dans le parent 2. On a fait le contraire pour l’enfant 2.

Mais on pourrait également recomposer en fonction du nombre d’adjacences de villes communes entre les deux parents. Si deux tournées possèdent des villes adjacentes en commun, il peut être intéressant que les trajets « enfant » les contiennent aussi. Des méthodes spécifiques de remplacement générationnel ont ainsi été élaborées, comme le « edge-3 » de Mathias et Whitley, qui ont montré leur grande efficacité. Mais il faut du temps pour se consacrer à l’étude et à la mise en place de bons opérateurs génétiques, face à un problème donné, et un algorithme génétique est sans doute plus délicat à faire fonctionner du premier coup qu’un algorithme du recuit simulé.

Le grand avantage des algorithmes génétiques est qu’ils parviennent à trouver de bonnes solutions sur des problèmes très complexes, et trop éloignés des problèmes combinatoires classiques pour qu’on puisse tirer profit de certaines propriétés connues. Ils doivent simplement déterminer entre deux solutions quelle est la meilleure, afin d’opérer leurs sélections. On les emploie dans les domaines où un grand nombre de paramètres entrent en jeu, et où l’on a besoin d’obtenir de bonnes solutions en quelques itérations seulement – dans les systèmes de régulation de transport en temps réel par exemple.

Par ailleurs, les algorithmes génétiques se prêtent bien, du fait de leur traitement simultané de solutions, à la recherche d’optimum multiples : en créant une fonction de coût partagée, dont la valeur dépend partiellement de la distance entre les individus, on voit se former graduellement des sous-populations d’individus, qui se stabilisent autour des différents pics de la fonction objectif. C’est la technique du nichage par la méthode du partage.

6

Page 8: Web viewrÉpublique algÉrienne dÉmocratique et populaireministÈre de l’enseignement supÉrieur et de la recherche scientifique université des sciences et de

Conclusion

Les algorithmes génétiques fournissent des solutions proches de la solution optimale à l'aide des mécanismes de sélection, d'hybridation et de mutation. Ils sont applicables à de nombreux problèmes, dont le problème du voyageur de commerce.

Mais malheureusement il consomme beaucoup de temps de calcule et peuvent facilement tombé dans les minimas locaux.

7

Page 9: Web viewrÉpublique algÉrienne dÉmocratique et populaireministÈre de l’enseignement supÉrieur et de la recherche scientifique université des sciences et de

Reference bibliographique

www.lsis.univ-tln.fr/~tollari/TER/AlgoGen1/node5.html

Genetic algorithms in search, optimization and machine learning (Goldberg Addison-

wesley 1989

[Spalanzani,99]: A.Spalanzani ,”Algorithmes évolutionnaires pour l’étude de la robustesse des Systèmes de reconnaissance automatique de la parole», thèse de

doctorat, Université Joseph Fourier- Grenoble ,France28Octobre 1999. [Dejong et al,92]: Dejong K.A. and W.M.Spears,”Aformel analysis of the role of

multi-point crossover in genetic algorithms”. Annals of Mathematics and Artificial Intelligence Journal,pp:1-26,1992.

8