8/20/2014 Intelligence Artificielle et plagiarisme constructif Mounir Boukadoum UQAM.

Post on 04-Apr-2015

113 views 1 download

Transcript of 8/20/2014 Intelligence Artificielle et plagiarisme constructif Mounir Boukadoum UQAM.

04/11/23

Intelligence Artificielle et plagiarisme constructif

Mounir Boukadoum

UQAM

Aujourd’hui… On peut-on réaliser des computations hors de

portée de la plupart des adultes avec un ordinateur : e.g., calculs arithmétiques, jouer aux échecs, brasser

de grandes quantités de données, etc. Mais pas des fonctions cognitives à la portée

d’un bébé ! e.g., reconnaissance des visages et des objets,

autonomie d’apprentissage, coordination sensori-motrice Le cerveau humain fonctionnerait-il suivant

des principes différents des ordinateurs actuels ?

Un système c’est quoi ?

Bonne question ! Une définition pragmatique :

Ensemble d’éléments physiques ou conceptuels liés par des relations causales

23-04-11 3

Relation(s) d’entrée-sortie

Causes (entrées)

Effets (sorties)

Paramètres

Et un modèle?

Définition pas plus évidente... autre définition pragmatique:

Construction physique ou schématique permettant d’expliquer la nature ou comportement d’un système à partir de postulats élémentaires.

04/11/23 4

Identification des éléments

Hmm…

stack_struct

stack_point

list

queue_num_elem

queue_struct

queue_headqueue_tail

stack_top stack_push stack_pop

stack_fullstack_empty

list_elimlist_is_in

list_add

list_empty

queue_full queue_empty

queue_extract

queue_insert

global_init

stack_to_queue

stack_to_list

queue_to_stack

list_to_stack

list_to_queue

queue_to_list

La modélisation classique

Part d’hypothèses intuitivement acceptables : Le tout est la somme des parties (principe de linéarité) Des perturbations minimes sur un nombre fini de

parties auront un effet minime sur le tout (principe de continuité locale)

Les lois régissant le fonctionnement sont immuables à court ou moyen terme (principe de stationnarité) ; en particulier, deux effets différents pour la même cause sont le fait de paramètres différents

Un système qui ne répond pas aux hypothèses demande seulement l’ajout de termes de correction

04/11/23 6

Conséquences... Les systèmes peuvent être décrits par un

approche formelle Équations différentielles/intégrales linéaires et

stationnaires dans le temps Raisonnement logique

Les « récalcitrants » peuvent être corrigés en changeant leurs paramètres ou en ajoutant des termes de correction : Un système non linéaire est un système linéaire, plus… Un système non stationnaire est un système invariant

dans le temps, plus…

04/11/23 7

Et que faire si…

Les valeurs des variables sont imprévisibles, (variables bruitées ou trop complexes) ?

Remplacer les équations d’entrée-sortie par des versions probabilistes

Les nature des variables est vague ou leurs valeurs imprécises, ou on tombe sur des contradictions?

Étudier le sujet avec plus de détail Les équations n’ont pas de solutions

analytiques Et l’analyse numérique, vous y avez pensé ?

04/11/23 8

Mais alors, pourquoi…

Peut-on réaliser des prouesses computationnelles hors de portée de la plupart des gens avec un ordinateur : e.g. calculs arithmétiques, jouer aux échecs, brasser de

grandes quantités de données précisément, etc.

mais pas réaliser des fonctions à la portée d’un bébé : e.g. reconnaissance des visages et des objets, autonomie

d’apprentissage, coordination sensori-motrice

Réponse possible : le cerveau humain fonctionne suivant des principes différents des ordinateurs Séquentiel vs. parallèle; « intelligence ».

IA classique

Descartes : Cogito, ergo sum (c.à.d. c’est l’esprit qui compte, pas le corps)

Le calcul analytique est un bon début, mais il faut aller plus loin reproduire les facultés cognitives humaines de

haut niveau : langage, raisonnement discursif, abs tractation des idées, etc.

La logique et les graphes indiquent le chemin

Représentation formelle des connaissances

Spot is a dog Spot is brown Every dog has four

legs Every dog has a tail Every dog is a

mammal Every mammal is

warm-blooded

dog(Spot) brown(Spot) (x)(dog(x)

four-legged(x)) (x)(dog(x) tail(x)) (x)(dog(x)

mammal(x)) (x)(mammal(x)

warm-blooded(x))

Graphe (Réseau sémantique)

mammal

dog

Spot

warm-blooded

four-legs

tail

brown

Exempled`inférence

Exemple d’utilisationIF

1) the infection is primary-bacteremia, and2) the site of the culture is one of the sterile

sites, and3) the suspected portal of entry of the

organism is the gastrointestinal tract,

THENthe identity of the organism is bacteroides

with suggestive evidence 0.7

Pourquoi cela ne marche pas toujours…

Difficulté de trouver un ordre (les règles)

Explosion combinatoire des règles Sensibilité au contexte Symboles sans ancrage sémantique Sens-commun difficile à modeler Cognition non verbale non modelée Les paradoxes ne sont pas exclus

Paradoxes de Russel, Théorèmes de Gödel

15

Modus ponens: ((PQ) P) Q Wason Task (1996, 1993):

Si voyelle, alors chiffre pair au verso

Carte(s) à tourner pour vérifier la règle? <10% de bonnes réponses (1 & 2)!

Si enveloppe sellée, alors timbre de 2.80$ au verso Enveloppe(s) à tourner pour vérifier la règle? 90% de bonnes réponses!

Même règle, mais utilisation inconsistante!

L’implication logique est-elle naturelle (chez l’humain) ?

A 3 B 2

Adapted from Ripoll and Tricot, 1995

Le cycle de la compétence chez l’humain1. Novice : apprentissage de faits et règles pour

application sans discernement 2. Débutant avancé : identification de situations

similaires par expérience3. Compétence émergente : sens de la

pertinence pour grouper des volumes de faits4. Compétent : pensée analytique enrichie par

l’organisation et la compréhension intuitives5. Expert : comportement est intuitif,

automatique et efficace.

04/11/23 17

Qu’en est-il de formalismes…

Résilients à l’incertitude, la complexité ou le manque de précision ?

Capables de s’adapter automatiquement à des changements de contexte

Plus proches de la manière dont l’être humain lambda et la nature en général résolvent les problèmes ?

Adapté de Léonard Studer

La « nouvelle » IA Apparue dans les années 80 Convergence de développements

en plusieurs disciplines : La représentation

propositionnelle émerge des connaissances et n’est plus un postulat de base

Utilisation d’approches non traditionnelles connexionnisme (savoir implicite vs.

explicite) métaphores

04/11/23 19

Traitement intelligent ?

Propriété d’un système capable : d’apprentissage autonome d’auto-adaptation à des contextes différents de traitement de données incomplètes, vagues

ou imprécises Défi de taille pour les outils de

modélisation traditionnels, mais pour la nature ! Pourquoi ne pas la copier? Processus biologiques, évolutionnaires,

cognitifs, etc. (intelligence mimétique), quelquefois matés avec des outils statistiques non linéaires.

Computation naturelle (mimétique)

Caractéristiques: Tolérance au bruit, à l’erreur, aux fautes,

aux défauts Algorithmes génériques Adaptabilité Réponse en temps réel Optimalité et boîte blanche non

essentiels

04/11/23 21

Quand utiliser TII ?

Modèles inconnus, vagues ou incomplets Modèles connus, mais pas les outils

(modèles non linéaires, variant dans le temps, etc.)

Données bruitées, fragmentaires ou soumises à l’influence environnementale

Performance des outils formels faible (temps, précision)

Dimension de l’espace de travail trop grande

04/11/23 22

Quelques fois on sait, mais…

Modèle en haute fréquence d’un transistor

Lg Gg LdGd

Gs

Ls

DG

S

Gi

G1Cs

Cd

Cg

gm VcVc

S21= { [-2 G0 Gg Gd gm Gi Gs] p**0 + 2 G0 Gg Gd Gi [Cg (Gs+gm+G1)+Cs G1] p**1 + [Cg Cs G0 Gg Gd

(Gi+Gs+G1)+ G0 Gg Gd Gi Cd (Cg+Cs)+G0 Gg Gd Gi Gs (Cg Ls (gm+G1)+G1 Cs Ls)] p**2 + 2 G0 Gg Gd [Cg

Cs Cd+Gs Cg Cs Ls (Gi+G1)+Gi Gs Cd Ls (Cg+Cs)] p**3 + 2 G0 Gg Gd Gs Cg Cs Cd Ls p**4 } / { G0 Gg Gi

(Gd GL (gm + G1 + Gs)+ G1 Gs (Gd + GL)) p**0 + [Cg Gi (G0 (Gg Gd gm + Gg GL gm + Gd GL gm + Gg Gd G1

+ Gg GL G1 + Gd GL G1 + Gg Gd Gs+ Gg GL Gs+ Gd GL Gs + Gd gm Gs + GL gm Gs + Gd G1 Gs + GL G1 Gs) + Gg (Gd GL gm + Gd GL G1 + Gd GL Gs + Gd gm Gs + GL gm Gs +Gd G1 Gs + GL G1 Gs)) + Cs (G0 (GL (Gg Gd

G1+ Gg Gd Gi + Gg G1 Gi + Gd G1 Gi + Gg Gd Gs + Gg G1 Gs + Gd Gi Gs + G1 Gi Gs) + Gg Gd G1 Gi + Gg Gd

G1 Gs + Gd G1 Gi Gs) + Gg Gi (Gd GL G1 + Gd GL Gs + Gd G1 Gs + GL G1 Gs)) + Cd G0 Gg Gi (Gd GL + Gd

Gs+ GL Gs)+ (Ld G1+ Ls (G1 + gm)) G0 Gg Gd GL Gi Gs] p**1 + [Cg Cs (G0 (GL (Gg G1+Gd G1+Gg Gi+Gd

Gi+Gg Gs+Gd Gs+G1 Gs+Gi Gs) + Gg Gd G1+Gg Gd Gi+Gg Gd Gs+Gd G1 Gs+Gd Gi Gs) +Gg (Gd GL G1+Gd

GL Gi+Gd GL Gs+Gd G1 Gs+GL G1 Gs+Gd Gi Gs+GL Gi Gs)) + Cg Cd Gi (G0 (Gg Gd +Gg GL + Gd GL + Gd Gs

+ GL Gs) + Gg (Gd GL + Gd Gs + GL Gs)) + Cs Cd (G0 (Gg Gd GL+Gg Gd Gi+Gg GL Gi + Gd GL Gi + Gg Gd

Gs + Gg GL Gs + Gd Gi Gs + GL Gi Gs) + Gg Gi (Gd GL + Gd Gs + GL Gs)) + Cg Lg G0 Gg Gi (Gd GL gm + Gd

GL G1 + Gd GL Gs + Gd gm Gs + GL gm Gs + GL G1 Gs + Gd G1 Gs ) + Cs Lg G0 Gg Gi (Gd GL G1 + Gd GL Gs + Gd G1 Gs + GL G1 Gs)+ Cg Ld Gd Gi (G0 (Gg GL gm + Gg GL G1 + Gg GL Gs + GL gm Gs + GL G1 Gs) + Gg GL

Gs (gm + G1))+ Cs Ld Gd G1 GL (G0 Gg Gi + G0 Gg Gs + G0 Gi Gs + Gg Gi Gs) + Cd (Ld + Ls) G0 Gg Gd GL Gi

Gs + Cs Ls Gs (G0 (Gg Gd (GL G1 + GL Gi + G1 Gi ) + GL G1 Gi (Gg + Gd)) + Gg Gd GL G1 Gi)+ Cg Ls Gi Gs

(G0 (Gg Gd gm + Gg GL gm + Gd GL gm + Gg Gd G1 + Gg GL G1 + Gd GL G1) + Gg Gd GL gm + Gg Gd GL G1)] p**2 + [Cg Cs Cd (G0 Gg Gd + G0 (Gg GL + Gd GL + Gd Gs + GL Gs) + Gg (Gd (GL + Gs) + GL Gs)) + Cg Cs

Lg G0 Gg (Gd (GL G1 + GL Gi + GL Gs + G1 Gs + Gi Gs) + GL G1 Gs + GL Gi Gs)+ Cg Cd Lg G0 Gg Gi (Gd (GL

+ Gs) + GL Gs) + Cs Cd Lg G0 Gg Gi (Gd (GL + Gs) + GL Gs)+ Cg Lg Ld G0 Gg Gd GL Gi Gs (gm + G1)+ Cg Lg

Ls G0 Gg Gd GL Gi Gs ( gm + G1) + Cs Lg (Ld + Ls) G0 Gg Gd GL G1 Gi Gs + Cg Cs Ld GL (G0 Gd (Gg G1 + Gg

Gi + G1 Gs + Gi Gs + Gg Gs) +Gg Gd Gs (G1 + Gi))+ Cg Cd Ld Gd Gi GL (G0 Gg + G0 Gs + Gg Gs)+ Cs Cd Ld

Gd GL (G0 Gg Gi + G0 Gg Gs + G0 Gi Gs + Gg Gi Gs) + Cg Ld Ls G0 Gg Gd GL Gi Gs (gm + G1) + Cs Ld Ls G0

Gg Gd GL G1 Gi Gs + Cg Cs Ls Gs (G0 (Gg Gd G1+Gg GL G1+Gd GL G1+Gg Gd Gi+Gg GL Gi+Gd GL Gi )+Gg

Gd GL (G1 + Gi)) + Cg Cd Ls Gi Gs (G0 (Gg Gd +Gg GL+Gd GL) +Gg Gd GL) + Cs Cd Ls Gs (G0 (Gg Gd GL

+Gg Gd Gi +Gg GL Gi +Gd GL Gi) +Gg Gd GL Gi)] p**3 + [Cg Cs Cd Ld Gd GL Gs ( G0 + Gg) + Cg Cs Cd Ls

Gs (G0 Gg Gd +G0 Gg GL +G0 Gd GL + Gg Gd GL)+ Cg Cd Lg G0 Gg GL Gs (Cs + Ld Gd Gi)+ Cg Cs Lg Ld G0 Gg

Gd GL Gs (G1 + Gi) + Cs Cd Lg (Ld+Ls) G0 Gg Gd GL Gi Gs + Cg Cs Lg Ls G0 Gg Gd GL Gs (G1 + Gi) + Cg Cd

Lg Ls G0 Gg Gd GL Gi Gs + Cg Cs Ld Ls G0 Gg Gd GL Gs (G1+ Gi) + (Cg + Cs) Cd Ld Ls G0 Gg Gd GL Gi Gs] p**4 + [Cg Cs Cd Lg (Ld + Ls) G0 Gg Gd GL Gs + Cg Cs Cd Ld Ls G0 Gg Gd GL Gs] p**5 }

Et on a supposé un modèle Et on a supposé un modèle linéaire à paramètres linéaire à paramètres distribués !distribués !

04/11/23 23

Inférence

Déductive(modèles précis)

Synthétique(modèles approximatifs)

AbductiveInductive

L’intelligence mimétique « raisonne »-t’elle ?

Proposition Type de raisonnement

(a) Les hommes sont mortels(b) Socrate est un homme(c) Socrate est mortel

(a) et (b) donne (c) par déduction(b) et (c) donne (a) par induction

(a) et (c) donne (b) par abduction

TI

04/11/23 24

La boîte à outils présente Réseaux de neurones artificiels (RN) Logique floue (LF) Algorithmes évolutionnaires (AE) Les systèmes immunitaires artificiels (AIS) Concepts associés (à des fins d’hybridation)

Machines à vecteurs supportsOptimiseurs algorithmiquesGraphes et treillis probabilistes (Modèles

markoviens, réseaux bayésiens, etc.)Raisonnement à base de casEt autres …

04/11/23 25

Lequel, pourquoi ?

RN

AELF

Classer/ Apprendre Optimiser

Expliquer/Décider

L’hybridation est possible et desirable :

Le but est un système de

traitement avec plus intelligence

AISDétecter

04/11/23 26

Fonctions clés- Diagnostique - Évaluation- Pronostique- Contrôle

Technologies- Classifieurs (SVM, BBN,

NN, FS, RF,…)

- Prédicteurs (NN, RBF, FS, RF, basés instance, …)

Lequel, quand ?

Tactique[ ns- hres-jours]

Opérationnel[ Jours-Sems]

Strategique[ Mois-Années]

Meta[ Vie]

Adapté de Piero Bonissone

Fonctions clés- Génération de cédules- Planif. logistique- Évaluation d’état & allocation de ressources

- Gestion d’actifs

Technologies- Optimiseurs (EA, Tabou …)- Simulateurs (Discrets,

Stochastiques, …)- Experts (Temporels, basés

règles, cas, instances, …)

Fonctions clés- Gestion de ressources

Multi-Objectifs - Détermination de politique- Optimisation simple/Multi-

objectif- Prise de décision

Technologies- Optimiseurs (EA Multi-

Objectifs, Tabou, …)- Simulateurs (Discrets,

Stochastiques, …)- Experts en compromis

(basés flou, règles, cas, instances, …)

- Visualisation (Interactifs, basés règles, cas, instances, …)

Fonctions clés- Support de cycle de vie - Surveillance de l’usage- Adaptabilité aux

changements- Évolutilivité des modèle

Technologies- Optimiseurs pour le

réglage & l’adaptation (EA, Gradients, Tabou, …)

- Simulateurs pour la validation (Discrets, Stochastiques, …)

04/11/23 27

Les propriétés générales

: Des théorèmes existent pour plusieurs techniques, prouvant les propriétés : Approximateur universel de toute fonction bornée

et suffisemment régulière. Parsimonieux en paramètres en comparaison avec

un algorithme linéaire. Convergence vers une solution

: Appoches heuristiques : pas de critères formels pour régler les paramètres !

04/11/23 28

Les RNA

« Inspirés » du système nerveux central Groupements d’éléments simples Fonctionnalité répartie dans l’espace et le

temps Se distinguent par la topologie, la/les

fonctions de sortie et la règle d’adaptation des poids

Entrées Sorties

: Neurone

: lien pondéré

04/11/23 29

RN un bon choix si :

Le problème est riche en données et pauvre en modèles (Modélisation classique inapplicable)

Relation d’e/s non linéaire, à variables multiples ou volatile (approximation par méthodes linéaires souvent inappropriées, les essayer d’abord !)

On a du temps (et de la créativité) pour arriver au RNA final La détermination des paramètres est un art !

04/11/23 30

RN en action

Classification/catégorisation/approximation Détection/identification de signaux, d’objets et

d’organismes biologiques Synthèse de fonctions complexes Modélisation non linéaire Visualisation de structures sous-jacentes Analyse d’image (cellules malignes, défauts de

soudure ou d’assemblage, aussi cibles de missiles malheureusement )

Codeurs/décodeurs

04/11/23 31

Logique floue 101

Remplace des intervalles de valeurs numériques par des étiquettes qualitatives (valeurs linguistiques).

On raisonne sur les valeurs linguistiques : Y=f(x) s’applique sur des intervalles et non des singletons

L’appartenance multiple est permise: une valeur numérique peut correspondre à plusieurs valeurs linguistiques

0.5

1.0

0.0

Valeur mesurée

v()NI NM NP PP PM PIb

a

b

y

xx

y

a

y = fct de points y = fct d’intervalles

04/11/23 32

LF un bon choix si :

L’expérience ou l’intuition peut compléter/remplacer la connaissance formelle

Le savoir du domaine est de nature heuristique Les objectifs sont clairs, mais pas la démarche ! Les données se prêtent à l’agrégation L’environnement d’opération est bruité La performance temporelle est un critère

04/11/23 33

LF en action

Décision/analyse/classification Régulateurs non-linéaires Algorithmes de décision à base d’heuristiques Modélisation en boîte blanche Systèmes experts intuitifs Systèmes embarqués à réaction rapide Recherche de plus courts chemins Classifieurs rapides

04/11/23 34

Algorithmes évolutionnaires 101

Trouvent la solution progressivement, par renforcement de traits positifs

Introduisent une dimension stochastique à la recherche de solution

Incluent : Les algorithmes génétiques La programmation génétique L’intelligence collective (« ant colonies », « swarms ») Autres…

04/11/23 35

AE un bon choix si :

Les données peuvent être codées et le problème peut être formalisé par un graphe

L’effet de groupe peut améliorer le comportement individuel et vice-versa

L’atteinte du but est facile à conditionner Le problème est à contraintes multiples Un temps de convergence potentiellement lent

est acceptable Le hasard est au secours de la nécessité !

04/11/23 36

AE en action

Optimisation/fouille/synthèse/décision Reproduction de processus à l’aveugle Matériel évolutif (e.g. systèmes auto adaptatifs) Recherche de chemins et de points d’intérêts dans des

espaces complexes Traitement d’images Optimisation multiobjective Contournement de brevets !

04/11/23 37

Comparaison entre systèmes

LF RN AE

Représentation des connaissances ++ -- -

Tolérance à l’incertitude ++ ++ ++

Tolérance au manque de précision ++ ++ ++

Adaptabilité - ++ ++

Capacité d’apprentissage -- ++ ++

Capacité d’explication ++ -- -

Temps de réponse ++ + -

Maintenabilité + ++ +

-- Ouach ! -Mmh… + Ok ++ Yes sir !

04/11/23 38

Technique de modélisation

Equa-diff. FL RN AE Autres

Structure définissante

Ordre Ensemble de règles

Architecture Topologie et/ou encodage

Encodage

Paramètres Coefficients Étiquettes

Degrés de vérité

Biais

Poids synaptiques

Varient

Processus d’utilisation

Résoudre les équations - Solution fermée

- Approximation

Évaluation de nœud & Propagation

Propagation Évaluation de nœud & Propagation

Évaluation d`étape et Propagation

En résumé

REPRESENTATION