Info Cognitives

IFT 703IFT 703Informatique cognitiveInformatique cognitive

IntroductionIntroduction

André Mayers Automne 2010

PlanPlan

Description du plan de cours Introduction à l’informatique cognitive

◦ Intelligence artificielle

◦ Psychologie cognitive

◦ Neuropsychologie

Introduction aux architectures cognitives◦ Historique

2

Sciences cognitivesSciences cognitives

Les sciences cognitives ont pour objet l’étude des systèmes intelligents dans leurs aspects représentationnels et computationnels.

Les systèmes intelligents sont des systèmes complexes de traitement de l'information capable d'acquérir, conserver, utiliser et transmettre des connaissances.

Les sciences cognitives s’intéressent◦ à la théorie abstraite des processus intelligents,

◦ à l’intelligence des machines artificielles,

◦ à l’étude de l’intelligence humaine et animale.

Les sciences cognitives étudient les phénomènes suivant◦ la perception, l’attention, le langage, les mécanismes de

résolution de problèmes (conception, planification…)

3

Les disciplines des sciences cognitivesLes disciplines des sciences cognitives

4

Philosophie

Linguistique

Anthropologie

Neurosciences

Informatique

Psychologie

Informatique cognitiveInformatique cognitive

Discipline des sciences cognitives But de l’informatique cognitive :

◦ Concevoir des modèles computationnels des processus cognitifs

Architecture cognitive◦ Modèle complet de la cognition humaine

Intégration de modèle computationnel de l’usager dans les systèmes homme-machine◦ Systèmes tutoriels intelligents

◦ Habitats intelligents

◦ Contrôle de systèmes complexes Centrales nucléaires ou électriques

5

Intelligence artificielleIntelligence artificielle

Résoudre des problèmes pour lequel il n’existe pas d’algorithmes dédiés connus◦ Fouille dans un espace d’état

Symbolique Forage de donnée, réseau de neurones, algorithme génétique

Deux approches◦ Intelligence générale

◦ Simulation de l’intelligence naturelle ou humaine

6

Psychologie Psychologie

Le behaviorisme considère les processus cognitifs comme une boîte noire et essaie de prédire le comportement (sortie de la boîte noire) en fonction des stimuli (entrée de la boîte noire).

La psychologie cognitive essaie de prédire le comportement en fonction des stimuli et d’hypothèses sur la boîte noire et ses processus◦ L’individu a un état interne qui influence son comportement

◦ La méthode scientifique aide à choisir l’hypothèse la plus plausible Les liens entre un concept théorique et les expériences le mettant en

valeur peuvent être complexes (entre une particule atomique et sa trace sur une photographie).

◦ Les processus cognitifs doivent être plausibles compte tenu des connaissances que nous avons sur le cerveau

7

Psychologie cognitivePsychologie cognitive

Étude de la pensée et de ses mécanismes pris dans un sens large. ◦ la perception

◦ la résolution de problèmes

◦ la mémoire

◦ les fonctions exécutives attention planification prise de décision …

4 approches ◦ Traitement de l’information

utilisation de symboles et d’abstraction

◦ Basé sur la biologie voir aussi neuropsychologie

◦ Basé sur les processus de l’évolution

◦ Une combinaison des trois précédentes

8

9Approche traitement de l’informationApproche traitement de l’information

Modèle modale◦ Atkinson & Shiffrin (1968)

◦ Information encodée sous sa forme perceptuelle dans la mémoire sensorielle

◦Information est transmise dans la mémoire à court terme (MCT) Capacité limitée et dégradation rapide de l’information

◦ Information est ensuite transmise avec une certaine probalité dans la mémoire à long teme (MLT) Capacité infinie et dégradation lente

9

Approche traitement de Approche traitement de l’information l’information

Module exécutif central : sélectionne et manipule le contenu des modules esclaves

Boucle phonologique : ◦ tampon à court terme : encode l’information sous sa forme verbale

◦ boucle articulatoire : processus de rafraichissement de l’information

Tablette Visuo-spatiale Visuo-spatial sketchpad: encode sous l’information sous sa forme spatiale ou visuelle

10

Modèle de la mémoire de travail

Baddeley et Hitch’s (1974)

NeuropsychologieNeuropsychologie

La neuropsychologie est une discipline scientifique et clinique qui étudie les fonctions mentales supérieures dans leurs rapports avec les structures cérébrales au moyen d'observations menées auprès de patients présentant des lésions cérébrales accidentelles, congénitales ou chirurgicales.

Son objectif est la compréhension du système cognitif normal et anormal par le biais de l'étude de ses dysfonctionnements.

11

ARCHITECTURE ARCHITECTURE COGNITIVECOGNITIVE

12

Architecture cognitiveArchitecture cognitive

Architecture informatique◦ ensemble de structures fixes permettant à un système d’être

programmé

Architecture cognitive◦ ensemble de structure fixe qui explique l’ensemble des

processus cognitifs indépendance de la tâche modéliser

◦ une théorie générale de la cognition,

◦ intègre plusieurs théories spécifiques perception, attention, mémoire …

◦ une explicitation de la boîte noire

13

Architecture cognitive computationnelleArchitecture cognitive computationnelle

Une architecture cognitivive pouvant servir de devis pour concevoir un programme

Un modèle informatique d’une architecture cognitive ◦ de simuler avec un ordinateur des comportements complexes

◦ de générer des hypothèses qui pourront être validés expérimentalement

14

Caractéristiques des architectures cognitivesCaractéristiques des architectures cognitives

Degré de dépendance par rapport à un domaine. ◦ généralisation possible

Degré de spécification ◦ sa distance d’un modèle computationnel

Étendue des fonctions cognitives modéliser explicitement◦ attention, mémoire, processus subsymboliques

Adéquation aux résultats expérimentaux

15

Architecture cognitive : définitionArchitecture cognitive : définition

“The fixed (or slowly varying) structure that forms the framework for the immediate processes of cognitive performance and learning” ◦ Newell, 1990, p. 111

“The functional architecture includes the basic operations provided by the biological substrate, say, for storing and retrieving symbols, comparing them, treating them differently” ◦ Pylyshyn, 1984, p. 30

“ A specification of the structure of the brain at a level of abstraction that explains how it achieves the function of the mind” ◦ Anderson, 2007, p. 7

La notion d’architecture cognitive permet de ne pas s’enfarger ◦ dans la complexité du cerveau humain (1012 cellules) en faisant

abstraction du but des structures du cerveau

◦ dans la multiplicité des explications du comportement humain en faisant abstraction du cerveau qui doit les produire

16

Les niveaux d’une architecture cognitive Les niveaux d’une architecture cognitive (Newell)(Newell) Tout dans la nature peut être décrit à différents niveaux

◦ La matière peut être décrit au niveau subatomique, atomique, moléculaire, nano, …

il en est de même pour les architectures cognitives

Un niveau dans une architecture consiste ◦ en un medium qui est manipulé

◦ des composantes qui permet les opérations de base

◦ des lois de composition qui permet d’assembler les composantes

◦ du système formé à l’aide des lois de composition

◦ des lois comportementales qui décrit le comportement du système les lois comportementales découlent du comportement de ses

composantes et de la façon dont elles sont assemblées.

17

Les niveaux de traitementLes niveaux de traitement

Le niveau du milieu est l’architecture qui manipule le contenu du niveau supérieur et est en même temps le contenu manipulé par le niveau du bas.

Une architecture offre des outils pour manipuler le contenu, p. ex. un traitement de texte offre des outils pour manipuler du texte.

18

Description d’un niveauDescription d’un niveau

Un niveau peut être décrit de deux façons ◦ autonome

Un programmeur n’a pas besoin de connaître le niveau de la logique des circuits

Un concepteur de circuits logiques n’a pas besoin de connaître les lois régissant le magnétisme ou le courant électrique

◦ par réduction au niveau précédent On explique les circuits logiques en terme des circuits

électriques

19

Description autonome du niveau connaissance Description autonome du niveau connaissance d’un agentd’un agent

La principale caractéristique du niveau connaissance est que son comportement est uniquement déterminé par ses connaissances et non par sa structure ou ses composantes.

Un agent au sens de l’intelligence artificielle possède ◦ des connaissances et des buts

◦ des composantes pour percevoir et agir dans son environnement

Le principe de rationalité ◦ Si un agent a la connaissance qu’une de ses actions lui permettra

d’atteindre un de ses buts alors il choisit cette action

Que pensez d’un thermostat ?

20

Médium connaissance

Composantes sans importance selon Newell

Lois de composition sans importance selon Newell

Système agent au sens AI

Lois comportementale le principe de rationalité

La description du niveau connaissance avec le La description du niveau connaissance avec le niveau sous-jacentniveau sous-jacent

21

Attribut \ Niveau

Connaissance Symbolique

Médium Connaissance Structure symbolique, Attributs subsymboliques

Composantes N. A.Sous-systèmes symboliques, de perception et moteur

Lois de composition

N. A.Échange de structures symboliques entre les sous-systèmes

SystèmeAgent intelligent

Système symbolique complet (architecture cognitive)

Lois comportementales

Principe de rationalité

Processus symbolique (Modèle mathématique des traitements de symboles)

Les niveaux d’architecture pour un agent intelligent Les niveaux d’architecture pour un agent intelligent informatiséinformatisé

Connaissance◦ le médium est constitué des connaissances

Programme ◦ le médium sont les symboles

Registre, ◦ le médium est le vecteur de bits

◦ les actions sont les transferts entre les registres ou la mémoire

Circuit logique ◦ le medium est le bit

Circuit électrique ◦ le médium est le courant électrique

Matériel ◦ le médium est l’électron avec toutes ses propriétés

22

Le niveau intelligence d’une architecture Le niveau intelligence d’une architecture cognitivecognitive Comme au niveau intelligence, les composantes et la structure

ne sont pas importantes alors une description autonome du niveau intelligence d’une architecture cognitive est la description de la « logique » de ses comportements en fonction de son environnement. ◦ Pas très réjouissant comme constatation pour des informaticiens

La solution est de le décrire en le réduisant au niveau précédent, i.e. au niveau d’un système de symbole ou programme. ◦ Tous les programmes ou systèmes de symboles ne sont pas des

agents intelligents, ils doivent respecter le principe de rationalité.

Il ne faut pas non plus s’enfarger dans les détails du programme et l’idéal est de créer une abstraction au niveau symbolique ainsi que le modèle mathématique décrivant les manipulations symboliques. ◦ C’est à ce niveau d’abstraction que nous décrirons les architectures

cognitives comme ACT-R et SOAR Nous décrirons les modules de ACT-R et l’espace problème de SOAR

◦ C’est aussi à ce niveau que vous devrez décrire les architectures dans vos travaux et présentations

23

La description du niveau connaissance avec le La description du niveau connaissance avec le niveau sous-jacent (bis)niveau sous-jacent (bis)

24

Attribut \ Niveau

Connaissance Symbolique

Médium Connaissance Structure symbolique, Attributs subsymboliques

Composantes N. A.Sous-systèmes symboliques, de perception et moteur

Lois de composition

N. A.Échange de structures symboliques entre les sous-systèmes

SystèmeAgent intelligent

Système symbolique complet (architecture cognitive)

Lois comportementales

Principe de rationalité

Processus symbolique (Modèle mathématique des traitements de symboles)

Comment la cognition est-elle possible dans Comment la cognition est-elle possible dans l’univers physique ?l’univers physique ?

Comment expliquer les fonctions mentales à partir du cerveau ?◦ Comment expliquer une maison à un extraterrestre ?

C’est certain qu’il faut décrire l’architecture d’une maison, mais est-ce suffisant ?

Il faut aussi expliquer pourquoi l’architecture est ce qu’elle est pour répondre aux besoins humains

Ce sont les contraintes (humain, économique… ) du marché qui font que les maisons ont la forme qu’elles ont actuellement.

Ce sont les contraintes de l’évolution (survie, biologie) qui font que nous avons notre cerveau actuel et ses fonctions cognitions cognitives

◦ Une architecture cognitive permet d’expliquer la fonction cognitive à partir du cerveau. ce n’est pas toujours le cas

25

3 alternatives pour expliquer la cognition3 alternatives pour expliquer la cognition

Une architecture qui ne tient pas compte du cerveau ◦ Le paradigme classique du traitement de l’information

Une architecture qui ne tient pas compte de la fonction cognitive ◦ Le paradigme du connexionnisme sans l’esprit

Un paradigme qui fait abstraction de l’architecture ◦ L’analyse rationnelle de la fonction cognitive i.e. la fonction

cognitive est le résultat d’une adaptation à l’environnement.

26

Alternative 1 pour expliquer la cognitionAlternative 1 pour expliquer la cognition

Le traitement de l’information classique◦ le paradigme “information processing” classique de la

psychologie

◦ présente des théories validées par des expérimentations expliquant la fonction cognitive voir la théorie de Sternberg pour expliquer si un nombre fait partie

d’une liste dans la WM sa théorie ne tenait pas compte de la vitesse à laquelle un neurone

peut être excitée

◦ ignorer le cerveau, c’est comme concevoir une maison sans tenir compte des contraintes des matériaux pour la construire

27

Alternative I1 pour expliquer la cognitionAlternative I1 pour expliquer la cognition

Le connexionnisme sans l’esprit ◦ Une description exacte et fonctionnelle du cerveau

◦ C’est comme expliquer une maison à un extraterrestre sans tenir compte des fonctions de ses parties pour un être humain.

◦ La cognition est un effet de bord du cerveau Construire une maison avec des briques, du bois… sans contraintes et

constater à la fin que l’être humain puisse y vivre

◦ C’est comme expliquer le fonctionnement d’un ordinateur sans expliquer l’intention en arrière de chaque structure

◦ C’est comme expliquer la physiologie en terme d’interactions entre les cellules du corps en faisant abstraction des fonctionnalités des organes.

◦ Rumelhart and McClelland (1986) ont conçu un réseau de neurones qui apprenait les participes passés comme un enfant en faisant par exemple les erreurs de surgénéralisation classique du début de l’apprentissage (runned au lieu de ran).

◦ Ignorer l’esprit, c’est considéré que ce réseau de neurones a été premièrement construit et constater ensuite qu’il fait les participes passés

28

Alternative III pour expliquer la cognitionAlternative III pour expliquer la cognition

L’analyse rationnelle de la fonction cognitive en faisant abstraction de l’architecture. ◦ Une des contraintes imposées à la façon dont le cerveau permet

la cognition est que les deux sont le résultat d’une évolution dans un environnement réel Le raccourci est de se concentrer sur l’adaptation de la cognition à

l’environnement en faisant abstraction de l’architecture qui doit supporter les fonctions cognitives

◦ C’est un courant très actif actuellement et toutes les variantes sont basées sur l’approche bayésienne Il ne s’agit pas d’expliquer comment les calculs bayésiens sont

exécutés mais tout simplement, sachant qu’il y a adaptation l’environnement, d’élaborer une théorie prédisant le comportement cognitif en conséquence.

29

L’approche bayésienne de la cognitionL’approche bayésienne de la cognition

1. L’évolution fait en sorte que nos capacités sont fonction de la probabilité qu’un évènement survienne a priori

◦ Pr(pluie), Pr(cumulonimbus)…

2. Nous sommes en mesure de connaître les situations dans lesquelles certains événements se produisent

◦ Pr(cumulonimbus | pluie)

3. Connaissant les probabilités conditionnelles et les probabilité a priori, nous pouvons connaître la probabilité a posteriori que nous sommes dans tel situation étant donné qu’un tel événement est survenu

◦ Pr(pluie | cumulonimbus) = Pr(cumulonimbus| pluie) * Pr(pluie) Pr(cumulonimbus).

4. Basé sur l’information précédente, i.e. les probabilités a posteriori des situations actuelles, il s’agit de choisir l’action qui maximise l’atteinte des besoins de l’individu

◦ se mettre à l’abri si la situation la plus probable est qu’il pleuve

30

Architecture cognitiveArchitecture cognitive

Architecture informatique◦ ensemble de structures fixes permettant à un système d’être

programmé

Architecture cognitive◦ ensemble de structure fixe qui explique l’ensemble des

processus cognitifs indépendance de la tâche modéliser

◦ une théorie générale de la cognition,

◦ intègre plusieurs théories spécifiques perception, attention, mémoire …

◦ une explicitation de la boîte noire

31

Architecture cognitive computationnelleArchitecture cognitive computationnelle

Une architecture cognitivive pouvant servir de devis pour concevoir un programme

Un modèle informatique d’une architecture cognitive ◦ de simuler avec un ordinateur des comportements complexes

◦ de générer des hypothèses qui pourront être validés expérimentalement

32

Caractéristiques des architectures cognitivesCaractéristiques des architectures cognitives

Degré de dépendance par rapport à un domaine. ◦ généralisation possible

Degré de spécification ◦ sa distance d’un modèle computationnel

Étendue des fonctions cognitives modéliser explicitement◦ attention, mémoire, processus subsymboliques

Adéquation aux résultats expérimentaux

33

Architecture cognitive : les débutsArchitecture cognitive : les débuts

1957◦ General Problem Solver

Herbert Simon et Allen Newell généralise Logic Theorist un résolveur de problème universel espace problème (problem space)

résoudre un problème consiste à explorer et construire un graphe à partir d’un état initial pour trouver un état final.

méthode faible (weak method) méthode de résolution pouvant être appliquée à plusieurs domaines comme

l’analyse moyens-fins (means-ends analysis, hill-climbing …

manipule des structures symboliques logique, géométrie, jeux d'échecs

34

19731973

human associative memory◦ John Robert Anderson

35

Représentation des propositionsReprésentation des propositions

36

1980 1980

validation expérimentale (protocole verbal)◦ K. Anders Ericsson et Herbert Simon

◦ 2 systèmes sont faiblements équivalents s’ils représentents la même fonction et fortement équivalents si c’est le même algorithme

37

Les architectures à base de systèmes de Les architectures à base de systèmes de productionproduction 1943

◦ Les systèmes de production sont apparus sous forme théorique

1972 ◦ implantation de systèmes de production

◦ Human problem solving de Newell

38

Évolution des architectures basés sur les systèmes Évolution des architectures basés sur les systèmes de productionde production

39

1983 1983

40

ACT* 1983ACT* 1983

41

ACT* : dispersion de l’activationACT* : dispersion de l’activation

L’activation part des objets (unit) actuellement actifs et via ses attributs (element) se propage à d’autres objets dans la mémoire à long terme.

42

19831983

SOAR 1 (State, Operator And Result)◦ John Laird, Allen Newell, et Paul Rosenbloom

◦ Expliquer le comportement intelligent en proposant l’architecture de base de tout système intelligent

◦ Mécanisme sophistiqué d’apprentissage de nouvelles connaissances

◦ Initialement peu de fondement psychologique à l’architecture Possible de produire des comportements plausibles et non plausibles Difficile de modéliser les connaissances sémantiques et épisodiques

avec l’architecture SOAR Attention les règles de production ne sont pas des connaissances

procédurales Il ajoutent des préférences dans la mémoire de travail et complète l’information

qui est déjà dans la mémoire de travail mais cette mémoire de travail n’a aucun rapport avec sa partie correspondante en psychologie

43

Soar : 1983Soar : 1983

44

1983 : 1983 : Model Human Processor (Model Human Processor (MHP)MHP)

45

1983 : 1983 : CPM-GOMSCPM-GOMS

Cognitive, Perceptual, Motor GOMSGoals, Operators, Methods and Selection rules46

Calcul du temps nécessaire pour Calcul du temps nécessaire pour percevoir un objet avec GOM/CPMpercevoir un objet avec GOM/CPM

47

1996 : EPIC1996 : EPIC

48

Description d’un ordinateur à deux niveauxDescription d’un ordinateur à deux niveaux

49

Aspects Register-Transfer Level

Symbol Level

Medium Bit Vectors Symbols, expressions

Components Registers Functional Units

Memories Operations

Composition Laws Transfer Path Designation, association

Systems Digital Systems Computers

Behavior Laws Logical Operations Sequential interpretation

Info Cognitives

Documents

Transcript of Info Cognitives