Construire et exploiter des croyances sur le monde à ... · 6/17 Déﬁnitionduproblème...

1/17

Construire et exploiter des croyances sur le mondeà partir de régularités d’interactions expérimentées

Florian Bernard

Encadrant : Amélie CordierAvec la participation d’Olivier Georgeon

22 juin 2015

2/17

Sommaire

Contexte

Définition du problème

Contributions

Démonstration

Synthèse du point de vue de l’agent

Questions

3/17

ContextePhilosophique

E. Kant définit :I Monde nouménal : le monde tel qu’il estI Monde phénoménal : le monde du point de vue de l’individu

4/17

ContexteThéorie de la cognition incarnée

Agent Experimentet ∈ EResult

rt ∈ R

Environnement

Observation Action

Agent

Environnement

Figure: Modèle du cycle Expérience/Résultat à gauche et classique àdroite (Georgeon & Cordier, 2014)

L’agent est :I incarné : il agit pour connaître son environnement (Anderson,

2003)I agnostique : les données d’entrée ne sont pas fonction de l’état

du monde (Georgeon & Sakellariou, 2012)Il utilise :

I l’apprentissage développemental (schèmesensorimoteur (Piaget, 1959))

I les interactions

5/17

ContexteDéfinition des interactions

I Couple action/résultatI Valence

AgentIi(et, rt)Ie(et, r't)

Environnement

Figure: Modèle basé sur les interactions

6/17

Définition du problèmeDu point de vue de l’agent

I Couplage entre l’agent et l’environnement à travers lesinteractions :

1

-1

0

0

0

0

Figure: L’agent est initialisé avec ces interactions

123

61 70 80

123

41 50 60

123

21 30 40

123

1 10 20

Figure: Flux d’interactions intended et enacted

7/17

Définition du problèmeRégularités

123

61 70 80

123

41 50 60

123

21 30 40

123

1 10 20

{ { { { { { {{{{{{{{{

{ { { { { { { {{{{{{{{

Figure: Régularités disponibles dans l’environnement

8/17

Définition du problèmeRégularités

123

61 70 80

123

41 50 60

123

21 30 40

123

1 10 20

{ { { { { { {{{{{{{{{

{ { { { { { { {{{{{{{{

Figure: Régularités séquentielles que l’on souhaiterait que l’agent trouveet utilise pour satisfaire sa motivation

9/17

Définition du problèmeEnvironnement String problem

Monter Descente

Toucher

Avancer

Échanger

1 732 93 5 6 7 81 2 40 9854 60

1 7 3 2 9 3 5 6 7 8 1 2 4 0 9 8 5 4 6 0

Figure: Représentation graphique du monde nouménal (Georgeon &Hassas, 2013)

10/17

ContributionsTable d’usage d’interaction

I Concept des signatures (Gay,2014)

I Maintenir à jour le nombred’intended et d’enacted pourchaque :

I 6Pré-interactionsI 8Post-interactionsI 7AlternativesI 7Opposées

I 2Types :I PersistanteI SporadiqueI Sporadique avec croyance

12

4 5

6

7

8Figure: Table d’usage del’interaction : « swapup »

11/17

ContributionsÉtat de croyance interne

I Inconnu : interaction sporadique avec ou sans croyanceI Phénomène : interaction persistante

1

2

3

Figure: Représentation des convictions de l’agent

12/17

Démonstration

13/17

Interactionnisme radical

Decision

Iip{I1,..., In}Iep{i1,...,im}

Interface Sensorimotrice

Enacter

IiIe

Effet sur lesmoteur, actionneur...

Effet dessensors surle programme

Programme pro-actif

Programme réactif

Environnement

Monde physique

Figure: Modèle de l’interactionnisme radical

14/17

Démonstration

15/17

Synthèse du point de vue de l’agentCe que l’agent sait faire

I Trouver les régularités directes et indirectes des interactionsI Construire et maintenir des phénomènesI Naviguer dans des environnements simples

16/17

Synthèse du point de vue de l’agentPerspectives

I Apprendre des régularités séquentielles hiérarchiques(séquences et sous-séquences)

I Apprendre des interactions composites pour atteindre lemodèle de l’interactionnisme radical (Georgeon & Aha, 2013)

I Créer des phénomènes à partir d’interactions compositesI Est-ce que l’agent pourra appréhender des environnements

spatiaux avec uniquement des phénomènes et des interactionscomposites ?

Des questions ?

17/17

Références I

Anderson, Michael L. 2003. Embodied cognition : A field guide.Artificial intelligence, 149(1), 91–130.

Gay, Simon. 2014 (Dec.). Mécanismes d’apprentissagedéveloppemental et intrinsèquement motivés en intelligenceartificielle : étude des mécanismes d’intégration de l’espaceenvironnemental. Thèse de Doctorat en Informatique, UniversitéLyon 1.

Georgeon, Olivier, & Aha, David. 2013. The Radical InteractionismConceptual Commitment. Journal of Artificial GeneralIntelligence, 4(2), 31–36.

Georgeon, Olivier, & Hassas, Salima. 2013. Single agents can beconstructivist too. Constructivist Foundations, 9(1), 40–42.

18/17

Références II

Georgeon, Olivier, & Sakellariou, Ilias. 2012 (June). DesigningEnvironment-Agnostic Agents. Pages 25–32 of : Enda Howley,Peter Vrancx, & Knudson, Matt (eds), ALA2012, AdaptiveLearning Agents workshop, at AAMAS2012, 11th InternationalConference on Autonomous Agents and Multiagent Systems.

Georgeon, Olivier L, & Cordier, Amélie. 2014. Inverting theInteraction Cycle to Model Embodied Agents. ProcediaComputer Science, 41, 243–248.

Piaget, J. 1959. The Construction of Reality in the Child. TheBasic classics in psychology. Basic Books.

19/17

Construire et exploiter des croyances sur le monde à ... · 6/17 Déﬁnitionduproblème...

Documents

Transcript of Construire et exploiter des croyances sur le monde à ... · 6/17 Déﬁnitionduproblème...