Construire et exploiter des croyances sur le monde à ... · 6/17 Définitionduproblème...
Transcript of Construire et exploiter des croyances sur le monde à ... · 6/17 Définitionduproblème...
1/17
Construire et exploiter des croyances sur le mondeà partir de régularités d’interactions expérimentées
Florian Bernard
Encadrant : Amélie CordierAvec la participation d’Olivier Georgeon
22 juin 2015
2/17
Sommaire
Contexte
Définition du problème
Contributions
Démonstration
Synthèse du point de vue de l’agent
Questions
3/17
ContextePhilosophique
E. Kant définit :I Monde nouménal : le monde tel qu’il estI Monde phénoménal : le monde du point de vue de l’individu
4/17
ContexteThéorie de la cognition incarnée
Agent Experimentet ∈ EResult
rt ∈ R
Environnement
Observation Action
Agent
Environnement
Figure: Modèle du cycle Expérience/Résultat à gauche et classique àdroite (Georgeon & Cordier, 2014)
L’agent est :I incarné : il agit pour connaître son environnement (Anderson,
2003)I agnostique : les données d’entrée ne sont pas fonction de l’état
du monde (Georgeon & Sakellariou, 2012)Il utilise :
I l’apprentissage développemental (schèmesensorimoteur (Piaget, 1959))
I les interactions
5/17
ContexteDéfinition des interactions
I Couple action/résultatI Valence
AgentIi(et, rt)Ie(et, r't)
Environnement
Figure: Modèle basé sur les interactions
6/17
Définition du problèmeDu point de vue de l’agent
I Couplage entre l’agent et l’environnement à travers lesinteractions :
1
-1
0
0
0
0
Figure: L’agent est initialisé avec ces interactions
123
61 70 80
123
41 50 60
123
21 30 40
123
1 10 20
Figure: Flux d’interactions intended et enacted
7/17
Définition du problèmeRégularités
123
61 70 80
123
41 50 60
123
21 30 40
123
1 10 20
{ { { { { { {{{{{{{{{
{ { { { { { { {{{{{{{{
Figure: Régularités disponibles dans l’environnement
8/17
Définition du problèmeRégularités
123
61 70 80
123
41 50 60
123
21 30 40
123
1 10 20
{ { { { { { {{{{{{{{{
{ { { { { { { {{{{{{{{
Figure: Régularités séquentielles que l’on souhaiterait que l’agent trouveet utilise pour satisfaire sa motivation
9/17
Définition du problèmeEnvironnement String problem
Monter Descente
Toucher
Avancer
Échanger
1 732 93 5 6 7 81 2 40 9854 60
1 7 3 2 9 3 5 6 7 8 1 2 4 0 9 8 5 4 6 0
Figure: Représentation graphique du monde nouménal (Georgeon &Hassas, 2013)
10/17
ContributionsTable d’usage d’interaction
I Concept des signatures (Gay,2014)
I Maintenir à jour le nombred’intended et d’enacted pourchaque :
I 6Pré-interactionsI 8Post-interactionsI 7AlternativesI 7Opposées
I 2Types :I PersistanteI SporadiqueI Sporadique avec croyance
12
4 5
6
7
8Figure: Table d’usage del’interaction : « swapup »
11/17
ContributionsÉtat de croyance interne
I Inconnu : interaction sporadique avec ou sans croyanceI Phénomène : interaction persistante
1
2
3
Figure: Représentation des convictions de l’agent
12/17
Démonstration
13/17
Interactionnisme radical
Decision
Iip{I1,..., In}Iep{i1,...,im}
Interface Sensorimotrice
Enacter
IiIe
Effet sur lesmoteur, actionneur...
Effet dessensors surle programme
Programme pro-actif
Programme réactif
Environnement
Monde physique
Figure: Modèle de l’interactionnisme radical
14/17
Démonstration
15/17
Synthèse du point de vue de l’agentCe que l’agent sait faire
I Trouver les régularités directes et indirectes des interactionsI Construire et maintenir des phénomènesI Naviguer dans des environnements simples
16/17
Synthèse du point de vue de l’agentPerspectives
I Apprendre des régularités séquentielles hiérarchiques(séquences et sous-séquences)
I Apprendre des interactions composites pour atteindre lemodèle de l’interactionnisme radical (Georgeon & Aha, 2013)
I Créer des phénomènes à partir d’interactions compositesI Est-ce que l’agent pourra appréhender des environnements
spatiaux avec uniquement des phénomènes et des interactionscomposites ?
Des questions ?
17/17
Références I
Anderson, Michael L. 2003. Embodied cognition : A field guide.Artificial intelligence, 149(1), 91–130.
Gay, Simon. 2014 (Dec.). Mécanismes d’apprentissagedéveloppemental et intrinsèquement motivés en intelligenceartificielle : étude des mécanismes d’intégration de l’espaceenvironnemental. Thèse de Doctorat en Informatique, UniversitéLyon 1.
Georgeon, Olivier, & Aha, David. 2013. The Radical InteractionismConceptual Commitment. Journal of Artificial GeneralIntelligence, 4(2), 31–36.
Georgeon, Olivier, & Hassas, Salima. 2013. Single agents can beconstructivist too. Constructivist Foundations, 9(1), 40–42.
18/17
Références II
Georgeon, Olivier, & Sakellariou, Ilias. 2012 (June). DesigningEnvironment-Agnostic Agents. Pages 25–32 of : Enda Howley,Peter Vrancx, & Knudson, Matt (eds), ALA2012, AdaptiveLearning Agents workshop, at AAMAS2012, 11th InternationalConference on Autonomous Agents and Multiagent Systems.
Georgeon, Olivier L, & Cordier, Amélie. 2014. Inverting theInteraction Cycle to Model Embodied Agents. ProcediaComputer Science, 41, 243–248.
Piaget, J. 1959. The Construction of Reality in the Child. TheBasic classics in psychology. Basic Books.
19/17