Une classe traitable de problèmes de Planification...
Transcript of Une classe traitable de problèmes de Planification...
Une classe traitable de problèmes dePlanification temporelle
Martin Cooper, Florian Franc, Frédéric Maris, Pierre Régnier
IRIT, Université Paul Sabatier, Toulouse
1
� Planification en IA
� Planification temporelle
� Complexité de la planification
� Une classe traitable pour la planification temporelle
� Définitions
� Détection de la monotonie
� Conclusion/Perspectives
2
Représentation de l’état initial
Représentation du but
Représentation des actions
Plan-solution
(Ensemble organisé d’actions)
3
� Cadre classique de la planification :◦ Monde totalement observable, pas d’incertitude
◦ Actions instantanées, discrètes, déterministes
A
P1
P2
< Conditions > < Effets >
E1
E2
¬E3
4
� Cadre temporel (PDDL 2.1) :� Actions avec durée (duration)
� Conditions
� at start
� at end
� over all
� Effets
� at start
� at end
A [durée]
P1
P3
P2
E1 E2
5
� Cas général : non soluble en temps polynomial
� Planification propositionnelle : PSPACE-complète
� Planification temporelle PDDL 2.1 :
� test de l’existence d’un plan valide EXPSPACE-complet
� PSPACE-complète lorsque différentes instances d’une même action ne peuvent se chevaucher
6
� Soluble en temps O(n3) et en espace O(n2), où n est le nombre total d’événements des actions de A
� Un plan temporel optimal en nombre d’actions peut être trouvé avec la même complexité
7
Ensemble des sousEnsemble des sousEnsemble des sousEnsemble des sous----butsbutsbutsbuts
Etant donné un problème de planification temporelle <I,A,G>, l’ensemble l’ensemble l’ensemble l’ensemble SgSgSgSg des sousdes sousdes sousdes sous----buts buts buts buts est le sous-ensemble minimal de Cond(A) ∪ G qui satisfait :
� G ⊆ Sg et
� pour toute action a ∈ A, si Add(a) ∩ (Sg\I) ≠ ∅,
alors Cond(a) ⊆ Sg.
Ensemble d’actions réduitEnsemble d’actions réduitEnsemble d’actions réduitEnsemble d’actions réduit
L’ensemble d’actions réduit L’ensemble d’actions réduit L’ensemble d’actions réduit L’ensemble d’actions réduit est ArArArAr = {a ∈ A | Add(a) ∩ (Sg\I) ≠ ∅}
8
EtablisseurEtablisseurEtablisseurEtablisseur----uniqueuniqueuniqueunique
Un ensemble d’actions A={a1,...,an}
est etablisseuretablisseuretablisseuretablisseur----uniqueuniqueuniqueunique relativement
à un ensemble de fluents S si aucun
fluent de S ne peut être établi par
deux actions distinctes de A
9
AAAA
CCCC
DDDD
w
y
BBBB
EEEE
z
FFFF
x
Monotonie d’un fluent fMonotonie d’un fluent fMonotonie d’un fluent fMonotonie d’un fluent f
� f est –monotone pour un problème de planification <I,A,G> si, après avoir été détruit, f n’est jamais ré-établi dans aucun plan temporel
� f est +monotone si, après avoir été établi, il n’est jamais détruit dans aucun plan temporel pour <I,A,G>
10
Monotonie d’un fluent fMonotonie d’un fluent fMonotonie d’un fluent fMonotonie d’un fluent f
� Exemples de – monotonie
� vivante (une personne)
� jamais-utilisée (une allumette)
� Exemples de + monotonie
� diplômée (une personne)
� explosé (un ballon)
� mangé (un plat)
11
Planification Temporelle
Ar EtablisseurUnique
+Monotonie de Sg
Ar Etablisseur Unique+
Monotonie de Sgdétectable par nos
règles
12
� Soit Π la classe des problèmes de planification temporelle <I,A,G> dans lesquels : � Ar est établisseur-unique relativement à Sg
� tous les fluents dans Sg sont monotones
� tous les fluents dans I ∩ Sg sont −monotones
� la monotonie des fluents peut être détectée en appliquant les règles suivantes règles suivantes règles suivantes règles suivantes jusqu’à convergence
Alors Π est traitable
13
Règle 1Règle 1Règle 1Règle 1
� S’il n’existe pas d’actions a, a′ ∈ Ar telles que f ∈ Del(a) ∩ Add(a′) alors f est à la fois +monotone et −monotone
14
af
p
f
a
¬f ¬p
Règle 2Règle 2Règle 2Règle 2
=> f est - monotone
15
Soit af l’unique action qui établit le fluent f ∈ Sg. Si pour toute a ∈ Ar telle que f ∈ Del(a) :
1) ∃ un fluent −monotone p ∈ Del(a) ∩ Cond(af) tel queτ(a → ¬p) − τ(a → ¬f) ≤ τ(p →| af) − τ(af → f) ou
2) …3) …4) …
Règle 3Règle 3Règle 3Règle 3
a
p
¬f
af
f ¬p
=> f est + monotone
16
Soit af l’unique action qui établit le fluent f ∈ Sg. Si pour toute a ∈ Ar telle que f ∈ Del(a) :
1) ∃ un fluent −monotone p ∈ Cond(a) ∩ Del(af) tel que τ(af → ¬p) − τ(af → f) ≤ τ(p →| a) − τ(a → ¬f) ou
2) …3) …4) …
� Pour trouver un plan (optimal) il faut résoudre un ensemble de contrainte de la forme :
� a ≤ Xi – Xj ≤ b
� Xi – Xj ≠ c
� Donc STP≠ : résolution en temps O(n3) et espace O(n2) [Gerevini & Cristani, 2007]
17
18
Available(s)
Available(water)
Mixed(p1,p2)
ACTIVATE(s)[22]
CATALYZE(p1,s,c1)[8]
MIX(p1,p2)[5]
SYNTHESIZE(p1,c1)[6]REACT(p1,p2,s)[5]
Catalyzing(p1,c1) ¬Catalyzing(p1,c1)End-Catalyze(p1)
Reacting(s)
Reacting(s)
Catalyzing(p1,c1)
Synthesized(p1)
CATALYZE(p2,s,c2)[8]
SYNTHESIZE(p2,c2)[6]
Catalyzing(p2,c2) ¬Catalyzing(p2,c2)
End-Catalyze(p2)
Reacting(s)
Synthesized(p2)
Catalyzing(p2,c2)
End-Catalyze(p1)
End-Catalyze(p2)
Synthesized(p1)
Synthesized(p2)
Mixed(p1,p2)
Reacted(p1,p2)
Reacting(s)
¬Available(s)
¬Reacting(s)
¬Available(c1)
Available(c2)
¬Available(c2)
Available(c1)
19
ACT-S ACT-E
CA1-S CA1-E
CA2-S CA2-E
SY1-S SY1-E
SY2-S SY2-E
MIX-S MIX-E REA-E
[8,8]
[8,8]
[6,6]
[22,22]
[6,6]
REA-S
[0,+∞[
[0,+∞[
[0,+∞[
[0,+∞[
[0,+∞[
[5,5]
[5,5]
[0,+∞[[0,+∞[
[0,+∞[
[0,+∞[[0,+∞[
[0,+∞[
[0,+∞[
[0,+∞[
[0,+∞[[0,+∞[
� Obtention d’une première classe traitable pour la planification temporelle
� Des problèmes courants rentrent dans cette classe
� Différentes applications
20
Planification Temporelle
Ar Etablisseur Unique+
Monotonie de Sg
Ar Etablisseur Unique+
Monotonie de Sgdétectable par nos
règles
21