EI1 M1 IES - ThÈorie des jeux pour líEIhebergement.u-psud.fr/manant/sites/default/files/Cours IES...
Transcript of EI1 M1 IES - ThÈorie des jeux pour líEIhebergement.u-psud.fr/manant/sites/default/files/Cours IES...
Introduction Forme normale Types díÈquilibres Forme extensive Jeux rÈpÈtÈs
EI1 M1 IES - ThÈorie des jeux pour líEI
Matthieu Manant - Nicolas SouliÈ
UniversitÈ Paris-Saclay
2015/2016
Introduction Forme normale Types díÈquilibres Forme extensive Jeux rÈpÈtÈs
Introduction ‡ la thÈorie des jeux (1/2)
Importance de la stratÈgie et illustration du principe de la thÈoriedes jeux qui cherche ‡ formuler des stratÈgies
Les idÈes audacieuses sont comme les piËces quíon dÈplacesur un Èchiquier : on risque de les perdre mais elles peuventaussi Ítre líamorce díune stratÈgie gagnante. Goethe(1749-1832).Líessence de la stratÈgie est le choix díaccomplir ses
activitÈs díune maniËre di§Èrente de celle de ses concurrents.Porter (1947-), Èconomiste.
Quíest-ce que la thÈorie des jeux ?ouvrages fondateurs : Theory of Games and Economic Behavior, vonNeuman et Morgenstern [1944]dÈveloppements importants avec les travaux de Nash [1950]pourquoi thÈorie des jeux ? ! rÈfÈrence aux jeux simples que laTDJ rÈsout : Èchecs, pierre/papier/ciseaux, etc.! par extension : toutes les situations avec plusieurs joueurs et des
rËgles. ex. football, jeux de cartes, diplomatie, nÈgociation, etc.
Introduction Forme normale Types díÈquilibres Forme extensive Jeux rÈpÈtÈs
Introduction ‡ la thÈorie des jeux (2/2)
Quand utiliser la thÈorie des jeux ?
outil mathÈmatique pour formaliser et analyser les stratÈgies ouchoix díagents en interaction
quelle stratÈgie optimale pour un agent si son choix a un impact surceux des autres ?formaliser des situations complexes ‡ analyser
nombreux champs díapplication : Èconomie, sciences politiques,Èthologie (Ètude des comportements animaux), psychologie,stratÈgie militaire
du grec stratos ageÓn, i.e. conduire une armÈe : art de diriger etcoordonner des actions pour atteindre un objectifen Èconomie : situations avec peu de Örmes en interaction, aide ‡ ladÈcision sur les choix de prix, de quantitÈ ‡ produire,díinvestissements en R&D ou de publicitÈ, etc.
! objectif du cours : description de stratÈgies dans des cadres biendÈÖnis
Introduction Forme normale Types díÈquilibres Forme extensive Jeux rÈpÈtÈs
DÈÖnition díun jeu (1/3)
Souvent, 3 ÈlÈments pour dÈÖnir un jeu
les joueurs : souvent des Örmesles stratÈgies : chaque joueur peut prendre des dÈcisions parmi unensemble de stratÈgies possibles
les paiements ou gains : une combinaison ou proÖl de stratÈgiesdonnÈe aboutit ‡ un paiement
! thÈorie des jeux non-coopÈratifs
i.e. pas de coordination des joueurs sur les stratÈgies ‡ choisir
6= jeux coopÈratifs, non-abordÈ ici : analyse des choix de coalition,díalliÈs
Introduction Forme normale Types díÈquilibres Forme extensive Jeux rÈpÈtÈs
DÈÖnition díun jeu (2/3)
CaractÈrisation díun jeu (souvent)
dÈcisions individuelles sans concertation avec jeux ìstatiqueî (ici)6= jeux dynamiques qui tiennent compte du temps
joueurs rationnels(1) choix de stratÈgie pour maximiser le paiement(2) anticipation des choix des autres joueurs
information complËte : pour chaque joueur, connaissance de sesstratÈgies et de celles des autres joueurs, de ses paiements et deceux des autres joueurs
ex. Bonnie et Clyde savet que tous les deux peuvent avouer ou nier
information imparfaite : pour chaque joueur, pas de connaissancede líhistoire des dÈcisions des autres joueurs au moment de prendreune dÈcision
! incertitude sur les consÈquences de ses dÈcisions
Introduction Forme normale Types díÈquilibres Forme extensive Jeux rÈpÈtÈs
DÈÖnition díun jeu (3/3)
! dÈtermination díune stratÈgie optimale basÈe sur líimpact de sastratÈgie sur les stratÈgies des autres joueurs! description díun jeu
soit sous forme normale ou stratÈgique : souvent pour les jeuxsimultanÈs
soit sous forme extensive ou tabulaire : souvent pour les jeuxsÈquentiels
! dÈtermination des stratÈgies
stratÈgies pures : choix díune action simple parmi un ensembledíactions possibles
stratÈgies mixtes : choix díune probabilitÈ associÈe ‡ chaque action
! ici : analyse des stratÈgies pures
Introduction Forme normale Types díÈquilibres Forme extensive Jeux rÈpÈtÈs
Forme normale (1/8)
Quand utiliser une forme normale ?
dÈcrit souvent un jeu simultanÈ, i.e. dÈcisions simultanÈes des joueurs
ex. dilemme du prisonnier - proposÈ par A.W. Tucker en 1950
2 joueurs aprËs un vol de banque interpellÈs par la police et mis dans2 cellules sans communiquer
líun avoue et líautre nie : libÈration pour lui / 10 ans pour lecompliceles deux avouent : 5 ans pour les deuxles deux nient : 1 an pour les deux (faute de preuve, oncondamne...)
Introduction Forme normale Types díÈquilibres Forme extensive Jeux rÈpÈtÈs
Forme normale (3/8)
Quelle stratÈgie optimale pour les deux joueurs ?
quel choix pour Bonnie si Clyde nie
nier ! 1 an de prisonavouer ! 0 annÈe
quel choix si Clyde avoue
nier ! 10 ans de prisonavouer ! 5 ans de prison
Bonnie prÈfËre avouer que Clyde avoue ou nie
! rÈsultat simple... mais nombreuses applications en Èconomie, Ècologie,politique internationale, etc.! modÈlisation díune campagne publicitaire co˚teuse
Introduction Forme normale Types díÈquilibres Forme extensive Jeux rÈpÈtÈs
Forme normale (4/8)
Dilemme Pepsi / Coca-Cola : publicitÈ comparative ou non ?loi du 18/01/1992 du code de la consommation (L.121-8/14)
conditions díapplication trËs restrictives : objectivitÈ, impartialitÈ,produits identiques, dÈmontrabilitÈ, etc.
paiements du jeu : I campagne publicitaire positive pour le produit(+5), nÈgative pour le concurrent (-5), I co˚t de campagne (-1)
Figure: Matrice de paiement du dilemme du prisonnier
Autre application : choix díun prix - baisser les prix pour gagner desparts de marchÈ... sauf si le concurrent baisse aussi son prix...
Introduction Forme normale Types díÈquilibres Forme extensive Jeux rÈpÈtÈs
Forme normale (5/8)
Chicken Game entre Jim et Buzz
Introduction Forme normale Types díÈquilibres Forme extensive Jeux rÈpÈtÈs
Forme normale (6/8)
DeÖnition
Un jeu sous forme normale est dÈcrit de la faÁon suivante :
1 un ensemble I # f1, ...,Ng de N joueurs.2 chaque joueur i = f1, ...,Ng peut choisir une stratÈgie parmi unensemble de stratÈgies Si #
!s1i , ..., s
mki
", o˘ mk est le nombre de
stratÈgies accessibles du joueur i et sji , j = f1, ...,mkg, chaquestratÈgie particuliËre accessible du joueur i .
3 s # fs1, ..., sN g, proÖl particulier de stratÈgies, i.e. une liste destratÈgies de tous les joueurs (8i si 2 Si )
4 Chaque joueur i , i = f1, ...,Ng, reÁoit un paiement pi (s) - un rÈel- qui dÈpend du proÖl de stratÈgies s.
Introduction Forme normale Types díÈquilibres Forme extensive Jeux rÈpÈtÈs
Forme normale (7/8)
Remarques
di§Èrence entre ensemble de stratÈgies et proÖl de stratÈgies
ensemble Si des stratÈgies accessibles au joueur iproÖt de stratÈgies s , liste des stratÈgies e§ectivement choisies partous les joueurs.
nombre Öni mk de stratÈgies accessibles dans líensemble Si pourchaque joueur : pas toujours vrai, par exemple dans le cas de choixde prix
importance de líordre des stratÈgies pour le proÖl de stratÈgies
Introduction Forme normale Types díÈquilibres Forme extensive Jeux rÈpÈtÈs
Forme normale (8/8)
Application au dilemme du prisonnier1 Ensemble de N = 2 joueurs : I # fBonnie, Clydeg.2 Ensembles de stratÈgies
SBonnie = fnier, avouergSClyde = fnier, avouerg
! stratÈgies des joueurs : fnier, nierg, fnier, avouerg,favouer, nierg et favouer, avouerg avec stratÈgie de Bonnie enpremier stratÈgie de Clyde en second
3 Paiements associÈs ‡ chaque proÖl
pBonnie (fnier, nierg) = (1 pClyde (fnier, nierg) = (1pBonnie (fnier, avouerg) = (10 pClyde (fnier, avouerg) = 0pBonnie (favouer, nierg) = 0 pClyde (favouer, nierg) = (10pBonnie (favouer, avouerg) = (5 pClyde (favouer, avouerg) = (5
Introduction Forme normale Types díÈquilibres Forme extensive Jeux rÈpÈtÈs
Quíest-ce quíun Èquilibre ? (1/2)
Quels stratÈgies pour un jeu ?
dans le dilemme du prisonnier : les joueurs vont choisir díavouer oude nier ?
si Bonnie nie, Clyde avoue : 0 annÈe plutÙt quíun 1 an ! mais siBonnie anticipe ce choix, elle avoue : 5 ans plutÙt que 10 ans ...
! rÈsultats non-coopÈratif avec 5 ans pour les deux plutÙt que 1 an! dilemme des prisonniers
mÈthodes pour anticiper les choix des joueurs ! introduction duconcept díÈquilibre
! dans líidÈal, sÈlectionner un seul proÖl parmi les proÖls de stratÈgie,i.e. pas díhÈsitation pour les joueurs sur la stratÈgie ‡ adopter
! Èquilibre unique du jeuex. pas díÈquilibre unique pour dilemme du prisonnier : ÈquilibrecoopÈratif o˘ les deux joueurs nient et líÈquilibre non-coopÈratif o˘les deux joueurs avouent.
Introduction Forme normale Types díÈquilibres Forme extensive Jeux rÈpÈtÈs
Quíest-ce quíun Èquilibre ? (2/2)
Notation
ensemble des stratÈgies des autres joueurs que le joueur i :
s(i # fs1, ..., si(1, si+1, ..., sN g
! rÈÈcriture díun proÖl de stratÈgie sous une autre forme
S = fs1, ..., si(1, si , si+1, ..., sN g= fsi , s(ig .
Introduction Forme normale Types díÈquilibres Forme extensive Jeux rÈpÈtÈs
Equilibre en stratÈgie dominante (1/4)
Concept díÈquilibre dit en stratÈgie dominante
critËre qui indique ‡ chaque joueur comment Èliminer certainesstratÈgies
DeÖnition
Une stratÈgie s)i díun joueur i 2 I est dite dominante si, quelles quesoient les stratÈgies des autres joueurs, choisir la stratÈgie s)i maximise lepaiement du joueur i . Formellement, pour tous choix de stratÈgies s(ides joueurs autres que i , on a :
pi (s)i , s(i ) > pi (si , s(i )
! stratÈgie telle que le paiement est plus important que pour touteautre stratÈgie! matrice rÈduite de paiements par Èlimination itÈrÈe
Introduction Forme normale Types díÈquilibres Forme extensive Jeux rÈpÈtÈs
Equilibre en stratÈgie dominante (2/4)
Application au dilemme du prisonnier
Introduction Forme normale Types díÈquilibres Forme extensive Jeux rÈpÈtÈs
Equilibre en stratÈgie dominante (2/4)
Application au dilemme du prisonnier
Introduction Forme normale Types díÈquilibres Forme extensive Jeux rÈpÈtÈs
Equilibre de Nash (1/4)
... mais pas toujours díÈquilibre en stratÈgie dominante : ex. de laBataille des sexes - jeu de coordination ou jeu des standards
Introduction Forme normale Types díÈquilibres Forme extensive Jeux rÈpÈtÈs
Equilibre de Nash (2/4)
! concept díÈquilibre de Nashintroduit en 1951 par le mathÈmaticien et prix Nobel J. Nash :preuve de líexistence díun concept díÈquilibreconcept díÈquilibre souvent utilisÈ en Èconomie : concept utilisÈ parCournot dËs 1838
DeÖnition
Un proÖl de stratÈgies s) #!s)1 , s
)2 , ..., s
)N
"est dit Èquilibre de Nash
(EN) si aucun joueur nía intÈrÍt ‡ dÈvier unilatÈralement de sa stratÈgie,i.e. si tous les autres joueurs ne choisissent pas une stratÈgie di§Èrente dela stratÈgie de Nash. Formellement, pour tous choix de stratÈgies s(i desjoueurs autres que i , on a :
pi#s)i , s
)(i$> pi
#si , s
)(i$.
Application ‡ deux joueurs : proÖl%s)Bonnie, s
)Clyde
&E.N. si pour les
deux joueurs et pour tout choix quelconque#sBonnie, sClyde
$on a
pBonnie%s)Bonnie, s
)Clyde
&> pBonnie
%sBonnie, s
)Clyde
&
pClyde%s)Bonnie, s
)Clyde
&> pClyde
#s)Bonnie, sClyde
$.
Introduction Forme normale Types díÈquilibres Forme extensive Jeux rÈpÈtÈs
Equilibre de Nash (3/4)
Pourquoi est-ce un Èquilibre ?
parce que la stratÈgie de chaque joueur est une meilleure rÈponseaux meilleures rÈponses des autres joueurs
! permet díobtenir le proÖt maximal Ètant donnÈes les stratÈgies desautres joueurs
Equilibre de Nash en pratique
pour un proÖl de stratÈgies donnÈes, chaque joueur a-t-il intÈrÍt ounon ‡ dÈvier unilatÈralement, i.e. si le choix díune autre stratÈgie luipermet díobtenir un paiement plus important
NB dÈviation unilatÈrale = chaque joueur suppose que tous lesautres joueurs ne choisissent pas díautre stratÈgie
Introduction Forme normale Types díÈquilibres Forme extensive Jeux rÈpÈtÈs
Equilibre de Nash (4/4)
Application ‡ la Bataille des sexes (opÈra, opÈra) EN
ni Bonnie, ni Clyde níont intÈrÍt ‡ dÈvier unilatÈralement
pas díintÈrÍt pour Bonnie ‡ choisir base-ball : si Clyde ìcontinueî dechoisir opÈra, paiement 3 (stratÈgie opÈra) plutÙt que paiement 0(stratÈgie base-ball).pas díintÈrÍt pour Clyde ‡ choisir base-ball : si Bonnie ìcontinueî dechoisir opÈra, paiement 1 (stratÈgie opÈra) plutÙt que paiement 0(stratÈgie base-ball).
! 2 E.N. (opÈra, opÈra) et (base-ball, base-ball)! faible pouvoir prÈdictif díun jeu avec plusieurs E.N. : les deux joueurspeuvent anticiper deux choix di§Èrents pour líautre joueur! analyse plus complexe pour connaÓtre líissue du jeu (cf. par exemplejeu rÈpÈtÈs)
Introduction Forme normale Types díÈquilibres Forme extensive Jeux rÈpÈtÈs
Non-existence díun EN (en stratÈgies pures)
Exemples díun jeu modiÖÈ sans EN
! variante de la Bataille des sexes : Bataille des sexes aprËs 10 ans devie commune
faible satisfaction de Clyde avec Bonnie : prÈfÈrence pour les sortiesseul... mais pas pour Bonnie (rÙles peuvent Ítre inversÈs...)jeu sans EN : intÈrÍt pour chacun ‡ dÈvier unilatÈralement des 4proÖls de stratÈgies
Introduction Forme normale Types díÈquilibres Forme extensive Jeux rÈpÈtÈs
Forme extensive (1/5)
Jeu sous forme extensiveforme normale : jeu simultanÈ sans information sur les stratÈgiesdes autres joueursforme extensive : jeu o˘ les joueurs jouent ‡ des momentsdi§Èrents et plus díune fois
jeu sÈquentiel avec timing
DeÖnition
Jeu sous forme extensive :
1 Un ensemble I # f1, ...,Ng de N joueurs.2 Un arbre de jeu avec un noeud de dÈcision initial, díautres noeuds dedÈcision et des branches liant les noeuds de dÈcision.entre eux.
3 Chaque noeud de dÈcision est associÈ ‡ la dÈcision díun joueur quichoisit une action parmi les actions possibles reprÈsentÈes par lesbranches aval.
4 Les paiements de chaque joueur sont indiquÈs aux noeuds terminaux.
Introduction Forme normale Types díÈquilibres Forme extensive Jeux rÈpÈtÈs
Forme extensive (2/5)
Forme extensive ou en arbre de dÈcisionforme adaptÈe aux jeux sÈquentiels (joueur 1 puis joueur 2, etc.)permet de reprÈsenter les ensembles díinformation des joueursex. Trust Game : Mise ‡ prix pour la tÍte de Tuco qui doit Ítrependu haut et court : 5000$. Blondin propose un marchÈ que Tucopeut accepter ou refuser : síil le ìcaptureî, Blondin coupera la cordeet partagera la rÈcompense. Et si Blondin Èvite la corde ? ...
Introduction Forme normale Types díÈquilibres Forme extensive Jeux rÈpÈtÈs
Forme extensive (3/5)
Jeu du Terroriste et du Pilote : un Terroristeannonce quíil fera exploser une bombe síils ne
vont pas Paris contre líavis des autorits franÁaisesqui ordonnent au Pilote díattrir Paris.
Introduction Forme normale Types díÈquilibres Forme extensive Jeux rÈpÈtÈs
Forme extensive (4/5)
jeu ‡ information stratÈgique : choix du Terroriste dÈpend du choixdu pilote
núud I : SPilote = fParis, Marseilleg)núud IIa : STerroriste = fBombe, Pas Bombegnoeud IIb : STerroriste = fBombe, Pas Bombeg
plusieurs dÈcisions pour un individu dans un jeu! dÈÖnition particuliËre de la notion de stratÈgie intÈgrant les dÈcisions
‡ chaque noeud de dÈcision
Introduction Forme normale Types díÈquilibres Forme extensive Jeux rÈpÈtÈs
Forme extensive (5/5)
DeÖnition
Une stratÈgie pour le joueur i , notÈe si , est une liste complËte díactionsdu joueur, le joueur ayant ‡ choisir une action aux noeuds de dÈcision leconcernant.
Quelles stratÈgies pour le terroriste et le pilote ?
pour le Terroriste : dÈcision selon sa position dans le jeu, i.e. selonla dÈcision du pilote
(PB ,B) : PB choix au noeud IIa et B choix au noeud IIb! 4 stratÈgies : (B ,B) , (B ,PB) , (PB ,B) et (PB ,PB)
pour le Pilote : 2 stratÈgies Par et Mar! 8 proÖls de stratÈgies : (Par , (B,B)), (Par , (B,PB)),
(Par , (PB,B)), (Par , (PB,PB)), (Mar , (B,B)), (Mar , (B,PB)),(Mar , (PB,B)) et (Mar , (PB,PB)).
Introduction Forme normale Types díÈquilibres Forme extensive Jeux rÈpÈtÈs
Ra¢nement de líEN (1/6)
Forme normale plus simple pour les EN
Introduction Forme normale Types díÈquilibres Forme extensive Jeux rÈpÈtÈs
Ra¢nement de líEN (2/6)
! 3 EN : (Mar , (B,PB)), (Mar , (PB,PB)) et (Par , (PB,B))
multiplicitÈ des Èquilibres complique líinterprÈtation des EN
! ra¢nement de líÈquilibre de Nash
si choix du Pilote de voler vers Marseille ! choix du Terroriste de nepas faire exploser la Bombe
! une fois que le Pilote choisit, pas díautre choix pour le Terroriste quede ne pas faire exploser la BombelíEN ne rend pas compte de la possibilitÈ pour le Pilote decomprendre que le Terroriste choisit de ne pas faire exploser laBombe síil choisit de voler vers Marseilleen thÈorie des jeux, menace non-crÈdible du Terroriste
formaliser líexclusion des EN non-raisonnables : intÈgrer líimpact dudu joueur qui dÈcide en premier sur les choix du du joueur qui dÈcideen second ! notion de sous-jeu.
Introduction Forme normale Types díÈquilibres Forme extensive Jeux rÈpÈtÈs
Ra¢nement de líEN (3/6)
DeÖnition
Un sous-jeu est líensemble formÈ par un núud de dÈcision issu du jeuoriginal (núud initial) et par tous les núuds qui suivent directement cenúud. On parle de sous-jeu propre si le jeu obtenu est di§Èrent du jeuoriginal.
!jeu du Terroriste et du Pilote dÈcomposÈ en 3 sous-jeux
le jeu lui-mÍme et les deux sous-jeux propres issus de deux núudsinitiaux IIa et IIb
Introduction Forme normale Types díÈquilibres Forme extensive Jeux rÈpÈtÈs
Ra¢nement de líEN (5/6)
On introduit ensuite le ra¢nement du concept díEN suivant (Selten,1965) :
DeÖnition
Un rÈsultat du jeu est un Èquilibre parfait en sous-jeu (EPSJ) síilcorrespond ‡ un EN pour chaque sous-jeu du jeu original.
! EPSJ : suite de dÈcisions pour chaque joueur ‡ chaque sous-jeu
ici, (Mar , (PB,PB)) est líunique EPSJ du jeu.