Eléments sur la théorie des jeux

Click here to load reader

  • date post

    20-Oct-2014
  • Category

    Business

  • view

    1.264
  • download

    0

Embed Size (px)

description

Ce livre blanc est une introduction à la théorie des jeux

Transcript of Eléments sur la théorie des jeux

Executive Summary

Teradata Warehouse

Elments sur la Thorie des Jeux

Michel Bruley, Directeur Marketing de Teradata France

Sommaire

La Thorie des Jeux fait aujourdhui lobjet dun grand intrt tant dun point vue thorique que du fait de son application dans des champs trs divers. Ce livre blanc a pour objet den permettre une premire dcouverte.

Introduction la thorie des jeux

Thorie des jeux et dcision dans lentreprise

Autres gnralits sur la thorie des jeux

Stratgie de coopration du donnant / donnant

Comment tre efficace au dilemme du prisonnier?

Comment promouvoir la coopration?

Structure sociale de la coopration

Bibliographie

Introduction la thorie des jeux

La Thorie des jeux a pour objet lanalyse des comportements rationnels de dcideurs (appels joueurs) en situation dinteraction. Autrement dit, il sagit de reconnatre que les rsultats obtenus par un dcideur en consquence de ses actions dpendent galement des actions des autres dcideurs. Considrons par exemple la problmatique gnrale du marketing-mix, qui inclut notamment le positionnement prix. Ce positionnement prix effectu par une entreprise a des impacts qui dpendent dune part des paramtres gnraux caractrisant le march (type lasticit des prix la demande), et de lautre du positionnement prix des entreprises concurrentes de lentreprise considre. Il conviendra par consquent pour cette dernire danticiper dans la mesure du possible les actions de ses concurrentes.

Une dcision est rationnelle si elle concourt atteindre les objectifs que sest fixs le dcideur, compte tenu de linformation dont celui-ci dispose sur ltat du monde. Cela signifie donc quune mme dcision peut tre rationnelle relativement un objectif et irrationnelle relativement un autre. Considrons par exemple une entreprise qui investit sur un march tranger rput troit et trs concurrentiel. Si lobjet de lentreprise est de maximiser son profit court terme, la dcision est videmment irrationnelle. En revanche, sil sagit pour lentreprise de prparer son dveloppement futur dans le pays en question, la dcision dinvestissement peut (ce nest pas obligatoire) tre rationnelle. De mme tant donn un objectif, une dcision peut tre rationnelle par rapport cet objectif pour un schma particulier dinformation du dcideur, et tre irrationnelle pour un autre schma. Revenons par exemple sur linvestissement de lentreprise ltranger, en supposant quelle a pour objectif son dveloppement long terme. Si dans un premier schma dinformation lentreprise sait quun pareil dveloppement est impossible ( par exemple pour des raisons lgales ou rglementaires qui ne sont pas prs de changer), tout investissement visant lobjectif ci-dessus est irrationnel. Si en revanche, les informations dont elle dispose permettent lentreprise destimer quil existe une chance raisonnable pour que les choses changent, sa dcision dinvestissement peut devenir rationnelle. Autrement dit, la notion de rationalit, renvoie toutes choses gales par ailleurs des problmes de perception (culture etc) et dobservation.

La quantit et la qualit de linformation peuvent avoir un impact majeur sur la pertinence de la dcision: une information insuffisante peut amener le dcideur substituer une dcision cible de faon optimale, une dcision moyenne permettant de tenir compte des risques associs aux incertitudes. A linverse une information trop abondante peut avoir pour effet de noyer le dcideur dans les dtails, brouillant la mcanique de la dcision. La qualit de linformation joue un rle tout aussi important dans le processus de dcision. A cet gard il est fondamental de bien prciser que la qualit de linformation est dfinie par sa proximit avec la problmatique du dcideur. Par exemple des informations dune granularit pertinente un usage oprationnel peuvent tre inutiles voire contre-productives pour le dcideur positionn au niveau stratgique. Exemple: pour dcider de se lancer ou non lassaut dun march tranger est-il ncessaire pour le dirigeant dentreprise de connatre le nombre de feuilles dimprimantes que sa secrtaire a consommes durant les six derniers mois?. La question qui se pose alors est celle de larticulation entre, dune part les diffrents niveaux de la dcision, et de lautre, les niveaux dinformation qui doivent tre associs aux premiers.

Parmi les informations dont le dcideur doit disposer figurent notamment:

lidentit des autres dcideurs

les moyens (ou dcisions possibles) du dcideur considr et des autres dcideurs

les consquences pour chaque dcideur de chaque combinaison de dcisions de lensemble des joueurs

les relations entre les dcideurs (les dcisions se prennent dans lignorance de celles des autres, ou au contraire, en connaissant celles-ci, les joueurs cooprent ou non etc.)

le rle du temps (dcision unique, dcisions squentielles etc.

Les dcisions se prennent sur la base des consquences anticipes des dites dcisions. Le caractre gnral de loutil constitu par la Thorie des Jeux provient du fait que sauf exception, lvaluation prcise de ces consquences est inutile. Seul compte le fait de savoir si telle dcision est meilleure que telle autre. Supposons ainsi que deux entreprises potentiellement concurrentes se posent la question de savoir si elles doivent entrer sur un march relativement troit. Pour chaque entreprise, la dcision est du type go-no go. Ce qui signifie quil y a quatre cas possibles: aucune entreprise nentre sur le march, lentreprise A mais pas lentreprise B, lentreprise B entre, mais pas lentreprise A, les deux entreprises entrent. Pour prendre sa dcision, une entreprise na pas besoin de dterminer au centime prs les pertes ou les gains associs cette dcision, mais plus simplement de classer les quatre situations possibles. L est tout lintrt de loutil constitu par la Thorie des Jeux.

La Thorie des Jeux permet galement de dcrire lvolution de populations dont les individus sont dnus de degr de libert quant leurs dcisions, par exemple parce que leur comportement est prdtermin, gntiquement, par appartenance une espce, une culture etc. La multiplication des interactions entre individus aboutit slectionner des comportements rationnels pour la population. Cette approche, appele Jeux Evolutionnaires et base sur un slectionnisme no-darwinien (les comportements les plus efficaces se reproduisent et liminent les comportements moins efficaces), permet dutiliser lapproche traditionnelle de la Thorie des Jeux (connue sous le vocable dindividualisme mthodologique) qui consiste partir du dcideur individuel, pour dcrire des phnomnes collectifs et volutifs. Ainsi, la naissance et lvolution des cultures au sein de lentreprise.

Parmi les grandes questions que la Thorie des jeux (volutionnaires ou non) permet daborder, se trouve la problmatique de la coopration. Si le vieil adage selon lequel lunion fait la force parat indiquer que la coopration simpose comme une vidence, la ralit est toute autre. Dans la vie de tous les jours, y compris dans la vie de lentreprise, la coopration a du mal simposer, les individus privilgiant la plupart du temps des comportements gostes, mme si une attitude plus cooprative serait bnfique pour tous. Lapport de la Thorie des jeux est ici considrable En premier lieu, celle-ci montre que contrairement ce que pourraient laisser penser les propos ci-dessus, lattitude goste des individus est trs souvent parfaitement rationnelle, et que la disjonction entre cette rationalit et les rsultats dcevants auxquels cette rationalit conduit, proviennent non dune faute de calcul des dcideurs, mais de la nature de linteraction qui conduit ce quil faut bien appeler une impasse: si tous les deux nous cooprions, nous nous en sortirons mieux que si nous ne cooprons pas. Mais si lautre coopre, je men tire encore mieux en ne cooprant pas quen cooprant! En second lieu, la Thorie des Jeux a permis de montrer comment sortir de ce cercle vicieux, partir dune analyse de cette problmatique dcisionnelle extrmement rpandue base sur la mtaphore du Dilemme du Prisonnier, la plus connue de la Thorie des Jeux. Les exemples concrets concernant la vie de lentreprise sont innombrables: guerre des prix, saturation des marchs, rmunration des sous-traitants, des employs, partage de linformation. Ce dernier cas illustre en particulier la relation entre le cot dextraction de linformation et le volont de deux individus travaillant lintrieur dune mme entreprise de partager cette information. Elle met notamment en lumire les possibilits dintervention du management pour favoriser un tel partage travers, soit des incitations directes, soit une amlioration de laccessibilit des systmes dinformation.

Thorie des jeux et dcision dans lentreprise

Modlisation mathmatique du comportement de dcideurs rationnels dans une situation dinteraction. Cette dfinition de la Thorie des Jeux ne donne pas toute la mesure de cette discipline, dont les champs dapplication sont trs varis. En voici quelques exemples:

Dfense: modlisation de la dissuasion nuclaire,

Sociologie et gntique: des chercheurs ont utilis la stratgie des jeux pour mieux comprendre lvolution du comportement des espces face la modification de leur environnement,

Organisation: dveloppement de systme multi-agents,

Marketing et stratgie dentreprise: La Thorie des Jeux a prcisment obtenu le prix Nobel dEconomie pour sa contribution la stratgie dentreprise,

Etc.

Bien entendu, lexistence de ces diffrents champs dapplication ne fait pas de la Thorie des Jeux une panace universelle, susceptible de rpondre toutes les situations. La Thorie des Jeux ne mrite toutefois pas les critiques quon lui assne volontiers au motif que lhomme ne serait pas rationnel. Car la notion de rationalit ne se juge pas en regard de lobjectif vis qui peut tre extravagant mais en fonction du comportement adopt pour atteindre cet objectif. Un exemple permet de mieux comprendre la nuance: deux fous sinvectivent dans la cour de leur asile. Lun est dguis en bonne sur, lautre en Napolon. Je suis Napolon!, assure lun. Non, cest moi, rpond lautre. Ils sont, certes, tous les deux fous. Mais lun, au moins, peut tre considr comme rationnel par rapport lobjectif fix: celui qui shabille effectivement comme Napolon, et non pas en bonne sur

La rationalit de base de la thorie des jeux est une rgle de maximisation de la satisfaction individuelle. Quel que soit le nombre de joueurs en prsence, il est possible dexpliquer leurs dcisions, leurs choix, les enjeux dune ngociation ou dun marchandage, etc. Il nest pas ncessaire de connatre avec prcision les consquences de chaque dcision. Il suffit de savoir ordonner les diffrentes combinaisons de dcisions possibles. Il faut, pour cela, dterminer:

qui sont les joueurs,

quels sont leurs moyens dactions (ce quon appelle, dans le jargon de la thorie des jeux, leur stratgie),

quelles sont les consquences de leurs actions,

quelles sont les informations dont ils disposent,

quels sont les types de relation quils ont avec les autres joueurs.

Si deux joueurs se font face, et quils ont chacun une possibilit de dcision binaire (oui ou non? go ou no go?), il existe quatre scnarios possibles. Prenons le fameux exemple du Dilemme du Prisonnier, un grand classique de la Thorie des Jeux. Deux prisonniers complices sont interrogs sparment. Chacun peut trahir son partenaire (T) ou rester silencieux (S). Si les deux trahissent, ils vont en prison pour trois ans. Si lun trahit et lautre pas, le tratre est libre et sa victime va en prison pour cinq ans. Si personne ne trahit, ils vont tous les deux en prison pour un an. Il est important de garder en tte que ces deux prisonniers bien que complices ne se connaissent pas et sont interrogs sparment: ils nont donc aucune ide de lattitude de leur complice (va-t-il cooprer ou privilgier son intrt personnel?)

Une matrice permet de faire apparatre les diffrents scnarios:

S

T

S

-1 , -1

-5 , 0

T

0 , -5

-3 , -3

t = tentation de la trahison = 0 anne de prison

r = rcompense de la coopration entre prvenus = 1 anne de prison

p = punition de lgosme = 3 annes de prison

s = salaire de la dupe = 5 annes de prison

Lanalyse de la matrice permet de voir aisment que quel que soit le choix de lautre, un joueur a toujours intrt avouer. Pourtant, si les deux prisonniers navaient pas avou, ils coperaient chacun dune seule anne de prison au lieu de trois. Cest l le paradoxe qui a rendu clbre le Dilemme du Prisonnier

Ce dilemme fait apparatre la contradiction extrmement rpandue entre intrt individuel et intrt collectif. Pour sortir de cette impasse, on peut considrer que dans de nombreux cas cette confrontation nest pas un one shot, mais est appele se renouveler rgulirement. Chaque joueur peut ainsi acqurir, au fil du temps, des informations sur le comportement de lautre joueur. Le thoricien amricain Robert Axelrod est arriv, aprs exprimentation, la conclusion que la stratgie du donnant-donnant, pour laquelle le joueur commence par adopter une attitude cooprative, puis joue ce qua jou lautre joueur la partie prcdente, est la plus payante long terme.

Considrons, par exemple le problme du partage de linformation dans lentreprise. Au Japon, les cadres ne sont pas seulement valus en fonction de leur activit quotidienne, mais sur la faon dont ils grent et dont ils diffusent linformation. Une culture bien diffrente de celle des cadres franais, qui partagent peu linformation tant ils considrent quelle reprsente le pouvoir Si lon se rfre au Dilemme du Prisonnier, la rtention dinformation nest une stratgie payante que sur le court terme (le one shot). A plus long terme, en revanche, le partage dinformation est toujours payant pour lorganisation, mais aussi pour le cadre, condition, toutefois, que le bnfice quil en retire soit suffisant. Autrement dit, le partage de linformation peut tre encourag par la mise en place dun systme dincitations, ou par un abaissement des cots de laccs linformation.

Comme cela a t dit plus haut, la Thorie des Jeux permet galement de mieux comprendre lvolution des comportements au sein dune population. A linstar des gnticiens, arrivs la conclusion que les espces ne se reproduisent que si elles ont un comportement adapt leur environnement, les thoriciens de lorganisation considrent quun mcanisme similaire no-darwinien, en somme! se met en place dans les organisations. Dans une entreprise, les comportements et les stratgies dominants deviennent si prgnants quils liminent tous les autres comportements et finissent par forger une vritable culture.

Des dcideurs commencent faire appel des spcialistes de la thorie des jeux pour les aider prendre des dcisions. Cest logique, puisque cette discipline met un cadre danalyse rigoureux et prcis face aux situations floues et complexes qui caractrisent le monde daujourdhui. Mais il ne sagit que dun cadre danalyse: les dcideurs restent matres de leurs choix et de leurs dcisions.

Autres gnralits sur la thorie des jeux

La thorie des jeux modlise le comportement dun agent face des situations de choix, elle se propose dtudier toute situation dans laquelle des agents rationnels interagissent. On pourrait aussi lappeler thorie de la dcision interactive, il sagit de modliser des situations dans lesquelles plusieurs agents font des choix, ceux des uns affectant les gains des autres.

La thorie des jeux sintresse aux comportements des individus. La rationalit de base de la thorie des jeux est une rgle de maximisation du profit individuel.

La thorie des jeux permet dexpliquer des processus de vote, de pouvoir, de diplomatie, de marchandage, de ngociation, de formation et de coalition.

Un jeu se caractrise pardes rgles du jeu qui dfinissent le nombre et le rle des acteurs ainsi que les variables quun joueur peut contrler, par exemple les possibilits de choix, linformation et la communication entre joueurs:

joueurs (au moins deux),

actions, stratgies possibles des joueurs et informations disponibles pour choisir,

droulements et tapes du jeu,

rtributions (gains, pertes) et rsultats.

On distingue diffrents types de jeux coopratifs / non coopratifs (gteau au chocolat) comptitifs / non comptitifs rptitifs / non rptitifs(jeux volutionnistes):

Jeux intrt communs (le rendez vous New York),

Jeux somme nulle o les intrts y sont parfaitement antagonistes,

Jeu type bataille des sexes qui fait intervenir une part de collaboration et de conflit,

Jeu type fureur de vivre (avec faucon et colombe),

Jeu type dilemme du prisonnier qui fait ressortir une tension entre intrt individuel et collectif (achat par internet, course aux armements, collusion & commission europenne).

Avec quelques principes simples ont peu dfinir des archtypes de joueurs: lagressif qui attaque systmatiquement, le rus qui se rend imprvisible, le machiavlique qui prvoit les attentes des autres et les manipule, le chaotique tellement imprvisible quil ne sait pas lui-mme ce quil va faire le coup daprs, lesclave qui cherche perdre au profit dun plus fort que lui,, le cooprant (donnant donnant ou gagnant gagnant) qui gagne quand il y a de bonnes conditions pour une coopration (jeu long terme, bonne communication, rciprocit des gains).

Cependant il est difficile de considrer la thorie des jeux comme une science positive fournissant des prdictions prcises. Plus une situation de jeu devient complexe moins les enseignements de la thorie des jeux mathmatiques deviennent instrumentaux pour expliquer ou conseiller un choix. Dans certains cas de modlisation peuvent apparatre des solutions dquilibres multiples sans que lon puisse choisir entre ceux-ci. Lanalyse de linteraction des comportements rationnels individuels devient rapidement inextricable ds que lon sort du cadre ultra simplifi des prsentations habituelles en thorie des jeux.

Stratgie de coopration du donnant / donnant

Dfinition: Dans le cadre de la thorie des jeux, il sagit dune stratgie o un joueur commence par cooprer puis rpte systmatiquement ce qua fait lautre joueur au coup prcdent (coopration sil y a eu coopration, dfection, sil y a eu dfection).

Dans le cas ou le jeu consiste en une srie (itration squentielle) de dilemmes du prisonnier, chaque participant a intrt pratiquer une stratgie de donnant / donnant (Tit for Tat en Anglais), c'est--dire une rciprocit conditionnelle. Pour quune stratgie de donnant / donnant ait un sens, il faut que le dilemme se reprsente nouveau dans le futur et que le nombre discret de partie soit inconnu des participants ou indtermin. Sinon la solution classique du dilemme peut tre prfre un moment donn.

Cette stratgie se rvle la plus efficace dans les simulations mais attention dans la vie de tous les jours, rares sont les fois o nous percevons parfaitement ce que lautre fait ou dit et o ce que nous faisons reflte ce que nous voulons faire.

Comment tre efficace au dilemme du prisonnier?

4 suggestions pour sen sortir honorablement:

Ne pas tre trop envieux: ne pas rflchir en termes de jeu sommes nulle, la maximisation de ses gains passe invariablement par celle des gains des autres.

Ne pas tre le premier faire cavalier seul: il est payant de cooprer tant que lautre joueur en fait autant. (attention bien tre dans un jeu suffisamment rptitif). La malveillance peut tre profitable au dbut mais elle finit par dtruire lenvironnement qui lui permettait de survivre.

Pratiquer la rciprocit dans la coopration comme dans la dfection: le jeu stricte est le plus performant, le tit for two tats est moins performant. Etre indulgent (revenir tout de suite la collaboration si elle est offerte) mais attention le niveau dindulgence dpend de lenvironnement (il faut en tenir compte dans certaines circonstances).

Ne pas tre trop malin: les stratgies compliques ne marchent pas mieux, il est prfrable davoir un comportement clair et donc prvisible ( court terme on peut tre roul mais long terme on lemporte).

Comment promouvoir la coopration?

Il sagit de transformer le contexte, le systme afin de favoriser lmergence de coopration(partenariat) :

Augmenter limportance de lavenir par rapport au prsent: augmenter la perspective de long terme, la durabilit de certaines interactions (traits), la frquence des relations.

Modifier les gains: arme majeur des gouvernants,

Enseigner au gens se soucier les uns des autres: compte tenu de lorganisation sociale, le bien tre personnel passe par celui des autres (interactions sociales frquentes, ) mais attention laltruisme correspond une coopration inconditionnelle qui nest pas une stratgie efficace.

Enseigner la rciprocit: laspect dsagrable du donnant / donnant rside dans son insistance appliquer durement la loi du Talion. Cest une justice trs dure mais la question est de savoir sil existe une meilleure alternative.

Amliorer les capacits de reconnaissance des joueurs.

La structure sociale de la coopration.

Quatre facteurs parmi dautres peuvent engendrer des consquences particulires sur lvolution de la coopration:

Etiquettes, strotypes, hirarchie,

Rputation, dissuasion,

Territorialit: au niveau culturel les individus partagent des valeurs particulires du fait de leur proximit territoriale, le territoire facilite la propagation des stratgies performantes(volution, colonisation, imitation),

Gouvernement et rglements explicites.

Bibliographie

La Thorie des Jeux, qui a obtenu le Prix Nobel dEconomie en 1994 pour sa contribution la stratgie dentreprise, fait aujourdhui lobjet dune immense littrature portant sur des problmes thoriques et des champs dapplication trs divers. On trouvera ci-dessous quelques ouvrages essentiellement introductifs.

Bernard Guerrien: La Thorie des Jeux, 108 p, Economie Poche, Economica, Paris, 1995. Une bonne introduction en 100 pages au format de poche, ne ncessitant dautre connaissance mathmatique que la notion desprance de gain.

Avinash. K. Dixit & Barry Nalebuff: Thinking Strategically, 393 p, W. W. Norton and Company, New-York, 1993. Pour une introduction purement littraire au raisonnement stratgique, base sur des exemples typiquement amricains.

John McMillan: Games, Strategies and Managers, 252 p, Oxford University Press, Oxford, New-York, 1992. Une trs bonne analyse travers des exemples de quelques problmes de dcision intressant lentreprise. Les dtails de la rsolution des problmes sont renvoys la fin du livre, et ne requirent que des connaissances mathmatiques du niveau de lenseignement secondaire.

Adam M. Brandenburger & Barry J. Nalebuff: Coo-petition, 290 p, Double Day, New-York 1996 (Traduit en Franais sous le mme titre aux Editions du Village, 1997). Une vision diffrente de la stratgie dentreprise, taye par des exemples, prsente sous une forme purement littraire, dissimulant parfaitement des concepts profonds.

H. Scott Bierman & Luis Fernandez: Game Theory with Economic Applications, 452 p, Addison-Wesley, 1998. Un cours lAmricaine, c-a-d tel que les concepts sont amens travers des exemples, emprunts la sphre de lconomie. Les nombreuses illustrations (do le nombre lev de pages) facilitent la lecture. Les connaissances mathmatiques requises se limitent la drivation des fonctions, et la notion desprance de gain.

Ken Binmore: Fun and Games, 602p + rponses aux exercices proposs, Heath and Company, Lexington, MA, 1992. Une magistrale promenade travers des exemples mettant en lumire quelques uns des concepts fondamentaux de la Thorie des Jeux. Dans chaque chapitre, les sections plus mathmatiques sont mises part de faon pouvoir tre sautes en premire lecture. Le niveau mathmatique requis est celui dun premier cycle universitaire scientifique.

Livre Blanc

WPNPage 1

Pour plus dinformation vous pouvez contacter [email protected]

Michel Bruley

Directeur Marketing Teradata France

1 square John H. Patterson

91749 Massy cedex

+ 33 1 64 47 92 00