Corrigés des TD - École Polytechniquebenaych/TD2010.corrige.pdf · 2010. 3. 3. ·...

44
Université Paris VI Master 1 : Modèles stochastiques pour la finance Corrigés des TD 1. Interêts simples / Intérêts composés. Définition : a) L’intérêt d’un prêt est dit simple lorsqu’il est calculé à chaque période seulement sur la base de la somme prêtée ou empruntée à l’origine. b) L’intérêt d’un prêt est dit composé lorsqu’à la fin de chaque période l’intérêt s’ajoute au capital de début de période pour former la base de calcul de l’intérêt pour la période suivante. Le montant d’intérêt et le capital changent à chaque période On emprunte N sur n périodes, et dans tout l’exercice, intérêt et capital seront toujours remboursés et payés à échéance (i.e. à la fin des n périodes). On note r s le taux simple par période et r c le taux composé. 1. Quel est le montant dû en n si les intérêts sont simples ? 2. Si les intérêts sont composés ? 3. Quelle relation doit exister entre r s et r c , en l’absence d’opportunité d’arbitrage et en supposant que l’on peut emprunter ou prêter selon les deux modalités ? 4. Ces taux peuvent-ils être tous les deux indépendants de n ? 5. Si les périodes associées au taux r s sont des mois, et si n est un multiple de 12, quel est le taux simple annuel r 0 s , en l’absence d’opportunité d’arbitrage et en supposant que l’on peut emprunter ou prêter en intérêts simples mensuels et annuels ? 6. Vous souhaitez effectuer un achat pour un montant de 1000 euros. Faute de dispo- nibilités immédiates, vous décidez de financer votre achat par un crédit de durée un an. Deux solutions vous sont alors possibles : a) votre carte de crédit vous donne la possibilité d’emprunter au taux mensuel simple de 0, 5%, b) votre banque vous offre une possibilité de financement au taux annuel composé de 6, 1%. Pour quelle méthode de financement opteriez-vous? Que se passe-t-il si vous devez em- prunter aux mêmes conditions mais sur deux ans avec remboursement du capital et des intérêt in fine ? Solution : 1. En n, on doit alors N + nr s N . 2. Soit, pour k =0,...,n, m k le montant total dû à la fin de la période k. On a m 0 = N , et pour tout k, m k = m k-1 (1 + r c ). Ainsi, m n = N (1 + r c ) n . 3. En l’absence d’opportunité d’arbitrage, on a alors 1+ nr s = (1 + r c ) n . Prouvons-le. Supposons que 1+ nr s < (1+ r c ) n . Alors à l’instant 0, on emprunte N euros en intérêts simples et les prête en intérêts composés. À l’instant n, on récupère N (1 + r c ) n et rend N (1 + nr s ) : gain de N ((1 + r c ) n - (1 + nr s )) > 0. Supposons que 1+ nr s > (1+ r c ) n . Alors à l’instant 0, on emprunte N euros en intérêts composés et les prête en intérêts simples. À l’instant n, on récupère N (1 + nr s ) et rend N (1 + r c ) n : gain de N ((1 + nr s ) - (1 + r c ) n ) > 0. 4. Ces taux ne peuvent être tous les deux indépendants de n, car les couples de solution de l’équation 1+ nx = (1 + y) n dépendent de n. 1

Transcript of Corrigés des TD - École Polytechniquebenaych/TD2010.corrige.pdf · 2010. 3. 3. ·...

  • Université Paris VIMaster 1 : Modèles stochastiques pour la finance

    Corrigés des TD

    1. Interêts simples / Intérêts composés. Définition : a) L’intérêt d’un prêt est ditsimple lorsqu’il est calculé à chaque période seulement sur la base de la somme prêtée ouempruntée à l’origine.b) L’intérêt d’un prêt est dit composé lorsqu’à la fin de chaque période l’intérêt s’ajouteau capital de début de période pour former la base de calcul de l’intérêt pour la périodesuivante. Le montant d’intérêt et le capital changent à chaque période

    On emprunteN sur n périodes, et dans tout l’exercice, intérêt et capital seront toujoursremboursés et payés à échéance (i.e. à la fin des n périodes). On note rs le taux simplepar période et rc le taux composé.

    1. Quel est le montant dû en n si les intérêts sont simples ?2. Si les intérêts sont composés ?3. Quelle relation doit exister entre rs et rc, en l’absence d’opportunité d’arbitrage et

    en supposant que l’on peut emprunter ou prêter selon les deux modalités ?4. Ces taux peuvent-ils être tous les deux indépendants de n ?5. Si les périodes associées au taux rs sont des mois, et si n est un multiple de 12, quel

    est le taux simple annuel r′s, en l’absence d’opportunité d’arbitrage et en supposant quel’on peut emprunter ou prêter en intérêts simples mensuels et annuels ?

    6. Vous souhaitez effectuer un achat pour un montant de 1000 euros. Faute de dispo-nibilités immédiates, vous décidez de financer votre achat par un crédit de durée un an.Deux solutions vous sont alors possibles :

    a) votre carte de crédit vous donne la possibilité d’emprunter au taux mensuel simplede 0, 5 %,

    b) votre banque vous offre une possibilité de financement au taux annuel composé de6, 1 %.Pour quelle méthode de financement opteriez-vous ? Que se passe-t-il si vous devez em-prunter aux mêmes conditions mais sur deux ans avec remboursement du capital et desintérêt in fine ?

    Solution : 1. En n, on doit alors N + nrsN .2. Soit, pour k = 0, . . . , n, mk le montant total dû à la fin de la période k. On a

    m0 = N , et pour tout k, mk = mk−1(1 + rc). Ainsi, mn = N(1 + rc)n.3. En l’absence d’opportunité d’arbitrage, on a alors 1 + nrs = (1 + rc)n. Prouvons-le.Supposons que 1+nrs < (1+rc)n. Alors à l’instant 0, on emprunte N euros en intérêts

    simples et les prête en intérêts composés. À l’instant n, on récupère N(1 + rc)n et rendN(1 + nrs) : gain de N((1 + rc)n − (1 + nrs)) > 0.

    Supposons que 1+nrs > (1+rc)n. Alors à l’instant 0, on emprunte N euros en intérêtscomposés et les prête en intérêts simples. À l’instant n, on récupère N(1 + nrs) et rendN(1 + rc)

    n : gain de N((1 + nrs)− (1 + rc)n) > 0.4. Ces taux ne peuvent être tous les deux indépendants de n, car les couples de solution

    de l’équation 1 + nx = (1 + y)n dépendent de n.

    1

  • 5. Un raisonnement par opportunité d’arbitrage montre que r′s = 12rs.6. Ici, en utilisant la question précédente, on peut se ramener à des intérêts simples

    annuels de rs = 12× 0, 5 = 6%.Dans le premier cas, on a alors, avec des périodes d’une année, n = 1, rs = 0, 06, rc =

    6, 1. 1 + nrs < (1 + rc)n, donc il vaut mieux emprunter en intérêt simples.Dans le deuxième cas, toujours avec des périodes d’une année, n = 2, rs = 0, 06, rc =

    6, 1. 1 + nrs = 1, 120, (1 + rc)n = 1, 126, donc il vaut mieux emprunter en intérêt simplesaussi.

    2. Limite continue de la capitalisation par intérêts composés.1. Donner, pour r ∈ R, et vn suite équivalente à tn, avec t > 0, la limite de la suite

    un =(1 + r

    n

    )vn .2. Dans de nombreux cas, les taux d’intérêts sont associés à des longues durées, mais

    calculés de façon composée sur des durées beaucoup plus courtes. On parle par exemplede taux annuel r à composition mensuelle, hebdomadaire, quotidienne, ou de façon plusgénérale m fois par an. Cela signifie précisément que les intérêts sont composés m foispar an au taux Frm. Par exemple, un montant A investi au taux annuel r à compositionmensuelle (donc m = 12) rapporte, au bout de respectivement 3, 7, 15 mois :

    A (1 + Fr12)3 , A (1 + Fr12)7 , A (1 + Fr12)15 .

    On dispose de 100 000 euros à investir deux ans. Vaut-il mieux l’investir au tauxannuel de 4,7% calculé composé de façon annuelle, au taux annuel 4,6% composé de façonmensuelle, au taux 4,5% composé de façon hebdomadaire, ou au taux 4,4% composé defaçon quotidienne (les années sont supposées avoir 365 jours) ?

    3. Supposons que l’on investisse A euros au taux annuel de r à composition m fois paran, avec m très grand. Donner la valeur Vm(t) du capital au bout d’un temps t (comptéen années, mais non forcément entier). Quelle est sa limite lorsque m → +∞ ? On parlealors de composition continue, et r est alors le taux continu.

    Solution : 1. lnun ∼ vn rn , donc un −−−→n→∞ ert.

    2. Il suffit de comparer les valeurs du capital au bout de 2 ans dans les 4 cas, soit,arrondis à 10 euros,

    100000(1 + 0, 047)2 = 109620; 100000(1 + 0, 046/12)24 = 109660;

    100000(1 + 0, 045/52)2×52 = 109410; 100000(1 + 0, 044/365)2×365 = 109200.

    La deuxième solution est donc la meilleure.3. Soit E la partie entière. La valeur du capital au bout d’un temps t, est de

    A (1 + Frm)E(t/(1/m)) .

    Or la suite E(t/(1/m)) = E(tm), encadrée par tm et tm− 1, est équivalente à tm. Doncpar la première question, Vm(t) −−−→

    m→∞Aert.

    3. Taux pré-compté / Taux post-compté.Un emprunt est à taux pré-compté si les intérêts sont payés en début de période (et nonen fin comme dans le cas post-compté).

    2

  • On note rp le taux par période pré-compté et r le taux post-compté.1. Vous voulez disposer de la somme N sur une période. Combien devez-vous emprun-

    ter au taux pré-compté ? Combien devez-vous rembourser en fin de période ? Combienquelqu’un qui possède N peut-il prêter en pré-compté ?

    2. Reprendre la question 1 avec le taux post-compté.3. En l’absence d’opportunité d’arbitrage et en supposant que l’on peut emprunter ou

    prêter selon les deux modalités, quelle relation doit-il y avoir entre les deux taux ?Solution : 1. Si on emprunte x, on rembourse immédiatement xrp, et donc on dispose

    de x(1−rp). x doit donc satisfaire x(1−rp) = N , donc x = N/(1−rp). À la fin de la période,on rembourse le principal emprunté, càd N/(1−rp). Quelqu’un qui possède N peut prêterN/(1−rp) en pré-compté. En effet,N/(1−rp) > N , mais on aN/(1−rp) = N+rpN/(1−rp)donc la personne qui possède N et prête N/(1− rp) s’endette de rpN/(1− rp) , mais ellerembourse tout de suite, car elle empoche les intérêts de son prêt.

    2. Là, c’est plus facile, on emprunte N . Par contre, on rembourse N(1 + r).3. Considérons la stratégie suivante.

    Début de période : emprunt de N en post-compté, et prêt de N/(1− rp) en précompté (lebilan est nul).Fin de période : retour des N/(1− rp) prêtés et payement du principal et des intérêts del’emprunt, soit N(1 + r).

    Le bilan ne peut être positif, sans quoi on aurait une opportunité d’arbitrage, doncN(1 + r) ≥ N/(1− rp).

    La stratégie inverse implique que N(1 + r) ≤ N/(1− rp).Donc (1 + r)(1− rp) = 1.

    4. Taux équivalents.On note rk le taux composé à capitalisation toutes les k périodes. Quelle relation doitexister entre rk et rpk si p ∈ IN∗ ?

    Solution : Un raisonnement par opportunité d’arbitrage donne : pour tout capitalinitial N , N(1 + rk)p = N(1 + rpk). La relation est donc : (1 + rk)p = 1 + rpk.

    5. Taux d’intérêts et taux de change.Considérons une économie à deux dates et deux pays. On note par rd le taux d’intérêt

    domestique, et par re le taux d’intérêt étranger sur la période considérée. On désigne parτ0 et τ1 le taux de change domestique/étranger aux dates 0 et 1, c’est à dire :

    τi unités en monnaie domestique à la date i ≡ 1 unité en monnaie étrangère à la date i .

    On suppose qu’il y a parfaite mobilité des capitaux. En utilisant un raisonnement d’ab-sence d’arbitrage, trouver une relation entre rd, re, τ0 et τ1.

    Solution : Montrons que τ1(1 + re) = τ0(1 + rd). Pour simplifier, appelons la monnaiedomestique l’euro et la monnaie étrangère de yen.

    Considérons la stratégie suivante.A la date 0, on emprunte τ0 euros, que l’on convertit en 1 yen, placé au taux sans

    risque au Japon (⇒ bilan nul à la date 0).A la date 1, on récupère (1 + re) yens, que l’on convertit en τ1(1 + re) euros, et on

    paye τ0(1 + rd) pour notre emprunt initial.En absence d’arbitrage, le bilan ne peut être positif, donc τ1(1 + re) ≤ τ0(1 + rd).

    3

  • Considérons maintenant la stratégie suivante.A la date 0, on emprunte 1 yen, que l’on convertit en τ0 euros, placé au taux sans

    risque en Europe (⇒ bilan nul à la date 0).A la date 1, on récupère τ0(1 + rd) euros, que l’on convertit en τ0(1 + rd)/τ1 yens, et

    on paye 1 + re yens pour notre emprunt initial.En absence d’arbitrage, le bilan ne peut être positif, donc 1 + re ≥ τ0(1 + rd)/τ1.

    6. Taux forward, courbe de taux et zéro-coupons.Cet exercice porte sur les taux d’intérêt ou d’emprunt à l’état, appelés taux sans risque,

    dans leur version discrète. On se place à un instant qui correspondra à la date 0 et onnote, pour 0 ≤ k ≤ l entiers, rk,l la valeur actuelle le taux composé sur la période [k, l]pour un placement effectué à la date k. Ce taux s’appelle le taux forward actuel pour lapériode [k, l].

    1. Exprimer, en l’absence d’opportunité d’arbitrage, rk,l en fonction des ri,i+1.2. On note, pour k ≥ 0, r(k) = r0,k le taux d’intérêt composé correspondant à un

    emprunt de maturité k à capitalisation par période (la fonction k 7→ r(k) est appelécourbe des taux). Exprimer rk−1,k en fonction de cette fonction. Donner le taux forwardmensuel actuel (on se place début janvier 2008) pour le mois de juin 2008 si les tauxd’intérêt mensuels pour des placements effectués aujourd’hui à maturités respectives finmai 2008 et fin juin 2008 sont 0,5% et 0,6%. Pouvait-on prévoir sans calcul que ce tauxserait supérieur à 0,6% ?

    3. Calculer r(k) dans le cas particulier où ri,i+1 = r ne dépend pas de i.4. On vous propose de vous donner 1 euros en k contre le paiement en j d’un montant

    B(j, k), j < k. Que vaut B(j, k) ? En déduite que connaître la fonction k 7→ B(0, k)(courbe zéro-coupon) est équivalent à connaître la fonction k 7→ r(k).

    Solution : 1. On a (1 + rk,l)l−k =l−1∏i=k

    (1 + ri,i+1) (l’arbitrage se construit facilement si

    cette propriété n’est pas vérifiée).

    2. On a (1 + r(k))k =k−1∏i=0

    (1 + ri,i+1), donc 1 + rk−1,k = F(1 + r(k))k(1 + r(k − 1))k−1.

    Dans l’exemple, on cherche r5,6 pour r(5) = 0, 005 et r(6) = 0, 006. Le calcul est aisé, onobtient un taux de 1,1%.

    3. Si ri,i+1 = r ne dépend pas de i, (1 + r(k))k = (1 + r)k, donc r(k) = r.4. On a B(j, k)(1 + rj,k)k−j = 1, donc B(j, k) = (1 + rj,k)−(k−j). La conclusion est

    immédiate.

    7. Taux instantané, courbe des taux instantanés.Cet exercice porte sur les taux d’intérêt ou d’emprunt à l’état, appelés taux sans

    risque, dans leur version continue. On travaille ici avec les taux annuels continus, c’est àdire que dire "le taux annuel continu pour un investissement I de durée T est r" signifieque un investissement de N euros dans I de durée T rapporte NeTr euros à la fin del’investissement. T est compté en années, et n’est pas forcément entier, c’est l’avantagede la notion de "taux continu".

    On a maintenant un repérage du temps continu. On se place à un instant qui cor-respondra à la date 0 et on note, pour 0 ≤ t ≤ t′ (non forcément entiers), rt,t′ la valeur

    4

  • actuelle le taux annuel continu sur la période [t, t′] pour un placement effectué à la datet. Ce taux s’appelle le taux forward annuel continu actuel pour la période [t, t′].

    1. Exprimer, pour 0 ≤ t ≤ t′ ≤ t′′, en l’absence d’opportunité d’arbitrage, la relationentre rt,t′′ , rt,t′ et rt′,t′′ .

    2. On note, pour t ≥ 0, r(t) = r0,t (la fonction t 7→ r(t) est appelé courbe des tauxcontinus). Exprimer rt,t′ en fonction de cette fonction. Donner le taux forward annuelcontinu actuel (on se place début janvier 2008) pour le mois de septembre 2008 si lestaux d’intérêt annuels pour des placements effectués aujourd’hui à maturités respectivesfin août 2008 et fin septembre 2008 sont 3,00% et 3,07%. Pouvait-on prévoir sans calculque ce taux serait supérieur à 3,07%?

    3. On suppose la fonction t 7→ r(t) dérivable. Donner la limite rF (t) de rt,t′ quand t′tend vers t, appelée taux forward annuel instantané à maturité t.

    4. Soit 0 ≤ t < t′. On vous propose de vous donner 1 euros en t′ contre le paiement en td’un montant B(t, t′). Que vaut B(t, t′) ? En déduite que connaître la fonction t 7→ B(0, t)(courbe zéro-coupon) est équivalent à connaître la fonction t 7→ r(t).

    Solution : 1. On a e(t′′−t)rt,t′′ = e(t

    ′−t)rt,t′e(t′′−t′)rt′,t′′ , i.e. (t′′ − t)rt,t′′ = (t′ − t)rt,t′ +

    (t′′ − t′)rt′,t′′ (l’arbitrage se construit facilement si cette propriété n’est pas vérifiée).2. D’après la relation précédente, t′r(t′) = tr(t) + (t′ − t)rt,t′ , donc

    rt,t′ = Ft′r(t′)− tr(t)t′ − t = r(t) + t′Fr(t′)− r(t)t′ − t.

    Dans l’exemple, on cherche r8/12,9/12 pour r(8/12) = 0, 03 et r(9/12) = 0, 031. Le calculest aisé, on obtient un taux de 3,9%.

    3. D’après la formule rt,t′ = r(t) + t′Fr(t′)− r(t)t′ − t, rF (t) = r(t) + tr′(t).4. On a B(t, t′)e(t

    ′−t)rt,t′ = 1, donc B(t, t′) = e−(t′−t)rt,t′ . La conclusion est immédiate.

    On rappelle qu’une obligation de maturité n, de coupons C1, . . . , Cn et de valeur deremboursement R est un flux dans lequel, si on se place à la date 0, on reçoit C1 à la date1, C2 à la date 2,. . . , Cn à la date n, plus R à la date n.

    En général, les coupons sont calculés à partir d’un nombre N , appelé nominal et d’unnombre c appelé taux de coupon, tels que pour tout k, Ck = Nc.

    8. Evaluation d’obligations.On considère une obligation O de maturité T années. Le taux de coupon est c et le

    nominal N . La valeur de remboursement est égale R. On note, pour tout n, rn le taux(à composition annuelle continue) sans risque du zéro coupon de maturité n années à ladate actuelle, notée 0.

    a. Rappeler le prix d’un zéro coupon de maturité n et de nominal égal à 1 (c’est à direce que l’on doit payer à la date 0 pour recevoir 1 à la date n).

    b. Que vaut l’obligation O à l’instant 0 ? Dans le cas où rn est constante et vaut r,avec c = er − 1 et R = N , quelle est cette valeur ? Comment cela se comprend-il ?

    c. On suppose maintenant que la courbe des taux zéro coupon est plate à toute date,i.e. rn = r pour tout n et ne varie pas quand le temps passe. Que vaut l’obligation ent ∈ [0, T ] ? Comment se comporte le prix de O lorsque r évolue ? La valeur absolue dela dérivée du prix rapportée au prix (i.e. divisée par le prix) est appelée sensibilité et estnotée S.

    5

  • d. On suppose toujours que la courbe est plate et ne bougera pas dans l’avenir. Quelmontant Mτ (r) obtenez vous en τ ∈ [0, T ] si vous achetez l’obligation à maturité T en 0,ré-investissez tous les coupons au taux zéro coupon, et la revendez en τ ?

    e. Calculer la durée de détention de l’obligation D telle que la richesse obtenue suivantla stratégie exposée en d. ne soit pas sensible à une petite variation de r (i.e. telle que ladérivée de cette richesse par rapport à r soit nulle) ? On appelle cette durée la durationde l’obligation.

    f. Quel lien existe-t-il entre sensibilité et duration ?Solution : a. La composition est annuelle continue, donc le prix est Bn := e−nrn .b. En 0, elle vaut P := BTR +

    ∑Tn=1BncN . Dans le cas où rn = r pour tout n,

    c = er − 1 et R = N , cette valeur est N . Cela se comprend bien : il suffit d’investir N àl’instant 0 pour se faire payer cN à la fin de chaque période.

    c. L’hypothèse signifie que l’argent rapporte à taux constant r sur toute période etque ce taux ne changera pas. Donc en t ∈ [0, T ], O vaut

    Pt(r) =T∑

    k=t+1

    FcNe(k−t)r + FRe(T−t)r

    = FRe(T−t)r + FcNerF1− e−(T−t)r1− e−r = 1e(T−t)r

    (R−FcNer − 1) + FcNer − 1.

    On a, pour tout k > t, F∂∂rFcNe(k−t)r < 0, donc comme on pouvait s’en douter, siles taux d’intérêt augmentent, le prix de l’obligation décroît.

    d. Une valeur A en t ≤ τ , investie au taux zéro-coupon, rapporte Ae(τ−t)r en τ . Donc

    Mτ (r) =τ∑t=1

    cNe(τ−t)r + Pτ (r) = eτr

    [T∑k=1

    FcNekr + FReTr].

    e. On veut τ tel que F∂Mτ∂rMτ (r) = 0, ce qui donne

    τ = FT∑t=1

    tcNe−rt + TRe−rTT∑t=1

    cNe−rt +Re−rT .

    f. On remarque que la sensibilité est égale à la duration.

    9. Emission obligataire.On considère une obligation O de maturité T années qui doit être émise aujourd’hui.

    Le taux de coupon est c, le nominal N , la valeur de remboursement est égale à R et lavaleur d’émission (i.e. le prix) est E. On note rn le taux annuel (composé) sans risque duzéro coupon de maturité n années.

    Donner la relation entre E,N, c, R et les rn.Solution : Soit, pour tout n, Bn = (1 + rn)−n. C’est ce qu’on doit payer à la date 0

    pour avoir 1 à la date n. On a donc

    E =T∑n=1

    BncN +RBT .

    6

  • 10. Contrat à terme.On considère un contrat de vente (i.e. un contrat qui donne le droit de vendre) au prix

    K d’un actif dans T années, dont l’estimation actuelle du prix dans T années est S < K,avec paiement en T . On note rn le taux annuel (composé) sans risque du zéro coupon dematurité n années. Quel est le prix de revente actuel d’un tel contrat ?

    Solution : C’est FK − S(1 + rT )T .

    11. Taux de change futur.On note re et rd les taux étrangers et domestiques à un an, τ0 le nombre d’unités de

    devise domestique obtenues contre une unité de devise étrangère en 0. On considère uncontrat par lequel un agent A achète à un agent B le droit de lui échanger, dans un an,N unités de devise étrangère au taux F (i.e. contre FN unités de devise domestique).Combien ce contrat vaut-il aujourd’hui ?

    Solution : On sait (feuille de TD 1) que le taux τ1, dans un an, est donné par laformule : τ1 = τ0F1 + rd1 + re. Donc le contrat permettra à A de gagner, s’il l’utilise, endevise domestique, N(F − τ1). Il vaut donc 1τ1

  • A la date 1, on récupère τ v0 (1 + rd) euros, que l’on convertit en τ v0 (1 + rd)F yens, eton paye 1 + re yens pour notre emprunt initial.

    En absence d’arbitrage, le bilan ne peut être positif, donc 1 + re ≥ τ v0 (1 + rd)F .Finalement, on a F(1 + re)τa0 1 + rd ≤ F ≤ F1 + reτ v0 (1 + rd).

    13. Parité call-put.On considère un actif financier S de prix St à la date t.a. Un call européen est un contrat par lequel le vendeur s’engage à livrer S à un prix K

    (strike) fixé à l’avance à une date T (maturité) si l’acheteur le désire (exerce son option).On note Ct le prix à la date t du call de maturité T et de strike K. Quelle est la valeuren T du call (du point de vue de l’acheteur) ?

    b. Un put européen est un contrat par lequel le vendeur s’engage à acheter S à unprix K (strike) fixé à l’avance à une date T (maturité) si l’acheteur le désire (exerce sonoption). On note Pt le prix à la date t du put de maturité T et de strike K. Quelle est lavaleur en T du put (du point de vue de l’acheteur) ?

    c. On note Bt le prix en t du zéro coupon versant 1 en T . Rappeler ce que ça représente.Montrer que en absence d’opportunités d’arbitrage, Ct−Pt = St−KBt. Ce lien est appelérelation de parité call-put.

    Solution : a. Le prix est CT = (ST −K)+.b. Le prix est PT = (K − ST )+c. Bt est le montant à investir au taux sans risque en t pour obtenir 1 en T .Supposons que Ct − Pt < St − KBt. On réalise alors un arbitrage avec la stratégie

    suivante.En t, on achète C, vend P , vend S, et placeKBt+V, avec V = −Ct+Pt+St−KBt > 0.

    Le bilan est −Ct + Pt + St −KBt − V = 0. En T , on exerce C, l’acheteur de P l’exerce,on achète S, et on a le fruit de notre placement. Le bilan est

    (ST −K)+ − (K − ST )+ − ST +K + V/Bt = V/Bt > 0.

    Supposons que Ct − Pt > St − KBt. On réalise alors un arbitrage avec la stratégiesuivante.

    En t, on achète P , vend C, achète S, emprunte KBt, et place V , avec V = Ct − Pt −St +KBt > 0. Le bilan est −Pt + Ct − St +KBt − V = 0. En T , on exerce P , l’acheteurde C l’exerce, on vend S, et on a le fruit de notre placement. Le bilan est

    (K − ST )+ − (ST −K)+ + ST −K + V/Bt = V/Bt > 0.

    14. Option américaine.On note Bt le prix en t du zéro coupon versant 1 en T . On considère un actif financier

    S de prix St à la date t. Un call américain est un contrat par lequel le vendeur s’engageà livrer S à un prix KBt (strike) fixé à l’avance à une date t (quelconque) inférieure à Tsi l’acheteur exerce son option en t. On note Ct le prix à la date t du call européen dematurité T et de strike K et Cat le prix du call américain correspondant. On note Bt leprix en t du zéro coupon versant 1 en T .

    a. Montrer que en l’absence d’opportunité d’arbitrage, Cat ≥ Ct.b. On suppose que St est aléatoire et que P (ST > K) > 0 et que P (ST < K) > 0.

    Montrer qu’en l’absence d’opportunités d’arbitrage Ct > [St −KBt]+.

    8

  • c. En déduire que sous les hypothèses précédentes, il vaut toujours mieux vendre uneoption américaine plutôt que de l’exercer, et enfin que Cat = Ct.

    Solution : a. Sinon, Ct > Cat . On réalise alors un arbitrage en vendant des calleuropéens à la date t et en achetant autant de call américains, ce qui constitue uneopération positive. On n’exerce nos call américains que à la date T , ce qui constitue uneopération neutre.

    b. Si St ≤ KBt, alors Ct > 0. En effet, sinon Ct ≤ 0, l’achat de C en t ne faitpas perdre d’argent, et permet un bilan strictement positif en T avec une probabilitéstrictement positive. Impossible en l’absence d’opportunité d’arbitrage.

    Si St > KBt, alors [St −KBt]+ = St −KBt. Supposons Ct ≤ St −KBt. Alors si en t,on achète C, vend S, et place KBt, le bilan est positif ou nul, et offre avec une probabilitéstrictement positive (celle du cas où ST < K) un bilan strictement positif en T : exercicede C si ST > K, rachat de S et fruit K du placement.

    c. La vente d’une option américaine en t < T rapporte ce que vaut cette option, soitVt := C

    at . Or Cat ≥ Ct > [St −KBt]+ =ce que rapporte l’exercice de l’option américaine

    en t. Il vaut donc toujours mieux vendre une option américaine que l’exercer.

    15. Conditionnement dans un exemple simple 1 Soit Ω = {1, . . . , 5} muni dela tribu F = P(Ω). Soit X, Y : Ω → R définies par X(1) = X(2) = 0, X(3) = 1,X(4) = X(5) = 2 et Y (ω) = ω2 pour tout ω ∈ Ω.

    a) Donner la tribu σ(X) engendrée par X (rappel : c’est la plus petite tribu G de Ωtelle que X : (Ω,G)→ (R,B(R)) est mesurable, i.e. l’intersection de ces tribus).

    b) On munit Ω de la loi uniforme. Donner E(Y |σ(X)).c) Même question si la loi choisie n’est plus la loi uniforme sur ω, mais (p1, . . . , p5)

    avec p1 = p2 = 1/4 et p3 = p4 = p5 = 1/6.Solution : a) Soit une tribu G de Ω telle que X : (Ω,G)→ (R,B(R)) est mesurable.

    On a, pour tout y ∈ R, X−1({y}) ∈ G. Donc G contient {1, 2}, {3} et {4, 5}. Ainsi, latribu G0 engendrée par {1, 2}, {3} et {4, 5} (qui est l’ensemble des unions de 0,1, 2 ou3 ensembles pris parmi {1, 2}, {3} et {4, 5}) est contenue dans σ(X). Par ailleurs, X estG0-mesurable, donc σ(X) ⊂ G0. Ainsi, σ(X) = G0.

    b) Soit Z = E(Y |σ(X)). Z est σ(X)-mesurable, donc constante sur chacun des en-sembles {1, 2}, {3} et {4, 5}. Par ailleurs, si E est un de ces trois ensembles, on a

    E(Z1E) = E(Y 1E).

    Donc, en notant zE la valeur de Z sur E, on a1

    5zE Card(E) =

    1

    5

    ∑ω∈E

    Y (ω),

    d’oùzE =

    1

    Card(E)

    ∑ω∈E

    Y (ω).

    On en déduit z{1,2} = 5/2, z{3} = 9, z{4,5} = 41/2.c) Soit Z = E(Y |σ(X)). Z est σ(X)-mesurable, donc constante sur chacun des en-

    sembles {1, 2}, {3} et {4, 5}. Par ailleurs, si E est un de ces trois ensembles, on a

    E(Z1E) = E(Y 1E).

    9

  • Donc, en notant zE la valeur de Z sur E, on a

    zE∑ω∈E

    pω =∑ω∈E

    pωY (ω),

    d’oùzE =

    1∑ω∈E pω

    ∑ω∈E

    pωY (ω).

    On en déduit z{1,2}, z{3}, z{4,5}.

    16. Conditionnement dans un exemple simple 2 Soit Ω un ensemble fini muni dela tribu F = P(Ω) et d’une loi P (telle que pour tout E ⊂ Ω, P (E) = 0⇒ E = ∅).

    a) Soit A = {A1, . . . , Ap} une partition de Ω, c’est à dire une partie de P(Ω) dont leséléments sont non vides, 2 à 2 disjoints et d’union Ω. Montrer que la tribu σ(A) engendréepar A (c’est à dire la plus petite tribu contenant A, c’est à dire l’intersection des tribuscontenant A) est

    σ(A) = {∪rj=1Aij ; 1 ≤ i1 < · · · < ir ≤ p}.

    b) Soit Y : Ω→ R. Montrer que

    E(Y |σ(A)) =p∑i=1

    yi1Ai ,

    avec yi =P

    ω∈AiP ({ω})Y (ω)P (Ai)

    pour tout i.c) Soit X : Ω → R prenant exactement p valeurs 2 à 2 distinctes x1, . . . , xp. Montrer

    queσ(X) = σ({X−1({x1}), . . . , X−1({xp})}).

    Solution : Les démonstrations sont des généralisations de celles de l’exercice 1.

    17. Questions basiques sur les filtrations 1. Une union de tribus est-elle toujoursune tribu ?

    2. Soit (Fn) une filtration (suite croissante de tribus) d’un ensemble Ω. ∪n∈INFn est-elletoujours une tribu ?

    3. Que dire d’une martingale (resp. d’une sous-martingale, d’une sur-martingale) parrapport à une filtration constante (i.e. telle que Fn = F0 pour tout n) ? Que dire d’untemps d’arrêt par rapport à une filtration constante ?

    Solution : 1. Non, si Ω = {1, 2, 3}, alors F = {∅,Ω, {1}, {2, 3}},G = {∅,Ω, {1, 2}, {3}}sont des tribus, mais pas F ∪G car {2} = {2, 3} ∩ {1, 2} /∈ F ∪G.

    2. Non, si l’on prend Ω = [0, 1[, et pour tout n, Fn = σ([(i−1)/2n, i/2n[ ; i = 1, · · · , 2n),alors ∪n∈INFn est l’ensemble des unions finies d’intervalles du type [(i− 1)/2n, i/2n[, avecn ≥ 0, i = 1, · · · , 2n. Cet ensemble n’est pas une tribu, sinon, il serait égal à la tribuqu’il engendre, et la tribu qu’il engendre est l’ensemble des boréliens de Ω, par densitédes nombres dyiadiques dans Ω.

    3. C’est une suite p.s. constante (resp. p.s. croissante, décroissante) d’éléments deL1 mesurables par rapport à cette tribu. Un temps d’arrêt par rapport à une filtrationconstante est une v.a. à valeurs dans ĪN mesurable par rapport à cette tribu.

    10

  • 18. Conditionnement et indépendance 1. Soient X et Y deux variables aléatoiresindépendantes de lois de Bernoulli de paramètres p, q ∈]0, 1[. On pose Z = 1{X+Y=0} etG = σ(Z). Calculer E(X | G) et E(Y | G).

    2. Ces deux variables aléatoires sont-elles indépendantes ?3. Soient Z, T des variables aléatoires définies sur un même espace de probabilité

    (Ω,A, P ) à valeurs dans des espaces mesurables quelconques (Ω′,A′), (Ω′′,A′′) telles quepour toute sous-tribu B de A, pour toutes fonctions numériques mesurables bornéesf, g définies respectivement sur (Ω′,A′), (Ω′′,A′′), E(f(Z)|B) et E(g(T )|B) sont indé-pendantes. Montrer que Z ou T est p.s. constante.

    Solution : 1. Les ensembles {Z = 0} et {Z = 1} forment une partition de Ω quiengendre G. Ainsi,

    E(X|G) = E (X|Z = 0)1{Z=0} + E (X|Z = 1)1{Z=1}.

    Sur {Z = 0}, X = 0 p.s et donc E(X|Z = 0) = 0. De plus,

    E (X|Z = 1) = P (X = 1)P (X + Y ≥ 1)

    =P (X = 1)

    1− P (X + Y = 0)=

    p

    1− (1− p)(1− q)=

    p

    p+ q − pq.

    Ainsi,E(X|G) = p

    p+ q − pq1{Z≥1}.

    Les rôles de X et Y étant symétriques,

    E(Y |G) = qp+ q − pq

    1{Z=≥1}.

    2. Les variables aléatoires E(X|G) et E(Y |G) sont donc proportionnelles p.s et nonconstantes, elles ne sont donc pas indépendantes.

    3. Supposons que ni Z, ni T ne soient p.s. constantes. Alors il existe les ensemblesmesurables A,B des espaces d’arrivée respectifs de Z, T tels que X := 1A(Z), Y := 1B(T )soient des v.a. de loi de Bernouilli de paramètres p, q ∈]0, 1[. X et Y sont indépendantes(par hypothèse en conditionnant avec la tribu A). Par ce qui précède, l’hypothèse est miseen défaut.

    19. Rappels : Martingales et sur-martingales.On se place sur une espace de probabilité (Ω,F ,P) muni de la filtration IF = (Fn)n≥0.1. Soit Y ∈ L1. On définit le processus X = (Xn)n≥0 par Xn = E(Y | Fn). Montrer

    que X est une IF -martingale.2. Soit (Xn) une sous-martingale et une fonction convexe croissante f : R 7→ R telle

    que pour tout n, f(Xn) ∈ L1. Montrer que (f(Xn))n≥0 est une sous-martingale pour IF .3. Soit (Xn) une sous-martingale et K ∈ R. Montrer que (Xn ∨K)n≥0 est une sous-

    martingale pour IF .

    11

  • 4. On suppose que Y ∈ L1 est FN−mesurable et on définit Z = (Zn)n≤N par ZN = Yet Zn = ξn∨EZn+1 | Fn pour n ≤ N − 1 où ξ = (ξn)n≥0 est IF−adapté et borné. Montrerque Z est une sur-martingale.

    5. Soit (Xn) une martingale et H = (Hn)n≥0 un processus IF -prévisible borné. Ondéfinit V = (Vn)n≥0 par Vn =

    ∑nk=1 Hk(Xk −Xk−1) pour n ≥ 0. Montrer que V est une

    martingale pour IF .6. Montrer qu’un processus prévisible intégrable est une martingale ssi il est p.s.

    constant.7. Soit (Xn) une martingale L2 et telle que Xn+1 − Xn est indépendant de Fn pour

    tout n ≥ 0. Montrer que W = (Wn)n≥0 défini par Wn = (Xn − EXn)2− Var(Xn) pourn ≥ 0 est une martingale.

    Solution : 1. C’est simplement une application de la transitivité de l’espérance condi-tionnelle : si B ⊂ A sont des tribus, alors pour tout X ∈ L1, E(X|B) = E(E(X|A)|B).

    2. On a, pour tout n,

    E(f(Xn+1)|Fn) ≥ f(E(Xn+1|Fn)) ≥ f(Xn)

    car f est convexe et croissante et (Xn) une sous-martingale.3. C’est une application de la question précédente pour f(x) = x ∧K.4. a) Zn est clairement adapté et on montre par récurrence décroissante que Zn, su-

    premum de deux fonctions intégrables, est intégrable.b) Pour tout n, Zn ≥ EZn+1 | Fn.5. Tout d’abord, comme somme de produit de v.a. Fn-mes, Vn est Fn-mes. Ensuite,

    Vn est clairement L1 car les Hk sont bornés et les Xk sont L1. Enfin,

    E(Vn+1|Fn) = Vn + E(Hn+1(Xn+1 −Xn)|Fn) = Vn +Hn+1E(Xn+1 −Xn|Fn) = Vn.

    6. Tout processus p.s. constant est une martingale et réciproquement, si H = (Hn)n≥0un processus IF -prévisible et une IF -martingale, on a pour tout n, p.s.

    Hn = E(Hn+1|Fn) = Hn+1.

    7. Posons Yn = Xn−EXn. Ce processus satisfait les mêmes hypothèses queXn en étanten plus centré, et l’exercice revient à montrer que Zn := Y 2n − E(Y 2n ) est une martingale.Notons que l’on a alors E(Yn+1Yn) = E(Y 2n ) (commencer par conditionner par Fn). Parailleurs, par indépendance, on a E((Yn+1 − Yn)2|Fn) = E((Yn+1 − Yn)2). Il en résulte, enécrivant

    Zn+1−Zn = Y 2n+1−Y 2n−E(Y 2n+1)+E(Y 2n ) = (Yn+1−Yn)2+2Yn+1Yn−2Y 2n−E(Y 2n+1)+E(Y 2n ),

    que l’on a E(Zn+1 − Zn|Fn) = 0.20. Une application du théorème d’arrêt.

    On considère une suiteXn =n∑i=1

    ξi, avec (ξi)i≥1 v.a.i.i.d. de loi 12(δ−1+δ1). On introduit

    la filtration Fn = σ(ξ1, . . . , ξn). Soit a < 0 < b entiers. On définit Ta,b = inf{n ≥ 1 ; Xn =a ou b}.

    12

  • 1. Que peut-on dire de (Xn) et de Ta,b ?2. Montrer que Ta,b est presque sûrement fini (on pourra considérer, pour p ∈ IN ,

    l’événement Ap = {ξp(b−a)+1 = · · · = ξp(b−a)+(b−a) = 1}).3. Donner la loi de XTa,b .Solution : 1. Les ξi étant indépendants et centrés, Xn est une martingale par rapport

    à la filtration Fn. Ta,b est un temps d’arrêt.2. Les événements Ap sont indépendants, de probabilité > 0, donc on est presque sûr

    que l’un d’entre eux se produira. Mais pour tout p, sur Ap, Ta,b ≤ p(b− a) + (b− a). DoncTa,b est presque sûrement fini.

    3. Appliquons le théorème d’arrêt : on sait que pour tout n ∈ IN , E(XTa,b∧n) =E(X0) = 0. Par convergence dominée, en faisant tendre n vers l’infini, par convergencedominée (car pour tout n, a ≤ XTa,b∧n ≤ b), on obtient, comme Ta,b est presque sûrementfini : E(XTa,b) = 0, soit

    aP (XTa,b = a) + bP (XTa,b = b) = 0,

    ce qui permet de conclure, avec

    P (XTa,b = a) + P (XTa,b = b) = 1.

    21. Martingales exponentielles.On reprend l’exercice précédent et on définit le processus Z = (Zn)n≥0 par Zn = eXn

    pour n ≥ 0.1. Montrer que Z est une sous-martingale pour IF .2. Trouver un processus IF -prévisible B = (Bn)n≥0 issu de 1 en 0 tel que U = (Un)n≥0

    défini par Un = BnZn pour chaque n ≥ 0 soit une martingale.3. Donner EZn pour tout n ≥ 0.Solution : 1. Il suffit de remarquer que exp est croissante et convexe.2. On a Xn+1 = Xn + �n, donc

    E(Zn+1|Fn) = ZnE(e�n+1|Fn) = Zn cosh(1)

    par indépendance. Donc Bn = cosh(1)−n convient.3. E(Un) est constante égale à un, donc E(Zn) = 1/Bn.

    22. Jeu de pile ou face et temps d’arrêts.On considère deux joueurs qui jouent à pile ou face. Le joueur 1 donne (resp. reçoit) 1

    euro si face apparaît (resp. si pile apparaît). Le jeu est répété plusieurs fois. On modélisele jeux comme suit. Soit X = (Xn)n≥1 une suite de variables aléatoires i.i.d. de loi deBernouilli B(1/2) définie sur un espace de probabilité (Ω,F ,P). L’évènement {Xn = 1}signifie que pile est apparu au n-eme tirage. On définit la suite Y = (Yn)n≥0 par Yn =∑n

    i=1(2Xi − 1) pour n ≥ 0. Le processus Y correspond à la richesse du joueur 1 aprèsles différents tirages. Après chaque tirage, les joueurs connaissent la valeur obtenue auxtirages précédents, leur information peut donc être modélisée par la filtration IF = (Fn)n≥0où Fn = σ(Xk, k ≤ n).

    1. Ecrire la dynamique de Y (i.e. la relation entre Yn+1 et Yn) et montrer que c’est unemartingale pour IF .

    13

  • 2. Le joueur 1 décide d’arrêter de jouer si il a déjà gagné 100 euros où si le nombrede tirages atteint N ∈ IN∗ et le joueur 2 est disposé à continuer à jouer jusqu’à ce que lejoueur 1 s’arrête : le jeux s’arrête au temps τ := inf{n ≥ 0 : Yn = 100} ∧ N . Montrerque τ est un IF -temps d’arrêt, i.e. que {τ ≤ n} ∈ Fn pour tout n ≥ 0.

    3. Quelle est, avec cette stratégie, l’espérance de gain du joueur 1 ?4. Y a-t-il une stratégie qui donne au joueur 1 une espérance un gain strictement

    positive en un temps borné ? Autrement dit, existe-t-il une v.a. σ à valeur dans IN ,bornée, telle que pour tout n, {σ = n} ∈ Fn et telle que E(Yσ) > 0 ?

    5. Soit M ∈ IN∗ et κ = inf{n ≥ 0|Yn = M}. κ est-elle bornée p.s. ?Solution : 1. Les v.a. X ′i := 2Xi−1 sont indépendantes et centrées, la tribu engendrée

    par X ′1, . . . , X ′n est Fn, donc Yn est une IF -martingale.2. Pour tout n, {τ ≤ n} = Ω ∈ Fn si n ≥ N et {τ ≤ n} = {Y1 ≥ 100} ∪ · · · ∪ {Yn ≥

    100} ∈ Fn.3. L’espérance de gain du joueur 1 si le jeu s’arrête en τ est E(Yτ ). Or on sait (théorème

    d’arrêt) que (Zn := Yn∧τ )n est une martingale. De plus, τ = τ ∧N . Donc

    E(Yτ ) = E(ZN) = E(Z0) = 0.

    4. Une telle v.a. σ est un temps d’arrêt, donc (Hn := Yn∧σ)n est une martingale, et siK entier est tel que σ ≤ K p.s., alors, Yσ = HK p.s., donc E(Yσ) = E(HK) = E(H0) = 0.Donc il n’existe pas de telle stratégie.

    5. Par la question précédente, la réponse est non.

    23. Doubling strategies. On considère un jeu répété avec tirages indépendants et mêmeprobabilité de succès que d’échec à chaque tirage. A chaque coup, on mise un montant x,que l’on remporte si on gagne et que l’on paye si on perd. Un joueur, partant de fortuneinitiale nulle, suit la stratégie suivante. Il joue 1 au premier tour et si sa dette est deD au n−ème tirage, il mise un montant 2D au tirage suivant (somme qu’il finance paremprunt) et s’arrête de jouer la première fois qu’il gagne. On suppose que les empruntssont sans intérêt. On pourra faire comme si les tirages continuent après que le joueur aiearrêté de jouer, mais sa fortune n’évolue plus.

    1. Modéliser le jeu en introduisant un espace de probabilité muni d’une filtrationadéquate. Donner l’espérance de la fortune du joueur après le n-ème tirage.

    2. Montrer que le joueur gagne en un nombre de coups fini avec probabilité 1. Cenombre est-il presque sûrement borné ?

    Solution : 1. Introduisons une suite (Xi) de vaiid valant ±1 avec probas 1/2, 1/2représentant les tirages successifs (1 = succès, −1 = échec). Soit τ = min{i/Xi = 1}.Alors la fortune du joueur au temps n est (Zn∧τ ), où Z0 = 0, Z1 = X1 et pour tout n ≥ 1,

    Zn+1 =

    {3Zn si Xn+1 = −1,−Zn sinon.

    Il faut donc calculer E(Zn∧τ ). Pour ce faire, on va montrer que (Zn) est une martingalepar rapport à la filtration Fn := σ(X1, . . . , Xn). Le processus est clairement a dapté,|Zn| ≤ 3n donc on a intégrabilité, et l’égalité de martingale peut se monter en écrivant

    ∀n ≥ 1, Zn+1 = Zn(1− 2Xn+1)

    14

  • ou∀n ≥ 1, Zn+1 = h(Zn, Xn+1)

    avec h(z, x) = 3z si x < 0 et −z si x ≥ 0.On en déduit, comme τ est un temps d’arrêt, que E(Zn∧τ ) = E(Z0) = 0.2. La probabilité que le joueur perde aux coups 1, 2, . . . , n vaut 2−n. Ces événement

    sont imbriques les uns dans les autres, donc la probabilité que le joueur perde tout letemps est la limite de cette probabilité, soit 0. Ainsi, le joueur gagne en un nombre decoups fini (égal à τ) avec probabilité 1. τ n’est pas presque sûrement borné : sinon, onaurait E(Zτ ) = E(Z0) = 0, ce qui est absurde car Zτ > 0. On peut aussi dire que pourtout n, la proba que τ soit supérieur à n est 2−n > 0.

    24. Une réciproque du théorème d’arrêt. Soit (Xn)n≥0 un processus sur un espacede probabilité filtré (Ω,F , (Fn)n≥0,P) intégrable et adapté. Montrer que, si l’on a E(Xτ ) =E(X0) pour tout temps d’arrêt borné τ , alors (Xn)n≥0 est une martingale.

    Solution :On remarque que E(Xn) = E(X0) pour tout n ≥ 0. De plus, pour n ≥ 0, et A un

    ensemble Fn-mesurable, on considère

    τ = n1A + (n+ 1)1Ac .

    Pour tout 0 ≤ k ≤ n−1, {τ ≤ k} = ∅ ; {τ ≤ n} = A ; et pour tout k ≥ n+1, {τ ≤ k} = Ω.Donc, τ est un temps d’arrêt et il est borné. Donc

    E(Xτ ) = E(Xn1A) + E(Xn+11Ac) = E(Xn+1)

    ce qui implique que E(Xn1A) = E(Xn+11A). Cette égalité étant vérifiée pour tous lesensembles Fn-mesurables, on a E(Xn+1|Fn) = Xn.25. Chaîne de Markov inhomogène à valeurs réelles (1). On considère un processusstochastique défini par

    X0 = x0 ∈ R, Xn+1 = Xn(1 + Fαn+ 1Yn),

    où α ∈ R et les Yn sont des vaiid de loi N (0, 1) (i.e. de densité 1√2πe−Ft22 sur R).

    a) Déterminer le noyau de cette chaîne de Markov inhomogène.b) Soit f : R→ R+ mesurable. Exprimer sous la forme d’intégrales E[f(Xn+1)|σ(X1, . . . , Xn)]

    et E[f(Xn+1)|σ(Xn)].Solution : a) Soit A ∈ B(R) et x ∈ R. Si x = 0, Pn(x,A) = 1A(0). Sinon,

    Pn(x,A) = P{x(1 + Fαn+ 1Yn) ∈ A} = N (x,Fx2α2(n+ 1)2)(A).

    Donc

    Pn(x, ·) = N (x,Fx2α2(n+ 1)2) =1√2πFn+ 1|x|αe−F(n+1)22x2α2(t−x)2dt.

    b) On a

    E[f(Xn+1)|σ(X1, . . . , Xn)] = E[f(Xn+1)|σ(Xn)] =∫

    Rf(t)

    1√2πFn+ 1|Xn|αe−F(n+1)

    22X2nα2(t−x)2dt.

    15

  • 26. Chaîne de Markov inhomogène à valeurs réelles (2). On considère un processusstochastique défini par

    X0 = x0 ∈ R+, Xn+1 = (Xn + F1n+ 1− v + Yn)+,

    où v ∈ R et les Yn sont des vaiid de loi exponentielle de paramètre 1 (i.e. de densité e−tsur R+).

    a) Déterminer le noyau de cette chaîne de Markov inhomogène.b) Calculer E[Xn+1|σ(Xn)] et E[eXn+1/2|σ(Xn)].Solution : a) Tout d’abord, la chaîne est à valeurs dans R+. Soit f : R → R+

    mesurable. On a, pour tout x ≥ 0,

    Pnf(x) =

    ∫ +∞t=0

    f((x+ F1n+ 1− v + t)+)e−tdt.

    b) On applique la formule précédente avec f(t) = t puis f(t) = et/2. Posons a =(v −Xn − 1n+1)

    +.

    E[Xn+1|σ(Xn)] =∫ +∞t=0

    (Xn + F1n+ 1− v + t)+e−tdt =∫ +∞t=a

    (t− a)e−tdt,

    et on conclut avec une intégration par parties.

    E[eXn+1/2|σ(Xn)] =∫ +∞t=0

    e(Xn+F1n+1−v+t)+/2e−tdt =

    ∫ at=0

    e−tdt+

    ∫ +∞t=a

    e(t−a)/2e−tdt,

    et on conclut avec une intégration par parties.

    27. Programmation dynamique : course au trésor avec aléa. Un navigateurpart du port O, atteint ensuite un des deux ports A,B, puis atteint un des trois portsC,D,E. Il obtient un prix (indiqué en négatif sur la figure). Mettre le cap vers une certainedestination a un coût, indiqué sur la figure. Partant de chacune des trois villes O,A,B, ilpeut choisir un cap (vers A ou B en partant de O, vers C ou D en partant de A et versD ou E en partant de B).

    C − 20

    A

    1���

    AA����

    4

  • b) On suppose que choisir un cap lui donne 75% de chances d’arriver à la destinationchoisie, et 25% de chances d’arriver à l’autre destination atteignable (qui est B s’il est enO et a choisi d’aller vers A, A s’il est en O et a choisi d’aller vers B, D s’il est en A et achois d’aller vers C, etc. . . ). Déterminer la stratégie optimale.

    c) On change le coup du passage B → D, qui coûte maintenant 24. Reprendre lesdeux premières questions.

    Solution : a) On a 4 trajets possibles : OAC, OAD, OBD et OBE. Celui qui rapportele plus est le dernier.

    b) On définit E = {0, A,B,C,D,E}, E = P(E), C = {h, b} et le modèle markoviencontrôlé P (u)n (x, y) par, pour tout n, pour tout u ∈ C,

    (P (u)n (0, A), P(u)n (0, B)) =

    {(0.75, 0.25) si u = h,(0.25, 0.75) si u = b,

    (P (u)n (A,C), P(u)n (A,D)) =

    {(0.75, 0.25) si u = h,(0.25, 0.75) si u = b,

    (P (u)n (B,C), P(u)n (B,D)) =

    {(0.75, 0.25) si u = h,(0.25, 0.75) si u = b,

    etP (u)n (C,C) = P

    (u)n (D,D) = P

    (u)n (E,E) = 1.

    On a alors

    c0(O, h) = 2, c0(O, b) = 5, c1(A, h) = 1, c1(A, b) = 4, c1(B, h) = 3, c1(B, b) = 4.

    On pose N = 2 et la fonction J du théorème de programmation dynamique est alors

    J2(C) = −20, J2(D) = −22, J2(E) = −26,

    J1(A) = min{1−(0.75 ·20+0.25 ·24), 4−(0.25 ·20+0.75 ·24)} = −20, atteint pour u = h,(autrement dit, en A, il vaut mieux essayer de monter), J1(B) = −23, atteint pour u = b(autrement dit, en B, il vaut mieux essayer de descendre) et J0(O) = min{2− (0.75 · 20 +0.25 · 23), 5− (0.25 · 20 + 0.75 · 23)} = −19.75, atteint pour u = h (autrement dit, en O,il vaut mieux essayer de monter).

    La stratégie optimale est donc : en O, d’essayer d’aller vers A, en A, d’essayer d’allervers C et en B, d’essayer d’aller vers E. L’espérance de gain, partant de O, est alors 19.75.

    c) Reprendre les calculs du b) avec cette nouvelle donnée. Le résultat est différent.

    28. Programmation dynamique : plus court chemin de A à B, sans aléa. Onconsidère des villes A,B, . . . , G. Certaines sont reliables directement par la route, d’autresnon. Les longueurs des trajets directs entre deux villes, quand ils existent, sont

    AB = 15, AC = 5, AD = 3, AG = 14

    BE = 5, BF = 7, BG = 6

    CD = 11, CE = 3, CF = 2

    DG = 6, DE = 7, EG = 7.

    Déterminer le plus court chemin de A à B.

    17

  • Solution : On définit E = {A,B,C,D,E, F,G}, E = P(E), C = E et le modèlemarkovien contrôlé P (u)n (X, Y ) = 1u=Y (autrement dit, le choix d’une stratégie, lorsquel’on est en une ville x, est le choix d’une ville où se rendre, sans aléa. La fonction γ, ici, estnulle, et le coût d’une stratégie est simplement la longueur du trajet direct reliant la villeoù l’on se trouve à la ville où l’on va, qui est bien entendu +∞ s’il n’existe pas de trajetdirect relient ces deux villes. On a donc, pour tous X, Y ∈ E, pour tout k, ck(X, Y ) = XY(qui vaut +∞ si XY ne figure pas dans la liste ci-dessus.

    La valeur de N sera précisée plus tard, comme bien souvent dans ce genre de problé-matiques.

    On a JN(B) = 0 et JN(X) = +∞ pou X 6= B. JN−1(B) = 0, JN−1(A) = 15,JN−1(E) = 5, JN−1(F ) = 7, JN−1(G) = 6 et JN−1(X) = +∞ pour les autres X.

    JN−2(A) = min{15 + 0, 14 + 6} = 15 atteint pour le trajet ABB. JN−2(B) = 0,JN−2(C) = min{5 + 15, 5 + 3, 2 + 7} = 8 atteint pour le trajet CEB. JN−2(D) = min{3 +15, 7 + 5, 7 + 6} = 12 atteint pour le trajet DEB. JN−2(E) = min{5 + 0, 7 + 6} = 5atteint pour le trajet EBB. JN−2(F ) = min{7 + 0} = 7 atteint pour le trajet FBB.JN−2(G) = min{6 + 0, 7 + 5, 14 + 15} = 6 atteint pour le trajet GBB.

    JN3(A) = min{0 + 15, 5 + 8, 3 + 12, 6 + 14} = 13, atteint pour le trajet ACEB.On continue, et on s’aperçoit que ACEB est optimal.La façon la plus simple de traiter le problème est :• Poser Q0(B) = 0 et Q0(X) = +∞ pour tout X 6= B,• Qn+1(X) = minY {XY +Qn(Y )}, Yn = le Y pour lequel c’est atteint,et d’aller jusqu’à n = 7.

    29. Un jeu favorable. Soit 0.5 < p < 1. Un joueur fait N parties (numérotées de0 à N − 1) indépendantes où la probabilité de succès est p et la probabilité d’échec estq = 1−p. Sa fortune initiale de x0 > 0 Euros. Pour tout n ∈ {0, . . . , N−1}, à l’étape n, ilmet sur le tapis une fraction Un de sa fortune (jamais plus que ce qu’il possède) : s’il gagne,il récupère ce qu’il a misé, plus autant d’argent. S’il perd, il perd sa mise. Déterminer lastratégie lui permettant d’optimiser le logarithme de sa fortune finale. Est-ce équivalentau fait d’optimiser sa fortune finale ?

    Solution : Posons Xn sa fortune avant la partie n. On a

    X0 = x0 et Xn+1 = Xn(1 + εnUn),

    où ε = 1 ou −1 selon que la partie n soit gagnée ou perdue. On a donc un modèlemarkovien contrôlé classique, d’espace d’états E = R+, d’espace des contrôles C = [0, 1]et de noyau

    P (u)n (x, ·) = pδx(1+u) + qδx(1−u)(pour tout a, δa désigne la masse de Dirac en a). Les coûts des contrôles sont nuls, onutilise donc l’algorithme de Bellman (contrôle optimal) pour γ(x) = ln(x) et ck(x, u) = 0(on cherche à maximiser plutôt qu’à minimiser, ce qui revient au même).

    On a donc JN(x) = ln(x) et

    Jn(x) = supu∈[0,1]

    pJn+1(x(1 + u)) + qJn+1(x(1− u)).

    18

  • On obtient JN−1(x) = ln(x) +C, avec C = ln(2ppqq), atteint pour uN−1(x) = p− q, puis,par récurrence sur k, JN−k(x) = ln(x) + kC, atteint pour uN−k(x) = p − q. La stratégiest donc optimale pour Un = p− q pour tout n et donne J0(x0) = ln(x0) +NC.

    Bien que ln soit strictement croissante, optimiser la moyenne du log d’un gain aléatoireet la moyenne du gain n’est pas équivalent à priori, car les poids donnés aux valeursextrêmes ne sont pas les mêmes dans les deux approches. Dans le deuxième, on a intérêtà choisir Un = 1 pour tout n.

    30. Un jeu défavorable. Soit 0.25 ≤ p < 0.5. Un joueur fait N parties (numérotées de0 à N − 1) indépendantes où la probabilité de succès est p et la probabilité d’échec estq = 1−p. Sa fortune initiale de x0 > 0 Euros. Pour tout n ∈ {0, . . . , N−1}, à l’étape n, ilmet sur le tapis une fraction Un de sa fortune (jamais plus que ce qu’il possède) : s’il gagne,il récupère ce qu’il a misé, plus autant d’argent. S’il perd, il perd sa mise. Déterminer lastratégie lui permettant d’optimiser le logarithme de sa fortune finale. Est-ce équivalentau fait d’optimiser sa fortune finale ?

    Solution : Posons Xn sa fortune avant la partie n. On a

    X0 = x0 et Xn+1 = Xn(1 + εnUn),

    où ε = 1 ou −1 selon que la partie n soit gagnée ou perdue. On a donc un modèlemarkovien contrôlé classique, d’espace d’états E = R+, d’espace des contrôles C = [0, 1]et de noyau

    P (u)n (x, ·) = pδx(1+u) + qδx(1−u)(pour tout a, δa désigne la masse de Dirac en a). Les coûts des contrôles sont nuls, onutilise donc l’algorithme de Bellman (contrôle optimal) pour γ(x) = x2 et ck(x, u) = 0(on cherche à maximiser plutôt qu’à minimiser, ce qui revient au même).

    On a donc JN(x) = x2 et

    Jn(x) = supu∈[0,1]

    pJn+1(x(1 + u)) + qJn+1(x(1− u)).

    On obtient JN−1(x) = 4px2, atteint pour uN−1(x) = 1, puis, par récurrence sur k,JN−k(x) = (4p)

    kx2, atteint pour uN−k(x) = 1. La stratégie st donc optimale pour Un = 1pour tout n (on mise tout à chaque fois) et donne J0(x0) = (4p)Nx20.

    On remarque que si l’on joue tout, on perd tout dès la première fois que l’on perd. Ona donc

    E(X0) = 2Nx0P{on a gagné ttes nos parties} = (2p)Nx0 < x0,cette stratégie n’est donc pas optimale.

    En refaisant les calculs, on retrouve, si l’on cherche à optimiser E(X0), qu’il vaut mieuxne rien miser dès le début.

    31. Révision d’une machine. Une machine peut se trouver dans 5 états E = {0, . . . , 4}.Son évolution spontanée, de jour en jour, est markovienne de matrice de transition

    P =

    p0 p0 p0 p0 p00 p1 p1 p1 p10 0 p2 p2 p20 0 0 p3 p30 0 0 0 p4

    19

  • avec pi = 15−i for chaque i. Le coût journalier d’utilisation de la machine est de α(i) sila machine est dans l’état i et la remise à l’état 0, qui peut se faire au début de chaquejournée, coûte R.

    Poser les équations définissant la stratégie optimale.Solution : L’espace des contrôles est C = {c, r} et les matrices de transition associées

    à ces contrôles sontP (c) = P, P (r)(i, j) = 1j=0.

    Les coûts sont donnés par c(i, c) = α(i) et c(i, r) = R + α(0). Le coût final γ est nul.

    32. Horticulture. Un horticulteur cultive des plantes. Le nombre de pieds dont il disposeau début de l’année n est noté Xn. Durant l’année n, chaque pied donne naissance à unautre pied. A la fin de l’été, il choisit d’en garder une proportion Un ∈ [0, 1] des piedsnouveaux de l’année et vend les autres pieds nouveaux au prix unitaire de 1 Euro. Parmiles pieds qu’il choisit de garder, seule une proportion aléatoire Yn ∈ [0, 1] survit durantl’automne.

    Les plantes ayant survécu à l’automne de l’année où elles sont nées ne meurent pasavant l’année N , où il choisit de toutes les vendre au prix unitaire de 1 Euro.

    On suppose que X0 = x0 > 0 et que les Yn sont des vaiid de loi µ.a) Exprimer Xn+1 en fonction des données de l’année n.b) Définir le modèle markovien contrôlé sous-jacent.c) Donner la fonction JN et écrire les équations de programmation dynamique reliant

    Jn et Jn+1.d) Montrer qu’il existe des réels α0, . . . , αN tels que pour tout n, Jn(x) = αnx. Montrer

    que pour tout n, αn > αn+1 et αn ≥ 1 +N − n. On posera m = E[Y1].e) On suppose m < 1. Montrer qu’il existe K ∈ {0, N − 1} tel que le contrôle optimal

    est donné par un = 1 pour n < K et un = 0 pour n ≥ K.f) Comment interprète-t-on ce résultat ?Solution : a) Xn+1 = Xn + UnYuXn.b) L’espace des phases E est ]0,+∞[, l’espace des contrôles est C = [0, 1], et pour

    tout u ∈ C,

    ∀x > 0, P (u)(x,A) = µ({y ∈ [0, 1] ; x(1 + uy) ∈ A}) =

    {µ( 1

    ux· A− x) si u 6= 0,

    δx(A) si u = 0.

    Les gains sont donnés par γ(x) = x et cn(x, u) = (1− u)x.c) JN(x) = x et pour tout n,

    Jn(x) = maxu∈[0,1]

    {x(1− u) + E[Jn+1(x(1 + uY1))]}.

    20

  • d) Récurrence descendante : αN = 1 et, si le résultat est acquis au rang n+ 1, on a

    Jn(x) = maxu∈[0,1]

    {x(1− u) + E[Jn+1(x(1 + uY1))]}

    = maxu∈[0,1]

    {x(1− u) + E[αn+1x(1 + uY1)]}

    = maxu∈[0,1]

    {x(1 + αn+1) + xu(αn+1m− 1)}

    = x(1 + αn+1 + maxu∈[0,1]

    {u(αn+1m− 1)}︸ ︷︷ ︸≥0

    ),

    d’où le résultat demandé.e) Pour tout n, un est définit par

    maxu∈[0,1]

    {u(αn+1m− 1)} = un(αn+1m− 1),

    donc

    un =

    1 si αn+1m > 10 si αn+1m < 1ce qu’on veut si αn+1m = 1

    On conclut en posant

    K = min{n ≥ 0 ; αn+1m < 1}

    et en utilisant le faut que (αn) est décroissante (on a bien K ≤ N − 1 car m < 1).f) La stratégie optimale consiste à arriver à un certain niveau de stock, garantissant

    une certaine production annuelle, et, au delà de ce stock, pour éviter les pertes dues à lamort de certains pieds durant l’automne, à vendre toute les "jeunes pousses".

    33. Arbitrage épargne/consomation. On dispose, au début de l’année n (n ∈{0, . . . , N}), d’un capital de Xn, dont on choisi de dépenser une proportion Un ∈ [0, 1].On épargne le reste (1 − Un)Xn du capital qui, par le biais d’un rendement aléatoire, sefructifie de façon à devenir Rn(1 − Un)Xn à la fin de l’année n, avec Rn ≥ 0 (mais pasforcément ≥ 1). On suppose les Rn vaiid de loi µ et on note m = E[R1]. A la N -èmeannée, on dépense ce qu’il nous reste.

    On cherche à optimiser la somme dépensée.a) Définir le modèle markovien contrôlé sous-jacent.b) Donner la fonction JN et écrire les équations de programmation dynamique reliant

    Jn et Jn+1.c) Selon la valeur dem, calculer JN−1(x), puis Jn pour n ≤ N−1 et donner la stratégie

    optimale.d) Comment interprète-t-on ce résultat ?Solution : a) On a Xn+1 = Rn(1−Un)Xn. L’espace des phases E est [0,+∞[, l’espace

    des contrôles est C = [0, 1], et pour tout u ∈ C,

    ∀x > 0, P (u)(x,A) = µ({y ≥ 0 ; y(1− u)x ∈ A}) =

    {µ( 1

    (1−u)x · A) si u 6= 1,δ0(A) si u = 1.

    21

  • Les gains sont donnés par γ(x) = x et cn(x, u) = ux.b) JN(x) = x et pour tout n,

    Jn(x) = maxu∈[0,1]

    {ux+ E[Jn+1(x(1− u)R1)]}.

    c) On aJN−1 = xm+ max

    u∈[0,1]ux(1−m).

    Donc si m > 1, JN−1(x) = mx et par récurrence descendante, on montre que pour toutn,

    Jn(x) = xmN−n

    et que la stratégie optimale est donnée par un = 0 pour tout n.Si m < 1, JN−1(x) = x et par récurrence descendante, on montre que pour tout n,

    Jn(x) = x

    et que la stratégie optimale est donnée par un = 1 pour tout n.Si m = 1, JN−1(x) = x et par récurrence descendante, on montre que pour tout n,

    Jn(x) = x

    et que la stratégie optimale est donnée par un ∈ [0, 1] pour tout n.d) selon le rendement, on a intérêt : soit à tout dépenser tout de suite (si m < 1), soit

    à tout épargner (si m > 1). Le cas m = 1 est intermédiaire.

    34. Contrôle optimal classique. On considère on considère une marche aléatoire réelle(Xn) de valeur initiale x0 ∈ R et de sauts ε1, ε2, . . . de valeur ±1 avec probabilités 1/2. Onse donne g > 0, N ≥ 1 et on cherche à minimiser, en moyenne, gX2N . On a la possibilitéde ramener, à chaque étape, la marche au point où l’on veut, avec un contrôle Un de coûtU2n.

    Autrement dit, on considère le système

    Xn+1 = Xn + Un + εn,

    avec X0 = x0, Un mesurable par rapport à σ(X0, . . . , Xn) pour tout n, et (εn)n≥0 vaiid deloi (δ1 + δ−1)/2 et on cherche à minimiser

    E{N−1∑k=0

    U2k + gX2N}.

    a) Question préliminaire. Soit a > 0, b ∈ R. Définissons la fonction f(t) = at2 + b.Pour x ∈ R, montrer que

    minu∈R{u2 + Ff(x+ u+ 1) + f(x+ u− 1)2}

    est atteint en u∗ = F−ax1 + a et vaut a+ Fax21 + a+ b.b) Définir le modèle markovien contrôlé sous-jacent à notre problème.

    22

  • c) Donner la fonction JN et écrire les équations de programmation dynamique reliantJn et Jn+1.

    d) Calculer JN−1(x), puis Jn pour n ≤ N − 1 et donner la stratégie optimale.Solution : a) Provient d’un simple tableau de variations.b) L’espace des phases E est R, l’espace des contrôles est C = R, et pour tout u ∈ C,

    ∀u, x ∈ R, P (u)(x,A) = F1x+u+1∈A + 1x+u−1∈A2.

    Les coûts sont donnés par γ(x) = x2 et cn(x, u) = u2.c) JN(x) = gx2 et pour tout n,

    Jn(x) = minu∈R{u2 + FJn+1(x+ u+ 1) + Jn+1(x+ u− 1)2}.

    d) On a

    JN−1(x) = minu∈R{u2 + FJN(x+ u+ 1) + JN(x+ u− 1)2}

    = g + Fgx21 + g,

    atteint pour u∗N−1 = F−gx1 + g. On définit donc aN = g, bN = 0 et, pour tout n,

    an = Fan+1an+1 + 1, bn = an+1 + bn+1.

    On a alors immédiatement, par récurrence descendante,

    Jn(x) = anx2 + bn,

    atteint pour u∗n = F−an+1x1 + an+1.35. Arbitrage épargne/consommation (2). On considère donc le modèle markoviencontrôlé suivant :

    X0 = x0 > 0, Xn+1 = Xn + YnXn(1− Un),

    où Un ∈ [0, 1]. Les (Yn) forment une suite de vaiid > 0 d’espérance finie θ. Le processus(Xn) représente l’évolution, au cours du temps, d’une certaine fortune, et UnXn représentela somme dépensée à l’instant n.

    On cherche à optimiser la somme dépensée : on désire donc maximiser

    E(N−1∑k=0

    XnUn).

    a) Définir le modèle markovien contrôlé sous-jacent.b) Donner la fonction JN et écrire les équations de programmation dynamique reliant

    Jn et Jn+1.c) Montrer qu’il existe des réels ρN , . . . , ρ0 tels que pour tout n = N, . . . , 0, pour tout

    x ≥ 0,Jn(x) = ρnx.

    23

  • Donner la relation de récurrence satisfaite par les ρn ainsi que les valeurs des contrôlesoptimaux.

    d) Montrer qu’il existe une unique K ∈ {0, . . . , N} tel que les contrôles optimaux sontdonnés par pour tout n < K,

    Un = 0 si n < K et Un = 1 si n ≥ K.

    Interpréter.Solution : a) L’espace des phases est E = R+∗, l’espace des contrôles est C = [0, 1] le

    noyau de transition associé à tout contrôle u ∈ [0, 1] est donné, pour f borelienne bornéesur R et x ∈ R,

    P (n)f(x) = E[f(x(1 + (1− u)Yn))].

    Les gains sont ck(x, u) = xu et γ = 0.b) JN(x) = 0 et

    Jn(x) = maxu∈[0,1]

    {xu+ E[Jn+1(x(1 + (1− u)Yn))]}.

    c) Tout d’abord, ρN = 0 convient. On a JN−1(x) = maxu∈[0,1]{xu} = x = ρN−1x, pourρN−1 = 1, le contrôle optimal étant uN−1 = 1. Continuons au rang suivant. On a

    JN−2(x) = maxu∈[0,1]

    {xu+ E[ρN−1x(1 + (1− u)YN−2)]}

    = maxu∈[0,1]

    {xu+ x[1 + (1− u)θ]}

    = x maxu∈[0,1]

    {u+ 1 + (1− u)θ}

    = xmax{1 + θ, 2}.

    Donc ρN−2 = max{1 + θ, 2} convient.Passons à la démonstration générale, et supposons le résultat acquis au rang n + 1.

    On a alors

    Jn(x) = maxu∈[0,1]

    {xu+ E[ρn+1x(1 + (1− u)Yn)]}

    = maxu∈[0,1]

    {xu+ ρn+1x[1 + (1− u)θ]}

    = x(ρn+1 + maxu∈[0,1]

    {u+ ρn+1(1− u)θ})

    = x(ρn+1 + max{θρn+1, 1}).

    De plus, le maximum est atteint pour

    u∗n =

    {0 si max{θρn+1, 1} = θρn+1,1 si max{θρn+1, 1} = 1.

    d) Comme pour tout n, ρn ≥ ρn+1 + 1, la suite ρ décroît, et pour

    K = min{n ∈ {0, . . . , N − 1} ; θρn+1 ≤ 1}

    24

  • convient. La stratégie optimale est donc d’investir la totalité de son capital les premièresannées afin de construire son capital, et, passé un certain seuil, de consommer la totalitéde ses apports.

    36. Arrêt optimal dans une suite de prix indépendants. Un gestionnaire doit faireun achat entre la date 0 et la date N . Le produit à acheter a un prix très fluctuant : sonprix à la date n ∈ {0, . . . , N} est donné par la v.a. Xn, où X0 = x0 > 0 est déterministeet (X1, . . . , XN) sont des vaiid > 0 de loi µ d’espérance m < ∞. On note F la fonctionde répartition de la loi µ : F (x) = µ([0, x]) pour tout x ≥ 0. On cherche à minimiser lecoût de l’achat.

    a) Donner le noyau de la chaîne de Markov (Xn) et donner une formulation mathé-matique à ce problème de minimisation.

    b) Donner la fonction JN et écrire les équations de programmation dynamique reliantJn et Jn+1.

    c) Calculer JN−1 et JN−2. Essayer de formuler une hypothèse sur la forme de Jn pourn quelconque.

    d) Donner une relation de récurrence descendante pour la suite αn :=∫Jn(t)dµ(t).

    e) En dédire la formule de Jn et la stratégie optimale.f) Donner le sens de variation de la suite (αn)n∈{0,...,N} et interpréter.Solution : a) L’espace des phases est R+ et le noyau est donné par Pf(x) =

    ∫f(t)dµ(t).

    En notant F la filtration naturelle de (Xn), on cherche le minimum, sur les F -temps d’ar-rêt τ à valeurs dans {0, . . . , N}, de

    E[Xτ ].b) On a JN(x) = x et

    Jn(x) = min{x,∫Jn+1(t)dµ(t)}.

    c) On a doncJN−1(x) = min{x,m}

    et

    JN−2(x) = min{x,∫

    min{t,m}dµ(t)}

    = min{x,∫

    [0,m]

    tdµ(t) +m

    ∫]m,+∞[

    dµ(t)}

    = min{x, γ}

    pour γ =∫

    [0,m]tdµ(t) +m(1− F (m)).

    d) On a αN = m, αN−1 =∫

    [0,m]tdµ(t) +m(1− F (m)) et on montre facilement que

    αn =

    ∫[0,αn+1]

    tdµ(t) + αn+1(1− F (αn+1)).

    e) On a donc Jn(x) = min{x, αn+1} et on achète dès que le minimum est x : le tempsd’arrêt optimal est donné par

    τ := min{k ∈ {0, . . . , N} ; Xk ≤ αk+1},

    25

  • avec αN+1 = +∞.f) Pour tout n,

    αn ≤∫

    [0,αn+1]

    αn+1dµ(t) + αn+1(1− F (αn+1)) = αn+1,

    donc la suite est croissante. Cela signifie que le seuil de prix en deçà duquel on choisid’acheter à la date n est de plus en plus élevé : au début, il nous reste beaucoup de temps,donc on peut se montrer exigeant, mais au fur et à mesure que le temps passe, il fautaccepter des prix plus élevés.

    37. Arrêt optimal. Un problème de parking. Une grande avenue à sens uniquese termine par un parking. Une voiture s’engage dans cette avenue afin de s’y garer, lechauffeur souhaitant aller à un concert qui a lieu au dessus du parking. Il peut soit segarer dans une des places au bord de l’avenue, qui sont numérotées en ordre croissant den = 0 à n = N − 1, soit aller dans le parking. Chaque place de l’avenue est libre avecune probabilité p, indépendamment des autres. On pose, pour n < N , Xn = 1 si la placen est libre, 0 sinon. On pose XN = 1. Le fait de se garer à la place n coûte N − n, quireprésente l’effort pour marcher jusqu’au lieu du concert. Le coût du parking situé au boutde l’avenue est de A > 1. On cherche la meilleure façon de se garer lorsque le chauffeurne voit que les places situées à sa hauteur (il ne voit pas les places situées entre lui et leparking).

    a) Donner le noyau de la chaîne de Markov (Xn) et donner une formulation mathé-matique à ce problème de minimisation.

    b) Donner la fonction JN et écrire les équations de programmation dynamique reliantJn et Jn+1.

    c) On pose q = 1− p. Soit n0 ∈ {1, . . . , N − 1} tel que

    N − n0 > pJn0+1(1) + qJn0+1(0).

    Montrer alors que :(i) Jn0(0) = Jn0(1) = pJn0+1(1) + qJn0+1(0) et la stratégie optimale, en n0, est de ne

    pas se garer,(ii) pour tout n ≤ n0, N − n > pJn+1(1) + qJn+1(0), Jn(0) = Jn(1) = pJn0+1(1) +qJn0+1(0) et la stratégie optimale, en n, est de ne pas se garer.

    d) Donner alors la forme de la stratégie optimale. On pourra introduire

    n∗ = min{n ∈ {0, . . . , N − 1} ; N − n ≤ pJn+1(1) + qJn+1(0)} ∪ {N}.

    Solution : a) Pour tout f : {0, 1} → R, Pf(x) = pf(1) + qf(0) (q = 1 − p). Onpose, pour n < N , ϕn(1) = N − n et ϕn(0) = +∞. On pose aussi ϕN(1) = ϕN(0) = A.On cherche à déterminer le minimum de E[ϕτ (Xτ )], où τ varie dans l’ensemble des tempsd’arrêt ≤ N .

    b) On a JN = A et, pour tout n > N , Jn(x) = min{ϕn(x), pJn+1(1) + qJn+1(0)}.c) (i) est évident par hypothèse :

    Jn0(0) = min{+∞, pJn0+1(1) + qJn+1(0)} = pJn0+1(1) + qJn0+1(0)

    26

  • etJn0(1) = min{N − n0, pJn0+1(1) + qJn+1(0)} = pJn0+1(1) + qJn+1(0).

    La stratégie optimale, en n0 est de ne pas se garer car

    N − n0 > pJn0+1(1) + qJn0+1(0).

    Montrons (ii) par récurrence descendante sur n ≤ n0. Pour n = n0, c’est fait. Suppo-sons le résultat acquis au rang n+ 1, avec n < n0. Alors

    pJn+1(1) + qJn+1(0) = pJn0+1(1) + qJn0+1(0) < N − n0 < N − n

    donc, comme pour tout x ∈ {0, 1}, ϕn(x) ∈ {+∞, N − n}, on a : pour tout x ∈ {0, 1},

    ϕn(x) > pJn+1(1) + qJn+1(0),

    doncJn(x) = min{ϕn(x), pJn+1(1) + qJn+1(0)} = pJn0+1(1) + qJn0+1(0)

    et et la stratégie optimale, en n, est de ne pas se garer.d) Posons

    n∗ = min{n ∈ {0, . . . , N − 1} ; N − n ≤ pJn+1(1) + qJn+1(0)} ∪ {N}.

    On sait, par c), que pour tout n < n∗,

    N − n > pJn+1(1) + qJn+1(0).

    De plus, par c), on sait qu’il est impossible qu’il existe n ∈ {n∗ + 1, . . . , N − 1} tel que

    N − n > pJn+1(1) + qJn+1(0).

    On en déduit que la stratégie optimale est de ne pas se garer en une place n < n∗ et dese garer à la première place libre de numéro ≥ n∗.38. Arrêt optimal en horizons fini et infini. On considère un projet qui peut êtredans différents états, éléments d’un ensemble fini F . A chaque instant n ≥ 0, lorsque leprojet est dans l’état Xn ∈ F , on a le choix, soit de quitter le projet, on obtient alorsune récompense fixe M , soit de continuer, on obtient alors un gain g(Xn), et le projetpasse alors dans un état Xn+1. On suppose que Xn est une chaîne de Markov homogènede noyau P . On utilisera un facteur d’actualisation 1 + r > 1. On cherche donc, selon quel’on travaille à horizon fini N ou à horizon infini, à résoudre le problème d’optimisation

    V (N)(x,M) = sup{Ex[(1+r)−τM+τ−1∑k=0

    (1+r)−kg(Xk)] ; τ temps d’arrêt à valeurs dans {0, . . . , N}}

    ou

    V (x,M) = sup{Ex[(1 + r)−τM +τ−1∑k=0

    (1 + r)−kg(Xk)] ; τ temps d’arrêt à valeurs dans N}.

    27

  • On suppose M ≥ 0 et g(x) ≥ 0 pour tout x.Les fonctions relatives au problème à horizon fini N seront écrites avec un exposant

    (N), comme dans V (N)(x,M).a) Montrer que pour tout x,N,M , V (x,M)

  • Il en résulte qu’il existe W (x,M) ≤ V (x,M) tel que

    limN→+∞

    V (N)(x,M) = W (x,M).

    Par ailleurs, pour tout temps d’arrêt τ à valeurs dans N,

    0 ≤ (1 + r)−τM +τ−1∑k=0

    (1 + r)−kg(Xk) ≤M + ‖g‖∞∑k≥0

    (1 + r)−k désigne le produit scalaire canonique de Rd.1. La valeur du portefeuille au matin du premier jour est sa valeur initiale x, et elle

    au aussi égale à B0β1+ < α1, S0 >. Donc β1 est déterminé par x et α1.Soit n ≥ 1. La valeur du portefeuille au soir du n-ème jour (après fermeture de la

    bourse) est βnBn+ < αn, Sn >. Le lendemain matin, avant ouverture de la bourse, leportefeuille est recomposé, et sa valeur devient βn+1Bn+ < αn+1, Sn >. On a donc, enauto-financement,

    βnBn+ < αn, Sn >= βn+1Bn+ < αn+1, Sn >,

    29

  • ce qui implique queβn+1 = βn+ < αn − αn+1, S̃n >,

    avec S̃n = Sn/Bn (valeur actualisée à l’instant 0 de Sn).Ainsi, par récurrence, βn est déterminé par x et (α).2. On déduit de ce qui précède que que pour tout n ≥ 1,

    Ṽ x,αn − Ṽx,αn−1 =< αn, S̃n − S̃n−1 >,

    d’où pour tout n ≥ 0,

    Ṽ x,αn = x+n∑t=1

    < αt, S̃t − S̃t−1 > .

    3. Le marché étant viable, il existe une mesure martingale. Sous cette mesure, leprocessus (Ṽ x,αn ) est une martingale. On en déduit que l’espérance conditionnelle est Ṽ

    x,αk .

    40. Etude d’un modèle simple de marché. On considère un marché à cinq étatsΩ = {ω1, ω2, . . . , ω5}, deux périodes et trois actifs : un actif sans risque B de prix 1, detaux d’intérêt r = 0 et deux actifs risqués Sa et Sb. On fait les hypothèses suivantes surles dynamiques de chaque actif risqué :a. Sa0 = 6 et

    ((Sa1 , Sa2 )(ωi))i=1,...,5 = ((5, 3), (5, 4), (5, 8), (7, 6), (7, 8)).

    b. Sb0 = 3.75 et

    ((Sb1, Sb2)(ωi))i=1,...,5 = ((3, 2), (3, 3), (3, 4), (4.5, 4), (4.5, 5)).

    On note F = P(Ω) et µ une mesure non redondante sur Ω (i.e. telle que pour tout i,µ({ωi}) > 0).1. Représenter les dynamiques de prix sous forme d’arbre. On note, pour n ∈ {0, 1, 2},

    Fn = σ{(Bi, Sai , Sbi ), i ≤ n}.

    Déterminer F0, F1 et F2.2. Déterminer l’ensemble des probabilités risque-neutre pour ce marché. Que dire dumarché ?3. On considère un actif dérivé F2-mesurable H : Ω 7→ R+ (c’est un un contrat assurantà son détenteur le flux H à la date terminale 2). Il est dit réplicable (ou simulable) s’ilexiste un portefeuille autofinancé Φ telle que V Φ2 = H. On note H la variable aléatoiredéfinie sur Ω par :

    H(ω1) = 0, H(ω2) = 0.25, H(ω3) = 4.25, H(ω4) = 1.5, H(ω5) = 3.5.

    3.a. Déterminer le prix de l’actif aux dates 0 et 1, i.e. la valeur du portefeuille associé àune stratégie autofinancée Φ permettant de dupliquer l’actif dérivé H.3.b. Déterminer explicitement une telle stratégie (stratégie de couverture pour l’actif dé-rivé H).4. On suppose maintenant que Sa1 (ωi) = 3 pour i = 1, 2, 3 mais que les autres hypothèses

    30

  • sont toujours satisfaites. Le marché est-il toujours viable sous ces conditions ?5. En ajoutant un état, proposer un marché non complet.

    Solution :1. On ne représente pas l’évolution des prix de B, qui est fixe.

    t = 0 t = 1 t = 2

    (Sa2 , Sb2) = (3, 2)

    (Sa1 , Sb1) = (5, 3)

    ω1kkkkkk

    55kkkkkk

    ω2 //

    ω3SSSS

    SS

    ))SSSSSS

    (Sa2 , Sb2) = (4, 3)

    (Sa2 , Sb2) = (8, 4)

    (Sa0 , Sb0) = (6, 3.75)

    ω1,2,3uuuuuuuuuuu

    ::uuuuuuuuuuu

    ω4,5II

    IIII

    IIII

    I

    $$III

    IIII

    IIII (S

    a2 , S

    b2) = (6, 4)

    (Sa1 , Sb1) = (7, 4.5)

    ω4kkkkkk

    55kkkkkk

    ω5SSSS

    SS

    ))SSSSSS

    (Sa2 , Sb2) = (8, 5)

    F0 = {Ω, ∅}, F1 = {Ω, ∅, {ω1, ω2, ω3}, {ω4, ω5}}, F2 = P(Ω).2. Soit p = (p1, . . . , p5) ∈ R5. p est une proba risque neutre pour ce marché si et

    seulement si p ∈ (R+∗)5, p1 + · · · + p5 = 1, et sous p, les prix actualisés (i.e. les prix, carr = 0) des trois actifs sont des martingales. B est toujours une martingale, Sa est unemartingale si et seulement si

    6 = 5(p1 + p2 + p3) + 7(p4 + p5), 5 =3p1 + 4p2 + 8p3p1 + p2 + p3

    , 7 =6p4 + 8p5p4 + p5

    .

    Sb est une martingale si et seulement si

    3.75 = 3(p1 + p2 + p3) + 4.5(p4 + p5), 3 =2p1 + 3p2 + 4p3p1 + p2 + p3

    , 4.5 =4p4 + 5p5p4 + p5

    .

    Il existe une unique solution, donnée par p1 = p2 = p3 = 1/6, p4 = p5 = 1/4.Le fait qu’il existé une proba risque neutre nous dit que le marché est viable, le fait

    qu’elle soit unique nous dit que le marché est complet.3.a. Le marché étant complet, on sait qu’il existe un portefeuille Φ dupliquant H.

    La valeur (V Φt )t est alors une martingale. D’où V Φ0 = E(H|F0) = E(H) = 2 et V Φ1 =E(H|F1) = 1.5 sur {ω1, ω2, ω3} et 2.5 sur {ω4, ω5}.

    31

  • 3.b. Notons, pour i = 1, 2, βi, αai et αbi les quantités resp. de B, Sa, Sb détenues lematin du i-ème jour dans cette stratégie. Ces v.a. sont Fi−1-mesurables.

    On a donc β1, αa1 et αb1 déterministes (car F0 = {Ω, ∅}),

    β1 + Sb0α

    a1 + S

    b0α

    b1 = V

    Φ0

    etβ1 + S

    a1α

    a1 + S

    b1α

    b1 = V

    Φ1 ,

    ce qui donne β1 + 6α

    a1 + 3.75α

    b1 = 2,

    β1 + 5αa1 + 3α

    b1 = 1.5,

    β1 + 7αa1 + 4.5α

    b1 = 2.5.

    On en déduit facilement β1, αa1 et αb1.On a aussi β2, αa2 et αb2 F2-mesurables, donc ne prenant que 2 valeurs, respectivement

    x, y, z sur {ω1, ω2, ω3} et x′, y′, z′ sur {ω4, ω5}.On a alors

    x+ 5y + 3z = 1.5,

    x′ + 7y′ + 3.75z′ = 2.5,

    x+ 3y + 2z = 0,

    x+ 4y + 3z = 0.25,

    x+ 8y + 4z = 4.25,

    x′ + 6y′ + 4z′ = 1.5,

    x′ + 8y′ + 5z′ = 3.5.

    On résout facilement.4. Dans ces conditions, on doit avoir 3 = 3p1+4p2+8p3

    p1+p2+p3, ce qui implique, avec le fait que

    les pi soient positifs, que p1 = 1 et p2 = p3 = 0, le marché n’est donc plus viable.5. On ajoute au modèle initial un état ω6, où toutes les v.a. ont la même valeur que

    en ω5. Les probas risque neutre sont alors caractérisées par p1 = p2 = p3 = 1/6, p4 =p5 + p6 = 1/4. On n’a donc plus unicité (il faudrait un autre actif pour "distinguer" ω5 etω6).

    41. Couverture et pricing pour un marché représenté par un arbre. Cet exercicegénéralise le précédent. On considère un marché (Ω,F , µ) muni d’une filtration IF =(Fn)0≤n≤N , vérifiant F0 = {∅,Ω} et FN = F . On suppose que le marché est completet fini (i.e. Ω est fini) et se représente par un arbre. On considère un actif dérivé surce marché, c’est à dire une v.a. H sur Ω. Donner les grandes lignes de la constitutiond’un portefeuille de couverture pour H (remarquer que ce problème est intimement lié àl’établissement du prix, à tout instant, de H, autrement-dit à son pricing).

    Solution : On commence par déterminer, par la résolution d’un système linéaire, lamesure martingale p du marché. Considérons maintenant un portefeuille de couverture deprix actualisés (Ṽn)0≤n≤N . On détermine Ṽn en chaque noeud de l’arbre (un noeud étantassocié à un instant et un ω ∈ Ω) par la formule

    Ṽn = E[H | Fn]

    32

  • (le plus simple est de travailler de façon récursive de la droite de l’arbre). Ensuite, à chaquenoeud de l’arbre, on détermine, par la résolution d’un système linéaire, une répartitiondu prix du portefeuille correspondant à ce noeud dans les actifs disponibles de façon àarriver, à l’instant suivant, au prix du portefeuille dans les noeuds fils. Remarquons que lamesure martingale ne sert ici que au pricing, et que nulle part il n’est dit qu’elle modélisebien l’évolution des prix des actifs.

    42. Modèle trinômial. On considère un modèle d’échéance T ∈ N∗ à deux actifs : unactif sans risque de prix B (de taux r) et un actif risqué de prix St ayant la dynamiquesuivante :

    S0 = s0 > 0 et St+1 = St(1 + Ut+1) ∀t ∈ {0, . . . , T − 1}où les Ut sont des variables aléatoires représentant les rendements successifs de l’actifrisqué S. Elles sont définies de la manière suivante sur l’espace Ω = {b, 0, h}T muni de latribu grossière F = P(Ω) et d’une probabilité P non redondante :

    Ut : Ω → {b, 0, h}ω = (ωt)t∈{1,...,T} 7→ ωt.

    On supposera que −1 < b < 0 < h. On note F0 la tribu triviale et Ft = σ(U1, . . . , Ut). S̃désignera le prix actualisé de l’actif risqué.A.1. Montrer que FT = F puis que Ft = σ(S1, . . . , St) pour tout t ∈ {0, . . . , T}.A.2. Montrer qu’il y a des arbitrages possibles si r /∈]b, h[.

    On suppose dans la suite que r ∈]b, h[.B. On suppose dans cette partie que T = 1.B.1. Montrer que le marché est viable mais non complet.B.2. Construire une base de l’ensemble des actifs réplicables puis retrouver le fait que lemarché n’est pas complet.B.3. On note Q l’ensemble des probabilités équivalentes à P sous lesquelles S̃ est unemartingale. Calculer

    supQ∈Q

    1

    1 + rEQ[(K − S1)+]

    lorsque K ∈]s0(1 + b), s0[. Comment interprète-t-on cette valeur ?B.4. On introduit un nouvel actif noté S ′ sur le marché. Il s’agit d’un put européen surl’actif S de prix d’exercice K ∈]s0(1 + b), s0[ (et d’échéance T = 1). On note p0 > 0 leprix de ce put à la date 0. Ainsi, S ′0 = p0 et S ′T = (K − S1)+.B.4.a. Montrer que tout actif dérivé k est réplicable si et seulement si, il existe α, β, γ ∈ Rtels que k = α(1 + r) + βS1 + γS ′1.B.4.b. Montrer que tout actif est réplicable. Peut-on affirmer que le marché est complet ?B.4.c. On note (b, 0, h) = (ω1, ω2, ω3) et k = (k(ω1), k(ω2), k(ω3)) un actif dérivé. Montrerque son prix de duplication 1 c(k) s’écrit sous la forme

    c(k) =1

    1 + r(q(ω1)k(ω1) + q(ω2)k(ω2) + q(ω3)k(ω3))

    1. Valeur à l’instant t = 0 de la stratégie introduite dans la question précédente donnant k à l’instantt = 1.

    33

  • où l’on déterminera les q(ωi) en fonction de s0, h, b, r, p0 et K.B.4.d. Calculer

    ∑3i=1 q(ωi) et déterminer une condition nécessaire et suffisante sur p0 pour

    laquelle q(ω1), q(ω2) et q(ω3) sont strictement positifs.B.4.e. À quelle condition le marché est-il complet ? Comment peut-on interprêter q(ω1),q(ω2) et q(ω3) ?

    C. On suppose maintenant que T ∈ N∗ et on souhaite retrouver la propriété B.1.C.1. Supposons que Q soit une probabilité équivalente à P. Montrer que S̃ est une (Ft)-martingale par rapport à Q si et seulement si EQ[Ut+1/Ft] = r pour tout t ∈ {0, . . . , T−1}.C.2. Soient u, v, w appartenant à ]0,1[ tels que u + v + w = 1. On note p l’applicationdéfinie sur {b, 0, h} par p(b) = u, p(0) = v et p(h) = w. Soit Q une mesure de probabilitésur Ω satisfaisant :

    Q(U1 = x1, . . . , UT = xT ) =T∏t=1

    p(xt), ∀(x1, . . . , xT ) ∈ {b, 0, h}T .

    C.2.a. Montrer que Q est une probabilité équivalente à P. Montrer que la suite (Ut) estune suite de v.a. indépendantes sous Q et que

    Q(U1 = b) = u, Q(U1 = 0) = v Q(U1 = h) = w.

    C.2.b. Déterminer une condition sur u, v et w sous laquelle S̃ est une (Ft)-martingale parrapport à Q.C.2.c. En déduire que le marché est viable mais non complet.

    Solution :A.1. On a clairement FT ⊂ F et tout singleton {(a1, . . . , aT )} de Ω est de la forme

    {U1 = a1, . . . , UT = aT}, donc tout élément de F , union finie de singletons, est dans FT .Pour montrer que σ(S1, . . . , St) ⊂ σ(U1, . . . , Ut) (resp. que σ(U1, . . . , Ut) ⊂ σ(S1, . . . , St)),il suffit de montrer que pour tout t, St est σ(U1, . . . , Ut)-mesurable (resp. que Ut estσ(S1, . . . , St)-mesurable), ce qui est évident.

    A.2. Si r ≥ h (resp. ≤ b), alors on réalise un arbitrage avec la stratégie suivante : onvend (resp. achète) l’actif S en 0, place sans risque (resp. emprunte) les S0 euros reçus(resp. à payer), et neutralise notre position en 1, récupérant S0(r−U1) (resp. S0(U1− r))≥ 0 avec proba > 0 d’être > 0.

    B.1. Soit p = (pb, p0, ph) ∈ R3. p est une proba risque neutre ssi p ∈ (R+∗)3, pb + p0 +ph = 1 et 1+b1+rpb +

    11+r

    p0 +1+h1+r

    ph = 1, i.e.pb, p0, ph > 0

    pb + p0 + ph = 1,

    bpb + hph = r,

    i.e. r+

    h< ph <

    r−bh−b

    pb =r−hphb

    p0 =b−r+ph(h−b)

    b

    34

  • on a une infinité de solutions, donc le marché est viable mais pas complet.B.2. Les actifs réplicables sont les combinaisons linéaires de B1 et de S1, donc ont pour

    base (B1, S1) : c’est un sous-ev strict de RΩ, qui est de dimension 3.B.3. On a (K − S1)+ = K − s0(1 + b) si K = s0(1 + b) et 0 sinon, donc on s’approche

    du sup lorsque pb tend vers le sup de ses valeurs possibles, qui est Fh− rh− b. Le supvaut donc

    (h− r)(K − s0(1 + b))(h− b)(1 + r)

    .

    C’est la plus grande valeur que dans un univers risque neutre on peut oser payer pouracheter S ′ en 0.

    B.4.a. Un actif réplicable est un actif pour lequel il existe un portefeuille auto-financéde valeur finale égale à celle de l’actif. Tout actif combi linéaire de B1, S ′1, S1 est doncréplicable. Réciproquement, tout actif réplicable est du type α(1 + r) + βS1 + γS ′1, avecα, β, γ F0-mesurables i.e. constants.

    B.4.b. S ′1 n’est pas combinaison linéaire de S1 et B1, donc l’ensemble des actifs répli-cables est un ev de dimension 3, donc égal à RΩ. On ne peut pas pour autant affirmer quele marché est complet, car on n’a pas montré qu’il est viable.

    B.4.c. Considérons un actif réplicable k = α(1 + r) + βS1 + γS ′1. c(k) est la valeurinitiale du portefeuille réplicant k, i.e. α + βs0 + γp0.

    Il faut donc exprimer α, β, γ en fct des valeurs de k en ω1, ω2, ω3.On a

    k(ω1) = α(1 + r) + βs0(1 + b) + γ(K − s0(1 + b))k(ω2) = α(1 + r) + βs0

    k(ω3) = α(1 + r) + βs0(1 + h)

    ce qui donne α = k(ω2)(1+h)−k(ω3)

    (1+r)h

    β = k(ω3)−k(ω2)s0h

    γ = k(ω1)+k(ω2)(b−h)/h−bk(ω3)/hK−s0(1+b)

    On aboutit à q(ω1) = p0K−s0(1+b) , q(ω2) = 1−(h−b)p0

    h(K−s0(1+b)) , q(ω3) =−bp0

    h(K−s0(1+b)) .B.4.d. On a q(ω1) + q(ω2) + q(ω3) = 1. Ils sont tous strictement positifs ssi

    0 < p0 <h(K − s0(1 + b))

    h− b.

    B.4.e. Le marché est complet ssi il existe une unique proba risque neutre. Ceci estéquivalent au fait qu’il existe p = (p1, p2, p3) ∈ (R+∗)3 telle que p1 + p2 + p3 = 1 et sousp, les trois actifs actualisés sont des martingales, i.e. tel que p1 + p2 + p3 = 1 et sous p,E(S1) = (1 + r)s0 et E(S ′1) = (1 + r)p0, ce qui est équivalent au fait que les q(ωi) soient> 0. Le marché est complet ssi

    0 < p0 <h(K − s0(1 + b))

    h− b.

    Ces trois coefficients sont ceux de l’unique proba risque neutre du marché.

    35

  • C.1. S̃ est une (Ft)-martingale par rapport à Q si et seulement si EQ[St+1/Ft] =St(1 + r) pour tout t ∈ {0, . . . , T − 1}, i.e. si et seulement si EQ[Ut+1/Ft] = r pour toutt ∈ {0, . . . , T − 1}.

    C.2.a. Q et P ont toutes les deux des densités par rapport à la mesure uniforme sur Ωstrictement positives, elles sont donc équivalentes.

    Par définition de Q, la loi image des Ut est la loi produit, donc on a indépendance.C.2.b. Sous Q, Ut est indep de Ft, donc la condition de C.1. devient ub+ wh = r.C.3.c. On a une infinité de solutions (u, v, w) ∈ R+∗ au système{

    u+ v + w = 1

    ub+ wh = r,

    donc le système est bien viable, mais non complet.

    Dans les trois exercices qui suivent, on considère un espace mesuré (Ω,F , µ) munid’une filtration IF = (Fn)n≥0 supposée complète, vérifiant F0 = {∅,Ω} et F∞ = F . Onconsidère une marché discret comportant un actif sans risque B et d actifs risqués S =(S1, . . . , Sd) où S est IF -adapté : pour tout i ∈ {1, . . . , d}, pour tout n ≥ 0, Sin est la valeurde l’actif Si au soir du n-ème jour après fermeture de la bourse (le soir du 0-ème jourdésigne la valeur initiale). La dynamique de B est donnée par B0 = 1 et Bn = (1+rn)Bn−1où r = (rn)n≥0 est positif IF -prévisible : pour tout n ≥ 0, Bn est la valeur de l’actif B ausoir du n-ème jour après fermeture de la bourse (le soir du 0-ème jour désigne la valeurinitiale). La vie d’un portefeuille est modélisée par un processus IF -prévisible (β, α)n≥1 àvaleurs dans R×Rd : βn (resp. αin) est la quantité d’actif sans risque (resp. d’actif risquéSi) détenue sur la période allant du matin du n-ème jour (avant ouverture de la bourse)au matin suivant. Si le portefeuille est auto-financé, la stratégie associée est entièrementdéterminée par la suite (αn)n≥1 prévisibles et sa valeur initiale x. Dans ce cas, sa valeurle soir du n-ème jour est notée V x,αn . On note A l’ensemble des stratégies, i.e. l’ensembledes couples ((αn)n≥1, x).

    On rappelle que probabilité risque neutre est synonyme de mesure martingale équiva-lente à la mesure µ.

    43. Information imparfaite.On se place dans le modèle décrit au début de la feuille, mais on suppose maintenant

    que d = 1, que l’actif sans risque est de prix contant égal à 1 et que l’information del’agent est donnée par une filtration GI = (Gn)n≥0 différente de IF , i.e. A est maintenantl’ensemble des processus GI-prévisibles à valeurs dans R. On suppose Gn ⊂ Fn pour tout n.Dans cet exercice, on utilisera plusieurs fois la transitivité de l’espérance conditionnelle :si T1 ⊂ T2 sont des sous-tribus de F , pour toute v.a. X intégrable pour une mesure deprobabilité P,

    EP(X|T1) = EP(EP(X|T2)|T1).a. Si α ∈ A par rapport à quelle filtration V x,α est-il adapté ?b. Montrer que si, pour une certaine mesure de probabilité P sur l’espace mesurablesous-jacent (Ω,F), un processus (Xn) est une IF -martingale, alors le processus Yn :=EP[Xn | Gn] est une GI-martingale.

    36

  • c. On se fixe une mesure µ sur (Ω,F). Montrer que si le marché associé à l’espace mesuré(Ω,F , µ), à la filtration IF et à l’actif S est viable de proba risque neutre P, alors le marchéassocié à l’espace mesuré (Ω,F , µ), à la filtration GI et à l’actif R défini par Rn = EP(Sn|Gn)est viable. La complétude est-elle, à priori, une propriété qui passe aussi de IF à GI de cettefaçon ?

    Solution : a. On se rappelle que pour tout n, pour tout n ≥ 0,

    V x,αn = Bn(x+n∑t=1

    αt(S̃t − S̃t−1)).

    Les St étant adaptés à la tribu IF , ce processus n’est adapté qu’à la tribu IF .b. On note E pour EP. On a

    E(Yn+1|Gn) = E(E(Xn+1|Gn+1)|Gn) = E(Xn+1|Gn) = E(E(Xn+1|Fn)|Gn) = Yn.

    c. Par ce qui précède, et comme Bn = 1 pour tout n, P est bien une proba risqueneutre pour cet actif. La complétude n’a pas de raisons de passer comme ça, car R peutêtre une martingale sans que S en soit une.

    44. Temps d’arrêt, stratégies arrêtées et options américaines.On se place dans le modèle décrit au début de la feuille. On rappelle qu’une variable

    aléatoire τ à valeurs dans IN est un IF -temps d’arrêt si {τ = n} ∈ Fn pour tout n ∈ IN .On noteM l’ensemble des mesures de probabilités P ∼ µ telles que les actifs Si sont desIF -martingales sous P. On supposeM 6= ∅.a. Montrer que τ est un IF -temps d’arrêt si et seulement si pour tout n, {τ ≤ n} ∈ Fn.b. Soit τ un IF -temps d’arrêt borné et α ∈ A. On définit α̃ par α̃n = αn1τ≥n. Montrerque α̃ ∈ A. Que vaut, pour x ∈ R, Ṽ x,α̃n ?c. Soit α ∈ A, τ := inf{n ≥ 0 : V 0,αn ≥ ε}, ε > 0. Montrer que pour tout N ≥ 0, on n’apas τ ≤ N µ-pp.d. Soit α ∈ A et τ une variable aléatoire à valeurs dans {0, . . . , N} telle que V 0,ατ ≥ 0 etµ(V 0,ατ > 0) > 0. Montrer que τ n’est pas un IF -temps d’arrêt.e. Soit τ un IF -temps d’arrêt borné et α ∈ A. Que vaut EP[Ṽ x,ατ ] si P ∈M ?f. On modélise une option américaine par un processus (Gn)n et une maturité N . L’ache-teur de l’option reçoit le montant Gn s’il décide de l’exercer à la date n avant N . Onappelle prix de sur-réplication de l’option américaine la quantité p := inf{x ∈ R : ∃ α ∈A t.q. V x,αn ≥ Gn µ− p.p. pour tout n ≤ N}. On suppose le processus G borné. Montrerque p ≥ sup

    {EP[Gτ/Bτ ] ; P ∈M, τ ∈ TN

    }où TN est l’ensemble des IF -temps d’arrêt à

    valeurs dans {0, . . . , N}.Solution : a. Très cla