Exercice de khôlle de maths sur les probabilités, prépa ... · PDF...

9
Exercice de khôlle de maths sur les probabilités, prépa BCPST: Séries de piles et de faces Mise en contexte : Cet exercice, dont l’énoncé est dans l’encadré un peu plus bas, m’a été donné lorsque j’étais en première année de classe prépa filière BCPST, à l’occasion d’une khôlle de maths. Il se base sur le jeu de pile ou face, et fait intervenir insidieusement la loi des séries. Mais tout d’abord, qu’est-ce que la loi des séries ? C’est une loi qui dit grosso modo que si un événement assez exceptionnel se produit, cela entraîne des événements de même type à se produire à sa suite, comme si ces événements s’attiraient (typiquement: « un malheur n’arrive jamais seul »). Peut-être vous souvenez-vous des 3 crashs de trains en Europe (et 1 au Québec) en Juillet 2013 ? A l’époque les médias avaient en toutes lettres invoqué la loi des séries. Idem pour les 5 crashs d’avions en 22 jours de l’été 2005, sauf que là une explication mathématique (qui avait fait l’objet de plusieurs articles de journaux) invoquant la loi des probabilités (et non des séries) a été proposée : environ 20 00 vols ont lieu chaque jour, et il y a en moyenne un crash (enfin, un accident, qu’il soit relativement mineur ou assez majeur, au décollage comme ailleurs durant le vol) tous les 500 000 vols, ce qui fait 1 chance sur 10 que 5 crashs se produisent en 22 jours ! Bref, on pourrait alors penser que cette loi des séries n’est qu’un artefact médiatique (un drame incite les médias à relater plus d’histoires impliquant ce même drame, histoire de faire dans le sensationnel, et le commun des mortels pense alors qu’un drame en appelle un autre identique). Mais, au risque de gâcher la surprise, l’exercice proposé ici est (à mon sens) une super illustration que cette loi existe… sous certaines conditions ;) A l’époque ça m’avait décoiffé ! Et 4 ans et demi plus tard j’arrive enfin à le refaire, avec quelques conseils de ma prof de maths de spé, Florence Gaja, et poussé par des interrogations de quelques amis à qui j’avais parlé de cette fameuse loi et de cet exercice. J’ai essayé d’être le plus rigoureux possible au niveau mathématique tout en essayant de rendre le contenu accessible à pas mal de niveaux différents en maths (d’où les lignes et les lignes d’explications, afin de notamment traduire en français le langage mathématique :) ). Notamment, les principaux résultats sont encadrés et en rouge, histoire que ceux qui ne veulent pas s’embêter avec les démonstrations puissent trouver facilement les réponses ;) Si vraiment vous n’avez que 5 minutes à accorder à cet exercice, sa réponse se trouve au point 5), et sa transposition dans la « vraie vie » au point 8) ! J’espère avoir limité au maximum les erreurs et les interprétations ou explications imprécises voire limite incorrectes. Bref, allumez vos cerveaux, c’est parti ! Kévin Maurin, Mai 2015

Transcript of Exercice de khôlle de maths sur les probabilités, prépa ... · PDF...

Page 1: Exercice de khôlle de maths sur les probabilités, prépa ... · PDF filecompris – et le raisonnement est le même pour les F). e n’était pas mon raisonnement quand j’avais

Exercice de khôlle de maths sur les probabilités, prépa BCPST: Séries de piles et de faces

Mise en contexte : Cet exercice, dont l’énoncé est dans l’encadré un peu plus bas, m’a été donné lorsque j’étais

en première année de classe prépa filière BCPST, à l’occasion d’une khôlle de maths. Il se base sur le

jeu de pile ou face, et fait intervenir insidieusement la loi des séries.

Mais tout d’abord, qu’est-ce que la loi des séries ? C’est une loi qui dit grosso modo que si

un événement assez exceptionnel se produit, cela entraîne des événements de même type à se

produire à sa suite, comme si ces événements s’attiraient (typiquement: « un malheur n’arrive

jamais seul »). Peut-être vous souvenez-vous des 3 crashs de trains en Europe (et 1 au Québec) en

Juillet 2013 ? A l’époque les médias avaient en toutes lettres invoqué la loi des séries. Idem pour les

5 crashs d’avions en 22 jours de l’été 2005, sauf que là une explication mathématique (qui avait fait

l’objet de plusieurs articles de journaux) invoquant la loi des probabilités (et non des séries) a été

proposée : environ 20 00 vols ont lieu chaque jour, et il y a en moyenne un crash (enfin, un accident,

qu’il soit relativement mineur ou assez majeur, au décollage comme ailleurs durant le vol) tous les

500 000 vols, ce qui fait 1 chance sur 10 que 5 crashs se produisent en 22 jours !

Bref, on pourrait alors penser que cette loi des séries n’est qu’un artefact médiatique (un

drame incite les médias à relater plus d’histoires impliquant ce même drame, histoire de faire dans

le sensationnel, et le commun des mortels pense alors qu’un drame en appelle un autre identique).

Mais, au risque de gâcher la surprise, l’exercice proposé ici est (à mon sens) une super illustration

que cette loi existe… sous certaines conditions ;) A l’époque ça m’avait décoiffé ! Et 4 ans et demi

plus tard j’arrive enfin à le refaire, avec quelques conseils de ma prof de maths de spé, Florence

Gaja, et poussé par des interrogations de quelques amis à qui j’avais parlé de cette fameuse loi et de

cet exercice.

J’ai essayé d’être le plus rigoureux possible au niveau mathématique tout en essayant de

rendre le contenu accessible à pas mal de niveaux différents en maths (d’où les lignes et les lignes

d’explications, afin de notamment traduire en français le langage mathématique :) ). Notamment, les

principaux résultats sont encadrés et en rouge, histoire que ceux qui ne veulent pas s’embêter avec

les démonstrations puissent trouver facilement les réponses ;) Si vraiment vous n’avez que 5

minutes à accorder à cet exercice, sa réponse se trouve au point 5), et sa transposition dans la

« vraie vie » au point 8) ! J’espère avoir limité au maximum les erreurs et les interprétations ou

explications imprécises voire limite incorrectes. Bref, allumez vos cerveaux, c’est parti !

Kévin Maurin, Mai 2015

Page 2: Exercice de khôlle de maths sur les probabilités, prépa ... · PDF filecompris – et le raisonnement est le même pour les F). e n’était pas mon raisonnement quand j’avais

L’énoncé :

On lance plusieurs fois une pièce de monnaie ayant une probabilité p de donner pile (P) et 1-p de

donner face (F). Les lancers sont indépendants.

Cette séquence de piles et de faces constitue des séries d’un même côté de pièce, que l’on

numérote. Ce numéro augmente à chaque fois qu’une nouvelle série commence (voir l’exemple ci-

dessous).

Côté de pièce PPP FFFFF PPPP FF PPPP F PPPP FFFFFF P

Suite numéro 1 2 3 4 5 6 7 8 9

Question : calculer la longueur moyenne des séries de numéros pairs.

Résolution :

Commençons d’abord par les définitions des lettres qui vont apparaître par la suite (histoire

de savoir de quoi on parle !) :

- La longueur d’une série d’un même côté de pièce : variable aléatoire notée 𝑆, qui prend

des valeurs 𝑘 ∈ ℕ∗ (une série infinie d’un même côté de pièce est improbable, mais pas

impossible (on dit alors quasi-impossible), ce qui est une différence importante en maths

– et qui devrait l’être un peu plus dans la « vraie vie » ;) )

- Le numéro d’une série : 𝑛 ∈ ℕ∗. Enfin, pas tout à fait : les séries de numéros pairs seront

notées 𝑆2𝑛 (2n donnant alors des numéros pairs, qui commencent bien à 2 qui est le

premier numéro pair de série, pour 𝑛 ∈ ℕ∗ : 2, 4, 6, 8…) et les séries de numéros impairs

notées 𝑆2𝑛−1 (2n-1 donnant alors des numéros impairs, qui commencent bien à 1 qui est

le premier numéro impair de série, pour 𝑛 ∈ ℕ∗ : 1, 3, 5, 7…)

1) L’idée pour calculer la probabilité qu’une série de F soit de longueur k : il faut que l’on

fasse k F de suite après une série de P, et faire un autre P à la fin qui termine la série de F. Chaque F

ayant une probabilité 1-p et le P une probabilité p de sortir, on en déduit que la probabilité qu’une

série de F soit de longueur k est donnée par :

𝑷(𝑺 = 𝒌|𝒔é𝒓𝒊𝒆 𝒅𝒆 𝑭) = (𝟏 − 𝒑)𝒌−𝟏 𝒑

Suivant le même raisonnement, la probabilité qu’une série de P soit de longueur k est

donnée par :

𝑷(𝑺 = 𝒌|𝒔é𝒓𝒊𝒆 𝒅𝒆 𝑷) = 𝒑𝒌−𝟏 (𝟏 − 𝒑)

Là, il y a un petit point conceptuel : pourquoi mettre exposant k-1 et non k ? Ma prof m’a

expliqué qu’il ne faut pas compter le premier jet d’une série car il est indispensable pour commencer

la série, sans lui la série n’existe pas. En gros la probabilité que le premier jet d’une série soit de

même nature que la série qu’il commence est de 1, donc il n’y a que k-1 P qui ont une vraie

probabilité p de sortir sur les k P que compte la série (ou du moins c’est comme ça que je l’ai

Page 3: Exercice de khôlle de maths sur les probabilités, prépa ... · PDF filecompris – et le raisonnement est le même pour les F). e n’était pas mon raisonnement quand j’avais

compris – et le raisonnement est le même pour les F). Ce n’était pas mon raisonnement quand

j’avais fait l’exercice à l’époque (enfin je crois – je ne m’en souviens plus à vrai dire…), mais ça donne

le même résultat final alors bon ^^’

2) Avant de vraiment s’intéresser à l’aspect pair ou impair des numéros des séries,

commençons par chercher la probabilité de la longueur d’une série indépendamment de sa nature

(c’est-à-dire qu’elle soit de P ou de F).

Il faut pour cela utiliser la formule des probabilités totales, ce que l’on peut faire car

l’ensemble des événements {« c’est une série de P » ; « c’est une série de F »} est un système

complet d’événements (il n’y a que 2 types de série possibles avec deux côtés de pièce). En toutes

lettres d’abord, la formule dit alors :

« La probabilité qu’une série soit de longueur k » = « la probabilité qu’une série soit de

longueur k sachant que c’est une série de F » x « la probabilité que ce soit une série de F » + « la

probabilité qu’une série soit de longueur k sachant que c’est une série de P » x « la probabilité que

ce soit une série de P »

Puis en langage plus mathématique :

𝑃(𝑆 = 𝑘) = 𝑃(𝑆 = 𝑘|𝑠é𝑟𝑖𝑒 𝑑𝑒 𝐹)𝑃(𝑠é𝑟𝑖𝑒 𝑑𝑒 𝐹) + 𝑃(𝑆 = 𝑘|𝑠é𝑟𝑖𝑒 𝑑𝑒 𝑃)𝑃(𝑠é𝑟𝑖𝑒 𝑑𝑒 𝑃)

Or on connaît les deux probabilités conditionnelles (voir point 1) ) :

𝑷(𝑺 = 𝒌) = (𝟏 − 𝒑)𝒌−𝟏 𝒑 𝑷(𝒔é𝒓𝒊𝒆 𝒅𝒆 𝑭) + 𝒑𝒌−𝟏(𝟏 − 𝒑) 𝑷(𝒔é𝒓𝒊𝒆 𝒅𝒆 𝑷) Equation (1)

Les deux dernières inconnues, à savoir les probabilités que l’on parle d’une série de F ou de

P, vont dépendre de si l’on s’intéresse à des séries de numéros pairs ou impairs.

3) Maintenant, comment formaliser dans le calcul qu’une série est de numéro pair ? Ce qui

était le super problème que j’ai eu en essayant de refaire l’exercice ^^

Si on jette un œil à l’énoncé plus haut, on remarque que les séries de numéros pairs sont des

séries de F. Si l’on veut que les séries de numéros pairs soient des séries de P, on voit qu’il suffit de

remplacer chaque F par un P et vice-versa.

Ce qui change ? Tout bien sûr, mais en particulier le tout premier jet : si les séries de

numéros pairs sont des séries de F, c’est un P, et vice-versa ! C’est donc « tout simplement » le côté

de pièce sorti au premier jet qui détermine de quelle nature sont les séries de numéros pairs !

Donc, pour des séries de numéros pairs : 𝑷(𝒔é𝒓𝒊𝒆 𝒅𝒆 𝑭) = 𝑷(𝒕𝒊𝒓𝒆𝒓 𝑷 𝒂𝒖 𝒑𝒓𝒆𝒎𝒊𝒆𝒓 𝒋𝒆𝒕) = 𝒑

et 𝑷(𝒔é𝒓𝒊𝒆 𝒅𝒆 𝑷) = 𝑷(𝒕𝒊𝒓𝒆𝒓 𝑭 𝒂𝒖 𝒑𝒓𝒆𝒎𝒊𝒆𝒓 𝒋𝒆𝒕) = 𝟏 − 𝒑

Page 4: Exercice de khôlle de maths sur les probabilités, prépa ... · PDF filecompris – et le raisonnement est le même pour les F). e n’était pas mon raisonnement quand j’avais

4) Désormais, on peut intégrer l’aspect « numéro pair de la série » pour répondre à la

question de l’énoncé.

On obtient alors enfin la probabilité qu’une série de numéro pair soit de longueur k :

𝑷(𝑺𝟐𝒏 = 𝒌) = (𝟏 − 𝒑)𝒌−𝟏 𝒑 𝒑 + 𝒑𝒌−𝟏(𝟏 − 𝒑) (𝟏 − 𝒑)

Je laisse volontairement les carrés développés pour faire la différence entre le tout premier

jet, qui donne le caractère pair au numéro de la série, et le jet qui termine la série.

5) Et ENFIN, on peut répondre à la question de l’énoncé, en calculant l’espérance de

𝑷(𝑺𝟐𝒏 = 𝒌) (l’espérance mathématique étant le moyen de donner la vraie valeur moyenne d’une

variable aléatoire), avec la formule :

𝐸(𝑆2𝑛) = ∑ 𝑘 𝑃(𝑆2𝑛 = 𝑘)

+∞

𝑘=1

Je vous passe le calcul, mais pour ceux qui veulent s’amuser à le refaire, un petit rappel ;)

∑ 𝑘 𝑥𝑘−1 =1

(1 − 𝑥)2

+∞

𝑘=1

Et Ô magie, miracle, THE résultat qui sur le coup m’a fait regarder mon tableau en mode

« WTF ? » en cherchant l’erreur :

𝑬(𝑺𝟐𝒏) = 𝟐

Oui, simplement 2. La longueur d’une suite de numéro pair a en moyenne une longueur de

2, et ce même si la pièce est truquée (ce qui est le truc le plus ouf de cette histoire !). Mais je

reviendrai là-dessus un peu plus bas (voir point 8) ).

6) Comme j’avais fini ces calculs en à peine 20 minutes à l’époque (alors qu’au cumulé, j’ai

bossé presque 4h30 à refaire cet exercice maintenant (sans compter le temps passé à rédiger ce

document) – comme quoi quand on quitte la prépa y’a des réflexes qui se perdent !), et qu’une

khôlle dure normalement 1h, le prof m’avait fait calculer d’autres choses sur le même exercice.

Heureusement pas de variances, que je n’ai d’ailleurs pas envie de calculer maintenant non plus (ça

n’illustre pas mieux le propos de toute façon – ou presque).

Tout d’abord, rebelote mais en considérant les séries de numéros impairs. La méthode est la

même, les calculs sont de même nature mais les résultats diffèrent.

Reprenons d’abord l’équation (1), dans le cas où l’on s’intéresse aux séries de numéros

impairs :

𝑃(𝑠𝑒𝑟𝑖𝑒 𝑑𝑒 𝐹) = 𝑃(𝑡𝑖𝑟𝑒𝑟 𝐹 𝑎𝑢 𝑝𝑟𝑒𝑚𝑖𝑒𝑟 𝑗𝑒𝑡) = 1 − 𝑝

et

𝑃(𝑠𝑒𝑟𝑖𝑒 𝑑𝑒 𝑃) = 𝑃(𝑡𝑖𝑟𝑒𝑟 𝑃 𝑎𝑢 𝑝𝑟𝑒𝑚𝑖𝑒𝑟 𝑗𝑒𝑡) = 𝑝

On obtient alors la probabilité qu’une série de numéro impair soit de longueur k :

𝑃(𝑆2𝑛−1 = 𝑘) = (1 − 𝑝)𝑘−1 𝑝 (1 − 𝑝) + 𝑝𝑘−1(1 − 𝑝) 𝑝

Page 5: Exercice de khôlle de maths sur les probabilités, prépa ... · PDF filecompris – et le raisonnement est le même pour les F). e n’était pas mon raisonnement quand j’avais

Puis on en calcule l’espérance, et on obtient :

𝐸(𝑆2𝑛−1) =1 − 𝑝

𝑝+

𝑝

1 − 𝑝

De manière tout aussi surprenante que le résultat pour les séries de numéros pairs, la

longueur moyenne des séries de numéros impairs dépend elle de p, donc de si la pièce est truquée

ou équilibrée !

7) Et si l’on testait un peu tout ça ? ;)

Ces résultats semblant assez surprenants, pourquoi ne pas aller les vérifier après tout ? Ce

n’est pas à proprement parler une partie de la résolution du problème, mais ça m’amusait ;) Et c’est

intéressant aussi !

J’ai donc pris une pièce d’1$ néozélandais, et j’ai tiré à pile ou face 100 fois en notant à

chaque fois le côté qui sortait du jet. J’ai ensuite délimité les séries, compté leurs longueurs, et fait

les calculs de moyenne des longueurs. J’ai répété cela 20 fois.

Non je rigole, j’ai demandé à un ordinateur de le faire pour moi ! Ça permet de faire bien

plus de tirages pour une même séquence et de réaliser bien plus de séquences que n’importe qui en

aurait eu la patience ;) Enfin, ce n’est pas aussi simple que de le demander, il a fallu faire un peu de

programmation sous R (version 3.1.2). Mon script, que vous pouvez trouver à la fin de ce document,

n’est pas très élégant d’un point de vue de programmeur : il y a très certainement moyen

d’optimiser le nombre de lignes de codes, surtout quand j’utilise les mêmes boucles plusieurs fois, et

surtout j’insiste pour travailler avec des matrices, ce qui rajoute des lignes de code dont j’aurais sans

doute pu me passer ^^’ Mais je l’ai construit en suivant la logique de résolution de l’exercice (qui est

plus logique pour moi en tout cas).

Voici donc les résultats de cette expérience, pour différentes valeurs de p, volontairement

prises « en miroir » autour de ½ :

p = 1/5 p = 1/4 p = 1/3 p = 1/2 p = 2/3 p = 3/4 p = 4/5

𝒎𝒆𝒂𝒏(𝑺𝟐𝒏)± 𝒔𝒅(𝑺𝟐𝒏)

2.023469 ±

1.84187

2.193948 ±

1.657151

2.025328 ±

0.7422293

2.010931 ±

0.3262646

1.996188 ±

0.7961163

2.0018 ±

1.219517

2.142271 ±

1.602829

𝒎𝒆𝒂𝒏(𝑺𝟐𝒏−𝟏)± 𝒔𝒅(𝑺𝟐𝒏−𝟏)

4.489319 ±

1.739573

2.990809 ±

1.03441

2.490302 ±

0.8563335

2.024394 ±

0.3489073

2.528058 ±

0.8757788

3.446491 ±

1.385318

3.960846 ±

1.796049

En faisant mes petites manips sur R, je me suis aperçu qu’en fait ça valait le coup de calculer

les variances. Du moins de les faire calculer par R, et sans point de comparaison avec une valeur

donnée par le calcul (le calcul à la main des expressions de ces variances étant légèrement relou)…

De toute façon, R ne calcule pas directement une variance mais son estimateur sans biais (qui lui est

largement équivalent pour ce que je vais en faire ici). Et de toute façon bis, la variance (enfin, son

estimateur sans biais) ne sert qu’à illustrer qualitativement les phénomènes suivants : (1) les

variances de 𝑆2𝑛 et 𝑆2𝑛−1 augmentent lorsque p s’éloigne de ½ ; (2) ces conclusions se répètent « en

Page 6: Exercice de khôlle de maths sur les probabilités, prépa ... · PDF filecompris – et le raisonnement est le même pour les F). e n’était pas mon raisonnement quand j’avais

miroir » autour de ½, comme les valeurs de p. Et de toute façon ter, je ne vais pas faire calculer à R la

variance, mais l’écart-type (enfin, son estimateur sans biais, 𝑠𝑑()) des longueurs des séries (il est

plus naturellement interprétable que la variance, il est plus parlant, bien qu’il ne soit rien de plus

compliqué que √𝑉).

On remarquera aussi au passage que la longueur moyenne des séries de numéros impairs

augmente lorsque p s’éloigne de ½ (ce qui était à prévoir au vu de l’expression de 𝑆2𝑛−1 ).

Comment comprendre que les écarts-types des longueurs des séries augmentent lorsque p

s’éloigne de ½ ? C’est ici où avoir calculé les variances des longueurs des séries (de numéros pairs et

de numéros impairs respectivement) aurait pu aider, en analysant les variations des fonctions

𝑉(𝑆2𝑛)(𝑝) et 𝑉(𝑆2𝑛−1)(𝑝)… Donc bon il va falloir expliquer cela avec des mots !

Si l’on considère p = 1/5, on a 𝑃(𝑆 = 𝑘|𝑠é𝑟𝑖𝑒 𝑑𝑒 𝑃) = (1

5)𝑘−1

4

5 et (𝑆 = 𝑘|𝑠é𝑟𝑖𝑒 𝑑𝑒 𝐹) =

(4

5)𝑘−1

1

5 . Il y a donc bien plus de chance de faire de longues séries de F que de P. Mais il y a aussi

bien plus de chance que les séries de numéros pairs soient des séries de P, puisque le premier jet a

bien plus de chance d’être un F qu’un P. Donc, en somme, quand on tire F au premier jet, les séries

de numéros impairs, qui sont des séries de F, sont très souvent beaucoup plus longues que les séries

de numéros pairs, qui sont des séries de P. Mais le peu de fois où l’on tire P au premier jet, ce sont

les séries de numéros pairs (séries de F) qui deviennent très longues par rapport à celles de numéros

impairs (séries de P).

Ces écarts de longueurs sont alors d’autant plus grands que p s’éloigne de ½, donc l’écart-

type de ces longueurs augmente, malgré que 𝑚𝑒𝑎𝑛(𝑆2𝑛) reste égale à 2. A noter que le paragraphe

précédent, valable pour p < ½, s’écrit exactement pareil, mais en inversant les lettres P et F, quand p

> ½.

J’aurais pu aussi pousser le vice jusqu’à faire un test statistique d’égalité entre les longueurs

des séries paires et 𝐸(𝑆2𝑛), genre en utilisant la matrice des valeurs calculées par mon programme

(valeurs dont je fais la moyenne 𝑚𝑒𝑎𝑛(𝑆2𝑛), ce qui donne un estimateur de l’espérance), et la valeur

de l’espérance de la variable aléatoire associée (en l’occurrence 2), histoire de démontrer que les

valeurs de presque 2 pour 𝑚𝑒𝑎𝑛(𝑆2𝑛) ne sont pas dues au hasard. Ce que j’ai fini par me résoudre à

faire en fait, en utilisant un test de Wilcoxon* (qui, pour donner une idée simple mais pas tout à fait

exacte sur ce que teste vraiment le test, teste ici 𝐻0 = "𝑚𝑒𝑎𝑛(𝑆2𝑛) − 𝐸(𝑆2𝑛) = 0", en utilisant des

rangs plutôt que les valeurs exactes), et pour les mêmes valeurs de p que celles prises

précédemment :

p = 1/5 p = 1/4 p = 1/3 p = 1/2 p = 2/3 p = 3/4 p = 4/5

Valeur de la p-value du test (et

de sa stat W)

0.2829 (3)

0.3636 (4)

0.7619 (7)

0.8687 (8.5)

0.8042 (8)

0.4572 (5)

0.4568 (5)

* ce test n’est pas capable de calculer des p-value exactes s’il y a des valeurs ex-aequo dans la

matrice 𝑚𝑒𝑎𝑛(𝑆2𝑛) ou entre cette matrice et 𝐸(𝑆2𝑛) (ce qui arrive extrêmement souvent dans le

cas de cette expérience). Mais d'une part, la différence entre la p-value calculée dans ce cas et la

vraie p-value est relativement négligeable (du moins tant qu’elle ne change pas la conclusion du test,

ce qui est le cas ici). D'autre part, les valeurs de p-value que j’obtenais en relançant plusieurs fois

l’expérience pour une même valeur de p étaient assez dispersées, donc une petite imprécision sur

Page 7: Exercice de khôlle de maths sur les probabilités, prépa ... · PDF filecompris – et le raisonnement est le même pour les F). e n’était pas mon raisonnement quand j’avais

l'une d'entre elles ne change pas grand-chose au fait que le phénomène des p-values qui diminuent

quand p s'éloigne de 1/2 n'est pas très flagrant (voir remarque un peu après).

Rigoureusement parlant, avoir une p-value supérieure à un certain seuil (seuil qui ici a peu

d’importances vu les valeurs des p-value) rend le test inconclusif à ce seuil. Mais bon, d’une manière

plus informelle, il est d’usage de penser que si la p-value dépasse le seuil, 𝐻0 est vérifiée, donc on

peut admettre ici que les séries de numéros pairs ont bien une longueur moyenne égale à la valeur

de l’espérance de la variable aléatoire qui les donne cette longueur (et qui vaut 2).

A noter que cette p-value décroît d’autant plus que p s’éloigne de ½. Là encore il n’y a pas de

rigueur mathématique dans les trois phrases qui vont suivre, mais cela donne une idée de ce qu’il se

passe. On peut associer ce phénomène au fait que 𝑠𝑑(𝑆2𝑛) augmente quand p s’éloigne de ½. En

gros, le fait que cet écart-type augmente rend moins certain le fait que 𝑚𝑒𝑎𝑛(𝑆2𝑛) soit réellement

égale a 𝐸(𝑆2𝑛) car il montre que certaines valeurs de 𝑚𝑒𝑎𝑛(𝑆2𝑛) se trouvent vraiment trop loin de

𝐸(𝑆2𝑛) (en vertu de ce que j’ai expliqué un peu plus haut pour comprendre ce phénomène). De ce

fait, la p-value tend à se rapprocher du seuil en dessous duquel 𝐻0 serait rejetée. Mais pour être

honnête (et le tableau ne le montre pas très bien), ce n’est pas si flagrant, surtout lorsque l’on

relance l’expérience pour une même valeur de p plusieurs fois (on obtient des valeurs de p-value

assez dispersées).

Mais bon, pour que toutes ces conclusions qualitatives aient un sens plus quantitatif, il

faudrait faire d’autres tests statistiques… Bref à un moment donné, même si j’aime bien bidouiller

sur R, il faut dire stop :P

J’aurais pu répéter tout ce manège pour les suites de numéros impairs, mais elles n’ont pas

la propriété aussi incroyable que celle des séries de numéros pairs qui est d’avoir une longueur

moyenne indépendante de p. Donc je ne les en ai pas jugées dignes (et bim !).

8) Et dans la « vraie vie » ça donne quoi ?

Ah la voilà, la fameuse question du « Et les maths (du moins, ce genre de maths), ça sert à

quoi dans la ‘’vraie vie’’ ? » ;)

Pour ceux qui n’ont pas eu envie de lire la partie maths, le résultat important est : la

longueur moyenne des séries de numéros pairs est de 2, elle ne dépend pas de p (donc ça marche

même si la pièce est truquée !).

En tant que tel ça ne sert pas à grand-chose, à moins que vous ne deviez un jour parier sur

des longueurs de séries de pile ou face ! Surtout que la propriété démontrée ici pour les séries de

numéros pairs est difficilement utilisable en tant que tel, puisqu’elle suppose que vous ne

connaissiez pas le côté de pièce sorti au premier jet, ni même aux suivants, ce qui semble assez

bizarre (parieriez-vous vraiment sur des piles et des faces sans savoir ce qu’il se passe ?) !

De plus, puisque les pièces de monnaie sont équilibrées (à moins que vous tombiez sur un

roublard qui a truqué sa pièce), les longueurs moyennes des séries, qu’elles soient de numéros pairs

Page 8: Exercice de khôlle de maths sur les probabilités, prépa ... · PDF filecompris – et le raisonnement est le même pour les F). e n’était pas mon raisonnement quand j’avais

ou impairs, et de 2. En effet, dans ce cas p = ½, l’espérance de la longueur des séries de numéros

impairs est 𝐸(𝑆2𝑛−1) =1−𝑝

𝑝+

𝑝

1−𝑝=

1/2

1/2+

1/2

1/2= 1 + 1 = 2 (résultat que l’on retrouve d’ailleurs

dans le premier tableau du point 7) ). Donc dans tous les cas de figure, si vous deviez parier sur des

longueurs de séries de lancers de pièce, pariez 2 ;) Ou si la pièce est potentiellement truquée, vous

pouvez au moins vous servir des probabilités conditionnelles du point 1).

Mais bon, au-delà de ses applications pratiques limitées, le point de cet exercice et de

donner une illustration de la loi des séries (son intérêt est donc plus pédagogique que pratique). En

effet, si l’on se replace dans le contexte d’une pièce potentiellement truquée, et pour peu que vous

ne sachiez pas quel côté de pièce est sorti au premier jet, vous êtes en droit de penser que le côté de

pièce sorti au premier jet d’une série de numéro pair en appelle en moyenne un deuxième

identique. Donc la loi des séries existe bien… moyennant certaines conditions (ça fait un peu

démonstration roublarde, mais bon ;) ).

J’ajouterai, pour conclure, un lien vers un PDF contenant d’autres surprises (mathématiques)

sur le jeu de pile ou face : http://www.lifl.fr/~jdelahay/pls/213.pdf

Et en cherchant un peu sur Internet, il y a d’autres propriétés de ce jeu à découvrir, qui en

ont d’ailleurs fait un thème très fertile en termes de sujets de khôlles ou d’autres types d’exercices.

C’est en tout cas incroyable (du moins de mon point de vue, je vous laisse vous faire le vôtre)

combien quelque chose d’aussi simple à faire et qui parait aussi facile à expliquer et à comprendre

puisse donner lieu à de tels questionnements et phénomènes !

Annexe : le script du point 7)

### Nombre de séquences de pile ou face à générer N = 20 ESpair = matrix() ESimpair = matrix() Ces matrices vont contenir les espérances des longueurs des séries (de numéros pairs dans ESpair et impairs dans ESimpair) sachant quel côté de pièce est sorti au premier jet, au fur et à mesure qu'elles sont générées à chaque itération de la boucle for qui suit. Des petits calculs supplémentaires seront nécessaires pour répondre en bonne et due forme à la question. Note: matrix() crée une matrice 1x1 contenant NA. La manière dont je vais remplir ces matrices (et toutes celles créées de la même manière) va nécessiter de supprimer ce NA avant de faire des calculs avec les matrices (enfin, il me semble qu’il y a un moyen d'ignorer les NAs, mais je préfère les nettoyer!). for(n in 1:N) { ### Paramètres de la séquence de tirage à pile (P) ou face (F) L = 100 # Nombre de lancers de pièce dans la séquence p = 1/2 # Probabilité de faire P ### On commence par créer une suite de P et de F (matrice "PouF"), avec une probabilité p d'avoir un P: PouF = matrix(NA,1,L) alea = matrix(runif(L, 0, 1)) for(i in 1:L) if (alea[i,1] <= p) PouF[1,i] = "P" else PouF[1,i] = "F"

Page 9: Exercice de khôlle de maths sur les probabilités, prépa ... · PDF filecompris – et le raisonnement est le même pour les F). e n’était pas mon raisonnement quand j’avais

### Puis, on délimite chaque série et on en compte la longueur, que l'on stocke dans une matrice "S": S = matrix() long = 1 for(i in 2:L) if (PouF[1,i] == PouF[1,i-1]) long = long+1 else {S = matrix(nrow = 1, c(S,long)) ; long = 1} S = matrix(nrow = 1, c(S,long)) S = matrix(nrow = 1, S[,c(-1)]) ### On sépare ensuite la matrice S contenant les longueurs des séries en une matrice contenant les longueurs des séries de numéros pairs uniquement("pair") et une autre contenant les longueurs des séries de numéros impairs uniquement ("impair"): pair = matrix() impair = matrix() i = 1 while (2*i-1 <= length(S)) {impair = matrix(nrow = 1, c(impair,S[1,2*i-1])) ; i = i+1} i = 1 while (2*i <= length(S)) {pair = matrix(nrow = 1, c(pair,S[1,2*i])); i = i+1} impair = matrix(nrow = 1, impair[,c(-1)]) pair = matrix(nrow = 1, pair[,c(-1)]) ### On sauvegarde enfin les espérances des longueurs de séries, sachant le côté de pièce du 1er jet, pour les séries paires ("ESpair") et impaires ("ESimpair"): ESpair = matrix(nrow = 1, c(ESpair, mean(pair))) ESimpair = matrix(nrow = 1, c(ESimpair, mean(impair))) } # Fin de la boucle for = fin d’une seule séquence de pile ou face ### Enfin, on peut accéder aux espérances et écarts-types des longueurs des séries de numéros pairs et impairs, indépendamment du côté de pièce sorti au 1er jet: ESpair = matrix(nrow = 1, ESpair[,c(-1)]) mean(ESpair) sd(ESpair) ESimpair = matrix(nrow = 1, ESimpair[,c(-1)]) mean(ESimpair) sd(ESimpair) ### Et le test de Wilcoxon entre mean(S2n) et E(S2n) wilcox.test(ESpair, 2)