De la loi binomiale à la loi normale - Photo noir&blanc...

5

Click here to load reader

Transcript of De la loi binomiale à la loi normale - Photo noir&blanc...

Page 1: De la loi binomiale à la loi normale - Photo noir&blanc ...michel.brissaud.pagesperso-orange.fr/math/binomiale-normale-c... · En dessous à droite, les aires des zones grisées

0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16

0

0,05

0,1

0,15

0,2

0,25

0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16

0

0,05

0,1

0,15

0,2

0,25

0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16

0

0,05

0,1

0,15

0,2

0,25

De la loi binomiale à la loi normale

1) De B (n , p) à N (m , v)

1.A] Premier exemple : de B (16 ; 0,5) à N (8 ; 4)

Soit Y suivant la loi binomiale B(16 ; 0,5) de paramètres n = 16 et p = 0,5. Espérance m = n p = 8, variance v = n p (1- p) = 4

C’est une variable discrète ayant 17 valeurs possibles, les entiers de 0 à 16. On envisage deux types de graphique : en bâtonset avec des rectangles de largeur 1 :

Représentation en bâtons. ci-dessus l’aire d’un rectangle est égale à la proba

Les proba sont en ordonnée. les rectangles sont "centrés" sur les entiers

(Cela revient à considérer une nouvelle variable aléatoire continue qui prolonge Y sur [-0,5 ; 16,5], et dont la densité est constante par intervalle.)

Soit maintenant la variable X suivant la loi normale N (8 ; 4). espérance : m = 8, variance : v = 4, écart-type : σ = 2.

C’est une variable aléatoire continue à valeurs dans ℝ de densité : f (x)=1

2√2 πe−12 ( x−8

2 )2

qui est tracée sur le schéma de

gauche sur [0 ; 16]. En dehors de [2 ; 14], les proba sont très faibles, et 12 rectangles sont dans cet intervalle qui est[m−3σ ;m+3σ] .

À droite, on a "rassemblé" les 2 graphiques précédents : ils sont très proches et l’aire sous la courbe est voisine de l’aire des rectangles. Plus précisément et sur un exemple, on peut écrire :

P(7⩽Y ⩽10) = somme des aires des 4 rectangles centrés en 7, 8, 9, 10, et on a l’approximation :

P(7⩽Y ⩽10)≈∫6,510,5

f (x)dx , cette intégrale étant égale à P(6,5⩽X ⩽10,5) (et aussi à P(6,5< X <10,5) ).

Une approximation plus grossière est P(7⩽Y ⩽10)≈∫710

f (x)dx=P (7⩽X ⩽10) . Sa formule est plus simple, et il est

intéressant de chercher à savoir quand cette approximation est pertinente.

Michel Brissaud (88) ([email protected]) février 2014 1 / 5

0 2 4 6 8 10 12 14 16

0,25

0,2

0,15

0,1

5E-02

Page 2: De la loi binomiale à la loi normale - Photo noir&blanc ...michel.brissaud.pagesperso-orange.fr/math/binomiale-normale-c... · En dessous à droite, les aires des zones grisées

1.B] Deuxième exemple : de B (48 ; 0,25) à N (12 ; 9)

Y : Loi binomiale B (48 ; 0,25) de paramètres n = 48 et p = 0,25, espérance E(Y)= m = n p = 12, variance V(Y) = n p (1-p) = 9.

Y a 49 valeurs possibles, les entiers de 0 à 48.

Diagramme en bâtons avec des rectangles de largeur 1,

l’aire d’un rectangle est égale à la proba.

La distribution de proba de Y n’est pas symétrique comme dans le cas précédent, cela vient du paramètre p qui est différent de 0,5. Mais il y a presque symétrie sur [1 ; 25].

X : Loi normale (12 ; 9), espérance : m = 12, variance : v = 9 , écart-type : σ = 3, densité : f (x)=1

3√2πe−12 (

x−123 )

2

.

À gauche, on a tracé la courbe de la densité sur [0 ; 48]. À droite, on a rassemblé les deux graphiques.

En dehors de [3 ; 21], les proba sont très faibles, et 19 rectangles sont dans cet intervalle qui est [m−3σ ;m+3σ] .

La courbe est plus proche des rectangles que dans l’exemple précédent, car il y en a plus (19) dans l’intervalle [3 ; 21] qui "contient" presque toute la proba (il n’y en avait que 12 précédemment).On a par exemple :P(11⩽Y ⩽14 ) = somme des aires des 4 rectangles centrés en 11, 12, 13, 14, et comme en §1 :

P(11⩽Y ⩽14 )≈∫10,514,5

f ( x)dx , mais ici les rectangles étant plus proches de la courbe que dans le cas précédent, on a une

nouvelle approximation, un petit peu plus grossière, mais qui s’exprime par une formule plus simple :

P(11⩽Y ⩽14 )≈∫1114

f (x )dx , cette intégrale étant égale à P(11⩽X ⩽14) .

Plus généralement, si Y suit la loi B (48 ; 0,25), alors P(a⩽Y ⩽b)≈P (a⩽X ⩽b) avec X suivant la loi N (E(Y) ; V(Y))

Ici, les approximations sont meilleures que dans le cas précédent car l’écart-type est plus grand (les rectangles sont plus "fins" par rapport à l’intervalle qui contient le "gros" de la proba), sans que la dissymétrie soit trop importante. Au paragraphe C], il y a des graphiques dans des cas où l’approximation d’une loi binomiale par une loi normale n’est pas pertinente.

Michel Brissaud (88) ([email protected]) février 2014 2 / 5

0 4 8 12 16 20 24 28 32 36 40 44 48

0,14

0,12

0,10

0,08

0,06

0,04

0,02

Page 3: De la loi binomiale à la loi normale - Photo noir&blanc ...michel.brissaud.pagesperso-orange.fr/math/binomiale-normale-c... · En dessous à droite, les aires des zones grisées

1.C] Mauvais exemples

1) Avec Y suivant la loi B (48 ; 0,05) :

Espérance E(Y) = n p = 2,4

Variance V(Y) = n p (1- p) = 2,28

Écart-type : σ (Y) ≈ 1,5

On remarque une forte dissymétrie qui s’explique par une espérance np trop faible. De plus l’écart-type est faible. On ne peut pas approcher avec une variable suivant une loi normale dont la courbe de densité est symétrique.

2) Avec Y suivant la loi B (48 ; 0,95) :

Espérance E(Y) = n p = 45,6

Variance V(Y) = n p (1- p) = 2,28

Écart-type : σ (Y) ≈ 1,5

On remarque encore une forte dissymétrie qui s’explique ici par une espérance np trop forte, et l’écart-type est faible.

Là encore, la variable aléatoire Y ne pourra pas être considérée comme proche de X suivant une loi normale.

3) Remarques :

Ici, on a n(1- p) = 2,4, et : np + n(1- p) = n ; "np trop grand" correspond à "n(1- p) trop petit"

Si on compare les 2 cas précédents, le diagramme de l’un est symétrique de l’autre et cela peut se justifier facilement en revenant à la formule de calcul des proba pour une loi binomiale car le paramètre p est 0,05 en A] et 0,95 en B] (somme 1).

Des graphiques semblables montrent que np et n(1- p) doivent être plus grands que 5 pour éviter les dissymétries observées ci-dessus. L’écart-type est assez grand si n est grand (quelques dizaines).

2) De N (m , v) à N (0 , 1)

Exemple : de N (8 , 4) à N (0 , 1)

1) ci-dessous à droite la densité de la loi normale (8 , 4) : f ( x)=1

2 √2πe−12 (

x−82 )

2

,

à gauche, la densité de la loi normale (0 ; 4) : f 1(x)=1

2 √2πe−12 (

x2 )2

On a f 1(x)= f (x+8 ) et on passe de la courbe de f à celle de f1 par une translation, les aires ne sont donc pas changées, et

f1 est la densité de proba de la variable aléatoire X1 = X - 8

Michel Brissaud (88) ([email protected]) février 2014 3 / 5

-8 -6 -4 -2 0 2 4 6 8 10 12 14

0,5

0,4

0,3

0,2

0,1

Page 4: De la loi binomiale à la loi normale - Photo noir&blanc ...michel.brissaud.pagesperso-orange.fr/math/binomiale-normale-c... · En dessous à droite, les aires des zones grisées

2) en trait continu, la courbe de la fonction f 1(x)=1

2 √2πe−12 (

x2 )2

en pointillé, la courbe de f 2 (x)=1

2√2 πe−12

x2

On a f2(x)= f

1(2 x) et on passe de la courbe de f1 à celle de

f2 par la transformation géométrique suivante : à ordonnée

constante, on divise les abscisses par 2.

Les aires sont divisées par 2.

Remarque : la fonction f2 n’est pas une densité de probabilité.

3) en pointillés serrés, la courbe de f 2 (x)=1

2√2 πe−12

x2

en pointillés espacés, la courbe de f ∗(x)=

1

√2πe−12

x2

On a f ∗(x)=2 f 2( x) et on passe de la courbe de f2 à celle de

f ∗ par la transformation géométrique suivante : à abscisse

constante, on multiplie les ordonnées par 2.

Les aires sont multipliées par 2.

f ∗ est la densité de probabilité d’une variable aléatoire X ∗

suivant la loi N (0 , 1).

4) Au final, on obtient :

à gauche, densité f ∗ de X ∗

suivant la loi N ( 0 ; 1), à droite, densité f de X suivant la loi N (8 , 4).

Et surtout, par la composée des transformations géométriques utilisées, les aires sont conservées !

Michel Brissaud (88) ([email protected]) février 2014 4 / 5

-8 -6 -4 -2 0 2 4 6 8

0,5

0,4

0,3

0,2

0,1

-4 -2 0 2 4 6 8 10 12 14

0,5

0,4

0,3

0,2

0,1

Page 5: De la loi binomiale à la loi normale - Photo noir&blanc ...michel.brissaud.pagesperso-orange.fr/math/binomiale-normale-c... · En dessous à droite, les aires des zones grisées

En dessous à droite, les aires des zones grisées sont égales, en utilisant les transformations géométriques précédentes.

Sous la courbe de f c’est ∫711

f ( x)dx=P(7⩽X ⩽11)

Sous la courbe de f ∗c’est ∫−0,5

1,5f ∗ (x)dx=P (−0,5⩽X ∗⩽1,5)

On a alors :

P(7⩽X ⩽11)=P(−0,5⩽X ∗⩽1,5)

et plus généralement :

P(a⩽ X ⩽b )=P(a−82

⩽X ∗⩽

b−82

)

et plus généralement encore un raisonnement semblablepermettrait de justifier :

si X suit la loi N ( m ; σ 2 ) et X ∗ suit la loi N ( 0 ; 1),

P(a⩽ X ⩽b )=P(a−m

σ ⩽ X ∗⩽

b−mσ )

Cette variable aléatoire X ∗ est alors la variable

X −mσ .

On ainsi justifié que si X suit la loi N ( m ; σ 2 ) , alors la variable X −mσ suit la loi N ( 0 ; 1).

3) Conclusion : de B (n , p) à N (0 , 1)

Si Y suit la loi B (n ; p) avec n "assez grand" (quelques dizaines au moins), np et n(1- p) plus grands que 5, et en notant m

l’espérance et σ l’écart-type de Y , on a l’approximation :

P(a⩽Y ⩽b)≈P (a⩽X ⩽b) avec X suivant la loi N ( m ; σ 2 )

avec de plus P(a⩽ X ⩽b )=P(a−m

σ ⩽X −m

σ ⩽b−m

σ ) avec X −m

σ = X ∗ qui suit la loi N ( 0 ; 1).

Michel Brissaud (88) ([email protected]) février 2014 5 / 5

-4 -2 0 2 4 6 8 10 12 14

0,5

0,4

0,3

0,2

0,1