La loi normale - Samuel Herrmann,...

24
La loi normale Séance 6 Samuel Herrmann http://herrmann.perso.math.cnrs.fr/enseign.html S.Herrmann (UBFC) Loi normale 1 / 24

Transcript of La loi normale - Samuel Herrmann,...

Page 1: La loi normale - Samuel Herrmann, Dijon.herrmann.perso.math.cnrs.fr/stat-seance1-loi-normale-trans.pdf · Pourdénombrertouslescaspossiblesetlescasfavorables,onutilise souvent: lesfactorielles:

La loi normale

Séance 6

Samuel Herrmann

http://herrmann.perso.math.cnrs.fr/enseign.html

S.Herrmann (UBFC) Loi normale 1 / 24

Page 2: La loi normale - Samuel Herrmann, Dijon.herrmann.perso.math.cnrs.fr/stat-seance1-loi-normale-trans.pdf · Pourdénombrertouslescaspossiblesetlescasfavorables,onutilise souvent: lesfactorielles:

Chapitre 4 : La loi normale (loi de Gauss ou Laplace-Gauss)

Rappel : Lorsqu’il s’agit de calculer la probabilité d’un événement particulier:

choisir deux personnes de même sexe dans un groupe de 40 étudiantslorsque le choix est fait au hasardavoir un 6 comme somme de deux lancers d’un dé équilibréobtenir un full house (main pleine) au pokerdeux sportifs en particulier s’affrontent dès le premier tour d’un tournoi

Faire appel à une loi de probabilité (règle de calcul)

Premier principe :

On utilise souvent le principe simple suivant:1 faire une liste de tous les cas possibles

2 calculer le rapport P[évènement] = nbre de cas favorablesnbre de cas possibles

Attention : cette règle ne s’applique que si tous les cas ont la même chanced’apparaître (équiprobable).

⇒ Éviter la liste FF , FG , GF , GG pour le premier exemple.S.Herrmann (UBFC) Loi normale 2 / 24

Page 3: La loi normale - Samuel Herrmann, Dijon.herrmann.perso.math.cnrs.fr/stat-seance1-loi-normale-trans.pdf · Pourdénombrertouslescaspossiblesetlescasfavorables,onutilise souvent: lesfactorielles:

Pour dénombrer tous les cas possibles et les cas favorables, on utilisesouvent:

les factorielles: 10! = 10× 9× . . .× 1 = 3 628 800correspond aux nombresde possibilités d’ordonner 10 individus.

Adèle Gérard Florian Léa Victorine Abdel Inès . . . Victor

les quotients de factorielles:

10!7!

=10× 9× 8× 7× 6× 5× 4× 3× 2× 1

7× 6× 5× 4× 3× 2× 1= 10× 9× 8 = 720.

Le nombre de possibilités d’ordonner 3 individus parmi 10 personnes.

Président Trésorier SecrétaireAdèle Gérard Florian

Adèle - Gérard - Florian

Gérard - Florian - Adèle

sont des possibilités différentes.les combinaisons:

(103

)= 10!

3! 7! = 120 le nombre de choix de 3 individusparmi 10 personnes, lorsque l’ordre n’a pas du tout d’importance.

Adèle Gérard Florian

Adèle - Gérard - Florian

Gérard - Florian - Adèle

représentent ici une même possibilité.S.Herrmann (UBFC) Loi normale 3 / 24

Page 4: La loi normale - Samuel Herrmann, Dijon.herrmann.perso.math.cnrs.fr/stat-seance1-loi-normale-trans.pdf · Pourdénombrertouslescaspossiblesetlescasfavorables,onutilise souvent: lesfactorielles:

Exemple d’application

Dans l’académie, sur 12 000 collègiens, 732 ont une phobie scolaire. Enchoisissant au hasard 20 élèves pour un voyage scolaire, quelle est la probabilitéd’avoir 2 enfants dans le groupe qui ont cette phobie ?

X nombre d’enfants ayant une phobie scolaire dans le groupe de 20 élèvessélectionnés. 732 ont cette phobie et 12 000− 732 = 11 268

P[X = 2] =

(7322

)(11 26818

)(12 00020

) ≈ 0, 2279 soit 22, 79%

⇒ on pourra simplifier ce calcul en utilisant un modèle binomial (voir plus loin).

Deuxième principe : l’indépendance

Deux événements sont indépendants s’ils n’ont aucune influence l’un enversl’autre. La probabilité de voir les deux évènements se réaliser en même tempsest le produit des probabilités de chaque évènement séparément.

P[lunettes & cheveux blonds] = P[lunettes]× P[cheveux blonds]

P[6 au premier dé & 6 au second dé] = P[6 au premier dé]× P[6 au second dé]S.Herrmann (UBFC) Loi normale 4 / 24

Page 5: La loi normale - Samuel Herrmann, Dijon.herrmann.perso.math.cnrs.fr/stat-seance1-loi-normale-trans.pdf · Pourdénombrertouslescaspossiblesetlescasfavorables,onutilise souvent: lesfactorielles:

Avec les deux principes généraux décrits jusqu’ici, on peut calculer lesprobabilités dans de nombreuses situations faisant appel à des variables discrètes.⇒ Dans certaines situations, on sait par avance la loi de probabilité àutiliser, pas besoin de refaire tous les calculs.Deux modèles statistiques souvent utilisés : modèle binomial & modèle gaussien.Dans chaque modèle, on décrit la loi de probabilité d’une variable statistique(discrète ou continue).

Rappel sur le modèle binomial, utilisé dans la situation suivante:

Expérience dt le résultat ne prend que 2 valeurs: succès (S) ou échec (E).On note p la proba de succès. Proba de l’échec est alors 1− p.répétition de l’expérience n fois, de manière indépendante.variable statistique X désigne le nombre de succès au cours des nexpériences.

La loi de probabilité de X est la loi binomiale de paramètres n et p.Elle est notée X ∼ B(n, p).C’est la loi de probabilité d’une variable aléatoire discrète.

S.Herrmann (UBFC) Loi normale 5 / 24

Page 6: La loi normale - Samuel Herrmann, Dijon.herrmann.perso.math.cnrs.fr/stat-seance1-loi-normale-trans.pdf · Pourdénombrertouslescaspossiblesetlescasfavorables,onutilise souvent: lesfactorielles:

Exemple de réalisation:

S S S E E E ECe scénario se réalise avec une proba-bilité

ppp(1− p)(1− p)(1− p)(1− p)

= p3(1− p)4.

Même probabilité pour le scénario:S E E S S E E

P[X = 3] = p3(1− p)4 × N

où N est le nombre de possibilités deplacer 3 succès dans une série de 7expériences:

N =

(73

)=

(74

).

Finalement

P[X = 3] =(73

)p3(1− p)4.

De manière générale

P[X = k] =

(n

k

)pk(1− p)n−k .

Cette probabilité caractérise la loi bi-nomiale.

Propriétés:loi discrètehistogramme en batonsapplication à l’échantillonnageE[X ] = np,

Var[X ] = np(1− p)

s(X ) =√np(1− p).

S.Herrmann (UBFC) Loi normale 6 / 24

Page 7: La loi normale - Samuel Herrmann, Dijon.herrmann.perso.math.cnrs.fr/stat-seance1-loi-normale-trans.pdf · Pourdénombrertouslescaspossiblesetlescasfavorables,onutilise souvent: lesfactorielles:

Chapitre 4 : La loi normale

Rappel sur les modèles de tirage avec remise

choix de 10 boulesdans une urne.variable stat. X :nb de boules noiresobtenues.

échantillon : un tirage de 10boules

P[X = 3] =(103

)(421

)3(1721

)10−3

≈ 0, 189

P[3 < X ≤ 5] = P[X = 4] + P[X = 5]≈ 0.078+ 0.022

Info: 4 noires parmi 21

Modèle de X : binomiale B(10, 421 ).

0 1 2 3 4 5 6 7 8 9 100

0.1

0.2

0.3

n = 10, p = 4/21

S.Herrmann (UBFC) Loi normale 7 / 24

Page 8: La loi normale - Samuel Herrmann, Dijon.herrmann.perso.math.cnrs.fr/stat-seance1-loi-normale-trans.pdf · Pourdénombrertouslescaspossiblesetlescasfavorables,onutilise souvent: lesfactorielles:

Chapitre 4 : La loi normale

Rappel sur les modèles de tirage avec remise

choix de 10 boulesdans une urne.variable stat. X :nb de boules noiresobtenues.

échantillon : un tirage de 10boules

P[X = 3] =(103

)(421

)3(1721

)10−3

≈ 0, 189

P[3 < X ≤ 5] = P[X = 4] + P[X = 5]≈ 0.078+ 0.022

Info: 4 noires parmi 21

Modèle de X : binomiale B(10, 421 ).

0 1 2 3 4 5 6 7 8 9 100

0.1

0.2

0.3

n = 10, p = 4/21

S.Herrmann (UBFC) Loi normale 8 / 24

Page 9: La loi normale - Samuel Herrmann, Dijon.herrmann.perso.math.cnrs.fr/stat-seance1-loi-normale-trans.pdf · Pourdénombrertouslescaspossiblesetlescasfavorables,onutilise souvent: lesfactorielles:

Modèle de tirage avec ou sans remise ?Modèle de tirage avec remise: on choisit n individus dans une population(taille N). Mais à chaque fois qu’on choisit un individu, on le replace dansla population: il peut être choisi plusieurs fois... (loi binomiale)Modèle de tirage sans remise: lorsqu’on choisit un individu, il est alorsretiré de la population totale, le prochain individu choisi sera forcément unindividu différent (loi hypergéométrique).

Ces probabilités ne sont pas les mêmes mais lorsque n est petit devant N(n < 0.1N), la loi hypergéométrique est approchée par une loi binomiale.

On choisit 2 cartes dans un jeu de 52 cartes.X est le nombre de cartes noires:

Avec remise, P[X = 2] =(22

) ( 12

)2= 0, 25

Sans remise,

P[X = 2] = 2652

2551 = 0, 245098 ≈ 0, 25

Le modèle binomial joue un rôle primordial !

S.Herrmann (UBFC) Loi normale 9 / 24

Page 10: La loi normale - Samuel Herrmann, Dijon.herrmann.perso.math.cnrs.fr/stat-seance1-loi-normale-trans.pdf · Pourdénombrertouslescaspossiblesetlescasfavorables,onutilise souvent: lesfactorielles:

De nombreuses applications :

Echantillon Variable statistique X Modèle

gpe de 20 adultes de 18ans en France

Nbre de personnes scolarisées B(20; 0, 775)

gpe de 100 jeuneshommes de 18-19 ans

Nbre de pers. plutôt optimistespour leur avenir professionnel

B(100; 0, 57)

gpe de 30 personnes de18 à 65 ans

Nbre de pers. en difficulté à l’écrit(étude sur l’illétrisme)

B(30; 0, 12)

Année de transport pourun étudiant de psycho

Nbre de pannes de tram subies aucours de l’année (130 jours)

B(260; p)

Données INSEE

Dans toutes ces situations, la variable statistique X est quantitative discrète, onpeut donc calculer la probabilité P[X = k] pour k une valeur particulière donnée(souvent une valeur entière) mais difficulté pour B(n; p) avec n grand.Dans le dernier exemple:

P[X ≤ 50] =50∑k=0

(260k

)pk(1− p)260−k Bonne chance !!!

S.Herrmann (UBFC) Loi normale 10 / 24

Page 11: La loi normale - Samuel Herrmann, Dijon.herrmann.perso.math.cnrs.fr/stat-seance1-loi-normale-trans.pdf · Pourdénombrertouslescaspossiblesetlescasfavorables,onutilise souvent: lesfactorielles:

Que faire lorsque la variable statistique considérée est continue ?

On sait alors que P[X = k] = 0 pour toute valeur k donnée.

Pour des variables discrètes, la probabilité

P[a < X ≤ b]

est la somme des longueurs des batons dudiagramme, localisés entre a et b.(a exclu...)

Pour les variables continues, cette sommeest remplacée par une aire

P[a < X ≤ b]=

∫ b

a

f (x) dx .

x

f (x)

a b

P[a < X ≤ b]

0

Lorsque l’égalité est vérifiée pour tout a et b avec a < b, la fonction f estappelée la densité de X .Elle décrit entièrement la loi de probabilité (modèle statistique) de X .

S.Herrmann (UBFC) Loi normale 11 / 24

Page 12: La loi normale - Samuel Herrmann, Dijon.herrmann.perso.math.cnrs.fr/stat-seance1-loi-normale-trans.pdf · Pourdénombrertouslescaspossiblesetlescasfavorables,onutilise souvent: lesfactorielles:

Quelques exemples de modèles statistiques avec des variables à densité:

X est le revenu moyen en euros d’un ménage enBelgique en 2015 (individu=ménage).La densité f dépend des régions considérées(Sources : SILC 2016).

S.Herrmann (UBFC) Loi normale 12 / 24

Page 13: La loi normale - Samuel Herrmann, Dijon.herrmann.perso.math.cnrs.fr/stat-seance1-loi-normale-trans.pdf · Pourdénombrertouslescaspossiblesetlescasfavorables,onutilise souvent: lesfactorielles:

X est l’Indice de Masse Corporelle(individu = un homme ou une femme) pourun homme ou une femme entre 18 et 65 ans(Source : enquête Santé 2002-2003, Insee).

X est le temps entre deux décharges succes-sives d’un neurone lors d’un stimulus (en ms).

S.Herrmann (UBFC) Loi normale 13 / 24

Page 14: La loi normale - Samuel Herrmann, Dijon.herrmann.perso.math.cnrs.fr/stat-seance1-loi-normale-trans.pdf · Pourdénombrertouslescaspossiblesetlescasfavorables,onutilise souvent: lesfactorielles:

Propriétés générales des variables statistiques à densité.

Pour tout a < b, on a

P[a < X ≤ b] = P[a ≤ X ≤ b] = P[a < X < b] = P[a ≤ X ≤ b].

On note F (x) = P[X ≤ x ] et on l’appelle la fonction de répartition.

b

F (b)

a

F (a)

a b

F (b)− F (a)

a

F (a)

a

1− F (a)

S.Herrmann (UBFC) Loi normale 14 / 24

Page 15: La loi normale - Samuel Herrmann, Dijon.herrmann.perso.math.cnrs.fr/stat-seance1-loi-normale-trans.pdf · Pourdénombrertouslescaspossiblesetlescasfavorables,onutilise souvent: lesfactorielles:

Le modèle gaussien : une loi de prob-abilité joue un rôle central pour les vari-ables continues, il s’agit de la loi de Gauss

DefinitionLa variable aléatoire Z suit une loinormale centrée réduite si sa densité est:

f (x) =1√2π

e−x22 , x ∈ R

On note : Z ∼ N (0; 1) x

f (x)

a b

P[a ≤ Z ≤ b]

0 4

0,1

Densité en forme de cloche, positive et symétrique (f est une fonction continuepaire), on admettra que ∫ ∞

−∞f (x)dx = 1.

La croissance et la décroissance de f sont extrêmement rapides.

x 0 1 2 3 5 10 20

f (x) 0, 399 0, 242 0, 053 0, 004 1, 5× 10−6 8× 10−23 6× 10−88

S.Herrmann (UBFC) Loi normale 15 / 24

Page 16: La loi normale - Samuel Herrmann, Dijon.herrmann.perso.math.cnrs.fr/stat-seance1-loi-normale-trans.pdf · Pourdénombrertouslescaspossiblesetlescasfavorables,onutilise souvent: lesfactorielles:

Dans la suite F représente la fonction de répar-tition de la loi normale centrée réduite:

F (z) = P[Z ≤ z ] lorsque Z ∼ N (0; 1).

Dans la pratique, on notera X la variable statis-tique dépendant du contexte de l’étude consid-érée, et Z cette variable aléatoire de référence.Le but est alors de comprendre comment seramener de X à Z (affaire à suivre...).

Johann Carl Friedrich GAUSS (1777-1855)

Les propriétés de la densité de la loi normale se traduisent par: si z < 0 alors

F (z) = 1− F (|z |) et F (0) =12.

z

F (z)

z |z |

F (|z |)

S.Herrmann (UBFC) Loi normale 16 / 24

Page 17: La loi normale - Samuel Herrmann, Dijon.herrmann.perso.math.cnrs.fr/stat-seance1-loi-normale-trans.pdf · Pourdénombrertouslescaspossiblesetlescasfavorables,onutilise souvent: lesfactorielles:

−4 −2 2 4

0.2

0.4

0.6

0.8

1

Fonction de répartition de la loi N (0; 1)

Dans la description de la loi de probabilité N (0; 1), µ = 0 représente la moyennede la variable aléatoire (variable centrée) et σ = 1 représente l’écart-type de la

variable (variable réduite).

S.Herrmann (UBFC) Loi normale 17 / 24

Page 18: La loi normale - Samuel Herrmann, Dijon.herrmann.perso.math.cnrs.fr/stat-seance1-loi-normale-trans.pdf · Pourdénombrertouslescaspossiblesetlescasfavorables,onutilise souvent: lesfactorielles:

Exemple

Une variable aléatoire Z ∼ N (0; 1), quelle est la probabilité pour que Z ≤ 0, 89 ?

On cherche P[Z ≤ 0, 89] = F (0, 89) = 0, 813

Utilisation de la table du formulaire pour F (z) avec z ≥ 0:

S.Herrmann (UBFC) Loi normale 18 / 24

Page 19: La loi normale - Samuel Herrmann, Dijon.herrmann.perso.math.cnrs.fr/stat-seance1-loi-normale-trans.pdf · Pourdénombrertouslescaspossiblesetlescasfavorables,onutilise souvent: lesfactorielles:

Exemple

Une variable aléatoire Z ∼ N (0; 1), quelle est la probabilité pour que Z ≤ 0, 89 ?

On cherche P[Z ≤ 0, 89] = F (0, 89)

Utilisation de la table du formulaire pour F (z) avec z ≥ 0:

F (z) = F (0, 89)

Les deux premiers chiffres 0, 8 déterminent la ligne à considérer dans la table etla seconde décimale ...9 détermine la colonne à considérer.

z . . . . . . 8 9...

......

...0, 8 . . . . . . . . . 0, 81330, 91, 0

F (0, 89) = 0, 8133

S.Herrmann (UBFC) Loi normale 19 / 24

Page 20: La loi normale - Samuel Herrmann, Dijon.herrmann.perso.math.cnrs.fr/stat-seance1-loi-normale-trans.pdf · Pourdénombrertouslescaspossiblesetlescasfavorables,onutilise souvent: lesfactorielles:

Exemple

Une variable aléatoire Z ∼ N (0; 1), quelle est la probabilité pour que Z ≤ −2 ?

On cherche P[Z ≤ −2] = F (−2)= 1− F (2)

Utilisation de la table du formulaire pour F (z) avec z ≥ 0:

F (z) = F (2, 00)

Les deux premiers chiffres 2, 0 déterminent la ligne à considérer dans la table etla seconde décimale ...0 détermine la colonne à considérer.

z 0 1 . . . . . ....

......

...2, 0 0, 97722, 12, 2

F (−2) = 1− F (2) = 1− 0, 9772 ≈ 0, 0228.

S.Herrmann (UBFC) Loi normale 20 / 24

Page 21: La loi normale - Samuel Herrmann, Dijon.herrmann.perso.math.cnrs.fr/stat-seance1-loi-normale-trans.pdf · Pourdénombrertouslescaspossiblesetlescasfavorables,onutilise souvent: lesfactorielles:

Exemple

Une variable aléatoire Z ∼ N (0; 1), quelle est la probabilité pour que−2 ≤ Z ≤ 0, 89 ?

On calcule

P[−2 ≤ Z ≤ 0, 89]= F (0, 89)− F (−2)= F (0, 89)− (1− F (2))= F (0, 89) + F (2)− 1= 0, 8133+ 0, 9772− 1= 0, 7905

Ici F (| − 2|) = F (2). x−2 0, 89

P[−2 ≤ Z ≤ 0, 89]

4Pour a > 0, on peut en déduire aussi que

P[−a ≤ Z ≤ a] = F (a)− F (−a) = F (a)− (1− F (a)) = 2F (a)− 1.

S.Herrmann (UBFC) Loi normale 21 / 24

Page 22: La loi normale - Samuel Herrmann, Dijon.herrmann.perso.math.cnrs.fr/stat-seance1-loi-normale-trans.pdf · Pourdénombrertouslescaspossiblesetlescasfavorables,onutilise souvent: lesfactorielles:

Exemple

Une variable Z ∼ N (0; 1), quelle est la probabilité pour que Z ≤ 1, 516 ?

P[Z ≤ 1, 516] = F (1, 516): pas dans la table de la loi normale centrée réduite !

z 0 1 2 . . . . . . . . ....

......

......

...1, 5 . . . 0, 9345 0, 9357 . . . . . . . . .

1, 61, 7

On peut utiliser une règle de proportionalité (interpolation linéaire) mais onpréfèrera simplement noter que

0, 9345 ≤ F (1, 516) ≤ 0, 9357.

Pour avoir un résultat plus précis, il suffit d’utiliser la calculatrice pour obtenir lavaleur de F (1, 516).

S.Herrmann (UBFC) Loi normale 22 / 24

Page 23: La loi normale - Samuel Herrmann, Dijon.herrmann.perso.math.cnrs.fr/stat-seance1-loi-normale-trans.pdf · Pourdénombrertouslescaspossiblesetlescasfavorables,onutilise souvent: lesfactorielles:

Exemple (Utilisation de lacalculatrice)

Une variable Z ∼ N (0; 1), quelle est laprobabilité pour que 0, 1 ≤ Z ≤ 1, 516 ?

P[0, 1 ≤ Z ≤ 1, 516] = F (1, 516)−F (0, 1)

≈ 0, 3954

Calc. Casio: Dans MENU , choisirSTAT , puis dans DIST , choisirNORM puis Ncd .

Calc. TI: Taper DISTRIB (2ndepuis var), choisir le deuxième item :normalFrép ou normalcdf (cdf :cumulative distribution function).

D.C. NormaleData : VariableLower : 0.1Upper : 1.516σ : 1µ : 0Save Res : NoneExécuter

D.C. NormaleP : 0.39541248z:Low : 0.1z:Up : 1.516

normalcdf(0.1,1.516).39541248

S.Herrmann (UBFC) Loi normale 23 / 24

Page 24: La loi normale - Samuel Herrmann, Dijon.herrmann.perso.math.cnrs.fr/stat-seance1-loi-normale-trans.pdf · Pourdénombrertouslescaspossiblesetlescasfavorables,onutilise souvent: lesfactorielles:

Exemple (Utilisation de la calculatrice)

Une variable Z ∼ N (0; 1), quelle est la probabilité pour que Z ≤ 1, 516 ?

Pour calculer P[Z ≤ 1, 516] = F (1, 516), on transforme d’abord ce calcul en

P[Z ≤ 1, 516] ≈ P[a ≤ Z ≤ 1, 516] = F (1, 516)− F (a)

en prenant a assez petit pour que la valeur de F (a) soit très petite. Il suffit deprendre a = −100 ou même a = −10. On obtient alors des résultats avec uneprécision à 10−9 près...

On tape par exemple sur la TI : normalFrép(-10,1.516) ounormalcdf(-10,1.516)

S.Herrmann (UBFC) Loi normale 24 / 24