S3 – STATISTIQUES INFERENTIELLES – TD et Exercices...

29
S3 – STATISTIQUES INFERENTIELLES – TD et Exercices CORRIGES I. LOIS DISCRETES TD1 : Reconnaître et utiliser une loi hypergéométrique On pioche simultanément 8 lettres dans l'alphabet, puis on les inspecte une par une. Le succès, pour une lettre tirée, est : "c'est une voyelle". La variable aléatoire X donne, à l'issue de l'expérience, le nombre de succès. a. Justifier que X suit une loi hypergéométrique et donner ses paramètres. * L’univers est partitionné en un événement et son contraire (succès = voyelle ; échec = consonne). N = 26, a = 6. * Le tirage des lettres s’effectue sans remise et l’ordre n’importe pas. * Au bout de 8 essais (n = 8), X désigne le nombre de succès. La loi de X est donc H(8 ; 6 ; 26). b. Calculer p(X = 0), p(X = 4), p(X = 8). ( 29 ( 29 ( 29 , ; , ; X X X × × = = = = = 0 8 4 4 6 20 6 20 8 8 26 26 C C C C p 0 0 0806 p 4 0 0465 p 8 C C impossible c. Calculer l'espérance et l'écart type de X , puis interpréter l'espérance. ( 29 ( 29 ( 29 ( 29 ( 29 , ; , , 2 2 N 6 N 6 20 18 E 8 1 846 V 8 1 0225 N 26 N N 1 26 25 V 1 0112 a a a n X n X n X X σ - - × = = × = = × × - = L’espérance montre que le plus probable est d’obtenir deux voyelles en piochant simultanément 8 lettres dans l’alphabet. En moyenne : 1,846 succès par pioche. d. Représenter graphiquement cette loi de probabilité (bâtons)

Transcript of S3 – STATISTIQUES INFERENTIELLES – TD et Exercices...

Page 1: S3 – STATISTIQUES INFERENTIELLES – TD et Exercices ...jff-dut-tc.weebly.com/uploads/1/4/7/9/14799044/s3_-_statinfér... · S3 – STATISTIQUES INFERENTIELLES – TD et Exercices

S3 – STATISTIQUES INFERENTIELLES – TD et Exercices CORRIGES

I. LOIS DISCRETES

TD1 : Reconnaître et utiliser une loi hypergéométrique On pioche simultanément 8 lettres dans l'alphabet, puis on les inspecte une par une.

Le succès, pour une lettre tirée, est : "c'est une voyelle".

La variable aléatoire X donne, à l'issue de l'expérience, le nombre de succès.

a. Justifier que X suit une loi hypergéométrique et donner ses paramètres.

* L’univers est partitionné en un événement et son contraire (succès = voyelle ; échec =

consonne). N = 26, a = 6.

* Le tirage des lettres s’effectue sans remise et l’ordre n’importe pas.

* Au bout de 8 essais (n = 8), X désigne le nombre de succès.

La loi de X est donc H(8 ; 6 ; 26).

b. Calculer p(X = 0), p(X = 4), p(X = 8).

( ) ( ) ( ), ; , ;X X X× ×= = ≈ = = ≈ =

0 8 4 4

6 20 6 20

8 8

26 26

C C C Cp 0 0 0806 p 4 0 0465 p 8

C C impossible

c. Calculer l'espérance et l'écart type de X , puis interpréter l'espérance.

( ) ( ) ( )

( ) ( )

, ; ,

,

2 2

N6 N 6 20 18E 8 1 846 V 8 1 0225

N 26 N N 1 26 25

V 1 0112

a aa nX n X n

X Xσ

− − ×= = × ≈ = = × × ≈−

= ≈

L’espérance montre que le plus probable est d’obtenir deux voyelles en piochant simultanément 8

lettres dans l’alphabet. En moyenne : 1,846 succès par pioche.

d. Représenter graphiquement cette loi de probabilité (bâtons)

Page 2: S3 – STATISTIQUES INFERENTIELLES – TD et Exercices ...jff-dut-tc.weebly.com/uploads/1/4/7/9/14799044/s3_-_statinfér... · S3 – STATISTIQUES INFERENTIELLES – TD et Exercices

TD2 : Reconnaître et utiliser une loi binomiale Une roue de type "roulette" est divisée en 26 secteurs de même taille. 6 secteurs sont blancs et les

autres sont rouges. Après avoir fait tourner la roue, le succès est : "elle s'arrête sur un secteur blanc".

La variable aléatoire X donne, à l'issue de 8 essais d'affilée, le nombre de succès.

a. Justifier que X suit une loi binomiale et donner ses paramètres.

* L’univers est partitionné en un événement et son contraire (succès et échec).

* A chaque essai, la probabilité de succès est invariable : p = 6/26.

* Au bout de 8 essais (n = 8), X désigne le nombre de succès.

La loi de X est donc B(8 ; 6/26).

b. Calculer p(X = 2). Obtenir sur la calculatrice la liste des probabilités de toutes les valeurs de X.

Formulaire : p(X = k) = C p qk k n k

n

−× × ; dans les conditions de l’exercice : =

k k

k

− × ×

8

8

6 20C

26 26 ;

ainsi : p(X = 2) = × × ≈

2 6

2

8

6 20C

26 26 0,3089.

Sur la calculatrice :

On saisit manuellement les valeurs k possibles en List1 : 0, 1, 2, 3, 4, 5, 6, 7, 8

On saisit la formule générale en List2 : 8CList1*(6/26)^List1*(20/26)^(8-List1)

c. Représenter graphiquement cette loi de probabilité (bâtons)

d. Calculer l'espérance et l'écart type de X, puis interpréter ces valeurs.

E(X) = np = 8×6/26 ≈ 1,846 ; σ(X) = npq ≈ 1,192

On s’attend à 1,846 succès, en moyenne, tous les 8 essais.

L’événement « 2 succès » est donc le plus probable.

En ajoutant et en retranchant l’écart type à la moyenne, on construit un intervalle qui englobe les

événements « de loin » les plus probables.

Ici, l’intervalle formé est, en arrondissant, [0,6 ; 3], qui englobe les valeurs 1, 2 et 3.

Dans la grande majorité des cas, nous aurons 1, 2 ou 3 succès en 8 essais.

Page 3: S3 – STATISTIQUES INFERENTIELLES – TD et Exercices ...jff-dut-tc.weebly.com/uploads/1/4/7/9/14799044/s3_-_statinfér... · S3 – STATISTIQUES INFERENTIELLES – TD et Exercices

TD3 : Utiliser une loi de Poisson La loi de la variable aléatoire X est binomiale de paramètres n = 50 et p = 0,06.

a. Calculer (liste calculatrice) p(X = i) pour i entier de 0 à 7.

On saisit manuellement les valeurs i demandées en List1 : 0, 1, 2, 3, 4, 5, 6, 7

On saisit la formule générale en List2 : 50CList1*0,06^List1*0,94^(50-List1)

b. Justifier l'approximation de cette loi par une loi de Poisson dont on déterminera le paramètre.

Donc il existe une loi de Poisson dont les résultats sont proches de la réalité.

λ = np = 3. La loi de Poisson à utiliser est la loi P(3).

c. Donner, à l'aide de la table de la loi de Poisson, les probabilités demandées plus haut.

Comparer à celles obtenues par une loi binomiale.

Dans la table de la loi de Poisson, on peut lire :

On remarque de légers décalages avec les probabilités

trouvées en question a., mais ces deux listes sont similaires.

d. En utilisant la formule page précédente (loi de Poisson), obtenir ces probabilités sur une nouvelle

liste de votre calculatrice.

On saisit la formule générale en List3 : e^(-3)*3^List1÷List1!

Page 4: S3 – STATISTIQUES INFERENTIELLES – TD et Exercices ...jff-dut-tc.weebly.com/uploads/1/4/7/9/14799044/s3_-_statinfér... · S3 – STATISTIQUES INFERENTIELLES – TD et Exercices

Exercice 1

Le rayon fruits d'une enseigne de grande distribution propose 24 espèces de fruits, dont 8 sont de

label bio. Un contrôle consiste à choisir au hasard 10 espèces de fruits. La variable aléatoire X donne

le nombre d'espèces bio sélectionnées, parmi les 10.

1) Donner, en justifiant, la loi de probabilité de X.

Pour une espèce sélectionnée, il y a deux issues : bio (succès) ou pas bio (échec).

On suppose que les dix espèces à sélectionner doivent être différentes, donc nous avons un tirage

sans remise. a = 8, N = 24, n = 10.

X compte les succès au bout de 10 essais. La loi de X est donc H(10 ; 8 ; 24).

2) Calculer l'espérance mathématique et l'écart-type de X.

E(X) = 10×8/24 = 3,333 espèces bio.

V(X) = 10×8/24×16/24×14/23 = 1,3527. σ(X) = 1,163 espèce bio

3) Quelle est la probabilité que moins de deux espèces sélectionnées soient bio ?

p(X < 2) = p(X = 0) + p(X = 1) = 0,0041 + 0,0467 = 0,0508.

Exercice 2

Un automobiliste rencontre sur son trajet 5 feux tricolores à la suite, identiques dans leurs durées :

le feu vert dure 40 secondes, le feu orange/rouge dure 20 secondes.

Malheureusement, ces feux ne sont pas synchronisés, et l'état de l'un n'a aucune influence sur l'état

du suivant.

1) Lorsque l'automobiliste arrive au niveau du premier feu, quelle est la probabilité que celui-ci soit

vert ?

Sur une plage d'une minute, le feu vert dure les deux tiers du temps.

A un instant quelconque indéterminé, le feu a 2 chances sur 3 d'être vert. p = 2/3

2) Déterminer la probabilité pour que, dans son trajet, il ait rencontré tous les feux au vert.

Ici, on répète 5 fois de suite la même expérience.

A chaque fois, la probabilité de succès est p, 2/3.

On désigne par X la variable aléatoire comptant le nombre de succès (feux verts) sur 5 tentatives.

Alors la loi de X est B(5 ; 2/3)

( ) ,5 0 5

5

5

2 1 2p 5 0 1317

3 3 3X C

= = × × = ≈

3) Quelle est la probabilité pour qu'il ait eu un et un seul feu rouge ?

Au moins deux feux rouges ?

( ) ,4 1 4

4

5

2 1 2 1p 4 5 0 3292

3 3 3 3X C

= = × × = × × ≈

( ) ( ) ( ) ,p 3 1 p 5 p 4 0 5391X X X≤ = − = − = ≈

4) A combien de feux verts peut-il s'attendre, en moyenne, à chaque trajet ?

E(X) = np = 5×2/3 = 3,333 feux verts environ, en moyenne.

Page 5: S3 – STATISTIQUES INFERENTIELLES – TD et Exercices ...jff-dut-tc.weebly.com/uploads/1/4/7/9/14799044/s3_-_statinfér... · S3 – STATISTIQUES INFERENTIELLES – TD et Exercices

Exercice 3

Le pouvoir germinatif d'une graine d'une certaine espèce est 0,8 (probabilité de germer).

1) On sème 8 graines. Quelle est la probabilité pour que…

a) 5 graines exactement germent ?

On répète 8 fois la même expérience, dont le succès a pour probabilité p = 0,8.

X sera la v.a. comptant le nombre de graines germées sur les 8 semées.

Alors la loi de X est B(8 ; 0,8).

( ) ( ) ( ), , ,5 35

8p 5 0 8 0 2 0 1468X C= = × × ≈

b) Au moins 7 graines germent ?

( ) ( ) ( ) ( ) ( ), , , , ,7 1 8 07 8

8 8p 7 C 0 8 0 2 C 0 8 0 2 0 5033X ≥ = × × + × × ≈

2) Quand une graine est germée, la probabilité pour que les limaces détruisent le jeune plant est 0,4.

a) Calculer la probabilité pour qu'une graine semée donne un plant bon à repiquer.

Il faut, pour une graine, l'événement "la graine germe ET sachant qu'elle a germé, les limaces

ne le détruisent pas". (on pourrait aussi construire un arbre, dont seule une des branches nous

intéresse ici)

La probabilité cherchée est 0,8×0,6 = 0,48.

b) Combien devra-t-on semer de graines pour que la probabilité d'avoir au moins un plant bon à

repiquer soit supérieure à 0,99 ?

La variable aléatoire Y compte ici les plants bons à repiquer (psuccès = 0,48) parmi n graines

semées. La loi de Y est B(n ; 0,48).

L'événement contraire de celui de la question est plus simple :

Il faut que p(Y = 0) soit inférieure à 0,01.

( ) ( ) ( )

( ) ( )( )

, , , ,

ln ,, ,

ln ,

00p 0 0 01 C 0 48 0 52 0 01

0 011 1 0 52 0 01

0 52

n

n

n

Y

n

= < ⇔ × × <

⇔ × × < ⇔ >

On doit donc avoir n > 7,042, il faut semer au moins 8 graines.

Exercice 4

D'après un sondage, 80 % des acheteurs d'un produit A se déclarent satisfaits.

Sur un groupe de 10 acheteurs du produit, choisis au hasard, quelle est la probabilité que :

a. Tous soient satisfaits ?

La probabilité p qu'un acheteur pris au hasard soit satisfait est 80% = 0,8.

Si on choisit 10 acheteurs, on répète 10 fois l'expérience à l'identique.

Soit X la variable aléatoire comptant le nombre d'acheteurs satisfaits sur les 10,

alors la loi de X est B(10 ; 0,8).

( ) ( ) ( ) ( ), , , ,10 0 1010

10p 10 C 0 8 0 2 0 8 0 1074X = = × × = ≈

b. 80 % soient satisfaits ?

( ) ( ) ( ) ( ) ( ), , , , ,8 2 8 28

10p 8 C 0 8 0 2 45 0 8 0 2 0 3020X = = × × = × × ≈

c. Au moins 80 % soient satisfaits ?

( ) ( ) ( ) ( ) ( ) ( ), , , , ,9 19

10p 8 p 8 p 9 p 10 0 3020 C 0 8 0 2 0 1074 0 6778X X X X≥ = = + = + = = + × × + ≈

Page 6: S3 – STATISTIQUES INFERENTIELLES – TD et Exercices ...jff-dut-tc.weebly.com/uploads/1/4/7/9/14799044/s3_-_statinfér... · S3 – STATISTIQUES INFERENTIELLES – TD et Exercices

Exercice 5

6 % des français sont clients de l'opérateur de téléphonie mobile "MAUVE".

Lors d'un sondage, on interroge 50 français sur leur opérateur de téléphonie mobile. La population

étant très grande, on peut assimiler le choix de ces 50 personnes à un tirage avec remise.

La variable aléatoire X donne le nombre de clients de "MAUVE" parmi ces 50 personnes.

1) a. Donner, en justifiant, la loi de probabilité de X.

Pour chaque personne il y a deux issues : client (p = 0,06) (succès) ou pas client (q = 0,94).

La probabilité de succès est invariable sur les 50 personnes interrogées et X compte le nombre

de succès sur 50 essais. La loi de X est donc B(50 ; 0,06).

b. Quelle est la probabilité que la proportion de 6 % soit respectée à l'issue du sondage ?

6% de 50 personnes = 3 personnes. p(X = 3) = 0,2311

c. Quelle est la particularité de la probabilité trouvée à la question précédente ?

C'est la probabilité la plus forte, car E(X) = 50×0,06 = 3

d. Quelle est la probabilité qu'aucune des 50 personnes ne soit cliente de "MAUVE" ?

p(X = 0) = 0,04533

e. Quelle est la probabilité qu'il y ait au moins 4 clients de "MAUVE" ?

p(X ≥ 4) = 1 - p(X ≤ 3) = 1 - 0,6473 = 0,3527

2) Ici, on ne connaît pas le nombre de personnes que l'on va interroger. Combien de personnes

faudrait-il interroger pour que la probabilité qu'il y ait au moins un client de "MAUVE" dépasse 99 % ?

p(X = 0) < 0,01 ssi 0,94n < 0,01 ssi n > ln(0,01)/ln(0,94) ssi n > 74,43

Il faut interroger au moins 75 personnes.

Exercice 6

Le nombre de micro-ordinateurs vendus chaque jour dans le magasin HIGHTECH suit la loi de Poisson

de paramètre 4. Calculez la probabilité que dans une journée :

a. On ne vende aucun ordinateur

( ) ,p 0 0 01832X = ≈

b. On vende au moins 1 ordinateur

( ) ( ) ,p 1 1 p 0 0 98168X X≥ = − = ≈

c. On vende 2 ordinateurs

( ) ,p 2 0 14653X = ≈

Exercice 7 (Déterminez X, n, p, justifiez la loi de Poisson)

Lors d'un sondage national portant sur un grand nombre d'individus, seulement 2 % des personnes

acceptent de ne pas rester anonymes.

Le sondeur a répété 250 fois la même expérience : choisir au hasard une personne, dans une

population très grande, avec une probabilité de succès (accepte de ne pas rester anonyme) quasi

fixe de 2% = 0,02. La v.a. X compte le nombre de succès au bout de ces 250 essais. Alors la loi de X

est B(250 ; 0,02).

Vérifions les conditions de passage à une loi de Poisson :

n > 30 ? Oui ; p < 0,1 ? Oui ; npq < 10 ? npq = 250×0,02×0,98 = 4,9 < 10

B(250 ; 0,02) peut donc être approximée par P(5).

Page 7: S3 – STATISTIQUES INFERENTIELLES – TD et Exercices ...jff-dut-tc.weebly.com/uploads/1/4/7/9/14799044/s3_-_statinfér... · S3 – STATISTIQUES INFERENTIELLES – TD et Exercices

Sachant que l'un des sondeurs a interrogé 250 personnes, calculez la probabilité que :

a. Ces 250 personnes souhaitent rester anonymes

( ) ,0 0 00674p X = ≈

b. Au moins 5 personnes acceptent de ne pas rester anonymes.

( ) ( ) ( ) ( ) ( ) ( ) ,5 1 0 1 2 3 4 0 5595p X p X p X p X p X p X≥ = − = − = − = − = − = ≈

Exercice 8

Une boîte contient 250 allumettes. Elle a été exposée à l’humidité, si bien que 20% des allumettes

sont inutilisables : elles ne s’allumeront pas.

On choisit au hasard 10 allumettes. Le nombre total (250) étant beaucoup plus grand, on pourra

assimiler ce tirage comme étant avec remise. La variable aléatoire X désigne le nombre de celles qui

s’allumeront, parmi les 10.

1. Montrer que la loi de X est binomiale et donner ses paramètres et son espérance.

Lorsqu'une allumette est choisie, le succès (elle s'allume) a pour probabilité p = 0,8 (et q = 0,2).

On tire avec remise n = 10 allumettes et X compte le nombre k de succès parmi les 10.

La loi de X est donc B(10 ; 0,8). E(X) = np = 8.

2. Calculer la probabilité des événements suivants :

a. Aucune ne s’allume

( ) , , ,0 0 10 10 7

100 0 8 0 2 0 2 10p X C−= = × × = ≈

b. Toutes s’allument

( ) , , , ,10 10 0 10

1010 0 8 0 2 0 8 0 1074p X C= = × × = ≈

c. Au moins trois ne s’allument pas

( ) ( ) ( ) ( ) ( ), , , ,

8 1 7 1 8 9 10

1 0 3020 0 2684 0 1074 0 3222

p X p X p X p X p X< = − > = − = − = − == − − − ≈

3. a. Déterminer les probabilités ci-dessus en se basant sur une loi de Poisson de paramètre λ bien

choisi.

λ = E(X) = 8

p(X = 0) = 0,00034

p(X = 10) = 0,09926 et p(X < 8) = p(X = 0) + p(X = 1) + ... + p(X = 7) = 0,45296

b. Expliquer les différences observées entre les résultats des questions 2. et 3.a.

La loi de Poisson est plutôt inexacte, car les conditions d'approximation de la loi binomiale vers

une loi de Poisson ne sont pas respectées :

il faut n > 30, or n = 10, il faut p < 0,1, or p = 0,8…

Par contre, npq < 10 est respectée, car npq = 1,6.

Page 8: S3 – STATISTIQUES INFERENTIELLES – TD et Exercices ...jff-dut-tc.weebly.com/uploads/1/4/7/9/14799044/s3_-_statinfér... · S3 – STATISTIQUES INFERENTIELLES – TD et Exercices

Exercice 9

Dans une population très nombreuse, on rencontre en moyenne 0,4 % de non-voyants.

1) Dans un échantillon de 100 personnes, quelle est la probabilité de n'avoir aucun non-voyant ?

Qu'il y en ait au moins 2 ?

On répète 100 fois la même expérience : choisir un individu au hasard avec une probabilité

p = 0,4% = 0,004 qu'il soit non-voyant (succès).

La population étant très grande, on considère que p est invariable, ce qui signifie que le tirage est

assimilé "avec remise" et qui nous autorise une loi binomiale.

Soit X la v.a. qui compte le nombre de non-voyants sur les 100 personnes.

La loi de X est B(100 ; 0,004).

( ) ( ) ( ) ( ), , , ,0 100 1000

1000 0 004 0 996 0 996 0 6698p X C= = × × = ≈

( ) ( ) ( ) ( ) ( ), , , ,1 991

1002 1 0 1 1 0 6698 0 004 0 996 0 06123p X p X p X C≥ = − = − = = − − × × ≈

2) Répondre à ces questions en justifiant puis utilisant la loi de Poisson appropriée.

n > 30 ; p < 0,1 ; npq = 0,3984 < 10. Donc B(100 ; 0,004) est à peu près P(0,4)

D'après la table de la loi de Poisson (λ = 0,4) :

( ) ,0 0 6703p X = ≈

( ) ( ) ( ) , , ,2 1 0 1 1 0 67032 0 26813 0 06155p X p X p X≥ = − = − = = − − ≈

Ces résultats, légèrement faussés, sont tout de même très proches de la réalité (binomiale).

Page 9: S3 – STATISTIQUES INFERENTIELLES – TD et Exercices ...jff-dut-tc.weebly.com/uploads/1/4/7/9/14799044/s3_-_statinfér... · S3 – STATISTIQUES INFERENTIELLES – TD et Exercices

S3 – STATISTIQUES INFERENTIELLES – CORRIGES des EXERCICES

II. LOI NORMALE

TD5 : Lecture de la table de la loi normale centrée réduite en vert : ce qui est directement lisible dans la table du formulaire

« = » en rouge : on retourne le problème : p(U > -) = p(U < +) ou p(U < -) = p(U > +)

p(U < 1) = 0,8413

p(U < 1,96) = 0,9750

p(U < 2,58) = 0,9951

p(U > 1) = 1 - p(U < 1) = 1 - 0,8413 = 0,1587

p(U > 1,63) = 1 - p(U < 1,63) = 1 - 0,9484 = 0,0516

p(U > 0,35) = 1 - p(U < 0,35) = 1 - 0,6368 = 0,3632

p(1 < U < 2) = p(U < 2) – p(U < 1) = 0,9772 - 0,8413 = 0,1359

p(0,42 < U < 1,07) = p(U < 1,07) – p(U < 0,42) = 0,8577 - 0,6628 = 0,1949

p(U < -1) = p(U > 1) = 1 - p(U < 1) = 1 - 0,8413 = 0,1587

p(U < -0,88) = p(U > 0,88) = 1 - p(U < 0,88) = 1 - 0,8106 = 0,1894

p(U > -0,5) = p(U < 0,5) = 0,6915

p(U > -2,23) = p(U < 2,23) = 0,9871

p(-1,85 < U < -1,07) = p(1,07 < U < 1,85) = p(U < 1,85) – p(U < 1,07) = 0,1101

p(-1,12 < U < 0,6) = p(U < 0,6) – p(U < -1,12) = p(U < 0,6) – p(U > 1,12)

= p(U < 0,6) – (1 - p(U < 1,12)) = 0,5943

TD6 : Calculs de probabilités dans le cas général Déterminer les probabilités demandées, dans les lois normales données :

1. loi de X : N(50 , 10). Calculer p(X < 60), p(X < 43), p(45 < X < 55)

p(X < 60) = p(U < 60 50

10

−) = p(U < 1) = 0,8413

p(X < 43) = p(U < 43 50

10

−) = p(U < -0,7) = 1 – p(U < 0,7) = 0,2420

p(45 < X < 55) = p(45 50

10

− < U <

55 50

10

−) = p(-0,5 < U < 0,5)

= p(U < 0,5) – p(U < -0,5) = p(U < 0,5) – (1 - p(U < 0,5)) = 0,3830

2. loi de X : N(3 , 0,45). Calculer p(X > 4), p(X < 2,55), p(3,2 < X < 3,7)

p(X > 4) = p(U > ,

4 3

0 45

−) = p(U > 2,22) = 1 - p(U < 2,22) = 0,0132

p(X < 2,55) = p(U < ,

,

2 55 3

0 45

−) = p(U < -1) = 1 – p(U < 1) = 0,1587

p(3,2 < X < 3,7) = p(,

,

3 2 3

0 45

− < U <

,

,

3 7 3

0 45

−) = p(0,44 < U < 1,56)

= p(U < 1,56) – p(U < 0,44) = 0,9406 – 0,6700 = 0,2706

Page 10: S3 – STATISTIQUES INFERENTIELLES – TD et Exercices ...jff-dut-tc.weebly.com/uploads/1/4/7/9/14799044/s3_-_statinfér... · S3 – STATISTIQUES INFERENTIELLES – TD et Exercices

TD7 : Passage de lois discrètes à une loi normale Justifiez le passage à une loi normale, puis calculez les probabilités :

1. 30 % des PME d'une région exportent. Si on choisit 80 PME au hasard, quelle est la

probabilité que plus de 30 exportent ?

* On choisit une entreprise : elle exporte (succès, p = 0,3) ou non (échec, q = 0,7).

* p est invariable d’une entreprise à une autre, car on imagine que le nombre total

d’entreprises du secteur est très grand et qu’interdire la répétition ne modifie que très peu

la proportion d’entreprises qui exportent, au fur et à mesure du choix de 80 d’entre elles.

* X est le nombre d’entreprises qui exportent, sur un choix aléatoire de 80 entreprises.

La loi de X est donc : B(80 ; 0,3).

* n > 30 ? OUI, n = 80

* npq > 5 ? OUI, npq = 16,8

Donc : B(80 ; 0,3) ≈ N(24 ; 4,1)

p(X > 30) = p(U > ,

30 24

4 1

−) = p(U > 1,46) = 1 – p(U < 1,46) = 0,0721

Quelle est la probabilité que 30 exportent ?

Pour la probabilité d’une valeur ponctuelle, on aura tendance à utiliser directement la loi

binomiale : p(X = 30) = , ,30 30 50

80C 0 3 0 7× × ≈ 0,03285.

Il existe aussi un moyen d’utiliser la loi normale :

p(X = 30) = p(29,5 < X < 30,5) = p(,

,

29 5 24

4 1

− < U <

,

,

30 5 24

4 1

−) = p(1,34 < U < 1,585)

= p(U < 1,585) – p(U < 1,34) = 0,9435 – 0,9099 = 0,0336

2. Le nombre d'articles vendus journellement est distribué suivant une loi de Poisson de

paramètre 25. Quelle est la probabilité, un jour donné, que moins de 20 articles soient vendus ?

La loi de X est : P(25)

* λ > 20 ? OUI, λ = 25

Donc : P(25) ≈ N(25 ; 5)

p(X < 20) = p(U < 20 25

5

−) = p(U < -1) = 1 – p(U < 1) = 0,1587

Page 11: S3 – STATISTIQUES INFERENTIELLES – TD et Exercices ...jff-dut-tc.weebly.com/uploads/1/4/7/9/14799044/s3_-_statinfér... · S3 – STATISTIQUES INFERENTIELLES – TD et Exercices

Exercice 10 (avec solutions)

La variable X “masse (kg) d’un nouveau-né” est distribuée selon la loi N(3,1 ; 0,5).

1. Quelle est la probabilité qu’un nouveau-né pèse plus de 4 kg ?

changement de variable : U = (X – 3,1)/0,5 est distribuée selon la loi N(0 ; 1).

Avec x = 4 : u = (4 – 3,1)/0,5 = 1,8 ; table : F(1,8) = p(U < 1,8) = 0,9641.

réponse : p(X > 4 kg) = p(U > 1,8) = 1 – 0,9641 = 0,0359.

2. Quelle est la probabilité qu’un nouveau-né pèse moins de 3 kg ?

changement de variable : U = (X – 3,1)/0,5 est distribuée selon la loi N(0 ; 1).

Avec x = 3 : u = (3 – 3,1)/0,5 = -0,2 ; table : F(0,2) = p(U < 0,2) = 0,5793.

réponse : p(X < 3 kg) = p(U < -0,2) = 1 - p(U < 0,2) = 1 – 0,5793 = 0,4207.

3. Quelle est la probabilité qu’un nouveau-né pèse entre 3 et 4 kg ?

formule de l’intervalle : p(a < X < b) = p(X < b) – p(X < a).

réponse : p(3 < X < 4) = p(X < 4) – p(X < 3) = 0,9641 – 0,4207 = 0,5434.

Exercice 11

1. La variable U est distribuée selon la loi N(0 ; 1).

a. Calculer :

* p(U < 0,86) = 0,8051 * p(U > 1,96) = 1 – 0,975 = 0,025

* p(U > -1,39) = p(U < 1,39) = 0,9177

* p(-0,63 < U < 0,63) = p(U < 0,63) – p(U < -0,63) = p(U < 0,63) – (1 - p(U < 0,63))

= 2p(U < 0,63) – 1 = 0,4714

b. Donner la valeur u0 telle que :

* p(U < u0) = 0,8944 : u0 = 1,25 (table)

* p(-u0 < U < u0) = 0,98 ⇔ 2p(U < u0) – 1 = 0,98 ⇔ p(U < u0) = 0,99 ⇔ u0 = 2,33

2. La variable X est distribuée selon la loi N(25 ; 7).

a. Calculer :

* p(X > 35,5) = p(U > , −35 5 25

7) = p(U > 1,5) = 1 – p(U < 1,5) = 1 – 0,9332 = 0,0668

* p(X < 18) = p(U < 18 25

7

−) = p(U < -1) = 1 – p(U < 1) = 1 – 0,8413 = 0,1587

b. Donner la valeur x0 telle que : p(X > x0) = 0,0516

p(U > u0) = 0,0516 ⇔ p(U < u0) = 0,9484 ⇔ u0 =1,63

0 25

7

x − = 1,63 ⇔ x0 = 25 + 1,63×7 = 36,41

Page 12: S3 – STATISTIQUES INFERENTIELLES – TD et Exercices ...jff-dut-tc.weebly.com/uploads/1/4/7/9/14799044/s3_-_statinfér... · S3 – STATISTIQUES INFERENTIELLES – TD et Exercices

Exercice 12

Une société fabrique des gyrophares pour tous types d’engins, en grandes quantités.

La probabilité qu’un gyrophare soit défectueux est p = 0,04.

Au cours de la production, on prélève un échantillon aléatoire de 600 gyrophares. X est la variable

aléatoire qui donne le nombre de gyrophares défectueux parmi ces 600.

1. Montrer que la distribution de la variable X est binomiale et donner ses paramètres.

Chaque gyrophare est soit défectueux (succès), soit non, avec une probabilité de succès

invariable : p = 0,04. La variable X est le nombre de succès parmi 600 articles.

Donc, la loi de X est B(600 ; 0,04).

2. Montrer qu’on peut approximer cette loi par une loi normale.

n > 30 (600) et npq > 5 (23,04), donc une loi normale approche correctement cette loi

binomiale.

3. Déterminer µ et σ, moyenne et écart type de la variable X selon cette loi normale.

np = 24 et pqn = 4,8. La loi normale est N(24 ; 4,8).

4. Calculer alors, avec la precision premise par la table, la probabilité d’avoir au moins 27

gyrophares défectueux parmi les 600.

p(X > 27) = p(U > ,

−27 24

4 8) = p(U > 0.625) = 1 – 0,734 = 0,266

Exercice 13

Un agent commercial doit faire du démarchage par téléphone. En moyenne, un appel sur cinq

conduit à une commande.

1. Soit X la variable aléatoire “nombre de commandes passes après 60 appels”.

a. Donner le nom et les paramètres de la loi de probabilité de X.

Un appel se conclut par une commande (succès) ou pas. La probabilité de succès,

invariable, est p = 1/5 = 0,2. Donc, la loi de X est binomiale : B(60 ; 0,2).

b. Justifier que cette loi peut être approximée par une loi normale, dont on donnera

les paramètres.

n > 30 (60) et npq > 5 (9,6), donc nous pouvons utiliser une loi normale à la place de la

loi binomiale. np = 12 et pqn = 3,098. La loi normale est N(12 ; 3,098).

c. En utilisant cette loi normale, calculer les probabilities suivantes :

* p(X > 15) = p(U > ,

−15 12

3 098) = p(U > 0,97) = 1 – 0,8340 = 0,1660

* p(X < 10) = p(U < ,

−10 12

3 098) = p(U < -0,65) = 1 – 0,7422 = 0,2578

* p(X = 12) peut être calculée avec la loi normale ou avec la loi binomiale.

N(12 ; 3,098) : p(X = 12) = p(11,5 < X < 12,5) = p(-0,16 < U < 0,16) = 0,1272

B(60 ; 0,2) : p(X = 12) = , ,12 12 48

60C 0 2 0 8 = 0,1278

Page 13: S3 – STATISTIQUES INFERENTIELLES – TD et Exercices ...jff-dut-tc.weebly.com/uploads/1/4/7/9/14799044/s3_-_statinfér... · S3 – STATISTIQUES INFERENTIELLES – TD et Exercices

2. Quel est le nombre minimal d’appels qu’on doit passer pour avoir au moins 75% de

chances d’obtenir au moins 15 commandes ?

Avec n appels, la loi de X est B(n ; 0,2), approximée par N(0,2n ; , ,n× ×0 2 0 8 ), c’est à

dire N(0,2n ; 0,4 n ). Le changement de variable, entre X et U, est :

U = ,

,

n

n

−X 0 2

0 4.

D’un autre côté, la table de la loi normale centrée réduite nous informe que u0 doit être

inférieur à -0,68 pour que p(U > u0) dépasse 75%.

Nous devons donc avoir ,

,0 0 2

0 4

x n

n

− < -0,68 ⇔ 0,2n – 0,272 n – 15 > 0.

On peut tester quelques valeurs de n, ou résoudre cette équation (on pose n = N², et on

résoud 0,2N² - 0,272N – 15 > 0).

On trouve que n doit être supérieur à 87,73 :

Il faut passer 88 appels pour avoir 75% de chances d’obtenir au moins 15 commandes.

Exercice 14

On suppose qu’en moyenne on se fait contrôler une fois tous les 20 voyages en bus.

M.A fait 800 voyages par an.

1. Quelle est la probabilité que M.A. soit contrôlé entre 30 et 50 fois dans l’année ?

Chaque voyage conduit à un contrôle (succès, probabilité invariable : p = 1/20 = 0,05) ou non.

Soit X le nombre aléatoire de contrôles durant 800 trajets. La loi de X est B(800 ; 0,05).

n > 30 (800) et npq > 5 (38), donc nous sommes en droit d’utiliser une loi normale à la

place de la loi binomiale. np = 40 et pqn = 6,164. La loi normale est N(40 ; 6,164).

p(30 < X < 50) = p(-1,62 < U < 1,62) = 2×0,9474 – 1 = 0,8948

2. M.A voyage toujours sans billet. L’abonnement annuel serait 320 €.

A combien la compagnie doit-elle fixer l’amende pour qu’au moins 75% des fraudeurs aient

meilleur compte de prendre un abonnement ? 99% ?

75% : Cherchons le nombre de contrôles x0 que l’on a 75% de chances de dépasser :

p(U > u0) = 0,75 donne u0 = -0,675 et, par changement de variable : x0 = 35,84.

75% des gens seront contrôlés au moins 35 fois.

Donc, 35 amendes doivent coûter plus cher que l’abonnement (320 €), soit une amende de

9,15 €.

99% : Cherchons le nombre de contrôles x0 que l’on a 99% de chances de dépasser :

p(U > u0) = 0,99 donne u0 = -2,33 et, par changement de variable : x0 = 25,66.

99% des gens seront contrôlés au moins 25 fois.

Donc, 25 amendes doivent coûter plus cher que l’abonnement (320 €), soit une amende de

12,80 €.

Page 14: S3 – STATISTIQUES INFERENTIELLES – TD et Exercices ...jff-dut-tc.weebly.com/uploads/1/4/7/9/14799044/s3_-_statinfér... · S3 – STATISTIQUES INFERENTIELLES – TD et Exercices

S3 – STATISTIQUES INFERENTIELLES – CORRIGES des EXERCICES

III. ECHANTILLONNAGE

TD8 : Distributions d'échantillonnages

1. Dans une population normale de moyenne 120 et d’écart type 40,

on prélève des EAS de tailles n = 10 et n = 50.

a. Quelle loi suit la distribution d'échantillonnage des moyennes des échantillons de taille 10 ? 50 ?

Soit X la variable « valeur d’un individu quelconque dans la population », de loi N(120 ; 40).

La variable X désigne donc la valeur moyenne d’un échantillon quelconque de n individus.

En EAS, la loi de X est N(120 ; 40

n).

Pour n = 10 : N(120 ; 12,65) et pour n = 50 : N(120 ; 5,657).

b. Représenter schématiquement ces deux distributions de moyennes sur un même graphique.

(la plus étalée est celle dont l’écart type est le plus grand)

c. Quelle est la probabilité pour qu'un échantillon de taille 10 ait une moyenne supérieure à 130 ?

p( X > 130) = p(U > ,

130 120

12 65

−) = p(U > 0,79) = 1 – p(U < 0,79) = 1 - 0,7852 = 0,2148

d. Même question pour un échantillon de taille 50.

p( X > 130) = p(U > ,

130 120

5 657

−) = p(U > 1,77) = 1 – p(U < 1,77) = 1 – 0,9616 = 0,0384

Page 15: S3 – STATISTIQUES INFERENTIELLES – TD et Exercices ...jff-dut-tc.weebly.com/uploads/1/4/7/9/14799044/s3_-_statinfér... · S3 – STATISTIQUES INFERENTIELLES – TD et Exercices

2. Dans la population mondiale, on a compté environ 3,38 milliards de femmes contre 3,12

milliards d'hommes. P est la v.a. donnant la proportion de femmes dans les échantillons de taille

100 personnes.

a. Quelle est la loi de probabilité de P ?

La proportion de femmes dans le monde était alors : ,

,,

3 380 52

6 5π = = .

Considérant que l’on est en EAS (manifestement, la population est plus de 20 fois plus

grande que l’échantillon), la loi de P est :

( ) ( ), ,, , ; , ; ,

1 0 52 0 480 52 0 52 0 04996

100n

π ππ − × = =

N N N .

(on attend majoritairement des échantillons contenant 52% de femmes, plus ou moins 5%)

b. Quelle est la probabilité que dans un échantillon de 100 personnes il y ait plus d'hommes que

de femmes ?

Cette situation signifie P < 0,5.

p(P < 0,5) = p(U < , ,

,

0 5 0 52

0 04996

−) = p(U < -0,40) = 1 – p(U < 0,40) = 1 – 0,6554 = 0,3446.

Il y a 34,46% de chances que notre échantillon contienne plus d’hommes que de femmes.

Exercice 15

Dans une chaîne de fabrication d’ampoules électriques, on admet que la durée

de vie d’une ampoule est une variable aléatoire normale de moyenne 900

heures et d’écart type 80 heures.

Calculer la probabilité pour que dans un échantillon aléatoire simple de 100

ampoules la durée de vie moyenne des ampoules dépasse 910 heures.

Soit X la variable "durée de vie d'une ampoule", de loi N(900 ; 80).

X désignera donc la "durée de vie moyenne d'un échantillon de 100 ampoules" et sa loi est

N(900 ; 80/√100) = N(900 ; 8).

p( X > 910) = p(U > (910-900)/8) = p(U > 1,25) = 1 - p(U < 1,25) = 1 - 0,8944 = 0,1056

Exercice 16

Un candidat a obtenu 55 % des suffrages exprimés à une élection.

1) Quelle est la probabilité d'avoir, dans un échantillon de 100 personnes, moins de 50 % de voix ?

La proportion de personnes ayant voté pour le candidat, dans les échantillons de taille 100,

est une variable aléatoire réelle P dont la loi est N (0,55 ; √(0,55×0,45/100)) = N (0,55 ; 0,04975)

p(P < 0,5) = p(U < (0,5-0,55)/0,04975) = p(U < -1,005) = 1 - 0,8425 = 0,1575

Page 16: S3 – STATISTIQUES INFERENTIELLES – TD et Exercices ...jff-dut-tc.weebly.com/uploads/1/4/7/9/14799044/s3_-_statinfér... · S3 – STATISTIQUES INFERENTIELLES – TD et Exercices

2) Même question pour un échantillon de 2000 personnes.

Ici, la loi de P est N (0,55 ; 0,01112)

p(P < 0,5) = p(U < -0,05/0,01112) = p(U < -4,5) < 0,0001

3) Combien de personnes faut-il interroger pour que la probabilité que moins de 50 % d'entre elles

aient voté pour lui passe en-dessous de 1 % ?

Reprenons le raisonnement dans le sens contraire :

p(U < -u0) < 0,01 signifie que p(U > u0) < 0,01, donc que p(U < u0) > 0,99 ce qui est vrai lorsque u0

vaut au moins 2,33.

Le changement de variable entre P et U est , ,

PU

n

π−=×0 55 0 45

.

Il faut donc que , , , , , ,

,, ,, ,

P

n n

n

π− − × × < − ⇔ > ⇔ > −×

2

0 05 0 55 0 45 0 05 0 55 0 452 33

2 33 2 330 55 0 45

, ,, , ,

, , , ,

nn

> ⇔ > × × ≈ ×

2 2

2 33 2 330 55 0 45 537 46

0 05 0 55 0 45 0 05

Il faut interroger au moins 538 personnes pour que la probabilité que moins de 50% d'entre

elles aient voté pour ce candidat passe en-dessous de 1%.

Exercice 17

Dans une région, pendant la période estivale, on admet que le nombre de touristes présents dans

une journée suit une loi normale de moyenne 50 000 et d'écart-type 8 000.

1) La préfecture estime que le tourisme est "gérable" (accueil, environnement, nuisances, …)

lorsque la probabilité d'accueillir moins de 55 000 personnes dans une journée dépasse 70 %. Est-

ce le cas ?

p(X < 55000) = p(U < (55000-50000)/8000) = p(U < 0,625) = 0,734

Cette probabilité est donc supérieure à 70%.

2) Elle souhaite réfléchir sur la base d'échantillons de 10 journées de vacances.

a) Quelle loi suit la variable X : "nombre moyen journalier de vacanciers dans un échantillon de 10

jours" ?

X a pour loi N(50000 ; 8000/√10) = N(50000 ; 2530)

b) Quelle est la probabilité que, dans un tel échantillon, le nombre journalier moyen de vacanciers

soit inférieur à 55 000 ?

p( X < 55000) = p(U < (55000-50000)/2530) = p(U < 1,98) = 0,9761

Page 17: S3 – STATISTIQUES INFERENTIELLES – TD et Exercices ...jff-dut-tc.weebly.com/uploads/1/4/7/9/14799044/s3_-_statinfér... · S3 – STATISTIQUES INFERENTIELLES – TD et Exercices

Exercice 19

Une population, contenant de nombreux individus, passe un test de Q.I. Les résultats forment une

variable aléatoire X normale de moyenne m = 102 et d’écart type s = 15.

1) Quelle est la probabilité pour qu'un individu pris au hasard ait un QI inférieur à 100 ?

p(X < 100) = p(U < -2/15) = p(U < -0,13) = 1 - p(U < 0,13) = 1 - 0,5517 = 0,4483

2) On veut analyser les résultats de quelques échantillons de cette population. Pour cela, on

formera des groupes de 20 individus, choisis par échantillonnage aléatoire simple (EAS), et on

calculera le QI moyen de chaque groupe.

a. Donner les paramètres de la loi normale selon laquelle se distribuent les QI moyens de tous

les échantillons possibles de taille 20.

moy : 102 ; écart type : 15/√20 = 3,354

b. Quelle est la probabilité pour que notre groupe sélectionné ait un QI moyen inférieur à 100 ?

p( X < 100) = p(U < -2/3,354) = p(U < -0,60) = 1 - p(U < 0,60) = 1 - 0,7257 = 0,2743

c. Au lieu de 20, combien d'individus faudrait-il choisir au hasard pour avoir moins de 5% de

risque que le QI moyen de ce nouveau groupe soit en-dessous de 100 ?

prob < 0,05 ssi p(U < u) > 0,95 avec u positif et valant 2/(15/√n) = 2√n /15 ssi u ≥ 1,65 (1,645

valable) ssi √n > 1,65×15/2 ssi n > 153,1. Il faut choisir au moins 154 personnes.

3) a. En regard du résultat de la question 1, quelle est la proportion d'individus de la population

dont le QI est inférieur à 100 ?

Sur la population, π = 0,4483.

b. Quelle est la probabilité pour que sur un groupe de 20 personnes cette proportion dépasse

50 % ?

La variable P, proportion d'individus de QI < 100 dans un échantillon de 20 personnes, a pour

loi N ( )

,n

π ππ −

1= N (0,4483 ; 0,1112)

p(P > 0,5) = p(U > (0,5-0,4483)/0,1112) = p(U > 0,465) = 1 - 0,679 = 0,321

autre valeur de u acceptée : 0,46 qui donne 1 - 0,6772 = 0,3228

Page 18: S3 – STATISTIQUES INFERENTIELLES – TD et Exercices ...jff-dut-tc.weebly.com/uploads/1/4/7/9/14799044/s3_-_statinfér... · S3 – STATISTIQUES INFERENTIELLES – TD et Exercices

S3 – STATISTIQUES INFERENTIELLES – CORRIGES des EXERCICES

IV. ESTIMATION

TD9 : Estimations ponctuelles et intervalles de confiance

Un échantillon d'entreprises d'un secteur a donné la série statistique suivante :

chiffre d'affaires (M€) [0 ; 2[ [2 ; 3[ [3 ; 4[ [4 ; 5[ [5 ; 7[

effectifs 6 12 17 10 5

a. Donner une estimation ponctuelle du CA moyen et de l'écart type du CA de l'ensemble des

entreprises de ce secteur.

estimation de µ : ˆ xµ = ≈ 3,41 M€ ; estimation de σ : ˆn

sn

σ = ≈−1

1,358 M€

b. Donner une estimation de leur CA moyen par intervalle de confiance, au niveau de confiance de

95 %.

σ est supposé inconnu ; on fait donc intervenir une loi de Student.

ddl = n – 1 = 49 ; confiance : 95%, donc α = 0,05 ; ainsi : t = 2,010 (table de la loi de Student)

, ,; , , ; , ,

s sI x t x t

n nα

= − + = − × + × − −

1 3442 1 34423 41 2 01 3 41 2 01

7 71 1

= [3,024 ; 3,796] (M€).

c. Donner une estimation ponctuelle de la proportion d'entreprises dont le CA dépasse 4,5 M€.

D’après le tableau, 10 entreprises ont un CA dépassant 4,5 M€,

soit une proportion de l’échantillon : p = 10/50 = 0,2.

Estimation ponctuelle de π : ˆ ,pπ = = 0 2

d. Donner une estimation de cette proportion par intervalle de confiance au seuil de risque de 1 %.

On se servira de ( ) ( )

;p p p p

I p u p un n

α

− −= − +

1 1.

loi N(0, 1) ; confiance : 99%, soit risque α = 0,01 et donc on cherche u tel que p(U < u) = 0,995 :

u = 2,58.

( ) ( ), , , ,, , ; , ,Iα

− −= − +

0 2 1 0 2 0 2 1 0 20 2 2 58 0 2 2 58

50 50 = [0,054 ; 0,3459] = [5,4% ; 34,59%].

Page 19: S3 – STATISTIQUES INFERENTIELLES – TD et Exercices ...jff-dut-tc.weebly.com/uploads/1/4/7/9/14799044/s3_-_statinfér... · S3 – STATISTIQUES INFERENTIELLES – TD et Exercices

Exercice 20

On a pesé le raisin sur 10 souches prises au hasard dans une vigne et on a obtenu les

résultats suivants en kilogrammes : 2,4 ; 3,2 ; 3,6 ; 4,1 ; 4,3 ; 4,7 ; 5,3 ; 5,4 ; 6,5 ; 6,9.

1. Calculer la masse moyenne et l’écart type de cet échantillon.

La moyenne de la série est 4,64 kg et son écart type 1,348 kg.

(calculatrice : mode stat, 1 variable)

2. Estimer la variance de la population dont ont été extraites ces souches.

� , ,n

sn

σ = = × =−

22 210

1 348 2 0191 9

3. Donner un intervalle de confiance de la moyenne de la population au risque de 0,05.

L'écart type de la population étant inconnu, la loi de référence sera celle de Student :

La loi de la variable T = X

S

n

µ−

−1

est la loi de Student à 9 degrés de liberté.

L'intervalle de confiance de µ au seuil de 5% est :

, ;s s

I x t x tn n

= − + − − 0 05

1 1 où t = 2,262 (ddl = 9 et α = 0,05)

[ ],

, ,, , ; , , , ; ,I

= − × + × = 0 05

1 348 1 3484 64 2 262 4 64 2 262 3 624 5 656

3 3

4. Calculer le nombre minimum de souches qu’il aurait fallu étudier pour que cet intervalle ait une

amplitude de 1 kg en supposant que la variance estimée est bien celle de la population.

L'hypothèse que la variance estimée (2,019) est bien celle de la population nous permet de

construire un intervalle de confiance sur la base d'une loi normale :

;I x u x un n

ασ σ = − +

dont u

n

σ est la demi-amplitude.

On nous impose donc : un

σ = 0,5.

Or u = 1,96 car α = 5%, et , ,σ = ≈2 019 1 421 kg par hypothèse.

un

σ = 0,5 donne ,n ≈ 5 57 et n = 31,02

Il faut donc un échantillon d'au moins 31 souches pour que l'amplitude de l'intervalle de

confiance devienne inférieure à 1 kg.

Exercice 21

Un laboratoire souhaite analyser l'état de contamination des arbres par les pluies acides dans un

territoire donné. Pour cela, un échantillon de 100 arbres a été examiné : 8 arbres sont touchés.

Donner une estimation de la proportion π d'arbres touchés dans la population de ce territoire, par

intervalle de confiance au seuil de risque de 10 %.

La proportion p relevée dans l'échantillon est 0,08.

L'intervalle de confiance de π, proportion de la population, au seuil de 10% est :

[ ], , , ,, , ; , , , ; ,

× ×− + =

0 08 0 92 0 08 0 920 08 1 645 0 08 1 645 0 03537 0 1246

100 100.

Page 20: S3 – STATISTIQUES INFERENTIELLES – TD et Exercices ...jff-dut-tc.weebly.com/uploads/1/4/7/9/14799044/s3_-_statinfér... · S3 – STATISTIQUES INFERENTIELLES – TD et Exercices

Exercice 22

Dans la gestion d’un silo à blé, on s’interroge sur le stock de sécurité à prévoir pour « être sûr » à

99 % de pouvoir satisfaire le client à tout moment. Pour cela, pendant 15 semaines, on observe la

consommation hebdomadaire de blé (en tonnes) c’est à dire la quantité de blé retirée du silo

chaque semaine. On obtient les résultats suivants :

Consommation en tonnes 4,6 4,7 4,8 4,9 5 5,1 5,2 5,3

Effectifs (nombre de semaines) 1 0 2 3 5 2 1 1

1) Déterminer la moyenne x et l’écart type s de cette série.

x = 4,973 et s = 0,1652 , en tonnes

2) Soit X la variable aléatoire qui, à une semaine passée ou future, associe la consommation de blé

(en tonnes) cette semaine-là. On suppose que la loi de X est normale N (µ, σ).

a. Déduire de la question 1) l'estimation ponctuelle de µ et celle de σ.

Estimations : ˆ ,x tµ = = 4 973 et ˆ , ,n

s tn

σ = ≈ ≈−

150 1652 0 1710

1 14

b. Dans la loi normale munie des deux paramètres trouvés en question 2)a., quelle valeur de X a-t-

on 99% de chances de ne pas dépasser ? Conclure sur la question générale de l'énoncé.

Pour la loi N (0 ; 1), p(U < 2,33) = 0,9901.

Valeur de X correspondant à u = 2,33 : x = 2,33σ + µ = 5,371

On peut estimer en première approche qu'avec un stock de secours hebdomadaire de 5,371

tonnes on pourra satisfaire la clientèle dans 99% des cas.

3) a. En utilisant l’échantillon de 15 semaines, déterminer une estimation de µ par un intervalle de

confiance à 99%. (on considérera, et c'est le cas, que σ est inconnue)

σ étant inconnu, on utilise la variable X

TS

n

µ−=

−1

décrite par la loi de Student à 14 ddl.

L'intervalle cherché est :

I = [4,973 - 2,977×0,1652/√(14) ; 4,973 + 2,977×0,1652/√(14)] = [4,842 ; 5,104]

b. Quelle est la probabilité que m soit supérieure à la borne supérieure de cet intervalle ?

p(µ > 5,104) = 0,5%

Page 21: S3 – STATISTIQUES INFERENTIELLES – TD et Exercices ...jff-dut-tc.weebly.com/uploads/1/4/7/9/14799044/s3_-_statinfér... · S3 – STATISTIQUES INFERENTIELLES – TD et Exercices

Exercice 23

Une entreprise veut se spécialiser dans la livraison de colis volumineux. Elle fait un état de ceux

qu'elle a déjà eu l'occasion de transporter et le considère comme un échantillon représentatif de

l'ensemble des colis futurs.

série statistique des colis déjà transportés :

volume en m³ 0,2 à 0,4 0,4 à 0,5 0,5 à 0,6 0,6 à 1

effectifs (nb colis) 15 40 60 10

1) Donner une estimation ponctuelle de la moyenne et de l'écart type du volume des futurs colis.

volume en m³ 0,3 0,45 0,55 0,8

effectifs (nb colis) 15 40 60 10

x = 0,508 et s = 0,1181 , en m3

Estimation ponctuelle de µ : 0,508 m³.

Estimation ponctuelle de σ : 0,1181×√(125/124) = 0,1185 m³.

2) Estimer le volume moyen des futurs colis par un intervalle de confiance à 99%.

σ étant inconnu, on détermine le coefficient t d'une loi de Student à 124 ddl au seuil de 1% :

t = 2,576.

I = [0,508 - 2,576×0,1181/√124 ; 0,508 + 2,576×0,1181/√124] = [0,4807 ; 0,5353]

loi normale acceptée, au lieu de Student, avec u = 2,58

3) Dans cette question, on considère que l'écart type des futurs colis est connu et vaut l'estimation

que vous en avez faite dans votre réponse à la question 1.

A quel niveau de confiance correspondrait un intervalle d'amplitude 0,05 m³ ? Interpréter.

La demi-amplitude de cet intervalle de confiance est u×0,1185/√125 = 0,0106u et doit valoir

0,025 d'après l'énoncé. Donc u doit valoir 2,36.

p(-2,36 < U < 2,36) = 2×0,9909 - 1 = 0,9818

Le niveau de confiance cherché est 98,18%, pour un intervalle d'amplitude 0,05 qui est donc

[0,483 ; 0,533].

Il y a donc 98,18% de chances que le volume moyen des futurs colis soit dans cet intervalle.

Page 22: S3 – STATISTIQUES INFERENTIELLES – TD et Exercices ...jff-dut-tc.weebly.com/uploads/1/4/7/9/14799044/s3_-_statinfér... · S3 – STATISTIQUES INFERENTIELLES – TD et Exercices

S3 – STATISTIQUES INFERENTIELLES – CORRIGES des EXERCICES

V. TESTS

TD10 : Test du χχχχ² d'adéquation à une distribution théorique uniforme

On effectue 120 lancers d'un même dé. On obtient les résultats suivants:

nombre obtenu 1 2 3 4 5 6

effectif observé 26 15 14 24 25 16

Peut-on considérer au vu de cet échantillon que le dé est juste (non truqué) au seuil de 0,02 (2 %) ?

Organisons un tableau :

nombre obtenu 1 2 3 4 5 6

effectif observé 26 15 14 24 25 16

effectif théorique 20 20 20 20 20 20

( )obs th

th

− 2

1,8 1,25 1,8 0,8 1,25 0,8 7,7

Hypothèse nulle : la distribution observée est conforme à la théorie

Variable de décision :

Valeur de la variable aléatoire χ² calculée entre l'échantillon et la théorie : χχχχ²calc = 7,7

Détermination de la zone de non rejet de H0 :

Seuil de risque : α = 1 - p = 2% Nombre de ddl : k - 1 = 5

Valeur de la variable aléatoire χ² limite avant rejet : χχχχ²lim = 13,39

Comparaison et décision :

Au seuil de 2%, on ne peut rejeter H0.

Dit autrement : on ne peut dire avec 98% de confiance que le dé est truqué.

Page 23: S3 – STATISTIQUES INFERENTIELLES – TD et Exercices ...jff-dut-tc.weebly.com/uploads/1/4/7/9/14799044/s3_-_statinfér... · S3 – STATISTIQUES INFERENTIELLES – TD et Exercices

TD11 : Test unilatéral de conformité à une moyenne (σσσσ connu)

Un marchand de légumes veut changer de fournisseur. Le nouveau fournisseur prétend que ses

haricots mesurent 10 cm en moyenne.

Si cette valeur est plausible, voire si l'estimation qu'on peut en faire est supérieure, alors le

marchand décidera de choisir ce fournisseur. Son choix sera contraire si un échantillon donne une

moyenne trop basse. Le marchand fixe son seuil de risque a à 5%.

Soit X la variable aléatoire "taille d'un haricot en cm", distribuée suivant N (µ , 2,3).

Nous prenons un échantillon de n = 25 haricots. La moyenne de cet échantillon est x = 9,5 cm.

* Décision :

La moyenne observée (9,5 cm) ne se trouve pas dans la zone de rejet.

Au seuil de 5%, on ne peut rejeter l’hypothèse nulle, selon laquelle la taille moyenne des

haricots de la population vaut 10 cm (ou plus).

C’est à dire : on ne peut affirmer avec 95% d’assurance que cette moyenne est inférieure à

10 cm.

H0 : µ = 10

H1 : µ < 10

N (10 ; ) = N (10 ; 0,46)

,

10

0 46

X −N (0 ; 1)

α = 5%

0

10

ulim = -1,645

car p(U < 1,645) = 0,95

implique p(U < -1,645) = 0,05

-1,645

,,

, ,obs

10 9 5 101 09

0 46 0 46

xu

− −= = ≈ −

, , ,lim 10 1 645 0 46 9 24x = − × ≈

9,24

Page 24: S3 – STATISTIQUES INFERENTIELLES – TD et Exercices ...jff-dut-tc.weebly.com/uploads/1/4/7/9/14799044/s3_-_statinfér... · S3 – STATISTIQUES INFERENTIELLES – TD et Exercices

TD12 : Test bilatéral de conformité à une moyenne (σσσσ inconnu)

Une carrière doit exploiter 300 tonnes de minerai en moyenne journalière.

On admet que la masse journalière de minerai extrait se distribue normalement.

Des quantités examinées sur 10 jours ont donné les résultats suivants, en tonnes :

302 287 315 322 341 324 329 345 392 289

Peut-on considérer au vu de cet échantillon que l'exploitation est conforme, au risque α de 1% ?

* Décision :

La moyenne observée (324,6 t/jour) ne se trouve pas dans la zone de rejet.

Au seuil de 1%, on ne peut rejeter l’hypothèse nulle, selon laquelle la production moyenne

est conforme à 300 t/jour.

C’est à dire : on ne peut affirmer avec 99% d’assurance que cette moyenne ne l’est pas.

H0 : µ = 300

H1 : µ ≠ 300

St (300 ; ) = St (300 ; 9,74)

,

300

9 74

X −St (0 ; ddl = 9)

α = 1%

0,5% 0,5%

300

0

±tlim = ±3,25

par lecture directe

sur la table de Student

pour 1-p = 0,01

-3,25 3,25

,,

, ,obs

300 324 6 3002 526

9 74 9 74

xt

− −= = ≈

, , , ,lim 300 3 25 9 74 331 65 ou 268 35x = ± × ≈

268,35 331,65

Page 25: S3 – STATISTIQUES INFERENTIELLES – TD et Exercices ...jff-dut-tc.weebly.com/uploads/1/4/7/9/14799044/s3_-_statinfér... · S3 – STATISTIQUES INFERENTIELLES – TD et Exercices

Exercice 24

Expérience : on lance un dé trois fois de suite. Le succès est : faire 5 ou 6.

X est la variable aléatoire qui prend pour valeurs 0, 1, 2 ou 3 : nombre de succès à l'issue de

l'expérience. On admettra que P(X = 0) = 8/27, P(X = 1) = 12/27 et P(X = 3) = 1/27.

Enfin, on réalise l'expérience 54 fois.

1. Compléter le tableau suivant :

succès obtenus 0 1 2 3 total

nombre théorique d'expériences 16 24 12 2 54

nombre réel observé d'expériences 14 20 16 4 54

ex : « 0 succès » s’obtient en moyenne 8 fois tous les 27 essais, donc 16 fois sur 54

2. En effectuant un test du χ², dire, au seuil de 5 %, si les résultats observés sont compatibles avec

les résultats théoriques attendus.

Hypothèse nulle H0 : le dé n'est pas truqué

calcul des Khi² partiels : (obs - th)²/th

0,25 0,6667 1,3333 2 total : 4,25

Valeur de la variable aléatoire K² observée sur l'échantillon : Khi²calc = 4,25

Valeur du Khi² limite à ne pas dépasser, au seuil de 5%, avec 3 ddl : Khi²lim = 7,815

Décision : Au seuil de 5%, on ne peut rejeter H0. (On prendrait plus de 5% de risques en rejetant

l'hypothèse nulle de conformité des résultats observés).

Exercice 25 Les parties 1 et 2 sont indépendantes.

Dans cinq groupes français du même secteur, on a relevé le budget annuel alloué à la promotion

sur internet comparativement au budget annuel global alloué à la promotion :

entreprise A B C D E

budget internet (k€) 47 55 58 63 72

budget global (k€) 558 545 587 560 585

Rassemblons dans un tableau les éléments chiffrés dont nous aurons besoin :

entreprise A B C D E

budget internet (k€) 47 55 58 63 72

budget global (k€) 558 545 587 560 585

taux int/global observé 0,084229 0,100917 0,098807 0,1125 0,123077

10% du budget global 55,8 54,5 58,7 56 58,5

χχχχ² partiels 1,387814 0,004587 0,008348 0,875 3,115385

Partie 1

1. Déterminer dans cet échantillon la proportion d'entreprises pour lesquelles le budget

internet dépasse 10% du budget global.

3 entreprises sur 5 sont dans ce cas, soit une proportion p = 3/5 = 0,6.

2. a. Déterminer l'intervalle de confiance à 95% de la proportion qui pourrait être observée

dans l'ensemble des groupes français du même secteur.

La formule donne, avec p = 0,6 et u = 1,96 : I = [0,1706 ; 1,0294]

(on peut remarquer que cet intervalle est très large puisqu'une proportion est

systématiquement comprise entre 0 et 1 ; l'intervalle dépasse même 1 !)

Page 26: S3 – STATISTIQUES INFERENTIELLES – TD et Exercices ...jff-dut-tc.weebly.com/uploads/1/4/7/9/14799044/s3_-_statinfér... · S3 – STATISTIQUES INFERENTIELLES – TD et Exercices

b. Cet ensemble se compose en fait de 58 groupes. Combien, au minimum, peut-on dire avec

un degré de confiance de 80 % qu'ils ont un budget internet dépassant 10% du budget global ?

La probabilité d'être inférieur à ce nombre vaut 20%. C'est donc la borne inférieure d'un

intervalle de confiance à 60%, pour lequel u = 0,85.

La proportion correspondante est , ,

, , ,×− =0 6 0 4

0 6 0 85 0 41385

et 41,38% de 58 entreprises donnent 24 entreprises.

Partie 2

Effectuer un test du Khi-deux pour dire, au seuil de 5%, si les budgets internet observés pour

ces cinq entreprises sont conformes à un budget internet valant 10% de leur budget global.

Le tableau au-dessus donne les Khi² partiels obtenus, dont le total vaut 5,391 (Khi²calc).

Pour 4 ddl et un seuil de 5%, la table donne Khi² limite = 9,488.

Donc au seuil de 5% on ne peut rejeter l'hypothèse qu'en France le budget internet

représente 10% du budget global de communication.

Exercice 26

Une étude a été conduite dans un échantillon de 50 entreprises de plasturgie. Sur chacune d'elles,

on a relevé le résultat net de l'année 2009. La liste des résultats nets forme une variable que l'on

note R, exprimée en M€. Le tableau ci-dessous donne une répartition par classes des entreprises :

Résultat net R (M€) [-1 ; 1[ [1 ; 1,5[ [1,5 ; 2[ [2 ; 3[ [3 ; 5[

effectifs (nombre d'entreprises) 3 10 18 15 4

Partie 1

1. Donner la moyenne et l'écart type de la distribution statistique ci-dessus (à l'aide des centres

des classes).

x = 1,950 et σ = 0,8761

2. Ces 50 entreprises représentent un échantillon aléatoire simple pris parmi un grand nombre

d'entreprises. Donner un intervalle de confiance à 99% du résultat net moyen de la population

d'entreprises (on notera que l'écart type de la population est inconnu).

σ étant inconnu, on recherche le coefficient t (Student) à 49 ddl, pour α = 1% : 2,680.

L'intervalle cherché est alors : [1,615 ; 2,285].

Partie 2

L'objectif consiste ici à dire s'il est plausible que la distribution des résultats nets des 50

entreprises est en accord avec la distribution normale N(2 ; 0,9) pour la population.

1. Soit une variable aléatoire X de loi normale de moyenne 2 et d'écart type 0,9.

a. Calculer les probabilités suivantes :

p(-1 < X < 1) ; p(1 < X < 1,5) ; p(1,5 < X < 2) ; p(2 < X < 3) ; p(3 < X < 5).

p(-1 < X < 1) = p(-3,33 < U < -1,11) = 0,1335 - 0 = 0,1335

p(1 < X < 1,5) = p(-1,11 < U < -0,56) = 0,2877 - 0,1335 = 0,1542

p(1,5 < X < 2) = p(-0,56 < U < 0) = 0,5 - 0,2877 = 0,2123

p(2 < X < 3) = p(0 < U < 1,11) = 0,8665 - 0,5 = 0,3665

p(3 < X < 5) = p(1,11 < U < 3,33) = 1 - 0,8665 = 0,1335

Page 27: S3 – STATISTIQUES INFERENTIELLES – TD et Exercices ...jff-dut-tc.weebly.com/uploads/1/4/7/9/14799044/s3_-_statinfér... · S3 – STATISTIQUES INFERENTIELLES – TD et Exercices

b. Montrer que si ces probabilités étaient respectées dans l'échantillon de 50 entreprises, alors

on obtiendrait la distribution d'effectifs théoriques suivante : 6,675 ; 7,71 ; 10,615 ; 18,325 ;

6,675 (dans l'ordre du tableau).

En multipliant les probabilités trouvées précédemment par 50, on trouve bien la liste

(6,675 ; 7,71 ; 10,615 ; 18,325 ; 6,675).

2. a. Effectuer un test d'adéquation du Khi-2, en comparant la distribution des effectifs observés

et celle des effectifs théoriques, pour dire au seuil de 5% si on peut considérer que la loi de R est

N (2 ; 0,9).

En comparant la liste d'effectifs observés (3 ; 10 ; 18 ; 15 ; 4) à la liste théorique ci-dessus, on

obtient la liste des Khi-2 partiels : (2,023 ; 0,6802 ; 5,138 ; 0,6033 ; 1,072).

Le Khi-2 calculé en est la somme : 9,517.

Pour une loi du Khi-2 à 4 ddl avec α = 5%, on trouve sur la table Khi-2 limite = 9,488.

En conclusion, on peut rejeter, au seuil de 5%, l'hypothèse selon laquelle le résultat net a

pour loi N (2 ; 0,9).

b. Que signifie ce seuil de 5% pour votre conclusion ?

En rejetant cette hypothèse d'adéquation, on prend moins de 5% de risque de se tromper.

Exercice 27

L'examen de 320 familles ayant 5 enfants s'est traduit par la distribution du tableau suivant.

Ce résultat est-il compatible avec l'hypothèse que la naissance d'un garçon et d'une fille sont des

événements équiprobables ?

enfants 5 garçons 4 garçons 3 garçons 2 garçons 1 garçon 0 garçon

0 fille 1 fille 2 filles 3 filles 4 filles 5 filles

effectif 18 56 110 88 40 8

La difficulté vient ici du calcul des effectifs théoriques attendus, car cela nous impose de

calculer les probabilités que dans une famille de cinq enfants on ait tant de garçons et tant de

filles (dans la situation « garçon/fille équiprobables). Commençons par cela.

Un enfant est une fille (succès, p = 0,5 est invariable) ou un garçon (échec, q = 0,5).

Au bout du choix de cinq enfants (n = 5), X désigne le nombre de succès.

La loi de X est donc B(5 ; 0,5) et l’application de la formule en loi binomiale permet d’obtenir

les probabilités de toutes les valeurs possibles de X (voir tableau ci-dessous : « prob »).

Enfin, il suffira de multiplier ces probabilités par 320 pour obtenir les nombres de familles

théoriquement attendus dans chaque catégorie (« eff th »).

enfants 5 garçons 4 garçons 3 garçons 2 garçons 1 garçon 0 garçon

0 fille 1 fille 2 filles 3 filles 4 filles 5 filles

eff obs 18 56 110 88 40 8

prob 0,03125 0,15625 0,3125 0,3125 0,15625 0,03125

eff th 10 50 100 100 50 10

Khi2 6,4 0,72 1 1,44 2 0,4

Le Khi2 total de ce tableau est : Khi²calc = 11,96

Page 28: S3 – STATISTIQUES INFERENTIELLES – TD et Exercices ...jff-dut-tc.weebly.com/uploads/1/4/7/9/14799044/s3_-_statinfér... · S3 – STATISTIQUES INFERENTIELLES – TD et Exercices

Valeurs des Khi² limites à ne pas dépasser :

ddl 1% 2% 5% 10%

5 15,09 13,39 11,07 9,236

Au seuil de 2%, on ne peut rejeter H0.

On peut rejeter H0 à un seuil de risque au moins égal à 5% d'après la table.

Le seuil de risque correspondant à χ² = 11,96 est compris entre 2% et 5% ; autrement dit : on

peut se permettre de rejeter l'hypothèse nulle d'équiprobabilité avec un niveau de confiance

de 95%, mais pas de 98%.

Exercice 28

Un fabricant de cordes affirme que les objets qu’il produit ont une tension de rupture moyenne de

300 kg et un écart type égal à 30 kg. On admet que la tension de rupture suit une loi normale. Des

expériences faites sur 10 cordes ont permis de constater les tensions de rupture suivantes :

251 277 255 305 341 324 329 314 272 289

Peut-on considérer au vu de cet échantillon que le fabricant remplit son engagement d’une

tension moyenne de rupture égale à 300 kg ? (au risque 10 % de répondre non à tort)

On décide de considérer qu’une corde remplit son rôle lorsque sa tension de rupture (sa

résistance) vaut au moins 300 kg. On procédera donc à un test unilatéral : H0 « la tension moyenne

vaut 300 kg » et H1 (rejet de H0) « la tension moyenne est inférieure à 300 kg ».

L’écart type des tensions de rupture, dans la population des cordes produites, est inconnu. Nous

aurons donc à utiliser une loi de Student pour ce test de conformité.

Données de l’échantillon : x = 295,7 kg et s = 30 kg.

Selon l’hypothèse nulle, les tensions moyennes des échantillons possibles de 10 cordes se

répartissent autour de 300 kg avec un écart type de 30

9 = 10 kg, et la variable

300

10

XT

−= suit

une loi de Student à 9 ddl.

La zone de rejet se situe d’un seul côté de la moyenne, en-dessous, et contient 10% des

échantillons possibles. La valeur de T correspondante est : -1,383. (attention, le formulaire est

calibré pour des tests bilatéraux !)

La valeur de X correspondante, limite de la zone de rejet, est 300 – 1,383×10 = 286,17 kg.

Notre échantillon a montré une moyenne supérieure à cette limite ; nous ne pouvons donc

affirmer au seuil de 10% que les cordes de ce fabricant ne sont pas assez résistantes. (nous

pouvons penser qu’elles ne sont pas assez résistantes, mais avec moins de 90% de confiance).

Exercice 29

Sur 1000 candidats français au baccalauréat pris au hasard, 675 ont réussi. Tester au seuil de 10 %

l’hypothèse selon laquelle le taux de réussite en France est de 70 %.

Page 29: S3 – STATISTIQUES INFERENTIELLES – TD et Exercices ...jff-dut-tc.weebly.com/uploads/1/4/7/9/14799044/s3_-_statinfér... · S3 – STATISTIQUES INFERENTIELLES – TD et Exercices

On décide de considérer que le test est positif lorsque le taux vaut au moins 70%. On procédera

donc à un test unilatéral : H0 « le taux vaut 70% » et H1 (rejet de H0) « le taux est inférieur à 70% ».

On teste une proportion, la loi à utiliser est donc la loi normale.

Selon l’hypothèse nulle, les proportions relevables dans les échantillons de 1000 personnes se

distribuent normalement autour de 70%, plus précisément selon la loi :

( ), ,, ; , ; ,

0 7 0 30 7 0 7 0 01449

1000

× =

N N .

La zone de rejet se situe d’un seul côté du taux idéal de 70%, en-dessous, et contient 10% des

échantillons possibles. La valeur de U correspondante est : -1,28. (car p(U < 1,28) = 0,9 implique

p(U < -1,28) = 0,1).

La valeur correspondante du taux limite (zone de rejet) est 0,7 – 1,28×0,01449 = 0,6815.

Or, la proportion relevée dans notre échantillon de 1000 personnes est p = 67,5%.

On peut donc affirmer au seuil de 10% que le taux de réussite a été inférieur à 70% (« au seuil de

10% » : on a au moins 90% de confiance dans le rejet de H0).

Exercice 30

Dans plusieurs pays, les prévisions météorologiques sont données sous forme de probabilité.

La prévision « la probabilité de pluie pour demain est de 0,4 » a été faite 50 fois au cours de

l’année et il a plu 26 fois. Tester l’exactitude de la prévision au risque de 5 %.

On décide de considérer que le test est positif lorsque le taux est proche de 0,4. On procédera

donc à un test bilatéral : H0 « le taux vaut 0,4 » et H1 (rejet de H0) « le taux est différent de 0,4 ».

On teste une proportion, la loi à utiliser est donc la loi normale.

Selon l’hypothèse nulle, les proportions relevables dans les échantillons de 50 jours se distribuent

normalement autour de 0,4, plus précisément selon la loi :

( ), ,, ; , ; ,

0 4 0 60 4 0 4 0 06928

50

× =

N N .

La zone de rejet se situe de part et d’autre de 0,4 et contient de chaque côté 2,5% des échantillons

possibles. La valeur de U correspondante est : ±1,96. (car p(U < 1,96) = 0,975 implique p(U > 1,96)

= 0,025 = 2,5%).

Les valeurs correspondantes du taux limite (zone de rejet) sont 0,4 ± 1,96×0,06928 = 0,2642 et

0,5358. Or, la proportion relevée dans notre échantillon de 50 jours est p = 26/50 = 0,52.

On ne peut donc pas rejeter, au seuil de 5%, l’exactitude de la prévision (il y a moins de 95% de

chances que la prévision soit inexacte).