Exercices Corrigés...C’est l’inverse de la moyenne empirique du r-échantillon. 6. Soit Xune...

124
Département de Mathématiques et Informatique Exercices Corrigés Abdelhamid El Mossadeq P ro fesseu r à l’E HTP 2006-2007

Transcript of Exercices Corrigés...C’est l’inverse de la moyenne empirique du r-échantillon. 6. Soit Xune...

Page 1: Exercices Corrigés...C’est l’inverse de la moyenne empirique du r-échantillon. 6. Soit Xune variable aléatoire normale de paramètres μet σ2. Sa densité de probabilité fest

Département de Mathématiques et Informatique

Exer ci ces Cor r i gés

Abdelhamid El Mossadeq P rofesseur à l’E H T P

2006-2007

Page 2: Exercices Corrigés...C’est l’inverse de la moyenne empirique du r-échantillon. 6. Soit Xune variable aléatoire normale de paramètres μet σ2. Sa densité de probabilité fest

© A. El Mossadeq Juin 2006

Page 3: Exercices Corrigés...C’est l’inverse de la moyenne empirique du r-échantillon. 6. Soit Xune variable aléatoire normale de paramètres μet σ2. Sa densité de probabilité fest

TABLE DES MATIERES

Structures Statistiques et Estimation 1

Les Procédures Usuelles des Tests d’Hypothèses : 1. Les Fréquences 45

Les Procédures Usuelles des Tests d’Hypothèses : 2. Les Tests du Khi-Deux 61

Les Procédures Usuelles des Tests d’Hypothèses : 3. Moyennes et Variances 95

Page 4: Exercices Corrigés...C’est l’inverse de la moyenne empirique du r-échantillon. 6. Soit Xune variable aléatoire normale de paramètres μet σ2. Sa densité de probabilité fest
Page 5: Exercices Corrigés...C’est l’inverse de la moyenne empirique du r-échantillon. 6. Soit Xune variable aléatoire normale de paramètres μet σ2. Sa densité de probabilité fest

Structure Statistique et

Estimation

Page 6: Exercices Corrigés...C’est l’inverse de la moyenne empirique du r-échantillon. 6. Soit Xune variable aléatoire normale de paramètres μet σ2. Sa densité de probabilité fest
Page 7: Exercices Corrigés...C’est l’inverse de la moyenne empirique du r-échantillon. 6. Soit Xune variable aléatoire normale de paramètres μet σ2. Sa densité de probabilité fest

A. El Mossadeq Structures Statistiques et Estimation

Exercice 1Déterminer et étudier les propriétés de l’estimateur du maximum de vraisemlanced’un r-échantillon pour :

1. le paramètre p d’une loi de Bernouilli2. le paramètre p d’une loi geometrique3. le paramètre p d’une loi binomiale d’ordre n4. le paramètre α d’une loi de Poisson5. le paramètre λ d’une loi exponentielle6. les paramètres μ et σ2 d’une loi normale7. le paramètre θ d’une loi uniforme sur l’intervalle [0, θ]

Solution 11. Soit X une variable aléatoire de Bernouilli de paramètre p.Pour tout x ∈ {0, 1}, la probabilité élémentaire p (x) de x est :

p (x) = px (1− p)1−x

de plus : ⎧⎨⎩ E [X] = p

V [X] = p (1− p)

(a) Recherche du maximum de vraisemlance :Considérons un r-échantillon de cette structure.Sa fonction de vraisemblance est définie pour tout p ∈ [0, 1] et tout(x1, ..., xr) ∈ {0, 1}r par :

L (p;x1, ..., xr) =rY

i=1

p (xi)

= p

rPi=1

xi(1− p)

r−rPi=1

xi

d’où :

lnL (p;x1, ..., xr) =Ã

rXi=1

xi

!ln p+

Ãr −

rXi=1

xi

!ln (1− p)

3

Page 8: Exercices Corrigés...C’est l’inverse de la moyenne empirique du r-échantillon. 6. Soit Xune variable aléatoire normale de paramètres μet σ2. Sa densité de probabilité fest

Structures Statistiques et Estimation A. El Mossadeq

Il en résulte que :

∂plnL (p;x1, ..., xr) =

rPi=1

xi

p−

r −rP

i=1

xi

1− p

d’où :

∂plnL (p;x1, ..., xr) = 0 =⇒ p =

1

r

rXi=1

xi

et comme :∂2

∂p2lnL (p;x1, ..., xr) < 0

donc l’estimateur du maximum de vraisemblance d’un r-échantillon d’unestructure de Bernouilli est :

p =1

r

rXi=1

Xi

C’est la fréquence empirique du r-échantillon.(b) Etude des propriétés de p :

Puisque :

E [p] = E [X]

= p

et :

V [p] =V [X]

r

=p (1− p)

r

On en déduit que p est un estimateur sans biais et convergent du paramètrep d’une loi de Bernouilli.

2. Soit X une variable aléatoire de géométrique de paramètre p.Pour tout x ∈ N∗, la probabilité élémentaire p (x) de x est :

p (x) = p (1− p)x−1

de plus : ⎧⎪⎪⎪⎨⎪⎪⎪⎩E [X] =

1

p

V [X] =1− p

p2

4

Page 9: Exercices Corrigés...C’est l’inverse de la moyenne empirique du r-échantillon. 6. Soit Xune variable aléatoire normale de paramètres μet σ2. Sa densité de probabilité fest

A. El Mossadeq Structures Statistiques et Estimation

Considérons un r-échantillon de cette structure.Sa fonction de vraisemblance est définie pour tout p ∈ [0, 1] et tout (x1, ..., xr) ∈(N∗)r par :

L (p;x1, ..., xr) =rY

i=1

p (xi)

= pr (1− p)

rPi=1

xi−r

d’où :

lnL (p;x1, ..., xr) = r ln p+

ÃrX

i=1

xi−!r ln (1− p)

Il en résulte que :

∂plnL (p;x1, ..., xr) =

r

p−

rPi=1

xi − r

1− p

=

r − prP

i=1

xi

p (1− p)

d’où :∂

∂plnL (p;x1, ..., xr) = 0 =⇒ p =

rrP

i=1

xi

et comme :∂2

∂p2lnL (p;x1, ..., xr) < 0

donc l’estimateur du maximum de vraisemblance d’un r-échantillon d’une struc-ture géométrique est :

p =r

rPi=1

Xi

C’est l’inverse de la moyenne empirique du r-échantillon.

3. Soit X une variable aléatoire binomiale d’ordre n et de paramètre p.pour tout x ∈ {0, 1, ..., n}, la probabilité élémentaire p (x) de x est :

p (x) = C (n, x) px (1− p)n−x

5

Page 10: Exercices Corrigés...C’est l’inverse de la moyenne empirique du r-échantillon. 6. Soit Xune variable aléatoire normale de paramètres μet σ2. Sa densité de probabilité fest

Structures Statistiques et Estimation A. El Mossadeq

de plus : ⎧⎨⎩ E [X] = np

V [X] = np (1− p)

(a) Recherche du maximum de vraisemlance :Considérons un r-échantillon de cette structure.Sa fonction de vraisemblance est définie pour tout p ∈ [0, 1] et tout(x1, ..., xr) ∈ {0, 1, ..., n}r par :

L (p;x1, ..., xr) =rY

i=1

p (xi)

=

"rY

i=1

C (n, xi)

#p

rPi=1

xi(1− p)

rn−rP

i=1xi

d’où :

lnL (p;x1, ..., xr) = lnrY

i=1

C (n, xi) +rX

i=1

xi ln p+

Ãrn−

rXi=1

xi

!ln (1− p)

Il en résulte que :

∂plnL (p;x1, ..., xr) =

rPi=1

xi

p−

rn−rP

i=1

xi

1− p

=

rPi=1

xi − rnp

p (1− p)

d’où :

∂plnL (p;x1, ..., xr) = 0 =⇒ p =

1

rn

rXi=1

xi

et comme :∂2

∂p2lnL (p;x1, ..., xr) < 0

donc l’estimateur du maximum de vraisemblance d’un r-échantillon d’unestructure de binomiale est :

p =1

rn

rXi=1

Xi

6

Page 11: Exercices Corrigés...C’est l’inverse de la moyenne empirique du r-échantillon. 6. Soit Xune variable aléatoire normale de paramètres μet σ2. Sa densité de probabilité fest

A. El Mossadeq Structures Statistiques et Estimation

(b) Etude des propriétés de p :Puisque :

E [p] =1

nE [X]

= p

et :

V [p] =V [X]

rn2

=p (1− p)

rn

on en déduit que p est un estimateur sans biais et convergent de p.

4. Soit X une variable aléatoire de Poisson de paramètre α.Pour tout x ∈ N, la probabilité élémentaire p (x) de x est :

p (x) =αx

x!exp−α

de plus : ⎧⎨⎩ E [X] = α

V [X] = α

(a) Recherche du maximum de vraisemlance :Considérons un r-échantillon de cette structure.Sa fonction de vraisemblance est définie pour tout α, α > 0, et tout(x1, ..., xr) ∈ Nr par :

L (α;x1, ..., xr) =rY

i=1

p (xi)

rPi=1

xi

x1!...xr!exp−rα

d’où :

lnL (α;x1, ..., xr) = − ln (x1!...xr!) +rX

i=1

xi lnα− rα

Il en résulte que :

∂αlnL (α;x1, ..., xr) =

rPi=1

xi

α− r

7

Page 12: Exercices Corrigés...C’est l’inverse de la moyenne empirique du r-échantillon. 6. Soit Xune variable aléatoire normale de paramètres μet σ2. Sa densité de probabilité fest

Structures Statistiques et Estimation A. El Mossadeq

d’où :

∂αlnL (α;x1, ..., xr) = 0 =⇒ p =

1

r

rXi=1

xi

et comme :∂2

∂α2lnL (α;x1, ..., xr) < 0

donc l’estimateur du maximum de vraisemblance d’un r-échantillon d’unestructure de Poisson est :

α =1

r

rXi=1

Xi

C’est la moyenne empirique du r-échantillon.

(b) Etude des propriétés de α :Puisque :

E [α] = E [X]

= α

et :

V [α] =V [X]

r

r

On en déduit que α est un estimateur sans biais et convergent de α.

5. Soit X une variable aléatoire exponentielle de paramètre λ.Sa densité de probabilité f est définie par :

f (x) =

⎧⎨⎩ 0 si x ≤ 0

λ exp−λx si x > 0

de plus : ⎧⎪⎪⎪⎨⎪⎪⎪⎩E [X] =

1

λ

V [X] =1

λ2

Considérons un r-échantillon de cette structure.

8

Page 13: Exercices Corrigés...C’est l’inverse de la moyenne empirique du r-échantillon. 6. Soit Xune variable aléatoire normale de paramètres μet σ2. Sa densité de probabilité fest

A. El Mossadeq Structures Statistiques et Estimation

Sa fonction de vraisemblance est définie pour tout λ, λ > 0, et tout (x1, ..., xr)dans Rr, tous strictement positifs, par :

L (λ;x1, ..., xr) =rY

i=1

f (xi)

= λr exp−λrX

i=1

xi

d’où :

lnL (λ;x1, ..., xr) = r lnλ− λrX

i=1

xi

Il en résulte que :

∂λlnL (λ;x1, ..., xr) =

r

λ−

rXi=1

xi

d’où :∂

∂λlnL (λ;x1, ..., xr) = 0 =⇒ λ =

rrP

i=1

xi

et comme :∂2

∂λ2lnL (λ;x1, ..., xr) < 0

donc l’estimateur du maximum de vraisemblance d’un r-échantillon d’une struc-ture exponentielle est :

λ =r

rPi=1

Xi

C’est l’inverse de la moyenne empirique du r-échantillon.

6. Soit X une variable aléatoire normale de paramètres μ et σ2.Sa densité de probabilité f est définie pour tout x ∈ R par :

f (x) =1

σ√2πexp− 1

2σ2(x− μ)2

de plus : ⎧⎨⎩ E [X] = μ

V [X] = σ2

9

Page 14: Exercices Corrigés...C’est l’inverse de la moyenne empirique du r-échantillon. 6. Soit Xune variable aléatoire normale de paramètres μet σ2. Sa densité de probabilité fest

Structures Statistiques et Estimation A. El Mossadeq

(a) Recherche du maximum de vraisemlance :

Considérons un r-échantillon de cette structure.Sa fonction de vraisemblance est définie pour tout μ ∈ R, tout σ > 0 ettout (x1, ..., xr) ∈ Rr par :

L (μ, σ;x1, ..., xr) =rY

i=1

f (xi)

=1¡

σ√2π¢r exp− 1

2σ2

rXi=1

(xi − μ)2

d’où :

lnL (μ, σ;x1, ..., xr) = −r ln√2π − r lnσ − 1

2σ2

rXi=1

(xi − μ)2

Il en résulte que :

⎧⎪⎪⎪⎪⎪⎨⎪⎪⎪⎪⎪⎩

∂μL (μ, σ;x1, ..., xr) =

1

σ2

rXi=1

(xi − μ)

∂σL (μ, σ;x1, ..., xr) = −

r

σ+1

σ3

rXi=1

(xi − μ)2

d’où :

⎧⎪⎪⎪⎨⎪⎪⎪⎩∂

∂μL (μ, σ;x1, ..., xr) = 0

∂σL (μ, σ;x1, ..., xr) = 0

=⇒

⎧⎪⎪⎪⎪⎪⎨⎪⎪⎪⎪⎪⎩μ =

1

r

rXi=1

xi

σ2 =1

r

rXi=1

(xi − μ)2

Donc les estimateurs du maximum de vraisemblance d’un r-échantillond’une structure normale est :⎧⎪⎪⎪⎪⎪⎨⎪⎪⎪⎪⎪⎩

μ =1

r

rXi=1

Xi

σ2 =1

r

rXi=1

(Xi − μ)2

10

Page 15: Exercices Corrigés...C’est l’inverse de la moyenne empirique du r-échantillon. 6. Soit Xune variable aléatoire normale de paramètres μet σ2. Sa densité de probabilité fest

A. El Mossadeq Structures Statistiques et Estimation

(b) Etude des propriétés de μ et σ:On a :

E [μ] = E [X]

= μ

et :

E£σ2¤

=r − 1r

V [X]

=r − 1r

σ2

On en déduit que μ est un estimateur sans biais et convergent de μ, maisσ est un estimateur biaisé de σ.

7. Soit X une variable aléatoire uniforme sur l’intervalle [0, θ].Sa densité de probabilité f est définie pour tout x ∈ [0, θ] par :

f (x) =

⎧⎪⎨⎪⎩1

θsi x ∈ [0, θ]

0 si x /∈ [0, θ]de plus : ⎧⎪⎪⎪⎨⎪⎪⎪⎩

E [X] =θ

2

V [X] =θ2

12

Considérons un r-échantillon de cette structure.Sa fonction de vraisemblance est définie pour tout θ, θ > 0, et tout (x1, ..., xr) ∈[0, θ]r :

L (θ;x1, ..., xr) =rY

i=1

f (xi)

=1

θr

La fonction :

θ −→ L (θ;x1, ..., xr)est strictement décroissante, donc elle atteint son maximum lorsque θ est min-imum.Et comme :

∀i ∈ {1, ..., r} : θ ≥ xi

11

Page 16: Exercices Corrigés...C’est l’inverse de la moyenne empirique du r-échantillon. 6. Soit Xune variable aléatoire normale de paramètres μet σ2. Sa densité de probabilité fest

Structures Statistiques et Estimation A. El Mossadeq

donc θ est minimum lorsque :

θ = max (x1, ..., xr)

Donc l’estimateur dumaximum de vraisemblance d’un r-échantillon d’une struc-ture uniforme est :

θ = max (X1, ...,Xr)

Exercice 2Soit X une variable aléatoire dont la densité de probabilité f est définie par :

f (x) =

⎧⎪⎨⎪⎩1

θexp−x

θsi x > 0

0 si x ≤ 0

où θ est un paramètre réel strictement positif.

1. Déterminer l’estimateur du maximum de vraisemlance θ de θ d’un r-échantillonde variable parente X.

2. θ est-il un résumé exhaustif ?3. Calculer l’espérance mathématique et la variance de θ.Que peut-on conclure ?

4. Calculer la quantité d’information de Fisher.En déduire que θ est efficace.

Solution 2SoitX une variable aléatoire exponentielle dont la densité de probabilité f est définiepour tout x, x > 0, par :

f (x) =

⎧⎪⎨⎪⎩1

θexp−x

θsi x > 0

0 si x ≤ 0

où θ est un paramètre réel strictement positif.On a : ⎧⎨⎩ E [X] = θ

V [X] = θ2

12

Page 17: Exercices Corrigés...C’est l’inverse de la moyenne empirique du r-échantillon. 6. Soit Xune variable aléatoire normale de paramètres μet σ2. Sa densité de probabilité fest

A. El Mossadeq Structures Statistiques et Estimation

1. Considérons un r-échantillon de cette structure.Sa fonction de vraisemblance est définie pour tout θ, θ > 0, et tout (x1, ..., xr) ∈Rr, tous strictement positifs, par :

L (θ;x1, ..., xr) =rY

i=1

f (xi)

=1

θrexp−

rPi=1

xi

θ

d’où :

lnL (θ;x1, ..., xr) = −r ln θ −

rPi=1

xi

θ

Il en résulte que :

∂θlnL (θ;x1, ..., xr) = −

r

θ+

rPi=1

xi

θ2

d’où :

∂θlnL (θ;x1, ..., xr) = 0 =⇒ θ =

1

r

rXi=1

xi

et comme :∂2

∂θ2lnL (θ;x1, ..., xr) < 0

donc l’estimateur du maximum de vraisemblance d’un r-échantillon d’une struc-ture exponentielle est :

θ =1

r

rXi=1

Xi

C’est la moyenne empirique du r-échantillon.

2. Pour tout θ, θ > 0, et tout (x1, ..., xr) ∈ Rr, tous strictement positifs, on a :

L (θ;x1, ..., xr) =1

θrexp−

rPi=1

xi

θ

=1

θrexp−rθ (x1, ..., xr)

θ

13

Page 18: Exercices Corrigés...C’est l’inverse de la moyenne empirique du r-échantillon. 6. Soit Xune variable aléatoire normale de paramètres μet σ2. Sa densité de probabilité fest

Structures Statistiques et Estimation A. El Mossadeq

D’après le théorème de factorisation, θ est un résumé exhaustif puisque :

L (θ;x1, ..., xr) = g³θ; θ (x1, ..., xr)

´h (x1, ..., xr)

où :

g³θ; θ (x1, ..., xr)

´=1

θrexp−rθ (x1, ..., xr)

θet :

h (x1, ..., xr) = 1

3. Comme :

θ =1

r

rXi=1

Xi

alors :

Ehθi

= E [X]

= θ

et :

Vhθi

=V [X]

r

=θ2

r

On en déduit que θ est un estimateur sans biais et convergent de θ.4. Calculons la quantité d’information de Fisher, I [X, θ], concernant θ.On a :

I [X, θ] = −E∙∂2

∂θ2ln f (θ,X)

¸= −E

∙∂2

∂θ2

µ− ln θ − X

θ

¶¸= E

∙− 1θ2+2X

θ3

¸=

1

θ2

Donc la quantité d’information de Fisher, I [X1, ..., Xr, θ], concernant θ fourniepar le r-échantillon est :

I [X1, ..., Xr, θ] = rI [X, θ]

=r

θ2

14

Page 19: Exercices Corrigés...C’est l’inverse de la moyenne empirique du r-échantillon. 6. Soit Xune variable aléatoire normale de paramètres μet σ2. Sa densité de probabilité fest

A. El Mossadeq Structures Statistiques et Estimation

Calculons l’efficacité ehθide .θ.

On a :

ehθi

=1

I [X1, ...,Xr, θ]Vhθi

= 1

donc, θ est efficace.

Exercice 3Soit X une variable aléatoire dont la densité de probabilité f est définie par :

f (x) =

⎧⎪⎨⎪⎩0 si x ≤ 0

λ

θkxk−1 exp−x

θsi x > 0

où θ est un paramètre réel strictement positif , k un entier naturel non nul et λ uneconstante réel.

1. Déterminer la constante λ.2. Déterminer l’estimateur du maximum de vraisemlance θ de θ d’un r-échantillonde variable parente X.

3. θ est-il un résumé exhaustif ?4. Calculer l’espérance mathématique et la variance de θ.Que peut-on conclure ?

5. Calculer la quantité d’information de Fisher.En déduire que θ est efficace.

Solution 3La densité de probabilité de la variable aléatoire X est définie par :

f (x) =

⎧⎪⎨⎪⎩0 si x ≤ 0

λ

θkxk−1 exp−x

θsi x > 0

Rappelons que pour tout k ∈ N :Z +∞

0

uk exp−udu = k!

15

Page 20: Exercices Corrigés...C’est l’inverse de la moyenne empirique du r-échantillon. 6. Soit Xune variable aléatoire normale de paramètres μet σ2. Sa densité de probabilité fest

Structures Statistiques et Estimation A. El Mossadeq

1. Ainsi : Z +∞

−∞f (x) dx =

Z +∞

0

λ

θkxk−1 exp−x

θdx

=

Z +∞

0

λuk−1 exp−udu

= λ (k − 1)!

d’où

λ =1

(k − 1)!puisque : Z +∞

−∞f (x) dx = 1

De plus :

E [X] =

Z +∞

−∞xf (x) dx

=

Z +∞

0

1

(k − 1)!θkxk exp−x

θdx

= kθ

et :

E£X2¤

=

Z +∞

−∞x2f (x) dx

=

Z +∞

0

1

(k − 1)!θkxk+1 exp−x

θdx

= k (k + 1) θ2

d’où :

V [X] = E£X2¤−E [X]2

= kθ2

2. Considérons un r-échantillon de cette structure.Sa fonction de vraisemblance est définie pour tout θ, θ > 0, et tout (x1, ..., xr)Rr,tous strictement positifs, par :

16

Page 21: Exercices Corrigés...C’est l’inverse de la moyenne empirique du r-échantillon. 6. Soit Xune variable aléatoire normale de paramètres μet σ2. Sa densité de probabilité fest

A. El Mossadeq Structures Statistiques et Estimation

L (θ;x1, ..., xr) =rY

i=1

f (xi)

=1

[(k − 1)!]r θrk(x1...xr)

k−1 exp−

rPi=1

xi

θ

d’où :

lnL (θ;x1, ..., xr) = −r ln (k − 1)!− ln (x1...xr)k−1 − rk ln θ −

rPi=1

xi

θ

Il en résulte que :

∂θlnL (θ;x1, ..., xr) = −

rk

θ+

rPi=1

xi

θ2

d’où :

∂θlnL (θ;x1, ..., xr) = 0 =⇒ θ =

1

rk

rXi=1

xi

et comme :∂2

∂θ2lnL (θ;x1, ..., xr) < 0

donc l’estimateur du maximum de vraisemblance d’un r-échantillon de cettestructure est :

θ =1

rk

rXi=1

Xi

3. Pour tout θ, θ > 0, et tout (x1, ..., xr) ∈ Rr, tous strictement positifs, on a :

L (θ;x1, ..., xr) =1

[(k − 1)!]r θrk(x1...xr)

k−1 exp−

rPi=1

xi

θ

=1

[(k − 1)!]r θrk(x1...xr)

k−1 exp−rkθ (x1, ..., xr)θ

D’après le théorème de factorisation, θ est un résumé exhaustif puisque :

L (θ;x1, ..., xr) = g³θ; θ (x1, ..., xr)

´h (x1, ..., xr)

17

Page 22: Exercices Corrigés...C’est l’inverse de la moyenne empirique du r-échantillon. 6. Soit Xune variable aléatoire normale de paramètres μet σ2. Sa densité de probabilité fest

Structures Statistiques et Estimation A. El Mossadeq

où :

g³θ; θ (x1, ..., xr)

´=

1

θrkexp−rkθ (x1, ..., xr)

θ

et :

h (x1, ..., xr) =1

[(k − 1)!]r (x1...xr)k−1

4. Puisque :

θ =1

rk

rXi=1

Xi

alors :

Ehθi=1

kE [X] = θ

et :

Vhθi=

V [X]

rk2=

θ2

rk

On en déduit que θ est un estimateur sans biais et convergent de θ.5. Calculons la quantité d’information de Fisher, I [X, θ], concernant θ.On a :

I [X, θ] = −E∙∂2

∂θ2ln f (θ,X)

¸= −E

∙∂2

∂θ2

µ− ln (k − 1)! + (k − 1) lnX − k ln θ − X

θ

¶¸= E

∙− k

θ2+2X

θ3

¸=

k

θ2

Donc la quantité d’information de Fisher, I [X1, ..., Xr, θ], concernant θ fourniepar le r-échantillon est :

I [X1, ..., Xr, θ] = rI [X, θ]

=rk

θ2

Calculons l’efficacité ehθide .θ.

On a :

ehθi=

1

I [X1, ..., Xr, θ]Vhθi = 1

18

Page 23: Exercices Corrigés...C’est l’inverse de la moyenne empirique du r-échantillon. 6. Soit Xune variable aléatoire normale de paramètres μet σ2. Sa densité de probabilité fest

A. El Mossadeq Structures Statistiques et Estimation

donc, θ est efficace.

Exercice 4Soit X une variable aléatoire dont la densité de probabilité f est définie par :

f (x) =

⎧⎪⎨⎪⎩0 si x /∈ [0, θ]

1

θsi x ∈ [0, θ]

où θ est un paramètre réel.

1. Déterminer la fonction de répartition de X.2. Calculer la quantité d’information de Fisher.3. Déterminer l’estimateur du maximum de vraisemlance θ de θ d’un r-échantillonde variable parente X.

4. Calculer l’espérance mathématique et la variance de θ.Que peut-on conclure ?

5. Dans le cas où θ est biasé, proposer un estimateur sans biais de θ.

Solution 41. La fonction de répartition F de X est définie pour tout x ∈ R par :

F (x) =

Z x

−∞f (t) dt

d’où :

F (x) =

⎧⎪⎪⎪⎪⎪⎨⎪⎪⎪⎪⎪⎩

0 si x ≤ 0

x

θsi 0 ≤ x ≤ θ

1 si x ≥ θ

de plus : ⎧⎪⎪⎪⎨⎪⎪⎪⎩E [X] =

θ

2

V [X] =θ2

12

2. Puisque le domaine Dθ :

Dθ = {x ∈ R |f (x) > 0}= [0, θ]

19

Page 24: Exercices Corrigés...C’est l’inverse de la moyenne empirique du r-échantillon. 6. Soit Xune variable aléatoire normale de paramètres μet σ2. Sa densité de probabilité fest

Structures Statistiques et Estimation A. El Mossadeq

dépend de θ, donc la quantité d’information de Fisher n’existe pas.

3. Considérons un r-échantillon de cette structure.Sa fonction de vraisemblance est définie pour tout θ, θ > 0, et tout (x1, ..., xr) ∈[0, θ]r :

L (θ;x1, ..., xr) =rY

i=1

f (xi)

=1

θr

La fonction :

θ −→ L (θ;x1, ..., xr)est strictement décroissante, donc elle atteint son maximum lorsque θ est min-imum.Et comme :

∀i ∈ {1, ..., r} : θ ≥ xi

Il en résulte que θ est minimum lorsque :

θ = max (x1, ..., xr)

Donc l’estimateur dumaximum de vraisemblance d’un r-échantillon d’une struc-ture uniforme est :

θ = max (X1, ...,Xr)

4. Pour déterminer la densité de probabilité de θ, commençons d’abord par calculersa fonction de répartition.

(a) Fonction de répartition de θ :

20

Page 25: Exercices Corrigés...C’est l’inverse de la moyenne empirique du r-échantillon. 6. Soit Xune variable aléatoire normale de paramètres μet σ2. Sa densité de probabilité fest

A. El Mossadeq Structures Statistiques et Estimation

Pour tout u ∈ R on a :

Fθ (u) = Phθ < u

i= P [max (X1, ...,Xr) < u]

= P [X1 < u, ...,Xr < u]

=rY

k=1

P [Xk < u]

= [F (u)]r

=

⎧⎪⎪⎪⎪⎪⎨⎪⎪⎪⎪⎪⎩

0 si u ≤ 0³uθ

´rsi 0 ≤ u ≤ θ

1 si u ≥ θ

21

Page 26: Exercices Corrigés...C’est l’inverse de la moyenne empirique du r-échantillon. 6. Soit Xune variable aléatoire normale de paramètres μet σ2. Sa densité de probabilité fest

Structures Statistiques et Estimation A. El Mossadeq

(b) Densité de probabilité de θ :Pour tout u ∈ R− {0, θ} on a :

fθ (u) =d

duFθ (u)

=

⎧⎪⎨⎪⎩0 si u /∈ ]0, θ[

rur−1

θrsi u ∈ ]0, θ[

(c) Espérance mathématique de θ :

Ehθi

=

ZRufθ (u) du

=

Z θ

0

rur

θrdu

=r

r + 1θ

(d) Espérance mathématique de θ2:

Ehθ2i

=

ZRu2fθ (u) du

=

Z θ

0

rur+1

θrdu

=r

r + 2θ2

(e) Variance de θ :

Vhθi

= Ehθ2i−E

hθi2

=r

(r + 1)2 (r + 2)θ2

L’estimateur θ de θ est biaisé, mais il est asymptotiquement sans biais.

5. Considérons l’estimateur :

T =r + 1

Alors :

E [T ] =r + 1

rEhθi

= θ

22

Page 27: Exercices Corrigés...C’est l’inverse de la moyenne empirique du r-échantillon. 6. Soit Xune variable aléatoire normale de paramètres μet σ2. Sa densité de probabilité fest

A. El Mossadeq Structures Statistiques et Estimation

et :

V [T ] =

µr + 1

r

¶2Vhθi

=1

r (r + 2)θ2

T est donc un estimateur sans biais et convergent de θ.

Exercice 5Soit X une variable aléatoire dont la densité de probabilité f est définie par :

f (x) =

⎧⎨⎩ 0 si x < θ

exp (θ − x) si x ≥ θ

où θ est un paramètre réel.

1. Déterminer la fonction de répartition de X.2. Calculer la quantité d’information de Fisher.3. Déterminer l’estimateur du maximum de vraisemlance θ de θ d’un r-échantillonde variable parente X.

4. Calculer l’espérance mathématique et la variance de θ.Que peut-on conclure ?

5. Dans le cas où θ est biasé, proposer un estimateur sans biais de θ.

Solution 51. La fonction de répartition F de X est définie pour tout x ∈ R par :

F (x) =

Z x

−∞f (t) dt

d’où :

F (x) =

⎧⎨⎩ 0 si x ≤ θ

1− exp (θ − x) si x ≥ θ

de plus : ⎧⎨⎩ E [X] = θ + 1

V [X] = 1

23

Page 28: Exercices Corrigés...C’est l’inverse de la moyenne empirique du r-échantillon. 6. Soit Xune variable aléatoire normale de paramètres μet σ2. Sa densité de probabilité fest

Structures Statistiques et Estimation A. El Mossadeq

2. Puisque le domaine Dθ :

Dθ = {x ∈ R |f (x) > 0}= [θ,+∞[

dépend de θ, donc la quantité d’information de Fisher n’existe pas.

3. Considérons un r-échantillon de cette structure.Sa fonction de vraisemblance est définie pour tout θ ∈ R, et tout (x1, ..., xr) ∈([θ,+∞[)r :

L (θ;x1, ..., xr) =rY

i=1

f (xi)

= exprX

i=1

(θ − xi)

La fonction :

θ −→ L (θ;x1, ..., xr)est strictement croissante, donc elle atteint son maximum lorsque θ est maxi-mum.Et comme :

∀i ∈ {1, ..., r} : θ ≤ xi

Il en résulte que θ est maximum lorsque :

θ = min (x1, ..., xr)

Donc l’estimateur du maximum de vraisemblance d’un r-échantillon de cettestructure est :

θ = min (X1, ...,Xr)

4. Pour déterminer la densité de probabilité de θ, commençons d’abord par calculersa fonction de répartition.

24

Page 29: Exercices Corrigés...C’est l’inverse de la moyenne empirique du r-échantillon. 6. Soit Xune variable aléatoire normale de paramètres μet σ2. Sa densité de probabilité fest

A. El Mossadeq Structures Statistiques et Estimation

(a) Fonction de répartition de θ :

Pour tout v ∈ R on a :

Fθ (v) = Phθ < v

i= P [min (X1, ...,Xr) < v]

= 1− P [min (X1, ...,Xr) ≥ v]

= 1− P [X1 ≥ v, ...,Xr ≥ v]

= 1−rY

k=1

P [Xk ≥ v]

= 1−rY

k=1

(1− P [Xk < v])

= 1− [1− F (v)]r

=

⎧⎨⎩ 0 si v ≤ θ

1− exp r (θ − v) si v ≥ θ

(b) Densité de probabilité de θ :

Pour tout u ∈ R− {θ} on a :

fθ (v) =d

dvFθ (v)

=

⎧⎨⎩ 0 si v < θ

r exp r (θ − v) si v > θ

(c) Espérance mathématique de θ :

Ehθi

=

ZRvfθ (v) dv

=

Z +∞

θ

rv exp r (θ − v) dv

= θ +1

r

25

Page 30: Exercices Corrigés...C’est l’inverse de la moyenne empirique du r-échantillon. 6. Soit Xune variable aléatoire normale de paramètres μet σ2. Sa densité de probabilité fest

Structures Statistiques et Estimation A. El Mossadeq

(d) Espérance mathématique de θ2:

Ehθ2i

=

ZRv2fθ (v) dv

=

Z +∞

θ

rv2 exp r (θ − v) dv

=

µθ +

1

r

¶2+1

r2

(e) Variance de θ :

Vhθi= E

hθ2i−E

hθi2=1

r2

L’estimateur θ de θ est biaisé, mais il est asymptotiquement sans biais.

5. Considérons l’estimateur :

T = θ − 1r

Alors :

E [T ] = Ehθi− 1

r= θ

et :

V [T ] = Vhθi=1

r2

T est donc un estimateur sans biais et convergent de θ.

Exercice 6Les éléments d’une population possédent un caractère X qui suit une loi de Poissonde paramètre inconnu α.Une suite de r expériences a fourni les valeurs k1, ..., kr.

1. Déterminer l’estimateur du maximum de vraisemlance α de α et étudier lespropriétés de cet estimateur.

2. α est-il un résumé exhaustif ?3. On désire estimer la quantité :

δ = P [X = 0]

Déterminer l’estimateur du maximum de vraisemlance δ de δ.Que remarquez-vous ?

26

Page 31: Exercices Corrigés...C’est l’inverse de la moyenne empirique du r-échantillon. 6. Soit Xune variable aléatoire normale de paramètres μet σ2. Sa densité de probabilité fest

A. El Mossadeq Structures Statistiques et Estimation

Solution 61. Soit X une variable aléatoire de Poisson de paramètre α.pour tout x ∈ N, la probabilité élémentaire p (x) de x est :

p (x) =αx

x!exp−α

de plus : ⎧⎨⎩ E [X] = α

V [X] = α

(a) Recherche du maximum de vraisemlance :Considérons un r-échantillon de cette structure.Sa fonction de vraisemblance est définie pour tout α, α > 0, et tout(k1, ..., kr) ∈ Nr par :

L (α; k1, ..., kr) =rY

i=1

p (ki)

rPi=1

ki

k1!...kr!exp−rα

d’où :

lnL (α; k1, ..., kr) = − ln (k1!...kr!) +rX

i=1

ki lnα− rα

Il en résulte que :

∂αlnL (α; k1, ..., kr) =

rPi=1

ki

α− r

d’où :

∂αlnL (α; k1, ..., kr) = 0 =⇒ p =

1

r

rXi=1

xi

et comme :∂2

∂α2lnL (α; k1, ..., kr) < 0

donc l’estimateur du maximum de vraisemblance d’un r-échantillon d’unestructure de Poisson est :

α =1

r

rXi=1

Xi

C’est la moyenne empirique du r-échantillon.

27

Page 32: Exercices Corrigés...C’est l’inverse de la moyenne empirique du r-échantillon. 6. Soit Xune variable aléatoire normale de paramètres μet σ2. Sa densité de probabilité fest

Structures Statistiques et Estimation A. El Mossadeq

(b) Etude des propriétés de α :Puisque :

E [α] = E [X]

= α

et :

V [α] =V [X]

r

r

On en déduit que α est un estimateur sans biais et convergent de α.

2. Pour tout α, α > 0, et tout (k1, ..., kr) ∈ Nr on a :

L (α;x1, ..., xr) =αrα(k1,...,kr)

x1!...xr!exp−rα

D’après le théorème de factorisation, θ est un résumé exhaustif puisque :

L (α;x1, ..., xr) = g (α; α (x1, ..., xr))h (x1, ..., xr)

où :

g (α; α (x1, ..., xr)) = αrα(k1,...,kr) exp−rαet :

h (x1, ..., xr) =1

x1!...xr!

3. On a :

δ = P [X = 0]

= exp−α

Pour tout δ, δ > 0, et tout (k1, ..., kr) ∈ Nr par :

L (δ; k1, ..., kr) =rY

i=1

p (ki)

=(− ln δ)

rPi=1

ki

k1!...kr!δr

d’où :

lnL (δ; k1, ..., kr) = − ln (k1!...kr!) +rX

i=1

ki ln (− ln δ) + r ln δ

28

Page 33: Exercices Corrigés...C’est l’inverse de la moyenne empirique du r-échantillon. 6. Soit Xune variable aléatoire normale de paramètres μet σ2. Sa densité de probabilité fest

A. El Mossadeq Structures Statistiques et Estimation

Il en résulte que :

∂δlnL (δ; k1, ..., kr) =

rPi=1

ki

δ ln δ+

r

δ

d’où :

∂δlnL (δ; k1, ..., kr) = 0 =⇒ δ = exp−

Ã1

r

rXi=1

ki

!et comme :

∂2

∂δ2lnL (δ; k1, ..., kr) < 0

donc l’estimateur du maximum de vraisemblance d’un r-échantillon de cettestructure est :

δ = exp−Ã1

r

rXi=1

Xi

!= exp−α

Exercice 7Soit α un réel appartenant à ]1,+∞[ et X une variable aléatoire telle que :

P [X = k] =1

α

µ1− 1

α

¶k−1, k ∈ N∗

1. Calculer l’espérance mathématique et la variance de X.2. Déterminer l’estimateur du maximum de vraisemlance α de α d’un r-échantillonde variable parente X et étudier ses propriétés.

3. α est-il un résumé exhaustif ?

Solution 71. On a :

E [X] =∞Xk=1

kP [X = k]

=∞Xk=1

k

α

µ1− 1

α

¶k−1

= α

29

Page 34: Exercices Corrigés...C’est l’inverse de la moyenne empirique du r-échantillon. 6. Soit Xune variable aléatoire normale de paramètres μet σ2. Sa densité de probabilité fest

Structures Statistiques et Estimation A. El Mossadeq

et :

E [X (X − 1)] =∞Xk=1

k (k − 1)P [X = k]

=∞Xk=1

k (k − 1)α

µ1− 1

α

¶k−1

= 2α2µ1− 1

α

¶d’où :

E£X2¤

= E [X (X − 1)] +E [X]

= α (2α− 1)

et :

V [X] = E£X2¤−E [X]2

= α (α− 1)

2. Considérons un r-échantillon de cette structure.Sa fonction de vraisemblance est définie pour tout α ∈ ]1,+∞[ et tout (x1, ..., xr) ∈(N∗)r par :

L (α;x1, ..., xr) =rY

i=1

p (xi)

=1

αr

µ1− 1

α

¶ rPi=1

xi−r

d’où :

lnL (α;x1, ..., xr) = −r lnα+Ã

rXi=1

xi − r

!ln

µ1− 1

α

¶Il en résulte que :

∂αlnL (α;x1, ..., xr) = − r

α+

rPi=1

xi − r

α (α− 1)

=

rPi=1

xi − rα

α (α− 1)

30

Page 35: Exercices Corrigés...C’est l’inverse de la moyenne empirique du r-échantillon. 6. Soit Xune variable aléatoire normale de paramètres μet σ2. Sa densité de probabilité fest

A. El Mossadeq Structures Statistiques et Estimation

d’où :

∂αlnL (α;x1, ..., xr) = 0 =⇒ α =

1

r

rXi=1

xi

et comme :∂2

∂α2lnL (p;x1, ..., xr) < 0

donc l’estimateur du maximum de vraisemblance d’un r-échantillon d’une struc-ture géométrique est :

α =1

r

rXi=1

Xi

C’est la moyenne empirique du r-échantillon.

3. Puisque :

α =1

r

rXi=1

Xi

alors :

E [α] = E [X]

= α

et :

V [α] =V [X]

r

=α (α− 1)

r

On en déduit que α est un estimateur sans biais et convergent du paramètre αd’une structure géométrique.

Exercice 8Soit X une variable aléatoire qui suit une loi de Pareto dont la densité de probabilitéf est définie par :

f (x) =

⎧⎪⎨⎪⎩αaα

xα+1si x ≥ a

0 si x < a

où X représente le revenu par habitant, a le revenu minimum et α, α > 2, uncoefficient dépendant du type du pays où l’on se place.

31

Page 36: Exercices Corrigés...C’est l’inverse de la moyenne empirique du r-échantillon. 6. Soit Xune variable aléatoire normale de paramètres μet σ2. Sa densité de probabilité fest

Structures Statistiques et Estimation A. El Mossadeq

1. Vérifier que f est bien une densité de probabilité.2. Calculer l’espérance mathématique et la variance de X.3. Calculer la fonction de répartition de X.4. Déterminer l’estimateur du maximum de vraisemlance a de a d’un r-échantillonissu X.

5. Dans le cas où a est biasé, proposer un estimateur sans biais de a.

Solution 81. La densité de probabilité de la loi de Pareto est définie par :

f (x) =

⎧⎪⎨⎪⎩αaα

xα+1si x ≥ a

0 si x < a

f est bien une densité de probabilité.En effet : Z

Rf (x) dx =

Z +∞

a

αaα

xα+1dx

= 1

2. On a :

E [X] =

ZRxf (x) dx

=

Z +∞

a

αaα

xαdx

α− 1a

et :

E£X2¤

=

ZRx2f (x) dx

=

Z +∞

a

αaα

xα−1dx

α− 2a2

d’où :

V [X] = E£X2¤−E [X]2

(α− 2) (α− 1)2a2

32

Page 37: Exercices Corrigés...C’est l’inverse de la moyenne empirique du r-échantillon. 6. Soit Xune variable aléatoire normale de paramètres μet σ2. Sa densité de probabilité fest

A. El Mossadeq Structures Statistiques et Estimation

3. La fonction de répartition F de X est définie pour tout x ∈ R par :

F (x) =

Z x

−∞f (t) dt

=

⎧⎪⎪⎨⎪⎪⎩0 si x ≥ aZ x

a

αaα

tα+1dt si x ≥ a

=

⎧⎪⎨⎪⎩0 si x ≤ a

1− aα

xαsi x ≥ a

4. Considérons un r-échantillon de cette structure.Sa fonction de vraisemblance est définie pour tout a ∈ R et tout (x1, ..., xr) ∈(]a,+∞[)r, par :

L (a;x1, ..., xr) =rY

i=1

f (xi)

=αrarα

(x1...xr)α+1

La fonction :

a −→ L (a;x1, ..., xr)est strictement croissante, donc elle atteint son maximum lorsque a est maxi-mum.Et comme :

∀i ∈ {1, ..., r} : a ≤ xi

Il en résulte que θ est maximum lorsque :

a = min (x1, ..., xr)

Donc l’estimateur du maximum de vraisemblance d’un r-échantillon de cettestructure est :

a = min (X1, ...,Xr)

5. Pour déterminer la densité de probabilité de θ, commençons d’abord par calculersa fonction de répartition.

33

Page 38: Exercices Corrigés...C’est l’inverse de la moyenne empirique du r-échantillon. 6. Soit Xune variable aléatoire normale de paramètres μet σ2. Sa densité de probabilité fest

Structures Statistiques et Estimation A. El Mossadeq

(a) Fonction de répartition de a :Pour tout x ∈ R on a :

Fa (x) = P [a < x]

= P [min (X1, ..., Xr) < x]

= 1− P [min (X1, ..., Xr) ≥ x]

= 1− P [X1 ≥ v, ..., Xr ≥ x]

= 1−rY

k=1

P [Xk ≥ x]

= 1−rY

k=1

(1− P [Xk < x])

= 1− [1− F (x)]r

=

⎧⎨⎩ 0 si x ≤ a

1−µaα

¶r

si x ≥ a

(b) Densité de probabilité de θ :Pour tout x ∈ R− {a} on a :

fa (x) =d

dvFa (x)

=

⎧⎪⎨⎪⎩0 si x < a

rαarα

xrα+1si x > a

(c) Espérance mathématique de a :

E [a] =

ZRvfa (v) dv

=

Z +∞

a

rαarα

vrαdv

=rα

rα− 1a

(d) Espérance mathématique de a2 :

E£a2¤

=

ZRv2fa (v) dv

=

Z +∞

a

rαarα

vrα−1dv

=rα

rα− 2a2

34

Page 39: Exercices Corrigés...C’est l’inverse de la moyenne empirique du r-échantillon. 6. Soit Xune variable aléatoire normale de paramètres μet σ2. Sa densité de probabilité fest

A. El Mossadeq Structures Statistiques et Estimation

(e) Variance de a :

V [a] = E£a2¤−E [a]2

=rα

(rα− 2) (rα− 1)2a2

L’estimateur a de a est biaisé, mais il est asymptotiquement sans biais.(f) Considérons l’estimateur :

T =rα− 1rα

a

Alors :

E [T ] = a

et :

V [T ] =

µrα− 1rα

¶2V [a] =

1

rα (rα− 2)a2

T est donc un estimateur sans biais et convergent de a.

Exercice 9Soit X une variable aléatoire dont la densité de probabilité f est définie par :

f (x) =

⎧⎪⎨⎪⎩0 si x ≤ θ

1

αexp

(θ − x)

αsi x > θ

où θ est un paramètre réel et α un paramètre réel strictement positif.

1. Vérifier que f est bien une densité de probabilité.2. Calculer l’espérance mathématique et la variance de X.3. Calculer la fonction de répartition de X.4. On suppose θ connu et α inconnu.

(a) Déterminer l’estimateur du maximum de vraisemlance α de α d’un r-échantillon issu X.

(b) Etudier les propriétés de α.(c) Dans le cas où α est biasé, proposer un estimateur sans biais de α.

5. On suppose α connu et θ inconnu.

(a) Déterminer l’estimateur du maximum de vraisemlance θ de θ d’un r-échantillon issu de X.

(b) Etudier les propriétés de θ(c) Dans le cas où θ est biasé, proposer un estimateur sans biais de θ.

35

Page 40: Exercices Corrigés...C’est l’inverse de la moyenne empirique du r-échantillon. 6. Soit Xune variable aléatoire normale de paramètres μet σ2. Sa densité de probabilité fest

Structures Statistiques et Estimation A. El Mossadeq

6. On suppose que θ et α sont tous les deux inconnus.

(a) Déterminer l’estimateur du maximum de vraisemlance³α, θ

´de (α, θ)

d’un r-échantillon issu de X.(b) Etudier les propriétés de

³α, θ

´(c) Proposer un estimateur sans biais de (α, θ) .

Solution 91. f est bien une densité de probabilité.En effet : Z

Rf (x) dx =

Z +∞

θ

1

αexp

(θ − x)

αdx

=

Z +∞

0

exp−tdt

= 1

2. On a :

E [X] =

ZRxf (x) dx

=

Z +∞

θ

x

αexp

(θ − x)

αdx

=

Z +∞

0

(αt+ θ) exp−tdt

= α+ θ

et :

E£X2¤

=

ZRx2f (x) dx

=

Z +∞

θ

x2

αexp

(θ − x)

αdx

=

Z +∞

0

(αt+ θ)2 exp−tdt

= 2α2 + 2αθ + θ2

= (α+ θ)2 + α2

d’où :

V [X] = E£X2¤−E [X]2

= α2

36

Page 41: Exercices Corrigés...C’est l’inverse de la moyenne empirique du r-échantillon. 6. Soit Xune variable aléatoire normale de paramètres μet σ2. Sa densité de probabilité fest

A. El Mossadeq Structures Statistiques et Estimation

3. La fonction de répartition F de X est définie pour tout x ∈ R par :

F (x) =

Z x

−∞f (t) dt

=

⎧⎪⎪⎨⎪⎪⎩0 si x ≤ θZ x

θ

1

αexp

(θ − t)

αdt si x ≥ θ

=

⎧⎪⎨⎪⎩0 si x ≤ θ

1− exp (θ − x)

αsi x ≥ θ

4. On suppose θ connu et α inconnu.

(a) Considérons un r-échantillon de cette structure.Sa fonction de vraisemblance est définie pour tout α, α > 0, θ ∈ R et tout(x1, ..., xr) ∈ (]θ,+∞[)r par :

L (α;x1, ..., xr) =rY

i=1

f (xi)

=1

αrexp

rXi=1

(θ − xi)

α

d’où :

lnL (α;x1, ..., xr) = −r lnα+1

α

rXi=1

(θ − xi)

Il en résulte que :

∂αlnL (α;x1, ..., xr) = − r

α− 1

α2

rXi=1

(θ − xi)

=1

α

"r − 1

α

rXi=1

(θ − xi)

#d’où :

∂αlnL (α;x1, ..., xr) = 0 =⇒ α =

1

r

rXi=1

(xi − θ)

=⇒ α =

"1

r

rXi=1

xi

#− θ

37

Page 42: Exercices Corrigés...C’est l’inverse de la moyenne empirique du r-échantillon. 6. Soit Xune variable aléatoire normale de paramètres μet σ2. Sa densité de probabilité fest

Structures Statistiques et Estimation A. El Mossadeq

et comme :∂2

∂α2lnL (α;x1, ..., xr) < 0

donc l’estimateur du maximum de vraisemblance d’un r-échantillon decette structure est :

α =

"1

r

rXi=1

Xi

#− θ

(b) On a :

E [α] = E

"Ã1

r

rXi=1

Xi

!− θ

#= α

et :

V [α] = V

"Ã1

r

rXi=1

Xi

!− θ

#

=V [X]

r

=α2

r

5. On suppose α connu et θ inconnu.

(a) Considérons un r-échantillon de cette structure.Sa fonction de vraisemblance est définie pour tout α, α > 0, θ ∈ R et tout(x1, ..., xr) ∈ (]θ,+∞[)r, tous strictement positifs, par :

L (θ;x1, ..., xr) =rY

i=1

f (xi)

=1

αrexp

rXi=1

(θ − xi)

α

La fonction :

θ −→ L (θ;x1, ..., xr)est strictement croissante, donc elle atteint son maximum lorsque θ estmaximum.

38

Page 43: Exercices Corrigés...C’est l’inverse de la moyenne empirique du r-échantillon. 6. Soit Xune variable aléatoire normale de paramètres μet σ2. Sa densité de probabilité fest

A. El Mossadeq Structures Statistiques et Estimation

Et comme :

∀i ∈ {1, ..., r} : θ ≤ xi

Il en résulte que θ est maximum lorsque :

θ = min (x1, ..., xr)

Donc l’estimateur du maximum de vraisemblance d’un r-échantillon decette structure est :

θ = min (X1, ...,Xr)

(b) Pour déterminer la densité de probabilité de θ, commençons d’abord parcalculer sa fonction de répartition.

(i) Fonction de répartition de θ :Pour tout v ∈ R on a :

Fθ (v) = Phθ < v

i= P [min (X1, ..., Xr) < v]

= 1− P [min (X1, ..., Xr) ≥ v]

= 1− P [X1 ≥ v, ..., Xr ≥ v]

= 1−rY

k=1

P [Xk ≥ v]

= 1−rY

k=1

(1− P [Xk < v])

= 1− [1− F (v)]r

=

⎧⎪⎪⎨⎪⎪⎩0 si v ≤ θ

1− exp rµθ − v

α

¶si v ≥ θ

(ii) Densité de probabilité de θ :Pour tout v ∈ R− {θ} on a :

fθ (v) =d

dvFθ (v)

=

⎧⎪⎪⎨⎪⎪⎩0 si v < θ

r

αexp r

µθ − v

α

¶si v > θ

39

Page 44: Exercices Corrigés...C’est l’inverse de la moyenne empirique du r-échantillon. 6. Soit Xune variable aléatoire normale de paramètres μet σ2. Sa densité de probabilité fest

Structures Statistiques et Estimation A. El Mossadeq

(iii) Espérance mathématique de θ :

Ehθi

=

ZRvfθ (v) dv

=

Z +∞

θ

r

αv exp r

µθ − v

α

¶dv

=

Z +∞

0

³αrt+ θ

´exp−tdt

r+ θ

(iv) Espérance mathématique de θ2:

Ehθ2i

=

ZRv2fθ (v) dv

=

Z +∞

θ

r

αv2 exp r (θ − v) dv

=³αr+ θ´2+³αr

´2(v) Variance de θ :

Vhθi

= Ehθ2i− E

hθi2

=³αr

´2L’estimateur θ de θ est biaisé, mais il est asymptotiquement sansbiais.

(c) Considérons l’estimateur :

T = θ − α

r

Alors :

E [T ] = Ehθi− α

r= θ

et :

V [T ] = Vhθi

r2

T est donc un estimateur sans biais et convergent de θ.

40

Page 45: Exercices Corrigés...C’est l’inverse de la moyenne empirique du r-échantillon. 6. Soit Xune variable aléatoire normale de paramètres μet σ2. Sa densité de probabilité fest

A. El Mossadeq Structures Statistiques et Estimation

6. On suppose que θ et α sont tous les deux inconnus.

(a) Considérons un r-échantillon de cette structure.Sa fonction de vraisemblance est définie pour tout α, α > 0, θ ∈ R et tout(x1, ..., xr) ∈ (]θ,+∞[)r, tous strictement positifs, par :

L (α, θ;x1, ..., xr) =rY

i=1

f (xi)

=1

αrexp

rXi=1

(θ − xi)

α

Compte tenu des questions précedentes, la fonction :

(α, θ) 7−→ L (α, θ;x1, ..., xr)

atteint son maximum pour :⎧⎪⎪⎪⎨⎪⎪⎪⎩θ = min (x1, ..., xr)

α =

"1

r

rXi=1

xi

#− θ

d’où, les estimateurs du maximum de vraisemblance³α, θ

´de (α, θ) sont

donnés par : ⎧⎪⎪⎪⎨⎪⎪⎪⎩θ = min (X1, ...,Xr)

α =

"1

r

rXi=1

Xi

#− θ

(b) On a :

Ehθi=

α

r+ θ

et :

E [α] = E [X]− Ehθi

=r − 1r

α

Donc les estimateurs α et θ sont biaisés.

41

Page 46: Exercices Corrigés...C’est l’inverse de la moyenne empirique du r-échantillon. 6. Soit Xune variable aléatoire normale de paramètres μet σ2. Sa densité de probabilité fest

Structures Statistiques et Estimation A. El Mossadeq

(c) Considérons les estimateurs T et S de α et θ respectivement définis par :⎧⎪⎪⎨⎪⎪⎩T =

r

r − 1 α

S = θ − 1

r − 1 α

alors : ⎧⎨⎩ E [T ] = α

E [S] = θ

Donc T et S sont des estimateurs sans biais de α et θ respectivement.

Exercice 10Soient X et Y deux variables aléatoires indépendantes, la première prenant lesvaleurs 1 et 0 avec les probabilités respectives α et 1−α, et la deuxième prenant lesvaleurs 1 et 0 avec les probabilités respectives P et 1− P . On suppose α inconnueet P connue, P > 0.5.On définit la variable aléatoire Z par :⎧⎨⎩ Z = 1 si X = Y

Z = 0 si X 6= Y

On considère un n-échantillon ((X1, Y1) , ..., (Xn, Yn)) de (X,Y ) et on définit Zi,1 ≤ i ≤ n, à partir de Xi et Yi comme on a défini Z à partir de X et Y .

1. Montrer que (Z1, ..., Zn) est un n-échantillon de Z.2. Etudier les propriétés de l’estimateur :

T =1

n(Z1 + ...+ Zn)

3. Proposer alors un estimateur sans biais S de α.4. Etudier la variance de S en fonction de P .5. Indiquer un intervalle de confiance pour α lorsque n est grand, en supposantqu’on dispose d’une observation p de la variable :

T =1

n(Z1 + ...+ Zn)

6. Voyez-vous une application de ce qui précède dans le domaine des sondagesd’opinion ?

42

Page 47: Exercices Corrigés...C’est l’inverse de la moyenne empirique du r-échantillon. 6. Soit Xune variable aléatoire normale de paramètres μet σ2. Sa densité de probabilité fest

A. El Mossadeq Structures Statistiques et Estimation

Solution 10On a : ⎧⎨⎩ P [X = 0] = 1− α

P [X = 1] = α

et : ⎧⎨⎩ P [Y = 0] = 1− P

P [Y = 1] = P

X et Y deux variables aléatoires de Bernouilli de paramètres α et P respectivement.Déterminons la loi de probabilité de Z :

P [Z = 0] = P [X 6= Y ]

= P [{(X,Y ) = (0, 1)}⊕ {(X,Y ) = (0, 1)}]= P [X = 0]P [Y = 1] + P [X = 1]P [Y = 0]

= (1− α)P + α (1− P )

et :

P [Z = 1] = P [X = Y ]

= P [{(X,Y ) = (0, 0)}⊕ {(X,Y ) = (1, 1)}]= P [X = 0]P [Y = 0] + P [X = 1]P [Y = 1]

= (1− α) (1− P ) + αP

Z est donc une variable aléatoire de Bernouilli de paramètre :

θ = (1− α) (1− P ) + αP

de plus :

E [Z] = θ

V [Z] = θ (1− θ)

1. Puisque (X1, Y1) , ..., (Xn, Yn) sont indépentants et suivent la même loi que(X,Y ), on en déduit que (Z1, ..., Zn) sont indépendants et suivent la mêmeloi que Z, donc c’est un n-échantillon de Z.

2. Soit l’estimateur :

T =1

n(Z1 + ...+ Zn)

On a :

E [T ] = E [Z]

= (1− α) (1− P ) + αP

43

Page 48: Exercices Corrigés...C’est l’inverse de la moyenne empirique du r-échantillon. 6. Soit Xune variable aléatoire normale de paramètres μet σ2. Sa densité de probabilité fest

Structures Statistiques et Estimation A. El Mossadeq

et :

V [T ] =1

nV [Z]

=1

n[(1− α) (1− P ) + αP ] [(1− α)P + α (1− P )]

3. T est donc un estimateur biaisé de α sauf lorsque :

α =1

2ou :

P = 1

(a) Si :

α =1

2ou P = 1

alors il suffit de prendre :

S = T

(b) Si :

α 6= 1

2et P 6= 1

alors il suffit de prendre :

S =1

2P − 1 [T − (1− P )]

4. On a :

V [S] =1

(2P − 1)2V [T ]

=1

n (2P − 1)2[(1− α) (1− P ) + αP ] [(1− α)P + α (1− P )]

44

Page 49: Exercices Corrigés...C’est l’inverse de la moyenne empirique du r-échantillon. 6. Soit Xune variable aléatoire normale de paramètres μet σ2. Sa densité de probabilité fest

Tests d’H ypothèses Les Fréquences

Page 50: Exercices Corrigés...C’est l’inverse de la moyenne empirique du r-échantillon. 6. Soit Xune variable aléatoire normale de paramètres μet σ2. Sa densité de probabilité fest
Page 51: Exercices Corrigés...C’est l’inverse de la moyenne empirique du r-échantillon. 6. Soit Xune variable aléatoire normale de paramètres μet σ2. Sa densité de probabilité fest

A. El Mossadeq Tests : Les Fréquences

Exercice 1A la veille d’une consultation électorale, on a intérrogé cent électeurs constituantun échantillon au hasard. Soixante ont déclaré avoir l’intention de voter pour lecandidat C.En quelles limites, au moment du sondage, la proportion du corps électoral favorableà C se situe-t-elle ?

Solution 1Construisons l’intervalle de confiance correspondant à la fréquence f = 0.6 du corpsélectoral favorable à C observée sur un échantillon de taille n = 100.Au seuil α, cet intervalle est défini par :"

f − t1−α/2

rf (1− f)

n, f + t1−α/2

rf (1− f)

n

#Pour α = 5%, on a :

t.975 = 1.96

on obtient alors l’intervalle :

[.504, .696]

A 95%, le candidat C serait élu.

Exercice 2On sait que le taux de mortalité d’une certaine maladie est de 30%.Sur 200 malades testés, combien peut-on envisager de décès ?

Solution 2Construisons d’obord l’intervalle de pari, pour un échantillon de taille n = 200,correspondant à la probabilité de décès p = 0.3.Au seuil α, cet intervalle est défini par :"

p− t1−α/2

rp (1− p)

n, p+ t1−α/2

rp (1− p)

n

#Pour α = 5%, on a :

t.975 = 1.96

47

Page 52: Exercices Corrigés...C’est l’inverse de la moyenne empirique du r-échantillon. 6. Soit Xune variable aléatoire normale de paramètres μet σ2. Sa densité de probabilité fest

Tests : Les Fréquences A. El Mossadeq

on obtient alors l’intervalle :

[.24, .36]

Il en résulte que sur les 200 malades, le nombre de décès à envisager serait compris,à 95%, entre 48 et 72 décès.

Exercice 3Dans une pré-enquête, on selectionne, par tirage au sort cent dossiers.Quinze d’entre eux sont incomplets.Combien de dossiers incomplets trouvera-t-on sur dix milles dossiers ?

Solution 3Construisons l’intervalle de confiance correspondant à la fréquence f = 0.15 dedossiers incomplets observée sur un échantillon de taille n = 100.Au seuil α, cet intervalle est défini par :"

f − t1−α/2

rf (1− f)

n, f + t1−α/2

rf (1− f)

n

#Pour α = 5%, on a :

t.975 = 1.96

on obtient alors l’intervalle :

[.08, .22]

Il en résulte que sur les 10000 dossiers, le nombre de dossiers incomplets seraitcompris, à 95%, entre 800 et 2200 dossiers.

Exercice 4Dans une maternité, on fait le point de la proportion de filles toutes les cent nais-sances.Comment peut varier cette proportion d’une fois à l’autre si l’on admet qu’il naiten moyenne 51% de filles ?

Solution 4Construisons l’intervalle de pari, pour un échantillon de taille n = 100, correspon-dant à la probabilité d’obtenir une fille p = 0.51.

48

Page 53: Exercices Corrigés...C’est l’inverse de la moyenne empirique du r-échantillon. 6. Soit Xune variable aléatoire normale de paramètres μet σ2. Sa densité de probabilité fest

A. El Mossadeq Tests : Les Fréquences

Au seuil α, cet intervalle est défini par :"p− t1−α/2

rp (1− p)

n, p+ t1−α/2

rp (1− p)

n

#Pour α = 5%, on a :

t.975 = 1.96

on obtient alors l’intervalle :

[.41, .61]

Il en résulte, qu’à 95%, la proportion de filles varie d’une fois à l’autre, entre 41%et 61%.

Exercice 5Une machine à former des pilules fonctionne de façon satisfaisante si la proportionde pilules non réussies est de 1 pour 1000.Sur un échantillon de 10000 pilules, on a trouvé 15 pilules défectueuses.Que faut-il conclure ?

Solution 5Ici on : ⎧⎪⎪⎪⎪⎨⎪⎪⎪⎪⎩

n = 104

f = 15× 10−4

p = 10−3

Testons, au seuil α, l’hypothèse nulle :

H0 : ”la machine est bien réglée”

Sous cette hypothèse, la quantité :

t =f − prp (1− p)

n

peut être considérée comme une réalisation d’une variable aléatoire normale centréeréduite.Pour α = 5%, on a :

t.975 = 1.96

49

Page 54: Exercices Corrigés...C’est l’inverse de la moyenne empirique du r-échantillon. 6. Soit Xune variable aléatoire normale de paramètres μet σ2. Sa densité de probabilité fest

Tests : Les Fréquences A. El Mossadeq

et comme :

t =f − prp (1− p)

n= 1.58

on accepte donc l’hypothèse nulle H0 au seuil α = 5%, c’est à dire, qu’au seuilα = 5%, la machine fonctionne de façon satisfaisante.

Exercice 6Sur un échantillon de 600 sujets atteints du cancer des poumons, on a trouvé 550fumeurs.Que peut-on dire du pourcentage de fumeurs parmi les cancéreux ?

Solution 6Construisons l’intervalle de confiance correspondant à la fréquence f =

11

12des

cancéreux parmi les fumeurs observée sur un échantillon de taille n = 600.Au seuil α, cet intervalle est défini par :"

f − t1−α/2

rf (1− f)

n, f + t1−α/2

rf (1− f)

n

#Pour α = 5%, on a :

t.975 = 1.96

on obtient alors l’intervalle :

[.9, .94]

Il en résulte que parmi, les fumeurs, la proportion des atteints par le cancer despoumons est comprise, à 95%, entre 90% et 94%.

Exercice 7Avant de procéder au lancement d’un produit, une entreprise a fait procéder à uneenquête portant sur deux régions géographiques A et B.Sur 1800 réponses provenant de la région A, 630 se déclarent intéressées par leproduit.En provenance de B, 150 réponses sur 600 se déclarent favorables.Tester, au seuil de 5%, l’hypothèse de l’identité des opinions des régions A et Bquant au produit considéré.

50

Page 55: Exercices Corrigés...C’est l’inverse de la moyenne empirique du r-échantillon. 6. Soit Xune variable aléatoire normale de paramètres μet σ2. Sa densité de probabilité fest

A. El Mossadeq Tests : Les Fréquences

Solution 7Ici on :

⎧⎪⎪⎨⎪⎪⎩nA = 1800 et fA =

7

20

nB = 600 et fB =1

4

Testons, au seuil α, l’hypothèse nulle :

H0 : ”les opinions des régions A et B sont identiques”

Sous cette hypothèse, la quantité :

t =fA − fBr

fA (1− fA)

nA+

fB (1− fB)

nB

peut être considérée comme une réalisation d’une variable aléatoire normale centréeréduite.Pour α = 5%, on a :

t.975 = 1.96

et comme :

t =fA − fBr

fA (1− fA)

nA+

fB (1− fB)

nB= 4.77

on rejette donc l’hypothèse nulle H0 à 95% (et même à 99.98%), c’est à dire, lesdeux régions A et B ont des opinions différentes.

Exercice 8Dans un groupe de 200 malades atteints du cancer du col de l’utérus, un traitementpar application locale du radium a donné 50 guérisons.Un autre groupe de 150 sujets atteints de la même maladie a été traité par chirurgie,on a trouvé 50 guérisons.Que peut-on conclure ?

51

Page 56: Exercices Corrigés...C’est l’inverse de la moyenne empirique du r-échantillon. 6. Soit Xune variable aléatoire normale de paramètres μet σ2. Sa densité de probabilité fest

Tests : Les Fréquences A. El Mossadeq

Solution 8Ici on :

⎧⎪⎪⎨⎪⎪⎩n1 = 200 , f1 =

1

4

n2 = 150 , f2 =1

3

Testons, au seuil α, l’hypothèse nulle :

H0 : ”les deux traitements sont équivalents”

Sous cette hypothèse, la quantité :

t =f1 − f2r

f1 (1− f1)

n1+

f2 (1− f2)

n2

peut être considérée comme une réalisation d’une variable aléatoire normale centréeréduite.Pour α = 5%, on a :

t.975 = 1.96

et comme :

t =f1 − f2r

f1 (1− f1)

n1+

f2 (1− f2)

n2= −1.69

on accepte donc l’hypothèse nulle H0 au seuil 5%, c’est à dire, les deux méthodessont équivalentes.

Exercice 9Aux guichets d’une gare parisienne, sur les 350 billets vendus vendredi après-midi,95 étaient des billets de 1ere classe. Sur les 250 billets vendus la matinée du lundisuivant, 55 étaient de 1ere classe.Peut-on considérer qu’il y a une différence entre les proportions de vente de parcoursen 1ere classe pour les fins et débuts de semaines ?

52

Page 57: Exercices Corrigés...C’est l’inverse de la moyenne empirique du r-échantillon. 6. Soit Xune variable aléatoire normale de paramètres μet σ2. Sa densité de probabilité fest

A. El Mossadeq Tests : Les Fréquences

Solution 9Ici on :

⎧⎪⎪⎨⎪⎪⎩n1 = 350 , f1 =

19

70

n2 = 250 , f2 =11

50

Testons, au seuil α, l’hypothèse nulle :

H0 : ”les taux de billets de 1ere classe vendus en finet début de semaines sont identiques”

Sous cette hypothèse, la quantité :

t =f1 − f2r

f1 (1− f1)

n1+

f2 (1− f2)

n2

peut être considérée comme une réalisation d’une variable normale centrée réduite.Pour α = 5%, on a :

t.975 = 1.96

et comme :

t =f1 − f2r

f1 (1− f1)

n1+

f2 (1− f2)

n2

= 1.45

on accepte donc l’hypothèse nulle H0 au seuil 5%, c’est à dire, les taux de billetsde parcours en 1ere classe vendus en fins et débuts de semaines sont identiques etqu’on peut estimer par :

f =n1f1 + n2f2n1 + n2

= 0.25

Exercice 10On a lancé cent fois une pièce de monnaie et l’on a obtenu soixante fois ”pile” etquarante fois ”face”.Tester au seuil de 5%, puis 1%, l’hypothèse de la loyauté de la pièce.

53

Page 58: Exercices Corrigés...C’est l’inverse de la moyenne empirique du r-échantillon. 6. Soit Xune variable aléatoire normale de paramètres μet σ2. Sa densité de probabilité fest

Tests : Les Fréquences A. El Mossadeq

Solution 10Ici on : ½

n = 100f = 0.6

où f est la fréquence de ”pile”.Testons, au seuil α, l’hypothèse nulle :

H0 : ”la pièce est loyale”

Sous cette hypothèse, on a :

p = 0.5

et la quantité :

t =f − prp (1− p)

n

peut être considérée comme une réalisation d’une variable aléatoire normale centréeréduite.on a :

t =f − prp (1− p)

n= 2

(1) Pour α = 5%, on a :

t.975 = 1.96

on rejette donc l’hypothèse nulle H0 à 95%, c’est à dire, qu’à 95%, la pièceest truquée.

(2) Pour α = 1%, on a :

2.57 < t.995 < 2.58

on accepte donc l’hypothèse nulle H0 au seuil α = 1%, c’est à dire, qu’auseuil α = 1%, la pièce est normale.

Exercice 11Un échantillon de taille n a donné lieu au calcul d’une fréquence observée f corre-spondant à l’intervalle de confiance [.22− .34] au seuil α = 5%.

1. Calculer n.2. Par rapport à la proportion p = 0.3, l’écart est-il significatif au seuil α = 5% ?3. Déterminer l’intervalle de confiance de |f − p| au seuil α = 5%.

54

Page 59: Exercices Corrigés...C’est l’inverse de la moyenne empirique du r-échantillon. 6. Soit Xune variable aléatoire normale de paramètres μet σ2. Sa densité de probabilité fest

A. El Mossadeq Tests : Les Fréquences

Solution 111. Au seuil α, l’intervalle de confiance correspondant à une fréquence f observéesur un échantillon de taille n est défini par :"

f − t1−α/2

rf (1− f)

n, f + t1−α/2

rf (1− f)

n

#On en déduit : ⎧⎪⎪⎪⎨⎪⎪⎪⎩

f =0.22 + 0.34

2

n = t21−α/2f (1− f)

(f − 0.22)2

Pour α = 5%, on a :

t0.975 = 1.96

on obtient alors : ½f = .28n = 215

2. Testons, au seuil α, l’hypothèse nulle :

H0 : ”l’écart n’est pas singificatif”

Sous cette hypothèse, la quantité :

t =f − prp (1− p)

n

peut être considérée comme une réalisation d’une variable aléatoire normalecentrée réduite.On a :

t =f − prp (1− p)

n= −0.64

Pour α = 5%, on a :

t.975 = 1.96

on accepte donc l’hypothèse nulle H0 au seuil α = 5%.3. Au seuil α :

f − prp (1− p)

n

∈£−t1−α/2, t1−α/2

¤

55

Page 60: Exercices Corrigés...C’est l’inverse de la moyenne empirique du r-échantillon. 6. Soit Xune variable aléatoire normale de paramètres μet σ2. Sa densité de probabilité fest

Tests : Les Fréquences A. El Mossadeq

donc, au seuil α :

|f − p| ∈"0, t1−α/2

rp (1− p)

n

#Pour α = 5%, on a :

t.975 = 1.96

d’où :

|f − p| ∈ [0, 0.06]

Exercice 12L’étude du taux de défectuosités afférentes aux caractéristiques de traitements ther-miques d’une même pièce, traitée par deux fours différents, a donné lieu aux résultatssuivants :* Pour le premier four, 20 pièces défectueuses sur un échantillon de 200 piècestraitées.* Pour le second four, 120 pièces défectueuses sur un échantillon de 800 piècestraitées.Que peut-on conclure ?

Solution 12Ici on : ⎧⎨⎩ n1 = 200 , f1 = 0.10

n2 = 800 , f2 = 0.15

Testons, au seuil α, l’hypothèse nulle :

H0 : ”les deux traitements thermiques sont équivalents”

Sous cette hypothèse, la quantité :

t =f1 − f2r

f1 (1− f1)

n1+

f2 (1− f2)

n2

peut être considérée comme une réalisation d’une variable aléatoire normale centréeréduite.Pour α = 5%, on a :

t.975 = 1.96

56

Page 61: Exercices Corrigés...C’est l’inverse de la moyenne empirique du r-échantillon. 6. Soit Xune variable aléatoire normale de paramètres μet σ2. Sa densité de probabilité fest

A. El Mossadeq Tests : Les Fréquences

et comme :

t =f1 − f2r

f1 (1− f1)

n1+

f2 (1− f2)

n2= −2.03

on rejette donc l’hypothèse nulle H0 à 95%, c’est à dire, les deux traitements ne sontpas équivalents.

Exercice 13Un questionnaire auquel on ne peut répondre que par ”oui” ou par ”non”, a étérempli par un échantillon de taille n.L’intervalle de confiance de la fréquence observée f des réponses ”oui” est (0.35− 0.43)au seuil α = 5%.

1. Quelle est la taille n de l’échantillon.2. Par rapport à la proportion p = 0.4, l’écart est-il significatif au seuil α = 5% ?3. Déterminer l’intervalle de confiance de |f − p| au seuil α = 5%.

Solution 131. Au seuil α, l’intervalle de confiance correspondant à une fréquence f observéesur un échantillon de taille n est défini par :"

f − t1−α/2

rf (1− f)

n, f + t1−α/2

rf (1− f)

n

#On en déduit : ⎧⎪⎪⎪⎨⎪⎪⎪⎩

f =0.35 + 0.43

2

n = t21−α/2f (1− f)

(f − 0.35)2

Pour α = 5%, on a :

t0.975 = 1.96

on obtient alors : ⎧⎨⎩ f = 0.39

n = 571

57

Page 62: Exercices Corrigés...C’est l’inverse de la moyenne empirique du r-échantillon. 6. Soit Xune variable aléatoire normale de paramètres μet σ2. Sa densité de probabilité fest

Tests : Les Fréquences A. El Mossadeq

2. Testons, au seuil α, l’hypothèse nulle :

H0 : ”l’écart n’est pas singificatif”

Sous cette hypothèse, la quantité :

t =f − prp (1− p)

n

peut être considérée comme une réalisation d’une variable aléatoire normalecentrée réduite.On a :

t =f − prp (1− p)

n= −0.49

Pour α = 5%, on a :

t.975 = 1.96

On accepte donc l’hypothèse nulle H0 au seuil α = 5%.3. Au seuil α :

f − prp (1− p)

n

∈£−t1−α/2, t1−α/2

¤donc, au seuil α :

|f − p| ∈"0, t1−α/2

rp (1− p)

n

#Pour α = 5%, on a :

t.975 = 1.96

d’où :

|f − p| ∈ [0, 0.04]

Exercice 14Parmi 470 sujets exposés à une infection, 370 n’ayant pas été immunisés.Parmi ces derniers, 140 contractent la malidie ainsi que 25 sujets immunisés.Le traitement donne-t-il une protection significative ?

58

Page 63: Exercices Corrigés...C’est l’inverse de la moyenne empirique du r-échantillon. 6. Soit Xune variable aléatoire normale de paramètres μet σ2. Sa densité de probabilité fest

A. El Mossadeq Tests : Les Fréquences

Solution 14Soient f1 la fréquence de contracter la maladie pour un sujet non immunisé et f2 lafréquence de contracter la maladie pour un sujet immunisé.Ici on : ⎧⎪⎪⎨⎪⎪⎩

n1 = 370 et f1 =14

37

n2 = 100 et f2 =1

4

Testons, au seuil α, l’hypothèse nulle :

H0 : ”le traitements n’est pas efficace”

Sous cette hypothèse, la quantité :

t =f1 − f2r

f1 (1− f1)

n1+

f2 (1− f2)

n2

peut être considérée comme une réalisation d’une variable aléatoire normale centréeréduite.Pour α = 5%, on a :

t.975 = 1.96

et comme :

t =f1 − f2r

f1 (1− f1)

n1+

f2 (1− f2)

n2= 2.56

On rejette donc l’hypothèse nulle H0 à 95%, c’est à dire, le traitement donne uneprotection significative.

59

Page 64: Exercices Corrigés...C’est l’inverse de la moyenne empirique du r-échantillon. 6. Soit Xune variable aléatoire normale de paramètres μet σ2. Sa densité de probabilité fest
Page 65: Exercices Corrigés...C’est l’inverse de la moyenne empirique du r-échantillon. 6. Soit Xune variable aléatoire normale de paramètres μet σ2. Sa densité de probabilité fest

Les Tests du Khi-deux

Page 66: Exercices Corrigés...C’est l’inverse de la moyenne empirique du r-échantillon. 6. Soit Xune variable aléatoire normale de paramètres μet σ2. Sa densité de probabilité fest
Page 67: Exercices Corrigés...C’est l’inverse de la moyenne empirique du r-échantillon. 6. Soit Xune variable aléatoire normale de paramètres μet σ2. Sa densité de probabilité fest

A. El Mossadeq Les Tests du Khi-Deux

Exercice 1Avant de procéder au lancement d’un produit, une entreprise a fait procéder à uneenquête portant sur deux régions géographiques A et B.Sur 1800 réponses provenant de la région A, 630 se déclarent intéressées par leproduit.En provenance de B, 150 réponses sur 600 se déclarent favorables.Tester, au seuil de 5%, l’hypothèse de l’identité des opinions des régions A et Bquant au produit considéré.

Solution 1La répartition observée est :

Tableau des effectifs observees

RegionÂOpinion favorable non favorable Total

Region A 630 1170 1800

Region B 150 450 600

Total 780 1620 2400

Testons, au seuil α, l’hypothèse nulle :

H0 : ”les régions A et B ont la même opinion”

Calculons, sous cette hypothèse, la répartition théorique :

Tableau des effectifs theoriques

RegionÂOpinion favorable non favorable Total

Region A 585 1215 1800

Region B 195 405 600

Total 780 1620 2400

Sous l’hypothèse nulle H0, la quantité :

χ2 =2X

i=1

2Xj=1

(oij − tij)2

tij

63

Page 68: Exercices Corrigés...C’est l’inverse de la moyenne empirique du r-échantillon. 6. Soit Xune variable aléatoire normale de paramètres μet σ2. Sa densité de probabilité fest

Les Tests du Khi-Deux A. El Mossadeq

est une réalisation d’une variable du Khi-deux à :

(2− 1) (2− 1) = 1

degré de liberté.Pour α = 5%, on a :

χ21;.95 = 3.84

Et comme :

χ2 =2X

i=1

2Xj=1

(oij − tij)2

tij

= 20.51

On rejette alors H0 à 95% (et même à 99.5%), c’est à dire, les deux régions ont desopinions différentes quant au produit considéré.

Exercice 2Dans un groupe de 200 malades atteints du cancer du col de l’utérus, un traitementpar application locale du radium a donné 50 guérisons.Un autre groupe de 150 sujets atteints de la même maladie a été traité par chirurgie,on a trouvé 54 guérisons.Que peut-on conclure ?

Solution 2La répartition observée est :

Tableau des effectifs observees

TraitementÂResultat gueri non gueri Total

radium 50 150 200

chirurgie 54 96 150

Total 104 246 350

Testons, au seuil α, l’hypothèse nulle :

H0 : ”les deux traitements sont équivalents”

64

Page 69: Exercices Corrigés...C’est l’inverse de la moyenne empirique du r-échantillon. 6. Soit Xune variable aléatoire normale de paramètres μet σ2. Sa densité de probabilité fest

A. El Mossadeq Les Tests du Khi-Deux

Calculons, sous cette hypothèse, la répartition théorique :

Tableau des effectifs theoriques

TraitementÂResultat gueri non gueri Total

radium 59.4 140.6 200

chirurgie 44.6 105.4 150

Total 104 246 350

Sous l’hypothèse nulle H0, la quantité :

χ2 =2X

i=1

2Xj=1

(oij − tij)2

tij

est une réalisation d’une variable du Khi-deux à :

(2− 1) (2− 1) = 1

degré de liberté.Pour α = 5%, on a :

χ21;.95 = 3.84

Et comme :

χ2 =2X

i=1

2Xj=1

(oij − tij)2

tij

= 4.94

On rejette alors H0 à 95% , c’est à dire, les deux traitements ne sont pas équivalents.

Exercice 3Aux guichets d’une gare parisienne, sur les 350 billets vendus vendredi après-midi,95 étaient des billets de 1ere classe. Sur les 250 billets vendus la matinée du lundisuivant, 55 étaient de 1ere classe.Peut-on considérer qu’il y une différence entre les proportions de vente de parcoursen 1ere classe pour les fins et débuts de semaines ?

65

Page 70: Exercices Corrigés...C’est l’inverse de la moyenne empirique du r-échantillon. 6. Soit Xune variable aléatoire normale de paramètres μet σ2. Sa densité de probabilité fest

Les Tests du Khi-Deux A. El Mossadeq

Solution 3La répartition observée est :

Tableau des effectifs observees

jourÂClasse 1ere classe 2ere classe Total

V endredi A.M 95 255 350

Lundi matin 55 195 250

Total 150 450 600

Testons, au seuil α, l’hypothèse nulle :

H0 : ”les taux de billets de parcours en 1ere classe vendus en finet début de semaines sont identiques”

Calculons, sous cette hypothèse, la répartition théorique :

Tableau des effectifs theoriques

JourÂClasse 1ere classe 2ere classe Total

V endredi A.M 87.5 262.5 350

Lundi matin 62.5 187.5 250

Total 150 450 600

Sous l’hypothèse nulle H0, la quantité :

χ2 =2X

i=1

2Xj=1

(oij − tij)2

tij

est une réalisation d’une variable du Khi-deux à :

(2− 1) (2− 1) = 1

degré de liberté.Pour α = 5%, on a :

χ21;.95 = 3.84

66

Page 71: Exercices Corrigés...C’est l’inverse de la moyenne empirique du r-échantillon. 6. Soit Xune variable aléatoire normale de paramètres μet σ2. Sa densité de probabilité fest

A. El Mossadeq Les Tests du Khi-Deux

Et comme :

χ2 =2X

i=1

2Xj=1

(oij − tij)2

tij

= 2.06

On accepte alors H0 au seuil α = 5% , c’est à dire, les taux de billets de parcours en1 ere classe vendus en fins et débuts de semaines sont identiques.

Exercice 4On a lancé cent fois une pièce de monnaie et l’on a obtenu soixante fois ”pile” etquarante fois ”face”.Tester au seuil de 5% puis 1%, l’hypothèse de la loyauté de la pièce.

Solution 4Testons, au seuil α, l’hypothèse nulle :

H0 : ”la pièce est loyale”

Sous cette hypothèse, on a :

p = 0.5

d’où les répartitions :

Cote Repartition Observee Repartition Theorique

pile 60 50

face 40 50

Total 100 100

Sous l’hypothèse nulle H0, la quantité :

χ2 =2X

i=1

(oi − ti)2

ti

67

Page 72: Exercices Corrigés...C’est l’inverse de la moyenne empirique du r-échantillon. 6. Soit Xune variable aléatoire normale de paramètres μet σ2. Sa densité de probabilité fest

Les Tests du Khi-Deux A. El Mossadeq

est une réalisation d’une variable du Khi-deux à :

2− 1 = 1

degré de liberté.On a :

χ2 =2X

i=1

(oi − ti)2

ti

= 4

(1) Pour α = 5%, on a :

χ21;.95 = 3.84

On rejette donc l’hypothèse nulle H0 à 95%, c’est à dire, qu’à 95%, la pièceest truquée.

(2) Pour α = 1%, on a :

χ21;.99 = 6.63

On accepte donc l’hypothèse nulle H0 au seuil α = 1%, c’est à dire, qu’auseuil α = 1%, la pièce est normale.

Exercice 5On veut savoir si la réussite (R) d’un traitement est indépendantes du niveaux dela tension artérielle du malade (T ).On dispose pour cela de 250 observations réparties comme suit :

TÂR echec succes

basse 21 104

elevee 29 96

Que peut-on conclure ?

68

Page 73: Exercices Corrigés...C’est l’inverse de la moyenne empirique du r-échantillon. 6. Soit Xune variable aléatoire normale de paramètres μet σ2. Sa densité de probabilité fest

A. El Mossadeq Les Tests du Khi-Deux

Solution 5La répartition observée est :

Tableau des effectifs observees

TÂR Echec Succes Total

Basse 21 104 125

Elevee 29 96 125

Total 50 200 250

Testons, au seuil α, l’hypothèse nulle :

H0 : ”la réussite du traitement est indépendante du niveau de la tension artérielle”

Calculons, sous cette hypothèse, la répartition théorique, le tableau de cette répar-tition est donné ci-après.

Tableau des effectifs theoriques

TÂR Echec Succes Total

Basse 25 100 125

Elevee 25 100 125

Total 50 200 250

Sous l’hypothèse nulle H0, la quantité :

χ2 =2X

i=1

2Xj=1

(oij − tij)2

tij

est une réalisation d’une variable du Khi-deux à :

(2− 1) (2− 1) = 1

degré de liberté.Pour α = 5%, on a :

χ21;.95 = 3.84

69

Page 74: Exercices Corrigés...C’est l’inverse de la moyenne empirique du r-échantillon. 6. Soit Xune variable aléatoire normale de paramètres μet σ2. Sa densité de probabilité fest

Les Tests du Khi-Deux A. El Mossadeq

Et comme :

χ2 =2X

i=1

2Xj=1

(oij − tij)2

tij

= 1.6

On accepte alors H0 au seuil α = 5% , c’est à dire, la réussite du traitement estindépendante du niveau de la tension artérielle.

Exercice 6On veut savoir s’il y a une liason entre la localisation (L) du cancer du poumon(périphérique , non périphérique) et le côté (C) de la lésion (poumon gauche ,poumon droit).L’étude a porté sur 1054 malades :

LÂC gauche droit

peripherique 26 62

non peripherique 416 550

Que peut-on conclure ?

Solution 6La répartition observée est :

Tableau des effectifs observees

LÂC gauche droit Total

peripherique 26 62 88

non peripherique 416 550 966

Total 442 612 1054

Testons, au seuil α, l’hypothèse nulle :

H0 : ”la localisation du cancer est indépendante du côté de la lésion”

Calculons, sous cette hypothèse, la répartition théorique.Le tableau de cette répartition est donnée ci-après.

70

Page 75: Exercices Corrigés...C’est l’inverse de la moyenne empirique du r-échantillon. 6. Soit Xune variable aléatoire normale de paramètres μet σ2. Sa densité de probabilité fest

A. El Mossadeq Les Tests du Khi-Deux

Tableau des effectifs theoriques

LÂC gauche droit Total

peripherique 36.9 51.1 88

nonperipherique 405.1 560.9 966

Total 442 612 1054

Sous l’hypothèse nulle H0, la quantité :

χ2 =2X

i=1

2Xj=1

(oij − tij)2

tij

est une réalisation d’une variable du Khi-deux à :

(2− 1) (2− 1) = 1

degré de liberté.Pour α = 5%, on a :

χ21;.95 = 3.84

Et comme :

χ2 =2X

i=1

2Xj=1

(oij − tij)2

tij

= 6.05

On rejette alors H0 à 95% (même à 97.5%), c’est à dire, la localisation du cancerdépend du côté de la lésion.

Exercice 7De nombreuses observations cliniques ont montré que jusque là :

• 30% des malades atteints de M ont une survie inférieure à un an• 50% ont une survie entre un an et deux ans• 10% ont une survie entre deux ans et cinq ans• 10% ont une survie supérieure à cinq ans.

On applique un nouveau traitement à 80 malades atteint de la maladie M et onconstate :

71

Page 76: Exercices Corrigés...C’est l’inverse de la moyenne empirique du r-échantillon. 6. Soit Xune variable aléatoire normale de paramètres μet σ2. Sa densité de probabilité fest

Les Tests du Khi-Deux A. El Mossadeq

• 12 ont une survie inférieure à un an• 56 ont une survie entre un an et deux ans• 8 ont une survie entre deux ans et cinq ans• 4 ont une survie supérieure à cinq ans.

Que peut-on conclure ?

Solution 7Testons, au seuil α, l’hypothèse nulle :

H0 : ”le nouveau traitement n’est pas actif contre la maladie M”

Sous cette hypothèse, on a les répartitions :

Survie Repartition Observee Repartition Theorique

survie ≤ 1 an 12 24

1 an < survie ≤ 2 ans 56 40

2 an < survie ≤ 5 ans 8 8

survie > 5 ans 4 8

Total 80 80

Sous l’hypothèse nulle H0, la quantité :

χ2 =4X

i=1

(oi − ti)2

ti

est une réalisation d’une variable du Khi-deux à :

4− 1 = 3

degrés de liberté.

Pour α = 5%, on a :

χ23;.95 = 7.81

72

Page 77: Exercices Corrigés...C’est l’inverse de la moyenne empirique du r-échantillon. 6. Soit Xune variable aléatoire normale de paramètres μet σ2. Sa densité de probabilité fest

A. El Mossadeq Les Tests du Khi-Deux

Et comme :

χ2 =2X

i=1

(oi − ti)2

ti

= 14.4

on rejette donc l’hypothèse nulle H0 à 95% (même à 99.5%), c’est à dire, qu’à 99.5%,le nouveau traitement est actif contre la maladie M.

Exercice 8On suppose pouvoir classer les malades atteints d’une maladieM en trois catégoriescliniques : A , B , C.On se demande si ces trois catégories diffèrent par leurs survies à un an.Les effectifs observés sont les suivants :

SurvieÂCategorie A B C

survie a un an 5 20 45

deces avant un an 15 50 145

Que peut-on conclure ?

Solution 8La répartition observée est :

Tableau des effectifs observees

SurvieÂCategorie A B C Total

Survie a un an 5 20 45 70

Deces avant un an 15 50 145 210

Total 20 70 190 280

Testons, au seuil α, l’hypothèse nulle :

H0 : ”la survie à un an est indépendante de la catégorie clinique”

Calculons, sous cette hypothèse, la répartition théorique.

73

Page 78: Exercices Corrigés...C’est l’inverse de la moyenne empirique du r-échantillon. 6. Soit Xune variable aléatoire normale de paramètres μet σ2. Sa densité de probabilité fest

Les Tests du Khi-Deux A. El Mossadeq

Tableau des effectifs theoriques

SurvieÂCategorie A B C Total

Survie a un an 5 17.5 47.5 70

Deces avant un an 15 52.5 142.5 210

Total 20 70 190 280

Sous l’hypothèse nulle H0, la quantité :

χ2 =2X

i=1

3Xj=1

(oij − tij)2

tij

est une réalisation d’une variable du Khi-deux à :

(2− 1) (3− 1) = 2

degrés de liberté.

Pour α = 5%, on a :

χ22;.95 = 5.99

Et comme :

χ2 =2X

i=1

3Xj=1

(oij − tij)2

tij

= .65

On accepte alorsH0 au seuil α = 5% , c’est à dire, la survie à un an est indépendantede la catégorie clinique.

Exercice 975 enfants sont vus en consultation pour un asthme. On relève chez eux les deuxsymptômes suivants :* Intensité de la maladie asmathique : légère , moyenne , forte* Existence ou absence d’un eczéma au moment de l’observation ou dans le passé.

74

Page 79: Exercices Corrigés...C’est l’inverse de la moyenne empirique du r-échantillon. 6. Soit Xune variable aléatoire normale de paramètres μet σ2. Sa densité de probabilité fest

A. El Mossadeq Les Tests du Khi-Deux

On peut classer les enfants selon la répartition suivante :

EÂA fort moyen leger

present 8 2 2

passe 11 11 3

jamais 6 18 14

Au vu de ces résultats, existe-t-il une association entre l’intensité de l’asthme etl’existence d’un eczéma ?

Solution 9Le tableau de la répartition observée est donnée ci-après:

Tableau des effectifs observees

EczemaÂAsthme fort moyen leger Total

present 8 2 2 12

passe 11 11 3 25

jamais 6 18 14 38

Total 25 31 19 75

Testons, au seuil α, l’hypothèse nulle :

H0 : ”l’intensité de l’asthme est indépendante de l’existence d’un eczéma”

Calculons, sous cette hypothèse, la répartition théorique.Le tableau de cette répartition est donnée ci-après.

75

Page 80: Exercices Corrigés...C’est l’inverse de la moyenne empirique du r-échantillon. 6. Soit Xune variable aléatoire normale de paramètres μet σ2. Sa densité de probabilité fest

Les Tests du Khi-Deux A. El Mossadeq

Tableau des effectifs theoriques

EczemaÂAsthme fort moyen leger Total

present 4 4.96 3.04 12

passe 8.33 10.33 6.34 25

jamais 12.67 15.71 9.62 38

Total 25 31 19 75

Les effectifs théoriques sur la première ligne sont strictement inférieurs à cinq, ce quiempêche l’application d’un test du Khi-deux.On peut remédier à cet état en opérantle groupement ”logique” des classes ”present” et ”passe”.Les nouveaux tableaux des effectifs observés et théoriques, obtenus après regroupe-ment de ces deux classes sont donnés ci-après.

Tableau des effectifs observees

EczemaÂAsthme fort moyen leger Total

present ou passe 19 13 5 37

jamais 6 18 14 38

Total 25 31 19 75

Tableau des effectifs theoriques

EczemaÂAsthme fort moyen leger Total

present ou passe 12.33 15.29 9.38 37

jamais 12.67 15.71 9.62 38

Total 25 31 19 75

Sous l’hypothèse nulle H0, la quantité :

χ2 =2X

i=1

3Xj=1

(oij − tij)2

tij

76

Page 81: Exercices Corrigés...C’est l’inverse de la moyenne empirique du r-échantillon. 6. Soit Xune variable aléatoire normale de paramètres μet σ2. Sa densité de probabilité fest

A. El Mossadeq Les Tests du Khi-Deux

est une réalisation d’une variable du Khi-deux à :

(2− 1) (3− 1) = 2

degrés de liberté.Pour α = 5%, on a :

χ22;.95 = 5.99

Et comme :

χ2 =2X

i=1

3Xj=1

(oij − tij)2

tij

= 11.84

On rejette alors H0 à 95% (même à 99.5%), c’est à dire, l’intensité de l’asthmedépend de l’existence d’un eczéma.

Exercice 10Une étude statistique relative aux résultats d’admission du concours d’une grandeécole fait ressortir la répartition des admis selon la profession des parents lorsquecelle-ci est connue.

1. La profession des parents a-t-elle une influence sur l’accès à cette école ?2. Cette conclusion persiste-t-elle lorsqu’on tient compte pour compléter la statis-tique précédente de 961 candidats dont l’origine socio-professionnelle est incon-nue et qui ont obtenus 43 succès ?

Profession des Parents Candidats Admis

Fontionnaires et Assimiles 2224 180

Commerce et Industrie 998 89

Professions Liberales 575 48

Proprietaires Rentiers 423 37

Proprietaires Agricoles 287 13

Artisans 210 18

Banques et Assurances 209 17

77

Page 82: Exercices Corrigés...C’est l’inverse de la moyenne empirique du r-échantillon. 6. Soit Xune variable aléatoire normale de paramètres μet σ2. Sa densité de probabilité fest

Les Tests du Khi-Deux A. El Mossadeq

Solution 101. La répartition observée est :

Profession des Parents Candidats Admis Non admis

Fontionnaires et Assimiles 2224 180 2044

Commerce et Industrie 998 89 899

Professions Liberales 575 48 527

Proprietaires Rentiers 423 37 386

Proprietaires Agricoles 287 13 274

Artisans 210 18 192

Banques et Assurances 209 17 192

Total 4916 402 4514

Testons, au seuil α, l’hypothèse nulle :

H0 : ”l’accès à l’Ecole est indépendant de la profession des parents”

Calculons, sous cette hypothèse, la répartition théorique :

Profession des Parents Candidats Admis Non admis

Fontionnaires et Assimiles 2224 181.9 2042.1

Commerce et Industrie 998 80.8 907.2

Professions Liberales 575 47 528

Proprietaires Rentiers 423 34.6 388.4

Proprietaires Agricoles 287 23.5 263.5

Artisans 210 17.2 192.8

Banques et Assurances 209 17.1 191.9

Total 4916 402 4514

78

Page 83: Exercices Corrigés...C’est l’inverse de la moyenne empirique du r-échantillon. 6. Soit Xune variable aléatoire normale de paramètres μet σ2. Sa densité de probabilité fest

A. El Mossadeq Les Tests du Khi-Deux

Sous l’hypothèse nulle H0, la quantité :

χ2 =7X

i=1

2Xj=1

(oij − tij)2

tij

est une réalisation d’une variable du Khi-deux à :

(7− 1) (2− 1) = 6

degrés de liberté.Pour α = 5%, on a :

χ26;.95 = 12.6

Et comme :

χ2 =2X

i=1

3Xj=1

(oij − tij)2

tij= 6.28

On accepte alors H0 au seuil α = 5% , c’est à dire, l’accès à l’Ecole est indépen-dant de la profession des parents.

2. Si l’on tient compte des 961 candidats dont l’origine socio-professionnelle estinconnue et qui ont obtenus 43 succès, la répartition observée et la répartitionthéorique, sous la même hypothèse nulle, deviennent comme consognés ci-après.

Tableau des effectifs observees

Profession des Parents Candidats Admis Non admis

Fontionnaires et Assimiles 2224 180 2044

Commerce et Industrie 998 89 899

Professions Liberales 575 48 527

Proprietaires Rentiers 423 37 386

Proprietaires Agricoles 287 13 274

Artisans 210 18 192

Banques et Assurances 209 17 192

Autres 961 43 918

Total 5877 445 5432

79

Page 84: Exercices Corrigés...C’est l’inverse de la moyenne empirique du r-échantillon. 6. Soit Xune variable aléatoire normale de paramètres μet σ2. Sa densité de probabilité fest

Les Tests du Khi-Deux A. El Mossadeq

Tableau des effectifs theoriques

Profession des Parents Candidats Admis Non admis

Fontionnaires et Assimiles 2224 168.4 2055.6

Commerce et Industrie 998 74.8 913.2

Professions Liberales 575 43.5 531.5

Proprietaires Rentiers 423 32 391

Proprietaires Agricoles 287 21.7 265.3

Artisans 210 15.9 194.1

Banques et Assurances 209 15.8 193.2

Autres 961 72.8 888.2

Total 5877 445 5432

Sous l’hypothèse nulle H0, la quantité :

χ2 =8X

i=1

2Xj=1

(oij − tij)2

tij

est une réalisation d’une variable du Khi-deux à :

(8− 1) (2− 1) = 7

degrés de liberté.Pour α = 5%, on a :

χ27;.95 = 14.1

Et comme :

χ2 =2X

i=1

3Xj=1

(oij − tij)2

tij= 22.5

On rejette alors H0 à 95% (même à 99.5%) , c’est à dire, l’accès à l’Ecole estindépendant de la profession des parents.

80

Page 85: Exercices Corrigés...C’est l’inverse de la moyenne empirique du r-échantillon. 6. Soit Xune variable aléatoire normale de paramètres μet σ2. Sa densité de probabilité fest

A. El Mossadeq Les Tests du Khi-Deux

Exercice 11Sur un échantillon de 84 prématurés, on cherche s’il existe une liaison entre lasurvenue d’une hypoglycémie et la survenue d’un ictère :

• sur 43 enfants n’ayant pas d’ictère, 23 sont hypoglycémiques• sur 20 enfants ayant un ictère modéré, 6 sont hypoglycémiques• sur 21 enfants ayant un ictère intense, 4 sont hypoglycémiques

Que peut-on conclure ?

Solution 11La répartition observée est donnée dans le tableau :

Tableau des effectifs observees

IctereÂHypoglycemie hypoglycemique non hypoglycemique Total

pas d0ictere 23 20 43

ictere modere 6 14 20

ictere intense 4 17 21

Total 33 51 84

Testons, au seuil α, l’hypothèse nulle :

H0 : ”la survenue d’une hypoglycémie est indépendante de la survenue d’un ictère”

Calculons, sous cette hypothèse, la répartition théorique :

Tableau des effectifs theoriques

IctereÂHypoglycemie hypoglycemique non hypoglycemique Total

pas d0ictere 16.89 26.11 43

ictere modere 7.86 12.14 20

ictere intense 8.25 12.75 21

Total 33 51 84

81

Page 86: Exercices Corrigés...C’est l’inverse de la moyenne empirique du r-échantillon. 6. Soit Xune variable aléatoire normale de paramètres μet σ2. Sa densité de probabilité fest

Les Tests du Khi-Deux A. El Mossadeq

Sous l’hypothèse nulle H0, la quantité :

χ2 =2X

i=1

2Xj=1

(oij − tij)2

tij

est une réalisation d’une variable du Khi-deux à :

(3− 1) (2− 1) = 2

degrés de liberté.Pour α = 5%, on a :

χ22;.95 = 5.99

Et comme :

χ2 =3X

i=1

2Xj=1

(oij − tij)2

tij

= 7.97

On rejette alors H0 à 95% (même à 97.5%), c’est à dire, la survenue d’une hypogly-cémie dépend de la survenue d’un ictère.

Exercice 12Un médicament essayé sur 42 patients est contrôlé quant aux effets secondaires qu’ilpeut avoir sur le poids des malades.On peut considérer que :

• quinze d’entre eux ont maigri• dix sept n’ont pas changé de poids• dix ont grossi

En supposant que la maladie est sans effet sur les variations de poids, le médicamenta-t-il un effet significatif sur le poids ?

Solution 12Testons, au seuil α, l’hypothèse nulle :

H0 : ”le traitement est sans effet sur les variations du poids”

Si le traitement est sans effet sur les variations du poids, alors ces variations sontdûes seulement au hasard.La loi de probabilité est donc la loi uniforme, c’est à dire la probabilité de chaque

classe est la même et est égale à1

3.

82

Page 87: Exercices Corrigés...C’est l’inverse de la moyenne empirique du r-échantillon. 6. Soit Xune variable aléatoire normale de paramètres μet σ2. Sa densité de probabilité fest

A. El Mossadeq Les Tests du Khi-Deux

D’où les répartitions :

V ariations Repartition Observee Repartition Theorique

ont maigri 15 14

n0ont pas change 17 14

ont grossi 10 14

Total 42 42

Sous l’hypothèse nulle H0, la quantité :

χ2 =3X

i=1

(oi − ti)2

ti

est une réalisation d’une variable du Khi-deux à :

3− 1 = 2

degrés de liberté.

Pour α = 5%, on a :

χ22;.95 = 5.99

Et comme :

χ2 =2X

i=1

(oi − ti)2

ti

= 1.86

on accepte donc l’hypothèse nulle H0 au seuil α = 5%, c’est à dire, le traitement estsans effet sur les variations du poids.

Exercice 13Pour étudier la densité de poussières dans un gaz, on a procédé à une série d’observationsde petits échantillons de gaz au moyen d’un microscope.On a ainsi effectué 143 observations et les résultats sont les suivants :

83

Page 88: Exercices Corrigés...C’est l’inverse de la moyenne empirique du r-échantillon. 6. Soit Xune variable aléatoire normale de paramètres μet σ2. Sa densité de probabilité fest

Les Tests du Khi-Deux A. El Mossadeq

Nombre de particules en suspension Nombre d0echantillons de gaz

0 34

1 46

2 38

3 19

4 4

5 2

> 5 0

Peut-on admettre, au seuil α = 5%, que le nombre de particules en suspension estune variable de Poisson ?

Solution 13Testons, au seuil α, l’hypothèse nulle :

H0 : ”le nombre de particules en suspension est une variable de Poisson”

Calculons une estimation ponctuelle du paramètre α de cette loi :

P [X = k] =αk

k!exp−α

où X est la variable aléatoire représentant le nombre de particules en suspension.On sait que :

α =1

n

nXi=1

Xi

est un estimateur sans biais et convergent de α.Une estimation ponctuelle α de α est donnée par :

α =1

143

5Xi=0

ini

= 1.4336

D’où les répartitions :

84

Page 89: Exercices Corrigés...C’est l’inverse de la moyenne empirique du r-échantillon. 6. Soit Xune variable aléatoire normale de paramètres μet σ2. Sa densité de probabilité fest

A. El Mossadeq Les Tests du Khi-Deux

Particules en suspension Repartition observee Repartition theorique

0 34 34.1

1 46 48.9

2 38 35.0

3 19 16.7

4 4 06.0

5 2 01.7

> 5 0 00.6

Total 143 143

L’effectif théorique tk, k ≥ 0, représentant le nombre particules en suspension k estdonné par :

tk = nP [X = k]

On constate que le tableau contient des effectifs théoriques strictement inférieurs à5, ce qui empêche l’utilisation d’un test du khi-deux.On peut remédier à cet état en opérant le groupement ”logique” des classes ”4 et plus”.Les tableaux des effectifs observés et théoriques deviennent comme consignés ci-après.

Particules en suspension Repartition observee Repartition theorique

0 34 34.1

1 46 48.9

2 38 35.0

3 19 16.7

≥ 4 4 08.3

Total 143 143

85

Page 90: Exercices Corrigés...C’est l’inverse de la moyenne empirique du r-échantillon. 6. Soit Xune variable aléatoire normale de paramètres μet σ2. Sa densité de probabilité fest

Les Tests du Khi-Deux A. El Mossadeq

Sous l’hypothèse nulle H0, la quantité :

χ2 =4X

i=0

(oi − ti)2

ti

est une réalisation d’une variable du Khi-deux à :

5− 1− 1 = 3

degrés de liberté.puisque pour calculer les effectifs théoriques, nous avons utilisél’estimation, et non la valeur réel, du paramètre α de la loi de Poisson.

Pour α = 5%, on a :

χ23;.95 = 7.81

Et comme :

χ2 = 2.97

On accepte alors H0 au seuil α = 5%, c’est à dire, le nombre de particules ensuspension peut être ajusté par une loi de Poisson dont le paramètre α est estimépar :

α = 1.4336

Exercice 14Le tableau ci-après concerne le nombre annuel de cyclones tropicaux ayant atteintla côte orientale des Etats-Unis entre 1887 et 1956 :

Nombre annuel de cyclones Nombre d0annees0 11 62 103 164 195 56 87 38 19 1> 9 0

Peut-on admettre, au seuil α = 5%, que ce nombre annuel de cyclones est unevariable de Poisson ?

86

Page 91: Exercices Corrigés...C’est l’inverse de la moyenne empirique du r-échantillon. 6. Soit Xune variable aléatoire normale de paramètres μet σ2. Sa densité de probabilité fest

A. El Mossadeq Les Tests du Khi-Deux

Solution 14Testons, au seuil α, l’hypothèse nulle :

H0 : ”le nombre annuel de cyclones est une variable de Poisson”

Calculons une estimation ponctuelle du paramètre α de cette loi :

P [X = k] =αk

k!exp−α

où X est la variable aléatoire représentant le nombre annuel de cyclones.On sait que :

α =1

n

nXi=1

Xi

est un estimateur sans biais et convergent de α.Une estimation ponctuelle α de α est donnée par :

α =1

70

9Xi=0

ini = 3.7286

L’effectif théorique tk, k ≥ 0, représentant le nombre d’années à k cyclones est donnépar :

tk = nP [X = k]

D’où les répartitions :

Nombre annuel de cyclones Effectifs observes Effectifs theoriques0 1 1.681 6 6.272 10 11.693 16 14.534 19 13.545 5 10.16 8 6.287 3 3.348 1 1.569 1 0.65> 9 0 0.36Total 70 70

On constate que le tableau contient des effectifs théoriques strictement inférieurs à5, ce qui empêche l’utilisation d’un test du khi-deux.On peut remédier à cet état en opérant le groupement ”logique” :* des classes ”0” et ”1” d’une part,* et des classes ”7 et plus” d’autre part.

87

Page 92: Exercices Corrigés...C’est l’inverse de la moyenne empirique du r-échantillon. 6. Soit Xune variable aléatoire normale de paramètres μet σ2. Sa densité de probabilité fest

Les Tests du Khi-Deux A. El Mossadeq

Les tableaux des effectifs observés et théoriques deviennent :

Nombre annuel de cyclones Effectifs observes Effectifs theoriques

0 ou 1 7 7.95

2 10 11.69

3 16 14.53

4 19 13.54

5 5 10.10

6 8 6.28

≥ 7 5 5.91

Total 70 70

Sous l’hypothèse nulle H0, la quantité :

χ2 =7X

i=1

(oi − ti)2

ti

est une réalisation d’une variable du Khi-deux à :

7− 1− 1 = 5

degrés de liberté.puisque pour calculer les effectifs théoriques, nous avons utilisél’estimation, et non la valeur réel, du paramètre α de la loi de Poisson.Pour α = 5%, on a :

χ25;.95 = 5.8948

Et comme :

χ2 = 5.81

On accepte alors H0 au seuil α = 5%, c’est à dire, le nombre annuel de cyclonespeut être ajusté par une loi de Poisson dont le paramètre α est estimé par :

α = 3.7286

88

Page 93: Exercices Corrigés...C’est l’inverse de la moyenne empirique du r-échantillon. 6. Soit Xune variable aléatoire normale de paramètres μet σ2. Sa densité de probabilité fest

A. El Mossadeq Les Tests du Khi-Deux

Exercice 15Le tableau suivant indique le résultat de l’examen de 124 sujets, classés d’après lacouleur de leurs yeux (Y ) et la couleur de leus cheveux (C) :

YÂC Blonds Bruns Noirs Roux

Bleus 25 9 3 7

Gris ou V erts 13 17 10 7

Marrons 7 13 8 5

Existe-t-il une liason entre ces deux caractères ?

Solution 15La répartition observée est :

YÂC Blonds Bruns Noirs Roux Total

Bleus 25 9 3 7 44

Gris ou V erts 13 17 10 7 47

Marrons 7 13 8 5 33

Total 45 39 21 19 124

Testons, au seuil α, l’hypothèse nulle :

H0 : ”les couleurs des yeux et des cheveux sont indépendantes”

Calculons, sous cette hypothèse, la répartition théorique :

YÂC Blonds Bruns Noirs Roux Total

Bleus 16 13.8 7.4 6.8 44

Gris ou V erts 17 14.8 8 7.2 47

Marrons 12 10.4 5.6 5 33

Total 45 39 21 19 124

89

Page 94: Exercices Corrigés...C’est l’inverse de la moyenne empirique du r-échantillon. 6. Soit Xune variable aléatoire normale de paramètres μet σ2. Sa densité de probabilité fest

Les Tests du Khi-Deux A. El Mossadeq

Sous l’hypothèse nulle H0, la quantité :

χ2 =3X

i=1

4Xj=1

(oij − tij)2

tij

est une réalisation d’une variable du Khi-deux à :

(3− 1) (4− 1) = 6

degrés de liberté.

Pour α = 5%, on a :

χ26;.95 = 12.6

Et comme :

χ2 =2X

i=1

3Xj=1

(oij − tij)2

tij

= 15

On rejette alors H0 à 95% (même à 97.5%), c’est à dire, les couleurs des yeux et descheveux ne sont pas indépendantes.

Exercice 16On considère les familles de quatre enfants.Sur un échantillon de cent familles à quatre enfants, la répartition suivante a été ob-servée :

Nombre de filles Nombre de familles

0 7

1 20

2 41

3 22

4 10

Peut-on considérer que la probabilité qu’un enfant soit une fille est1

2?

90

Page 95: Exercices Corrigés...C’est l’inverse de la moyenne empirique du r-échantillon. 6. Soit Xune variable aléatoire normale de paramètres μet σ2. Sa densité de probabilité fest

A. El Mossadeq Les Tests du Khi-Deux

Solution 16Testons, au seuil α, l’hypothèse nulle :

H0 : ”la probabilité d’avoir une fille est1

2”

Sous l’hypothèse nulle H0, la variable aléatoire X égale au nombre de filles parmi

les quatre enfants suit une loi binomiale d’ordre 4 et de paramètre1

2: B

µ4,1

2

¶.

Ainsi, pour tout k, 0 ≤ k ≤ 4, la probabilité pk d’avoir k filles parmi les quatreenfants est :

pk = C (4, k)

µ1

2

¶4L’effectif théorique tk, 0 ≤ k ≤ 4, représentant le nombre de familles ayant k fillesparmi les quatre enfants est donné par :

tk = npk

D’où les répartitions :

Nombre de filles Repartition observee Repartition theorique

0 7 6.25

1 20 25

2 41 37.5

3 22 25

4 10 6.25

Total 100 100

Sous l’hypothèse nulle H0, la quantité :

χ2 =4X

i=0

(oi − ti)2

ti

est une réalisation d’une variable du Khi-deux à :

5− 1 = 4

degrés de liberté.Pour α = 5%, on a :

χ24;.95 = 9.49

91

Page 96: Exercices Corrigés...C’est l’inverse de la moyenne empirique du r-échantillon. 6. Soit Xune variable aléatoire normale de paramètres μet σ2. Sa densité de probabilité fest

Les Tests du Khi-Deux A. El Mossadeq

Et comme :

χ2 = 4.03

On accepte alors H0 au seuil α = 5% : la probabilité d’avoir une fille est1

2.

Exercice 17On distribue un jeu de quarante cartes à quatre joueurs : A , B , C , D ; chacunreçevant dix cartesUn statisticien a élaboré un programme de distribution de donnes par ordinateur.Pour un ensemble de deux cents donnes, obtenues à partir de ce programme, ilobserve le nombre de donnes où le joueur A reçoit k as, 0 ≤ k ≤ 4. Les résultatssont les suivants :

Nombre d0as Nombre de donnes

0 64

1 74

2 52

3 8

4 2

Le programme du statisticien est-il fiable ?

Solution 17Testons, au seuil α, l’hypothèse nulle :

H0 : ”le programme du statisticien est fiable”

Sous l’hypothèse nulle H0, la variable aléatoire X égale au nombre d’as du joueurA suit une loi hypergéométrique.Ainsi, pour tout k, 0 ≤ k ≤ 4, la probabilité pk pour que le joueur A ait k as est :

pk =C (4, k)C (36, 10− k)

C (40, 10)

L’effectif théorique tk, 0 ≤ k ≤ 4, représentant le nombre de donnes à k as, dujoueur A, est donné par :

tk = npk

92

Page 97: Exercices Corrigés...C’est l’inverse de la moyenne empirique du r-échantillon. 6. Soit Xune variable aléatoire normale de paramètres μet σ2. Sa densité de probabilité fest

A. El Mossadeq Les Tests du Khi-Deux

D’où les répartitions :

Nombre d0as Repartition observee Repartition theorique

0 64 59.97

1 74 88.85

2 52 42.84

3 8 7.88

4 2 0.46

Total 200 200

On constate que le tableau contient des effectifs théoriques strictement inférieurs à5, ce qui empêche l’utilisation d’un test du khi-deux.On peut remédier à cet état en opérant le groupement ”logique” des classes ”3 et 4”.Le tableau des effectifs observés et théoriques deviennent :

Nombre d0as Repartition observee Repartition theorique

0 64 59.97

1 74 88.85

2 52 42.84

3 ou 4 10 8.34

Total 200 200

Sous l’hypothèse nulle H0, la quantité :

χ2 =3X

i=0

(oi − ti)2

ti

est une réalisation d’une variable du Khi-deux à :

4− 1 = 3

degrés de liberté.

93

Page 98: Exercices Corrigés...C’est l’inverse de la moyenne empirique du r-échantillon. 6. Soit Xune variable aléatoire normale de paramètres μet σ2. Sa densité de probabilité fest

Les Tests du Khi-Deux A. El Mossadeq

Pour α = 5%, on a :

χ23;.95 = 7.81

Et comme :

χ2 = 5.0418

On accepte alors H0 au seuil α = 5%, c’est à dire, le programme du statisticien estfiable.

94

Page 99: Exercices Corrigés...C’est l’inverse de la moyenne empirique du r-échantillon. 6. Soit Xune variable aléatoire normale de paramètres μet σ2. Sa densité de probabilité fest

Tests d’H ypothèses Moyennes et Variances

Page 100: Exercices Corrigés...C’est l’inverse de la moyenne empirique du r-échantillon. 6. Soit Xune variable aléatoire normale de paramètres μet σ2. Sa densité de probabilité fest
Page 101: Exercices Corrigés...C’est l’inverse de la moyenne empirique du r-échantillon. 6. Soit Xune variable aléatoire normale de paramètres μet σ2. Sa densité de probabilité fest

A. El Mossadeq Tests : Moyennes et Variances

Exercice 1Une série de cent mesures a donné comme résultat :⎧⎪⎪⎪⎪⎪⎪⎨⎪⎪⎪⎪⎪⎪⎩

100Xi=1

xi = 5200

100Xi=1

"xi −

1

100

100Pj=1

xj

#2= 396

1. Estimer la moyenne et la variance.2. Quel est, à 95%, l’intervalle de confiance de la moyenne ?3. En supposant la variable mesurée gaussienne, déterminer, à 95%, l’intervalle deconfiance de la variance.

Solution 11. Soit m l’estimation de la moyenne et s2 celle de la variance.On a :

m =1

100

100Xi=1

xi

= 52

et :

s2 =1

99

100Xi=1

(xi −m)2

= 4

2. Au seuil α, l’intervalle de confiace de la moyenne est défini par :∙m− t1−α/2

σ√n,m+ t1−α/2

σ√n

¸Pour α = 5%, on a :

t.975 = 1.96

d’où l’intervalle de confiance à 95% :

[51.608, 52.392]

3. Au seuil α, l’intervalle de confiace de la variance est défini par :"(n− 1)

χ2n−1;1−α/2s2,

(n− 1)χ2n−1;α/2

s2

#

97

Page 102: Exercices Corrigés...C’est l’inverse de la moyenne empirique du r-échantillon. 6. Soit Xune variable aléatoire normale de paramètres μet σ2. Sa densité de probabilité fest

Tests : Moyennes et Variances A. El Mossadeq

Pour α = 5% : ⎧⎨⎩ χ299;.025 ' χ2100;.025 = 74.2

χ299;.975 ' χ2100;.975 = 129.6

d’où l’intervalle de confiace de l’écart-type à 95% :

[3.06, 5.34]

Exercice 2La force de rupture d’un certain type de cable peut être assimilée à une variablealéatoire normale.Des essais portant sur dix cables ont donné une variance empirique s2 de 1560N2.Construire un intervalle de confiance, à 95%, de l’écart-type de cette force de rupture.

Solution 2Au seuil α, l’intervalle de confiace de l’écart-type est défini par :"s

(n− 1)χ2n−1;1−α/2

s,

s(n− 1)χ2n−1;α/2

s

#Pour α = 5% : ⎧⎨⎩ χ29;.025 = 2.7

χ29;.975 = 19

d’où l’intervalle de confiace de l’écart-type à 95% :

[27.18N, 72.11N]

Exercice 3Une enquête statistique effectuée sur cent sujets permet de définir, à 95%, l’intervallede confiance de la moyenne :

[49.6− 50.4]Dans quelles conditions aurait-il été possible que le résultat fût à 95% :

[49.8− 50.2]

98

Page 103: Exercices Corrigés...C’est l’inverse de la moyenne empirique du r-échantillon. 6. Soit Xune variable aléatoire normale de paramètres μet σ2. Sa densité de probabilité fest

A. El Mossadeq Tests : Moyennes et Variances

Solution 3Il s’agit de déterminer la taille n0 de l’échantillon à prélever pour que l’intervalle deconfiance de la moyenne à 95% soit :

[49.8, 50.2]

sachant que pour un échantillon de taille n = 100, cet intervalle est :

[49.6, 50.4]

Puisque : ∙m− t1−α/2

σ√n,m+ t1−α/2

σ√n

¸= [49.6, 50.4]

on en déduit :

m =49.6 + 50.4

2= 50

et :

σ =

√n (50.4− 49.6)2t1−α/2

' 2.04

L’égalité :

50.2 = m+ t1−α/2σ√n0

implique :

n0 =

µσt1−α/250.2−m

¶2= 400

Exercice 4Pour déterminer le point de fusion moyen μ d’un certain alliage, on a procédé à neufobservations qui ont données une moyenne m = 1040 ◦C et un écart-type s = 16 ◦C.Construire un intervalle de confiance de la moyenne μ à 95%.

99

Page 104: Exercices Corrigés...C’est l’inverse de la moyenne empirique du r-échantillon. 6. Soit Xune variable aléatoire normale de paramètres μet σ2. Sa densité de probabilité fest

Tests : Moyennes et Variances A. El Mossadeq

Solution 4Ici on a :

n = 9

m = 1040 ◦C

s = 16 ◦C

Au seuil α, l’intervalle de confiace d’une telle moyenne est défini par :∙m− tn−1;1−α/2

s√n,m+ tn−1;1−α/2

s√n

¸Pour α = 5%, on a :

t8;.975 = 2.31

d’où l’intervalle de confiance à 95% :

[1027.68 ◦C, 1052.32 ◦C]

Exercice 5La taille de 1200 conscrits du bureau de recrutementX a pour moyenne X = 172 cmet pour écart-type sX = 6 cm.Les mêmes mesures effectuées sur les 250 conscrits du bureau de recrutement Y ontdonné pour moyenne Y = 170 cm et pour écart-type sX = 5 cm.Que peut-on conclure ?

Solution 5Testons au seuil α l’hypothèse nulle :

H0 : ”les conscrits des bureaux de recrutement X et Y ont la même taille”

Sous l’hypothèse nulle H0, la quantité :

t =X − Yrs2Xn1+

s2Yn2

peut être considérée comme une réalisation d’une variable aléatoire normale centréeréduite.Pour α = 5%, on a :

t.975 = 1.96

100

Page 105: Exercices Corrigés...C’est l’inverse de la moyenne empirique du r-échantillon. 6. Soit Xune variable aléatoire normale de paramètres μet σ2. Sa densité de probabilité fest

A. El Mossadeq Tests : Moyennes et Variances

Et comme :

t =X − Yrs2Xn1+

s2Yn2

= 5.547

On rejette alors l’hypothèse nulle H0 à 95% (même à 99%), c’est à dire, les conscritsdes bureaux de recrutement X et Y ont des tailles moyennes différentes.

Exercice 6On se propose de comparer le poids à la naissance chez une série de primapares(série 1) et une série de multipares (série 2) :

Serie 1 : n1 = 95 m1 = 3197 g s21 = 210100 g2

Serie 2 : n2 = 105 m2 = 3410 g s22 = 255400 g2

Que peut-on conclure ?

Solution 6Testons au seuil α l’hypothèse nulle :

H0 : ”les primapares et les multipares ont le même poids moyen à la naissance”

Sous l’hypothèse nulle H0, la quantité :

t =m1 −m2rs21n1+

s22n2

peut être considérée comme une réalisation d’une variable aléatoire normale centréeréduite.Pour α = 5%, on a :

t.975 = 1.96

Et comme :

t =m1 −m2rs21n1+

s22n2

= −3.1256

On rejette alors l’hypothèse nulle H0, à 95% (même à 99%), c’est à dire, les prima-pares et les multipares n’ont pas le même poids moyen à la naissance

101

Page 106: Exercices Corrigés...C’est l’inverse de la moyenne empirique du r-échantillon. 6. Soit Xune variable aléatoire normale de paramètres μet σ2. Sa densité de probabilité fest

Tests : Moyennes et Variances A. El Mossadeq

Exercice 7Chez cent sujet normaux, on dose l’acide urique, les résultats sont :½

m1 = 53.3mg/ ls1 = 9.1mg/ l

Chez cent sujet atteints de la maladie de goutte, le même dosage de l’acide uriquefournit les résultats : ½

m2 = 78.6mg/ ls2 = 13.1mg/ l

Que peut-on conclure ?

Solution 7Testons au seuil α, l’hypothèse nulle :

H0 : ”la maladie de goutte n’a pas d’influence sur la dose de l’acide urique”

Sous cette hypothèse, la quantité :

t =m1 −m2rs21n1+

s22n2

peut être considérée comme une réalisation d’une variable aléatoire normale centréeréduite.Pour α = 5%, on a :

t.975 = 1.96

et comme :

t =m1 −m2rs21n1+

s22n2

= −15.862

On rejette l’hypothèse nulle H0 à 95% (même à 99.99%), c’est à dire, la maladie degoutte a une influence sur la dose de l’acide urique.

Exercice 8On admet que la valeur moyenne de la glycémie du sujet normal est 1 g/ l.Sur 17 sujets, on a trouvé une moyenne de .965 g/ l et un écart-type estimé de.108 g/ l.Cette valeur peut-elle être considérée comme différente du taux normal ?

102

Page 107: Exercices Corrigés...C’est l’inverse de la moyenne empirique du r-échantillon. 6. Soit Xune variable aléatoire normale de paramètres μet σ2. Sa densité de probabilité fest

A. El Mossadeq Tests : Moyennes et Variances

Solution 8Testons au seuil α, l’hypothèse nulle :

H0 : ”la valeur est normale”

Sous cette hypothèse, la quantité :

t =m− μ

s√n

est une réalisation de la variable aléatoire Tn−1 de Student à :

n− 1 = 16

degrés de liberté.Pour α = 5%, on a :

t16;.975 = 2.12

et comme :

t =m− μ

s√n

= −1.3362

on accepte l’hypothèse nulle H0 au seuil α = 5%, c’est à dire, la valeur est normale.

Exercice 9Dans un échantillon de 17 prématurés, la moyenne du Na-plasmatique est :⎧⎨⎩ m1 = 133

s21 = 81.2

Soit un autre échantillon de 25 dysmaturés, dans lequel la moyenne duNa-plasmatiqueest : ⎧⎨⎩ m2 = 136

s22 = 56.57

Que peut-on conclure ?

Solution 9Testons d’abord, au seuil α = 10%, l’hypothèse nulle d’égalité des variances du Na-plasmatique chez les prématurés et les dysmaturés.

103

Page 108: Exercices Corrigés...C’est l’inverse de la moyenne empirique du r-échantillon. 6. Soit Xune variable aléatoire normale de paramètres μet σ2. Sa densité de probabilité fest

Tests : Moyennes et Variances A. El Mossadeq

Sous cette hypothèse, la quantité :

f =s21s22

est une réalisation d’une variable aléatoire de Fisher à :

(n1 − 1, n2 − 1) = (16, 24)

degrés de liberté.Pour α = 10%, on a :

F16,24;.95 = 2.09

Et comme :

f =s21s22

= 1.4354

on accepte donc l’hypothèse d’égalité des variances des deux populations.Calculons maintenant l’estimation commune s2 de cette variance :

s2 =(n1 − 1) s21 + (n2 − 1) s22

n1 + n2 − 2= 66.42

et testons l’hypothèse nulle :

H0 : ”les prématurés et les dysmaturés ont la même moyenne du Na-plasmatique”

Sous cette hypothèse, la quantité :

t =m1 −m2

s

r1

n1+1

n2

est une réalisation de la variable aléatoire de Student à :

n1 + n2 − 2 = 40

degrés de liberté.Pour α = 10%, on a :

t40;.95 = 1.68

Et comme :

t =m1 −m2

s

r1

n1+1

n2= −1.17

104

Page 109: Exercices Corrigés...C’est l’inverse de la moyenne empirique du r-échantillon. 6. Soit Xune variable aléatoire normale de paramètres μet σ2. Sa densité de probabilité fest

A. El Mossadeq Tests : Moyennes et Variances

On accepte l’hypothèse nulle H0 au seuil α = 10%, c’est à dire, les prématurés et lesdysmaturés ont la même moyenne du Na-plasmatique estimée par :

m =n1m1 + n2m2

n1 + n2= 134.79

Exercice 10Lorqu’une machine est bien réglée, elle produit des pièces dont le diamètre D estune variable gaussienne de moyenne 25mm.Deux heures après le réglage de la machine, on a prélevé au hasard neuf pièces.Leurs diamètres ont pour mesure en mm :

22 23 21 25 24 23 22 26 21

Que peut-on conclure quant à la qualité du réglage après deux heures de fonction-nement de la machine ?

Solution 10Calculons d’abord les estimations m et s2 de la moyenne et de la variance sur cetéchantillon de taille n = 9.On a :

m =1

n

nXi=1

xi

= 23mm

et :

s2 =1

n− 1

nXi=1

(xi −m)2

= 3mm2

Testons l’hypothèse nulle :

H0 : ”la machine est bien réglée”

Sous l’hypothèse nulle H0, la quantité :

t =m− μ

s√n

105

Page 110: Exercices Corrigés...C’est l’inverse de la moyenne empirique du r-échantillon. 6. Soit Xune variable aléatoire normale de paramètres μet σ2. Sa densité de probabilité fest

Tests : Moyennes et Variances A. El Mossadeq

est une réalisation d’une variable aléatoire de Student à :

n− 1 = 8

degrés de liberté : T8.Pour α = 5%, on a :

t8;.975 = 2.31

et comme :

t =m− μ

s√n

= −3.4641

On rejette l’hypothèse nulle H0 à 95% (même à 99%), c’est à dire, le réglage de lamachine est rompu.

Exercice 11Si l’écart-type de la durée de vie d’un modèle de lampe électrique est estimé à centheures, quelle doit être la taille de l’échantillon à prélever pour que l’erreur surl’estimation de la durée de vie moyenne n’exède pas vingt heures et ce avec uneprobabilité de 95% puis 99% ?

Solution 11L’erreur sur l’estimation de la moyenne est donnée par :

t1−α/2s√n

(1) Pour α = 5%, on a :

t1−α/2 = 1.96

d’où :

t1−α/2s√n≤ 20 =⇒ n ≥ 97

(2) Pour α = 1%, on a :

t1−α/2 = 2.57

d’où :

t1−α/2s√n≤ 20 =⇒ n ≥ 166

106

Page 111: Exercices Corrigés...C’est l’inverse de la moyenne empirique du r-échantillon. 6. Soit Xune variable aléatoire normale de paramètres μet σ2. Sa densité de probabilité fest

A. El Mossadeq Tests : Moyennes et Variances

Exercice 12Une machine fabrique des rondelles dont le diamètre D est une variable guassienne.On prélève au hasard un échantillon de huit rondelles.Leurs diamètres ont pour mesure en mm :

20.1 19.9 19.7 20.2 20.1 23.1 22.6 19.8

Construire à 95% puis 99% les intervalles de confiance de la moyenne et de la vari-ance.

Solution 12Calculons d’abord les estimations m et s2 de la moyenne et de la variance sur cetéchantillon de taille n = 8.On a :

m =1

n

nXi=1

xi

= 20.6875mm

et

s2 =1

n− 1

nXi=1

(xi −m)2

= 1.827mm2

1. L’intervalle de confiance de la moyenne à 1− α est :∙m− tn−1;1−α/2

s√n,m+ tn−1;1−α/2

s√n

¸

(a) Pour α = 5%, on a :

t7;.975 = 2.36

d’où l’intervalle :

[19.163, 22.212]

(b) Pour α = 1%, on a :

t7;.995 = 3.5

d’où l’intervalle :

[18.427, 22.948]

107

Page 112: Exercices Corrigés...C’est l’inverse de la moyenne empirique du r-échantillon. 6. Soit Xune variable aléatoire normale de paramètres μet σ2. Sa densité de probabilité fest

Tests : Moyennes et Variances A. El Mossadeq

2. L’intervalle de confiance de la variance à 1− α est :"(n− 1) s2χ2n−1;1−α/2

,(n− 1) s2χ2n−1;α/2

#

(a) Pour α = 5%, on a : ⎧⎨⎩ χ27;.025 = 1.69

χ27;.975 = 16

d’où l’intervalle :

[.79931, 7.5675]

(b) Pour α = 1%, on a : ⎧⎨⎩ χ27;.005 = .989

χ27;.995 = 20.3

d’où l’intervalle :

[.63, 12.931]

Exercice 13On effectue un dosage par deux méthodes différentes A et B.On obtient les résultats suivants :

Methode A .6 .65 .7 .7 .7 .7 .75 .8 .8

Methode B .6 .6 .65 .65 .7 .6 .75 .8 .8

Peut-on considérer que les deux méthodes sont équivalentes ?

Solution 13Calculons les estimations (m1, s

21) de (μ1, σ

21) et (m2, s

22) de (μ2, σ

22) :⎧⎪⎪⎪⎪⎨⎪⎪⎪⎪⎩

m1 =1

9

9Xi=1

x1i = .71

s21 =1

8

9Xi=1

(x1i −m1)2 = .004

108

Page 113: Exercices Corrigés...C’est l’inverse de la moyenne empirique du r-échantillon. 6. Soit Xune variable aléatoire normale de paramètres μet σ2. Sa densité de probabilité fest

A. El Mossadeq Tests : Moyennes et Variances

et : ⎧⎪⎪⎪⎪⎨⎪⎪⎪⎪⎩m2 =

1

9

9Xi=1

x2i = .68

s22 =1

8

9Xi=1

(x2i −m2)2 = .007

Testons d’abord, au seuil α = 10%, l’hypothèse nulle d’égalité des variances desdeux méthodes de dosage.Sous cette hypothèse, la quantité :

f =s22s21

est une réalisation d’une variable aléatoire de Fisher à :

(n2 − 1, n1 − 1) = (8, 8)

degrés de liberté.Pour α = 10%, on a :

F8,8;.95 = 3.44

et comme :

f =s22s21

= 1.75

On accepte donc l’hypothèse d’égalité des variances des deux populations.Calculons maintenant l’estimation commune s2 de cette variance :

s2 =(n1 − 1) s21 + (n2 − 1) s22

n1 + n2 − 2= 0.0055

et testons l’hypothèse nulle :

H0 : ”les deux méthodes de dosage sont équivalentes.”

Sous cette hypothèse, la quantité :

t =m1 −m2

s

r1

n1+1

n2

est une réalisation de la variable aléatoire de Student à :

n1 + n2 − 2 = 16

degrés de liberté.

109

Page 114: Exercices Corrigés...C’est l’inverse de la moyenne empirique du r-échantillon. 6. Soit Xune variable aléatoire normale de paramètres μet σ2. Sa densité de probabilité fest

Tests : Moyennes et Variances A. El Mossadeq

Pour α = 10%, on a :

t16;.95 = 1.75

et comme :

t =m1 −m2

s

r1

n1+1

n2= 0.86

on accepte l’hypothèse nulle H0 au seuil α = 10%, c’est à dire, les deux méthodes dedosage sont équivalentes.

Exercice 14Dans deux types de forêts, on a mesuré les hauteurs de treize et quatorze peuple-ments choisis au hasard et indépendamment dans le but de vérifier si les hauteursde ces deux types d’arbres sont ou ne sont pas égales.Les résultats sont les suivants :

Type 1 : 22.5 22.9 23.7 24.0 24.4 24.5 26.0

26.2 26.4 26.7 27.4 28.6 28.7

Type 2 : 23.4 24.4 24.6 24.9 25.0 26.2 26.3

26.8 26.8 26.9 27.0 27.6 27.7 27.8

On admet que les hauteurs de ces deux types d’arbres sont des variables gaussiennesN (μ1, σ21) et N (μ2, σ22).Que peut-on conclure ?

Solution 14Calculons les estimations (m1, s

21) de (μ1, σ

21) et (m2, s

22) de (μ2, σ

22) :⎧⎪⎪⎪⎪⎨⎪⎪⎪⎪⎩

m1 =1

13

13Xi=1

x1i = 25.538

s21 =1

12

13Xi=1

(x1i −m1)2 = 4.1576

110

Page 115: Exercices Corrigés...C’est l’inverse de la moyenne empirique du r-échantillon. 6. Soit Xune variable aléatoire normale de paramètres μet σ2. Sa densité de probabilité fest

A. El Mossadeq Tests : Moyennes et Variances

et : ⎧⎪⎪⎪⎪⎨⎪⎪⎪⎪⎩m2 =

1

14

14Xi=1

x2i = 26.1

s22 =1

13

14Xi=1

(x2i −m2)2 = 1.9431

Testons d’abord, au seuil α = 10%, l’hypothèse nulle d’égalité des variances deshauteurs des deux types d’arbres.Sous cette hypothèse, la quantité :

f =s21s22

est une réalisation d’une variable aléatoire de Fisher à :

(n1 − 1, n2 − 1) = (12, 13)degrés de liberté.

Pour α = 10%, on a :

F12,13;.95 = 2.6

et comme :

f =s21s22

= 2.1398

on accepte donc l’hypothèse d’égalité des variances des hauteurs des deux typesd’arbres.Calculons maintenant l’estimation commune s2 de cette variance :

s2 =(n1 − 1) s21 + (n2 − 1) s22

n1 + n2 − 2= 3.0062

et testons l’hypothèse nulle :

H0 : ”les deux types d’arbres ont la même hauteur”

Sous cette hypothèse, la quantité :

t =m1 −m2

s

r1

n1+1

n2

111

Page 116: Exercices Corrigés...C’est l’inverse de la moyenne empirique du r-échantillon. 6. Soit Xune variable aléatoire normale de paramètres μet σ2. Sa densité de probabilité fest

Tests : Moyennes et Variances A. El Mossadeq

est une réalisation de la variable aléatoire de Student à :

n1 + n2 − 2 = 25

degrés de liberté.

Pour α = 10%, on a :

t25;.95 = 1.71

et comme :

t =m1 −m2

s

r1

n1+1

n2= −0.84155

on accepte l’hypothèse nulleH0 au seuil α = 10%, c’est à dire, les deux types d’arbresont la même hauteur moyenne estimée par :

m =n1m1 + n2m2

n1 + n2= 25.829

Exercice 15On considère deux variétés de maïs M1 et M2 dont les rendements sont des vari-ables aléatoires gaussiennes N (μ1, σ21) et N (μ2, σ22).Afin de comparer les rendements de ces deux variétés de maïs, on a choisi de cul-tiver dans neuf stations différentes des parcelles voisines encemencées de l’une oul’autre des deux variétés.On a observé les rendements suivants :

Station 1 2 3 4 5 6 7 8 9

V ariete 1 39.6 32.4 33.1 27 36 32 25.9 32.4 33.2

V ariete 2 39.2 33.1 32.4 25.2 33.1 29.5 24.1 29.2 34.1

Que peut-on conclure ?

112

Page 117: Exercices Corrigés...C’est l’inverse de la moyenne empirique du r-échantillon. 6. Soit Xune variable aléatoire normale de paramètres μet σ2. Sa densité de probabilité fest

A. El Mossadeq Tests : Moyennes et Variances

Solution 15Calculons les estimations (m1, s

21) de (μ1, σ

21) et (m2, s

22) de (μ2, σ

22) :⎧⎪⎪⎪⎪⎨⎪⎪⎪⎪⎩

m1 =1

13

13Xi=1

x1i = 32.4

s21 =1

12

13Xi=1

(x1i −m1)2 = 17.188

et : ⎧⎪⎪⎪⎪⎨⎪⎪⎪⎪⎩m2 =

1

14

14Xi=1

x2i = 31.1

s22 =1

13

14Xi=1

(x2i −m2)2 = 21.785

Testons d’abord, au seuil α = 10%, l’hypothèse nulle d’égalité des variances desrendements des deux variétés de maïs.Sous cette hypothèse, la quantité :

f =s22s21

est une réalisation d’une variable aléatoire de Fisher à :

(n2 − 1, n1 − 1) = (8, 8)

degrés de liberté.Pour α = 10%, on a :

F8,8;.95 = 3.44

et comme :

f =s22s21

= 1.2675

On accepte donc l’hypothèse d’égalité des variances des hauteurs des deux typesd’arbres.Calculons maintenant l’estimation commune s2 de cette variance :

s2 =(n1 − 1) s21 + (n2 − 1) s22

n1 + n2 − 2

=s21 + s222

= 19.4865

113

Page 118: Exercices Corrigés...C’est l’inverse de la moyenne empirique du r-échantillon. 6. Soit Xune variable aléatoire normale de paramètres μet σ2. Sa densité de probabilité fest

Tests : Moyennes et Variances A. El Mossadeq

et testons l’hypothèse nulle :

H0 : ”les deux variétés de maïs ont le même rendement”

Sous cette hypothèse, la quantité :

t =m1 −m2

s

r1

n1+1

n2

est une réalisation de la variable aléatoire de Student à :

n1 + n2 − 2 = 16

degrés de liberté.Pour α = 10%, on a :

t16;.95 = 1.75

et comme :

t =m1 −m2

s

r1

n1+1

n2= .42892

on accepte l’hypothèse nulle H0 au seuil α = 10%, c’est à dire, les deux variétés demaïs ont le même rendement moyen estimé par :

m =n1m1 + n2m2

n1 + n2= 31.75

Exercice 16Le relevé des températures journalières minimales de deux stations S1 et S2, aucours de neuf journées consécutives a fourni les valeurs suivantes en ◦C:

Station 1 12 8 9 10 11 13 10 7 10

Station 2 7 11 10 6 8 11 12 9 7

On admet que la distribution des températures journalières minimales des deuxstations S1 et S2 sont des variables gaussiennes N (μ1, σ21) et N (μ2, σ22).

1. Déterminer les estimations des moyennes et des variances des températuresjournalières minimales des deux stations S1 et S2.

2. Construire, au seuil α = 5%, les intervalles de confiance de ces estimations.

114

Page 119: Exercices Corrigés...C’est l’inverse de la moyenne empirique du r-échantillon. 6. Soit Xune variable aléatoire normale de paramètres μet σ2. Sa densité de probabilité fest

A. El Mossadeq Tests : Moyennes et Variances

3. Peut-on admettre, au seuil α = 10%, l’hypothèse selon laquelle les températuresjournalières minimales moyennes des deux stations S1 et S2 sont identiques ?

Solution 161. Calculons les estimations (m1, s

21) de (μ1, σ

21) et (m2, s

22) de (μ2, σ

22).

On a : ⎧⎪⎪⎪⎪⎪⎪⎨⎪⎪⎪⎪⎪⎪⎩m1 =

1

9

11Xi=1

x1i = 10◦C

s21 =1

8

11Xi=1

(x1i −m1)2 = 3.5

et : ⎧⎪⎪⎪⎪⎪⎪⎨⎪⎪⎪⎪⎪⎪⎩m2 =

1

9

10Xi=1

x2i = 9◦C

s22 =1

8

10Xi=1

(x2i −m2)2 = 4.5

(a) L’intervalle de confiance de μ1 à 1− α est défini par :∙m1 − tn−1;1−α/2

s1√n,m1 + tn−1;1−α/2

s1√n

¸Pour α = 5%, on a :

t8;.975 = 2.31

d’où l’intervalle :

[8.56 ◦C, 11.44 ◦C]

(b) L’intervalle de confiance de σ21 à 1− α est défini par :"(n− 1) s21χ2n−1;1−α/2

,(n− 1) s21χ2n−1;α/2

#Pour α = 5%, on a : ⎧⎨⎩ χ28;.025 = 2.18

χ28;.975 = 17.5

115

Page 120: Exercices Corrigés...C’est l’inverse de la moyenne empirique du r-échantillon. 6. Soit Xune variable aléatoire normale de paramètres μet σ2. Sa densité de probabilité fest

Tests : Moyennes et Variances A. El Mossadeq

d’où l’intervalle :

[1.6, 12.8]

(c) L’intervalle de confiance de μ2 à 1− α est défini par :∙m2 − tn−1;1−α/2

s2√n,m2 + tn−1;1−α/2

s2√n

¸Pour α = 5%, on a :

t8;.975 = 2.31

d’où l’intervalle :

[7.37 ◦C, 10.63 ◦C]

(d) L’intervalle de confiance de σ22 à 1− α est défini par :"(n− 1) s22χ2n−1;1−α/2

,(n− 1) s22χ2n−1;α/2

#Pour α = 5%, on a : ⎧⎨⎩ χ28;.025 = 2.18

χ28;.975 = 17.5

d’où l’intervalle :

[2.06, 16.51]

2. Testons d’abord, au seuil α = 10%, l’hypothèse nulle d’égalité des variances destempératures journalières minimales des deux stations S1 et S2.Sous cette hypothèse, la quantité :

f =s22s21

est une réalisation d’une variable aléatoire de Fisher à :

(n2 − 1, n1 − 1) = (8, 8)

degrés de liberté.Pour α = 10%, on a :

F8,8;.95 = 3.44

et comme :

f =s22s21= 1.29

On accepte donc l’hypothèse d’égalité des variances.

116

Page 121: Exercices Corrigés...C’est l’inverse de la moyenne empirique du r-échantillon. 6. Soit Xune variable aléatoire normale de paramètres μet σ2. Sa densité de probabilité fest

A. El Mossadeq Tests : Moyennes et Variances

Calculons maintenant l’estimation commune s2 de cette variance :

s2 =(n1 − 1) s21 + (n2 − 1) s22

n1 + n2 − 2

=s21 + s222

= 4

et testons l’hypothèse nulle :

H0 : ”les températures journalières minimales moyennes des deux stationsS1 et S2.sont identiques”

Sous cette hypothèse, la quantité :

t =m1 −m2

s

r1

n1+1

n2

est une réalisation de la variable aléatoire de Student à :

n1 + n2 − 2 = 16

degrés de liberté.

Pour α = 10%, on a :

t16;.95 = 1.75

et comme :

t =m1 −m2

s

r1

n1+1

n2

= 1.0607

On accepte l’hypothèse nulle H0 au seuil α = 10%, c’est à dire, les températuresjournalières minimales moyennes des deux stations S1 et S2.sont identiques.Cette température moyenne peut être estimée par :

m =n1m1 + n2m2

n1 + n2

=m1 +m2

2= 9.5

117

Page 122: Exercices Corrigés...C’est l’inverse de la moyenne empirique du r-échantillon. 6. Soit Xune variable aléatoire normale de paramètres μet σ2. Sa densité de probabilité fest

Tests : Moyennes et Variances A. El Mossadeq

Exercice 17On étudie l’effet d’une substance sur la croissance d’une tumeur greffée.Les résultats sont consignés sur le tableau ci-dessous donnant la surface de la tumeurau 20eme jour après sa greffe :

Surface 5.5 6 6.5 7 7.5 8T emoins 1 2 3 8 4 3Traites 4 4 8 3 1 1

Le traitement a-t-il un effet significatif sur la surface tumorale ?On suppose que la surface tumorale est distribuée selon des lois normales N (μ1, σ21)et N (μ2, σ22) chez les témoins et les traités respectivement.

Solution 17Calculons les estimations (m1, s

21) de (μ1, σ

21) et (m2, s

22) de (μ2, σ

22).

On a : ⎧⎪⎪⎪⎪⎪⎪⎨⎪⎪⎪⎪⎪⎪⎩m1 =

1

21

6Xi=1

n1ixi = 7

s21 =1

20

6Xi=1

n1i (xi −m1)2 = .45

et : ⎧⎪⎪⎪⎪⎪⎪⎨⎪⎪⎪⎪⎪⎪⎩m2 =

1

21

6Xi=1

n2ixi = 6.4048

s22 =1

20

6Xi=1

n2i (xi −m2)2 = .87972

Testons d’abord, au seuil α = 2%, l’hypothèse nulle d’égalité des variances dessurfaces tumorales chez les populations des témoins et des traités.Sous cette hypothèse, la quantité :

f =s22s21

est une réalisation d’une variable aléatoire de Fisher à :

(n2 − 1, n1 − 1) = (20, 20)

degrés de liberté.

118

Page 123: Exercices Corrigés...C’est l’inverse de la moyenne empirique du r-échantillon. 6. Soit Xune variable aléatoire normale de paramètres μet σ2. Sa densité de probabilité fest

A. El Mossadeq Tests : Moyennes et Variances

Pour α = 2%, on a :

F20,20;.99 = 2.94

et comme :

f =s22s21

= 1.9549

on accepte donc l’hypothèse d’égalité des variances des deux populations.Calculons maintenant l’estimation commune s2 de cette variance :

s2 =(n1 − 1) s21 + (n2 − 1) s22

n1 + n2 − 2= .66486

et testons l’hypothèse nulle :

H0 : ”le traitement est sans effet sur la croissance de la surface tumorale”

Sous cette hypothèse, la quantité :

t =m1 −m2

s

r1

n1+1

n2

est une réalisation de la variable aléatoire de Student à :

n1 + n2 − 2 = 40

degrés de liberté.Pour α = 2%, on a :

t40;.99 = 2.42

et comme :

t =m1 −m2

s

r1

n1+1

n2= 2.831

on rejette l’hypothèse nulle H0 à 98%, c’est à dire, le traitement a une influence surla croissance de la surface tumorale.

119

Page 124: Exercices Corrigés...C’est l’inverse de la moyenne empirique du r-échantillon. 6. Soit Xune variable aléatoire normale de paramètres μet σ2. Sa densité de probabilité fest