Brigitte CHAPUT - Journée de la Régionale APMEP de Toulouse - 19 janvier 2011 UTILISATION DE LA...

Post on 04-Apr-2015

105 views 0 download

Transcript of Brigitte CHAPUT - Journée de la Régionale APMEP de Toulouse - 19 janvier 2011 UTILISATION DE LA...

Brigitte CHAPUT - Journée de la Régionale APMEP de Toulouse - 19 janvier 2011

UTILISATION DE LA LOI BINOMIALE

POUR UNE PRISE DE DÉCISION À

PARTIR D'UNE FRÉQUENCE

Brigitte CHAPUT - Journée de la Régionale APMEP de Toulouse - 19 janvier 2011

1 - Contexte de travail

On considère une population statistique dans laquelle on étudie un caractère qualitatif prenant une modalité donnée dans une proportion p.

On cherche des renseignements sur p.

Brigitte CHAPUT - Journée de la Régionale APMEP de Toulouse - 19 janvier 2011

1 - Contexte de travail

On peut étudier toute la population et avoir une connaissance précise de p.

Recensement

Mais cela peut s'avérer :• long (la valeur de p pourra avoir changé entre temps)

•ou coûteux, •voire impossible lorsque l'étude est destructrice des individus.

Brigitte CHAPUT - Journée de la Régionale APMEP de Toulouse - 19 janvier 2011

1 - Contexte de travail

On détermine la fréquence f de la modalité dans l'échantillon, elle induit des résultats sur p avec une certaine marge d'erreur cependant.

Statistique inférentielle

On peut raisonner à partir d'un échantillon tiré au hasard dans la population.

Brigitte CHAPUT - Journée de la Régionale APMEP de Toulouse - 19 janvier 2011

1 - Contexte de travail

• l'estimation (ponctuelle ou par intervalle de confiance...)

Statistique inférentielle

Deux problèmes relèvent de la statistique inférentielle :

• les tests (tests d'hypothèse, tests d'adéquation...).

Brigitte CHAPUT - Journée de la Régionale APMEP de Toulouse - 19 janvier 2011

1 - Contexte de travail

Supposons que l'on travaille sur la proportion p de bonbons à la menthe délivrés par un distributeur.

• test d'hypothèse on cherche à savoir si p = 25 % (par exemple)

• estimation on cherche à connaître la valeur de p.

Exemple :

Brigitte CHAPUT - Journée de la Régionale APMEP de Toulouse - 19 janvier 2011

2 - Les programmes de Premières

Programmes de Première 2011

Brigitte CHAPUT - Journée de la Régionale APMEP de Toulouse - 19 janvier 2011

Les programmes de premières conduisent à travailler dans le cadre des tests d'hypothèse.

2 - Les programmes de Premières

Brigitte CHAPUT - Journée de la Régionale APMEP de Toulouse - 19 janvier 2011

3- Démarche des tests d'hypothèse sur une proportion

On émet une hypothèse sur la proportion p d'un caractère qualitatif dans une population statistique.

On cherche des raisons de rejeter cette hypothèse au vu d'un échantillon tiré au hasard.

Brigitte CHAPUT - Journée de la Régionale APMEP de Toulouse - 19 janvier 2011

1 - Contexte de travail

On travaille sur la proportion p de bonbons à la menthe délivrés par un distributeur.

On cherche à savoir si p = 25 % : c'est l'hypothèse que l'on cherche à vérifier.

On constitue au hasard un échantillon de 20 bonbons issus du distributeur.

Exemple :

Brigitte CHAPUT - Journée de la Régionale APMEP de Toulouse - 19 janvier 2011

3- Démarche des tests d'hypothèse sur une proportion

Si l'hypothèse émise est vraie, on connaît la distribution d'échantillonnage de la fréquence Fn du caractère étudié dans les échantillons de taille n. On connaît alors les valeurs de Fn les plus fréquemment observables.

On observe la valeur f de Fn pour un échantillon.

Brigitte CHAPUT - Journée de la Régionale APMEP de Toulouse - 19 janvier 2011

1 - Contexte de travail

On constitue au hasard et avec remise un échantillon de 20 bonbons.

Exemple :

Si la proportion de bonbons à la menthe délivrés par le distributeur est 25 %, le nombre de bonbons à la menthe de l'échantillon se distribue selon la loi binomiale de paramètres 20 et 0,25.

Ce résultat nous permet de connaître la distribution de F20.

Brigitte CHAPUT - Journée de la Régionale APMEP de Toulouse - 19 janvier 2011

1 - Contexte de travail

Exemple : Échantillons de taille 20

0,00

0,05

0,10

0,15

0,20

0,25

0

1/20

2/20

3/20

4/20

5/20

6/20

7/20

8/20

9/20

10/2

0

11/2

0

12/2

0

13/2

0

14/2

0

15/2

0

16/2

0

17/2

0

18/2

0

19/2

0

20/2

0

Fréquence dans l'échantillon

Pro

bab

ilité

Distribution de F20.

Brigitte CHAPUT - Journée de la Régionale APMEP de Toulouse - 19 janvier 2011

3- Démarche des tests d'hypothèse sur une proportion

On observe la valeur f de Fn pour un

échantillon. On considère que le hasard fait bien les choses et on adopte la démarche suivante :

•si f ne fait pas partie des valeurs les plus fréquemment observables, on rejette l'hypothèse émise.

•si f fait partie des valeurs les plus fréquemment observables, on ne rejette pas l'hypothèse émise.

Brigitte CHAPUT - Journée de la Régionale APMEP de Toulouse - 19 janvier 2011

3- Démarche des tests d'hypothèse sur une proportion

Cet ensemble des valeurs les plus fréquemment observables se déterminent à l'aide d'un niveau de probabilité, en général 95 %.

C'est un intervalle centré en p qui contient la valeur de Fn avec une probabilité d'au moins 95

% et qui soit d'amplitude minimale : c'est l'intervalle de fluctuation de p au niveau de probabilité de 95 %.

Brigitte CHAPUT - Journée de la Régionale APMEP de Toulouse - 19 janvier 2011

Travaillons au niveau de probabilité de 95 %.

Exemple :

3- Démarche des tests d'hypothèse sur une proportion

On détermine l'intervalle centré en 0,25, d'amplitude minimale, qui contient la valeur de F20 pour un échantillon tiré au hasard avec une probabilité d'au moins 95 %.

Brigitte CHAPUT - Journée de la Régionale APMEP de Toulouse - 19 janvier 2011

Exemple : Échantillons de taille 20

0,00

0,05

0,10

0,15

0,20

0,25

0

1/20

2/20

3/20

4/20

5/20

6/20

7/20

8/20

9/20

10/2

0

11/2

0

12/2

0

13/2

0

14/2

0

15/2

0

16/2

0

17/2

0

18/2

0

19/2

0

20/2

0

Fréquence dans l'échantillon

Pro

bab

ilité

L'intervalle [0,05 ; 0,45] contient F20 avec la probabilité d'environ 0,98.

3- Démarche des tests d'hypothèse sur une proportion

Brigitte CHAPUT - Journée de la Régionale APMEP de Toulouse - 19 janvier 2011

Règle de décision :

•Si la valeur observée de F20 dans l'échantillon n'appartient pas à [0,05 ; 0,45] alors on rejette l'hypothèse que p = 25 %.

•Si la valeur observée de F20 dans l'échantillon appartient à [0,05 ; 0,45] alors on ne rejette pas l'hypothèse que p = 25 %.

Exemple :

3- Démarche des tests d'hypothèse sur une proportion

Brigitte CHAPUT - Journée de la Régionale APMEP de Toulouse - 19 janvier 2011

INTERVALLE DE FLUCTUATION

Brigitte CHAPUT - Journée de la Régionale APMEP de Toulouse - 19 janvier 2011

1 - Dans le programme de Seconde 2009

Brigitte CHAPUT - Journée de la Régionale APMEP de Toulouse - 19 janvier 2011

1 - Dans le programme de Seconde 2009

Brigitte CHAPUT - Journée de la Régionale APMEP de Toulouse - 19 janvier 2011

1 - Dans les programmes de Première

Programmes de Première 2011

Brigitte CHAPUT - Journée de la Régionale APMEP de Toulouse - 19 janvier 2011

3 - Un exemple de détermination de l'intervalle de fluctuation

Considérons un échantillon de taille 20, constitué "au hasard" et avec remise dans une population contenant

une sous-population A en proportion p = 14.

20 F20 est distribuée selon la loi binomiale de paramètres

20 et 14.

On s' intéresse à la f réquence f d'éléments de A dans l'échantillon, c'est l'observation de la variable aléatoire F20 sur l'échantillon.

Brigitte CHAPUT - Journée de la Régionale APMEP de Toulouse - 19 janvier 2011

3 - Un exemple de détermination de l'intervalle de fluctuation

Fréquence de A

0/20

1/20

2/20

3/20

4/20

5/20

6/20

7/20

8/20

9/20

10/20

11/20

12/20

13/20

Fréquence de A

14/20

15/20

16/20

17/20

18/20

19/10

20/20

Brigitte CHAPUT - Journée de la Régionale APMEP de Toulouse - 19 janvier 2011

3 - Un exemple de détermination de l'intervalle de fluctuation

Fréquence de A

Probabilité

0/20 0,03

1/20 0,021

2/20 0,067

3/20 0,134

4/20 0,190

5/20 0,202

6/20 0,169

7/20 0,112

8/20 0,061

9/20 0,027

10/20 0,010

11/20 0,003

12/20 0,001

13/20 0,000

Fréquence de A

Probabilité

14/20 0,000

15/20 0,000

16/20 0,000

17/20 0,000

18/20 0,000

19/10 0,000

20/20 0,000

Brigitte CHAPUT - Journée de la Régionale APMEP de Toulouse - 19 janvier 2011

3 - Un exemple de détermination de l'intervalle de fluctuation

Fréquence de A

Probabilité

0/20 0,03

1/20 0,021

2/20 0,067

3/20 0,134

4/20 0,190

5/20 0,202

6/20 0,169

7/20 0,112

8/20 0,061

9/20 0,027

10/20 0,010

11/20 0,003

12/20 0,001

13/20 0,000

p = 25 %

Fréquence de A

Probabilité

14/20 0,000

15/20 0,000

16/20 0,000

17/20 0,000

18/20 0,000

19/10 0,000

20/20 0,000

Brigitte CHAPUT - Journée de la Régionale APMEP de Toulouse - 19 janvier 2011

3 - Un exemple de détermination de l'intervalle de fluctuation

Fréquence de A

Probabilité

0/20 0,03

1/20 0,021

2/20 0,067

3/20 0,134

4/20 0,190

5/20 0,202

6/20 0,169

7/20 0,112

8/20 0,061

9/20 0,027

10/20 0,010

11/20 0,003

12/20 0,001

13/20 0,000

p = 25 %

Brigitte CHAPUT - Journée de la Régionale APMEP de Toulouse - 19 janvier 2011

3 - Un exemple de détermination de l'intervalle de fluctuation

Fréquence de A

Probabilité

0/20 0,03

1/20 0,021

2/20 0,067

3/20 0,134

4/20 0,190

5/20 0,202 0,561

6/20 0,169

7/20 0,112

8/20 0,061

9/20 0,027

10/20 0,010

11/20 0,003

12/20 0,001

13/20 0,000

p = 25 %

Brigitte CHAPUT - Journée de la Régionale APMEP de Toulouse - 19 janvier 2011

3 - Un exemple de détermination de l'intervalle de fluctuation

Fréquence de A

Probabilité

0/20 0,03

1/20 0,021

2/20 0,067

3/20 0,134

4/20 0,190

5/20 0,202 0,561 0,807

6/20 0,169

7/20 0,112

8/20 0,061

9/20 0,027

10/20 0,010

11/20 0,003

12/20 0,001

13/20 0,000

p = 25 %

Brigitte CHAPUT - Journée de la Régionale APMEP de Toulouse - 19 janvier 2011

3 - Un exemple de détermination de l'intervalle de fluctuation

Fréquence de A

Probabilité

0/20 0,03

1/20 0,021

2/20 0,067

3/20 0,134

4/20 0,190

5/20 0,202 0,561 0,807 0,935

6/20 0,169

7/20 0,112

8/20 0,061

9/20 0,027

10/20 0,010

11/20 0,003

12/20 0,001

13/20 0,000

p = 25 %

Brigitte CHAPUT - Journée de la Régionale APMEP de Toulouse - 19 janvier 2011

3 - Un exemple de détermination de l'intervalle de fluctuation

Fréquence de A

Probabilité

0/20 0,03

1/20 0,021

2/20 0,067

3/20 0,134

4/20 0,190

5/20 0,202 0,561 0,807 0,935 0,983

6/20 0,169

7/20 0,112

8/20 0,061

9/20 0,027

10/20 0,010

11/20 0,003

12/20 0,001

13/20 0,000

p = 25 %

Brigitte CHAPUT - Journée de la Régionale APMEP de Toulouse - 19 janvier 2011

3 - Un exemple de détermination de l'intervalle de fluctuation

Fréquence de A

Probabilité

0/20 0,03

1/20 0,021

2/20 0,067

3/20 0,134

4/20 0,190

5/20 0,202 0,561 0,807 0,935 0,983 0,999

6/20 0,169

7/20 0,112

8/20 0,061

9/20 0,027

10/20 0,010

11/20 0,003

12/20 0,001

13/20 0,000

p = 25 %

Brigitte CHAPUT - Journée de la Régionale APMEP de Toulouse - 19 janvier 2011

3 - Un exemple de détermination de l'intervalle de fluctuation

Échantillons de taille 20

0,00

0,05

0,10

0,15

0,20

0,250

1/20

2/20

3/20

4/20

5/20

6/20

7/20

8/20

9/20

10/2

0

11/2

0

12/2

0

13/2

0

14/2

0

15/2

0

16/2

0

17/2

0

18/2

0

19/2

0

20/2

0

Fréquence de A

Pro

bab

ilit

é

p = 25 %

Brigitte CHAPUT - Journée de la Régionale APMEP de Toulouse - 19 janvier 2011

3 - Un exemple de détermination de l'intervalle de fluctuation

Échantillons de taille 20

0,00

0,05

0,10

0,15

0,20

0,250

1/20

2/20

3/20

4/20

5/20

6/20

7/20

8/20

9/20

10/2

0

11/2

0

12/2

0

13/2

0

14/2

0

15/2

0

16/2

0

17/2

0

18/2

0

19/2

0

20/2

0

Fréquence de A

Pro

babi

lité

p = 25 %

0,561

Brigitte CHAPUT - Journée de la Régionale APMEP de Toulouse - 19 janvier 2011

3 - Un exemple de détermination de l'intervalle de fluctuation

Échantillons de taille 20

0,00

0,05

0,10

0,15

0,20

0,250

1/20

2/20

3/20

4/20

5/20

6/20

7/20

8/20

9/20

10/2

0

11/2

0

12/2

0

13/2

0

14/2

0

15/2

0

16/2

0

17/2

0

18/2

0

19/2

0

20/2

0

Fréquence de A

Pro

babi

lité

p = 25 %

0,807

Brigitte CHAPUT - Journée de la Régionale APMEP de Toulouse - 19 janvier 2011

3 - Un exemple de détermination de l'intervalle de fluctuation

Échantillons de taille 20

0,00

0,05

0,10

0,15

0,20

0,250

1/20

2/20

3/20

4/20

5/20

6/20

7/20

8/20

9/20

10/2

0

11/2

0

12/2

0

13/2

0

14/2

0

15/2

0

16/2

0

17/2

0

18/2

0

19/2

0

20/2

0

Fréquence de A

Pro

babi

lité

p = 25 %

0,935

Brigitte CHAPUT - Journée de la Régionale APMEP de Toulouse - 19 janvier 2011

3 - Un exemple de détermination de l'intervalle de fluctuation

Échantillons de taille 20

0,00

0,05

0,10

0,15

0,20

0,250

1/20

2/20

3/20

4/20

5/20

6/20

7/20

8/20

9/20

10/2

0

11/2

0

12/2

0

13/2

0

14/2

0

15/2

0

16/2

0

17/2

0

18/2

0

19/2

0

20/2

0

Fréquence de A

Pro

babi

lité

p = 25 %

0,983

Brigitte CHAPUT - Journée de la Régionale APMEP de Toulouse - 19 janvier 2011

3 - Un exemple de détermination de l'intervalle de fluctuation

Échantillons de taille 20

0,00

0,05

0,10

0,15

0,20

0,250

1/20

2/20

3/20

4/20

5/20

6/20

7/20

8/20

9/20

10/2

0

11/2

0

12/2

0

13/2

0

14/2

0

15/2

0

16/2

0

17/2

0

18/2

0

19/2

0

20/2

0

Fréquence de A

Pro

babi

lité

p = 25 %

0,999

Brigitte CHAPUT - Journée de la Régionale APMEP de Toulouse - 19 janvier 2011

3 - Un exemple de détermination de l'intervalle de fluctuation

En résumé :

I l n'y a pas d' intervalle centré en p = 14 tel que la

probabilité que Fn appartienne à cet intervalle soit exactement 0,95.

Brigitte CHAPUT - Journée de la Régionale APMEP de Toulouse - 19 janvier 2011

3 - Un exemple de détermination de l'intervalle de fluctuation

On adopte la définition suivante : L’intervalle de fluctuation de Fn au niveau de probabilité de 95 %, est le plus petit intervalle de la f orme [p ; p + ] tel que

P

p Fn p + 0,95.

Brigitte CHAPUT - Journée de la Régionale APMEP de Toulouse - 19 janvier 2011

3 - Un exemple de détermination de l'intervalle de fluctuation

Pour l'exemple :

Brigitte CHAPUT - Journée de la Régionale APMEP de Toulouse - 19 janvier 2011

3 - Un exemple de détermination de l'intervalle de fluctuation

Pour l'exemple :

Le plus petit intervalle de la f orme

1

4 a ., 14 + a tel

que P

1

4 a F20

14+a 0,95 est obtenu pour a = 0,2.

L' intervalle de fluctuation de F20 au niveau de probabilité de 95 % est : [0,05 ; 0,45].

Brigitte CHAPUT - Journée de la Régionale APMEP de Toulouse - 19 janvier 2011

PRISE DE DÉCISION

Brigitte CHAPUT - Journée de la Régionale APMEP de Toulouse - 19 janvier 2011

1 - Application à la prise de décision

Programmes de Première 2011

Brigitte CHAPUT - Journée de la Régionale APMEP de Toulouse - 19 janvier 2011

1 - Application à la prise de décision

Exemple 1 :

En 2000, dans le village de Xicun, en Chine, il est né 20 enfants, parmi lesquels 16 garçons. (Source : Washington Post du 29 mai 2001.)

Peut-on considérer que cette répartition est le fruit du seul hasard ?

Brigitte CHAPUT - Journée de la Régionale APMEP de Toulouse - 19 janvier 2011

1 - Application à la prise de décision

Exemple 1 : On veut rejeter ou non l'hypothèse que la distribution des sexes des enfants nés en 2000 à Xicun est due au seul hasard.

On considère que la variable aléatoire "sexe à la naissance" prend les deux valeurs fille et garçon avec la même probabilité 0,5.

Brigitte CHAPUT - Journée de la Régionale APMEP de Toulouse - 19 janvier 2011

1 - Application à la prise de décision

Exemple 1 :

La distribution des sexes dans un tel échantillon suit la loi binomiale de paramètres 20 et 0,5.L'intervalle de fluctuation de la fréquence de garçons dans l'échantillon au niveau de probabilité de 95 % est [0,3 ; 0,7].

Si la distribution des sexes des enfants nés en 2000 à Xicun est due au seul hasard, les 20 enfants sont assimilés à un échantillon d'enfants choisis au hasard dans la population.

Brigitte CHAPUT - Journée de la Régionale APMEP de Toulouse - 19 janvier 2011

1 - Application à la prise de décision

Exemple 1 :

La fréquence de garçons observée à Xicun est 0,8 qui n'appartient pas à [0,3 ; 0,7].

Brigitte CHAPUT - Journée de la Régionale APMEP de Toulouse - 19 janvier 2011

1 - Application à la prise de décision

Brigitte CHAPUT - Journée de la Régionale APMEP de Toulouse - 19 janvier 2011

1 - Application à la prise de décision

Exemple 1 :

La fréquence de garçons observée à Xicun est 0,8 qui n'appartient pas à [0,3 ; 0,7]. On considère que la différence entre 0,8 et la valeur attendue 0,5 est significative et on rejette l'hypothèse que la répartition des sexes des enfants est due au seul hasard.On a pu, par la suite, établir un lien avec l’acquisition en 1999, dans ce village d’une machine à ultra-sons bon marché, permettant aux médecins de déterminer le sexe du fœtus.

Brigitte CHAPUT - Journée de la Régionale APMEP de Toulouse - 19 janvier 2011

1 - Application à la prise de décision

Exemple 2 :

Dans la réserve indienne d’Aamjiwnaag, située au Canada à proximité d’industries chimiques, il est né entre 1999 et 2003, 132 enfants dont 46 garçons. (Sources : Science et Vie février 2006 – Environmental Health Perspectives octobre 2005).Peut-on considérer que cette répartition est le fruit du seul hasard ?

Brigitte CHAPUT - Journée de la Régionale APMEP de Toulouse - 19 janvier 2011

1 - Application à la prise de décision

Exemple 2 : On veut rejeter ou non l'hypothèse que la distribution des sexes des enfants nés entre 1999 et 2003 à Aamjiwnaag est due au seul hasard. On considère que la variable aléatoire "sexe à la naissance" prend les deux valeurs fille et garçon avec la même probabilité 0,5.

Brigitte CHAPUT - Journée de la Régionale APMEP de Toulouse - 19 janvier 2011

1 - Application à la prise de décision

Exemple 2 :

La distribution des sexes dans un tel échantillon suit la loi binomiale de paramètres 132 et 0,5.L'intervalle de fluctuation de la fréquence de garçons dans l'échantillon au niveau de probabilité de 95 % est approché par [0,416 ; 0,584].

Si la distribution des sexes des enfants nés entre 1999 et 2003 à Aamjiwnaag est due au seul hasard, les 132 enfants sont assimilés à un échantillon d'enfants choisis au hasard dans la population.

Brigitte CHAPUT - Journée de la Régionale APMEP de Toulouse - 19 janvier 2011

1 - Application à la prise de décision

Exemple 2 :

On considère que la différence entre 0,348 et la valeur attendue 0,5 est significative et on rejette que la répartition des sexes des enfants est due au seul hasard.

Ce résultat conduit à suspecter l'impact des usines chimiques voisines utilisant des polluants chimiques sur le sex-ratio.

La fréquence de garçons observée à Aamjiwnaag est environ 0,348 qui n'appartient pas à [0,416 ; 0,584].

Brigitte CHAPUT - Journée de la Régionale APMEP de Toulouse - 19 janvier 2011

1 - Application à la prise de décision

Brigitte CHAPUT - Journée de la Régionale APMEP de Toulouse - 19 janvier 2011

1 - Application à la prise de décision

Exemple 2 :