1 1 Problème 1.Garçons ou filles : qui réussi le mieux au bac ? 2.Cigarette et cancer : y a t il...

Post on 04-Apr-2015

103 views 0 download

Transcript of 1 1 Problème 1.Garçons ou filles : qui réussi le mieux au bac ? 2.Cigarette et cancer : y a t il...

11

ProblèmeProblème1. Garçons ou filles : qui réussi le mieux au bac ?

2. Cigarette et cancer : y a t il un lien ?

3. Prévention routière : moins d’accident chez les verbalisés ?

Autre formulation :

1. Y a t il un lien entre sexe et réussite au bac ?

2. Y a t il un lien entre cancer et cigarette ?

3. Y a t il un lien entre accident et verbalisation ?

22

MesuresMesures

EffectifAdmis Garçon 10Admis Fille 42Refusé Garçon 5Refusé Fille 18

Garçons FillesRefusés 5 18Admis 10 42

Résultat SexeIsabelle Ref FSylvain Adm GLucie Adm Fjean Ref GZoé Adm F… … …

Données brutes

Tableau des effectifs

Tableau croisé

33

Théorie…Théorie…• Définition : Hypothèse nulle (=H0) : il n’y a pas de lien entre

la variable sexe et la variable résultat.

• Si H0 est vrai : le pourcentage des Admis est le même chez les garçons que chez les filles

Garçons FillesRefusés 10 10Admis 10 10

Garçons FillesRefusés 10 20Admis 10 20

Garçons FillesRefusés 10 20Admis 20 40

Garçons FillesRefusés 50% 50%Admis 50% 50%

Garçons FillesRefusés 50% 50%Admis 50% 50%

Garçons FillesRefusés 33% 33%Admis 67% 67%

44

… et pratique… et pratique

Garçons FillesRefusés 5 18Admis 10 42

Garçons FillesRefusés 33% 30%Admis 67% 70%

Garçons FillesRefusés 25% 20%Admis 75% 80%

Garçons FillesRefusés 34% 35%Admis 66% 65%

On mesure : Dans d’autres lycées :

Garçons FillesRefusés 70% 65%Admis 30% 35%

55

ProblèmeProblème• Une différence significative cache probablement une cause

• Quand peut-on considérer qu’une différence est significative ? Quand est-elle du au hasard ?

Garçons FillesRefusés 34% 35%Admis 66% 65%

Garçons FillesRefusés 34% 39%Admis 66% 61%

Garçons FillesRefusés 34% 50%Admis 66% 50%

66

SolutionSolution• Test du 2 (prononcez khi2) permet de trancher :

• Le 2 est un indice que l’on calcule à partir d’un tableau croisé.

• Quand on l’a trouvé, il permet de décider si oui ou non les variations du tableau soit du au hasard :

Garçons FillesRefusés 5 18Admis 10 42

2=0,062

2=0,062 IncertitudeOn ne sait pas si la différence est due au hasard des mesures ou a un lien entre les deux variables

2=8,68

2=8,68 Pas de hasardOn en est sûr, une telle différence ne peut pas être due au hasard : il y a un lien entre les deux variables.

Fumeur Non fumeurCancer 10 5

Non cancer 65 154

77

Calcul du 2 Calcul du 2 On utilise des tableaux :

• Effectifs observés (tableau croisé)

• Effectifs théoriques

• Ecarts bruts

• Ecarts au carré et pondérés

• Formule du 2

• Lecture de la table

88

1 : Effectifs observés1 : Effectifs observés

Garçons Filles TotalRefusés 5 18 23Admis 10 42 52Total 15 60 75

99

2 : Effectifs théoriques2 : Effectifs théoriques

Résultats

Pour chaque case : effectif théorique = total colonne x total ligne

total généralGarçons Filles Total

Refusés 23Admis 52Total 15 60 75

Garçons Filles TotalRefusés 15x23/75 6x23/75 23Admis 15x52/75 60x52/75 52Total 15 60 75

Garçons Filles TotalRefusés 4,6 18,4 23Admis 10,4 41,6 52Total 15 60 75

Totaux

Calcul par case

1010

3 : Ecarts bruts3 : Ecarts bruts• Pour chaque case : écarts bruts = effectif théorique - observé

=Effectifs théoriques Effectifs observés

Tableau des écarts bruts

Garçons FillesRefusés 4,6 18,4Admis 10,4 41,6

Garçons FillesRefusés 5 18Admis 10 42

Garçons FillesRefusés -0,4 0,4Admis 0,4 -0,4

1111

4 : Ecarts au carré et pondérés4 : Ecarts au carré et pondérés

• Pour chaque case : Ecart au carré pondéré =

Garçons Filles

Refusés (-0,4)2/4,6 (0,4)2/18,4

Admis (-0,4)2/10,4 (-0,4)2/41,6

(ecart brut)2

effectif théorique

Garçons FillesRefusés 0,035 0,009Admis 0,015 0,004

1212

5 : Formule du 25 : Formule du 2

• Le 2 est la somme des écarts au carré pondérés

2 =(ecart brut)2

effectif théorique

2 =0,035+0,015+0,009+0,004=0,63

Garçons FillesRefusés 0,035 0,009Admis 0,015 0,004

1313

2 en bref2 en bref

2 =(effectif théorique – effectif observé)2

effectif théorique

1414

GénéralisationGénéralisation• Y a t il un lien entre couleur des yeux et des cheveux ?

1 : Effectifs observés

CheveuxBlond Bruns Noir Roux Total

Bleus 25 9 3 7 44

Yeux Vert 13 17 10 7 47

Marron 7 13 8 5 33Total 45 39 21 19 124

1515

2 : Effectifs théoriques2 : Effectifs théoriques

CheveuxBlond Bruns Noir Roux Total

Bleus 44

Yeux Vert 47

Marron 33Total 45 39 21 19 124

CheveuxBlond Bruns Noir Roux Total

Bleus 16,0 13,8 7,5 6,7 44

Yeux Vert 17,1 14,8 8,0 7,2 47

Marron 12,0 10,4 5,6 5,1 33

Total 45 39 21 19 124

Pour chaque case : effectif théorique = total colonne x total ligne

total général

1616

3 : Ecarts bruts3 : Ecarts bruts• Pour chaque case : écarts bruts = effectif théorique - observé

=Effectifs théoriques Effectifs observés

Tableau des écarts bruts

Blond Bruns Noir RouxBleus 25 9 3 7

Vert 13 17 10 7

Marron 7 13 8 5

Blond Bruns Noir RouxBleus 16,0 13,8 7,5 6,7

Vert 17,1 14,8 8,0 7,2

Marron 12,0 10,4 5,6 5,1

Blond Bruns Noir RouxBleus -9,0 4,8 4,5 -0,3Vert 4,1 -2,2 -2,0 0,2

Marron 5,0 -2,6 -2,4 0,1

1717

4 : Ecarts au carré et pondérés4 : Ecarts au carré et pondérés

• Pour chaque case : Ecart au carré pondéré = (ecart brut)2

effectif théorique

Blond Bruns Noir Roux

Bleus (-9,0)2/16,0 (4,8)2/13,8 (4,5)2/7,5 (-0,3)2/6,7

Vert (4,1)2/17,1 (-2,2)2/14,8 (-2,0)2/8,0 (0,2)2/7,2

Marron (5,0)2/12,0 (-2,6)2/10,4 (-2,4)2/5,6 (0,1)2/5,1

Blond Bruns Noir RouxBleus 5,11 1,69 2,66 0,01Vert 0,96 0,33 0,52 0,01

Marron 2,07 0,66 1,04 0,00

1818

5 : 25 : 2

2 =(ecart brut)2

effectif théorique

2 =5,11+0,96+2,07+1,69+0,33+0,66+2,66+0,52+1,04+0,01+0,00+0,00=15,05

Blond Bruns Noir RouxBleus 5,11 1,69 2,66 0,01Vert 0,96 0,33 0,52 0,01

Marron 2,07 0,66 1,04 0,00

1919

6 : DDL6 : DDL• DDL=Degré de liberté

DDL=(Nombre de colonnes-1)x(Nombre de lignes-1)

DDL = (2-1)x(2-1) = 1 DDL=(4-1)x(3-1)=6

Blond Bruns Noir RouxBleus 16,0 13,8 7,5 6,7

Vert 17,1 14,8 8,0 7,2

Marron 12,0 10,4 5,6 5,1

Garçons FillesRefusés 5 18Admis 10 42

2020

Lecture de la tableLecture de la table

2=0,63 avec DDL=1 : il y a entre 50% et 10% de chances que les différences observées entre garçons et filles soient dues au hasard. C’est trop faible :

On ne peut pas conclure

Pourcentage50% 10% 5% 1%

1 0,455 2,706 3,841 6,635

2 1,386 4,605 5,991 9,21

DDL 3 2,366 6,251 7,815 11,3454 3,357 7,779 9,488 13,2775 4,351 9,236 11,07 15,0866 … … … …

Garçons FillesRefusés 5 18Admis 10 42

2121

TableTable

2=15,05 avec DDL=6 : il y a entre 5% et 1% de chances que les différences observées entre fumeurs et non fumeurs soient dues au hasard. C’est suffisant :

On peut conclure :

Il y a un lien entre les variables Cancer et Fumeur

Pourcentage50% 10% 5% 1%

1 0,455 2,706 3,841 6,635

2 1,386 4,605 5,991 9,21

DDL 3 2,366 6,251 7,815 11,3454 3,357 7,779 9,488 13,2775 4,351 9,236 11,07 15,0866 … … … …

Blond Bruns Noir RouxBleus 16,0 13,8 7,5 6,7

Vert 17,1 14,8 8,0 7,2

Marron 12,0 10,4 5,6 5,1