1 1 Problème 1.Garçons ou filles : qui réussi le mieux au bac ? 2.Cigarette et cancer : y a t il...

21
1 Problème 1. Garçons ou filles : qui réussi le mieux au bac ? 2. Cigarette et cancer : y a t il un lien ? 3. Prévention routière : moins d’accident chez les verbalisés ? Autre formulation : 1. Y a t il un lien entre sexe et réussite au bac ? 2. Y a t il un lien entre cancer et cigarette ? 3. Y a t il un lien entre accident et verbalisation ?

Transcript of 1 1 Problème 1.Garçons ou filles : qui réussi le mieux au bac ? 2.Cigarette et cancer : y a t il...

Page 1: 1 1 Problème 1.Garçons ou filles : qui réussi le mieux au bac ? 2.Cigarette et cancer : y a t il un lien ? 3.Prévention routière : moins daccident chez.

11

ProblèmeProblème1. Garçons ou filles : qui réussi le mieux au bac ?

2. Cigarette et cancer : y a t il un lien ?

3. Prévention routière : moins d’accident chez les verbalisés ?

Autre formulation :

1. Y a t il un lien entre sexe et réussite au bac ?

2. Y a t il un lien entre cancer et cigarette ?

3. Y a t il un lien entre accident et verbalisation ?

Page 2: 1 1 Problème 1.Garçons ou filles : qui réussi le mieux au bac ? 2.Cigarette et cancer : y a t il un lien ? 3.Prévention routière : moins daccident chez.

22

MesuresMesures

EffectifAdmis Garçon 10Admis Fille 42Refusé Garçon 5Refusé Fille 18

Garçons FillesRefusés 5 18Admis 10 42

Résultat SexeIsabelle Ref FSylvain Adm GLucie Adm Fjean Ref GZoé Adm F… … …

Données brutes

Tableau des effectifs

Tableau croisé

Page 3: 1 1 Problème 1.Garçons ou filles : qui réussi le mieux au bac ? 2.Cigarette et cancer : y a t il un lien ? 3.Prévention routière : moins daccident chez.

33

Théorie…Théorie…• Définition : Hypothèse nulle (=H0) : il n’y a pas de lien entre

la variable sexe et la variable résultat.

• Si H0 est vrai : le pourcentage des Admis est le même chez les garçons que chez les filles

Garçons FillesRefusés 10 10Admis 10 10

Garçons FillesRefusés 10 20Admis 10 20

Garçons FillesRefusés 10 20Admis 20 40

Garçons FillesRefusés 50% 50%Admis 50% 50%

Garçons FillesRefusés 50% 50%Admis 50% 50%

Garçons FillesRefusés 33% 33%Admis 67% 67%

Page 4: 1 1 Problème 1.Garçons ou filles : qui réussi le mieux au bac ? 2.Cigarette et cancer : y a t il un lien ? 3.Prévention routière : moins daccident chez.

44

… et pratique… et pratique

Garçons FillesRefusés 5 18Admis 10 42

Garçons FillesRefusés 33% 30%Admis 67% 70%

Garçons FillesRefusés 25% 20%Admis 75% 80%

Garçons FillesRefusés 34% 35%Admis 66% 65%

On mesure : Dans d’autres lycées :

Garçons FillesRefusés 70% 65%Admis 30% 35%

Page 5: 1 1 Problème 1.Garçons ou filles : qui réussi le mieux au bac ? 2.Cigarette et cancer : y a t il un lien ? 3.Prévention routière : moins daccident chez.

55

ProblèmeProblème• Une différence significative cache probablement une cause

• Quand peut-on considérer qu’une différence est significative ? Quand est-elle du au hasard ?

Garçons FillesRefusés 34% 35%Admis 66% 65%

Garçons FillesRefusés 34% 39%Admis 66% 61%

Garçons FillesRefusés 34% 50%Admis 66% 50%

Page 6: 1 1 Problème 1.Garçons ou filles : qui réussi le mieux au bac ? 2.Cigarette et cancer : y a t il un lien ? 3.Prévention routière : moins daccident chez.

66

SolutionSolution• Test du 2 (prononcez khi2) permet de trancher :

• Le 2 est un indice que l’on calcule à partir d’un tableau croisé.

• Quand on l’a trouvé, il permet de décider si oui ou non les variations du tableau soit du au hasard :

Garçons FillesRefusés 5 18Admis 10 42

2=0,062

2=0,062 IncertitudeOn ne sait pas si la différence est due au hasard des mesures ou a un lien entre les deux variables

2=8,68

2=8,68 Pas de hasardOn en est sûr, une telle différence ne peut pas être due au hasard : il y a un lien entre les deux variables.

Fumeur Non fumeurCancer 10 5

Non cancer 65 154

Page 7: 1 1 Problème 1.Garçons ou filles : qui réussi le mieux au bac ? 2.Cigarette et cancer : y a t il un lien ? 3.Prévention routière : moins daccident chez.

77

Calcul du 2 Calcul du 2 On utilise des tableaux :

• Effectifs observés (tableau croisé)

• Effectifs théoriques

• Ecarts bruts

• Ecarts au carré et pondérés

• Formule du 2

• Lecture de la table

Page 8: 1 1 Problème 1.Garçons ou filles : qui réussi le mieux au bac ? 2.Cigarette et cancer : y a t il un lien ? 3.Prévention routière : moins daccident chez.

88

1 : Effectifs observés1 : Effectifs observés

Garçons Filles TotalRefusés 5 18 23Admis 10 42 52Total 15 60 75

Page 9: 1 1 Problème 1.Garçons ou filles : qui réussi le mieux au bac ? 2.Cigarette et cancer : y a t il un lien ? 3.Prévention routière : moins daccident chez.

99

2 : Effectifs théoriques2 : Effectifs théoriques

Résultats

Pour chaque case : effectif théorique = total colonne x total ligne

total généralGarçons Filles Total

Refusés 23Admis 52Total 15 60 75

Garçons Filles TotalRefusés 15x23/75 6x23/75 23Admis 15x52/75 60x52/75 52Total 15 60 75

Garçons Filles TotalRefusés 4,6 18,4 23Admis 10,4 41,6 52Total 15 60 75

Totaux

Calcul par case

Page 10: 1 1 Problème 1.Garçons ou filles : qui réussi le mieux au bac ? 2.Cigarette et cancer : y a t il un lien ? 3.Prévention routière : moins daccident chez.

1010

3 : Ecarts bruts3 : Ecarts bruts• Pour chaque case : écarts bruts = effectif théorique - observé

=Effectifs théoriques Effectifs observés

Tableau des écarts bruts

Garçons FillesRefusés 4,6 18,4Admis 10,4 41,6

Garçons FillesRefusés 5 18Admis 10 42

Garçons FillesRefusés -0,4 0,4Admis 0,4 -0,4

Page 11: 1 1 Problème 1.Garçons ou filles : qui réussi le mieux au bac ? 2.Cigarette et cancer : y a t il un lien ? 3.Prévention routière : moins daccident chez.

1111

4 : Ecarts au carré et pondérés4 : Ecarts au carré et pondérés

• Pour chaque case : Ecart au carré pondéré =

Garçons Filles

Refusés (-0,4)2/4,6 (0,4)2/18,4

Admis (-0,4)2/10,4 (-0,4)2/41,6

(ecart brut)2

effectif théorique

Garçons FillesRefusés 0,035 0,009Admis 0,015 0,004

Page 12: 1 1 Problème 1.Garçons ou filles : qui réussi le mieux au bac ? 2.Cigarette et cancer : y a t il un lien ? 3.Prévention routière : moins daccident chez.

1212

5 : Formule du 25 : Formule du 2

• Le 2 est la somme des écarts au carré pondérés

2 =(ecart brut)2

effectif théorique

2 =0,035+0,015+0,009+0,004=0,63

Garçons FillesRefusés 0,035 0,009Admis 0,015 0,004

Page 13: 1 1 Problème 1.Garçons ou filles : qui réussi le mieux au bac ? 2.Cigarette et cancer : y a t il un lien ? 3.Prévention routière : moins daccident chez.

1313

2 en bref2 en bref

2 =(effectif théorique – effectif observé)2

effectif théorique

Page 14: 1 1 Problème 1.Garçons ou filles : qui réussi le mieux au bac ? 2.Cigarette et cancer : y a t il un lien ? 3.Prévention routière : moins daccident chez.

1414

GénéralisationGénéralisation• Y a t il un lien entre couleur des yeux et des cheveux ?

1 : Effectifs observés

CheveuxBlond Bruns Noir Roux Total

Bleus 25 9 3 7 44

Yeux Vert 13 17 10 7 47

Marron 7 13 8 5 33Total 45 39 21 19 124

Page 15: 1 1 Problème 1.Garçons ou filles : qui réussi le mieux au bac ? 2.Cigarette et cancer : y a t il un lien ? 3.Prévention routière : moins daccident chez.

1515

2 : Effectifs théoriques2 : Effectifs théoriques

CheveuxBlond Bruns Noir Roux Total

Bleus 44

Yeux Vert 47

Marron 33Total 45 39 21 19 124

CheveuxBlond Bruns Noir Roux Total

Bleus 16,0 13,8 7,5 6,7 44

Yeux Vert 17,1 14,8 8,0 7,2 47

Marron 12,0 10,4 5,6 5,1 33

Total 45 39 21 19 124

Pour chaque case : effectif théorique = total colonne x total ligne

total général

Page 16: 1 1 Problème 1.Garçons ou filles : qui réussi le mieux au bac ? 2.Cigarette et cancer : y a t il un lien ? 3.Prévention routière : moins daccident chez.

1616

3 : Ecarts bruts3 : Ecarts bruts• Pour chaque case : écarts bruts = effectif théorique - observé

=Effectifs théoriques Effectifs observés

Tableau des écarts bruts

Blond Bruns Noir RouxBleus 25 9 3 7

Vert 13 17 10 7

Marron 7 13 8 5

Blond Bruns Noir RouxBleus 16,0 13,8 7,5 6,7

Vert 17,1 14,8 8,0 7,2

Marron 12,0 10,4 5,6 5,1

Blond Bruns Noir RouxBleus -9,0 4,8 4,5 -0,3Vert 4,1 -2,2 -2,0 0,2

Marron 5,0 -2,6 -2,4 0,1

Page 17: 1 1 Problème 1.Garçons ou filles : qui réussi le mieux au bac ? 2.Cigarette et cancer : y a t il un lien ? 3.Prévention routière : moins daccident chez.

1717

4 : Ecarts au carré et pondérés4 : Ecarts au carré et pondérés

• Pour chaque case : Ecart au carré pondéré = (ecart brut)2

effectif théorique

Blond Bruns Noir Roux

Bleus (-9,0)2/16,0 (4,8)2/13,8 (4,5)2/7,5 (-0,3)2/6,7

Vert (4,1)2/17,1 (-2,2)2/14,8 (-2,0)2/8,0 (0,2)2/7,2

Marron (5,0)2/12,0 (-2,6)2/10,4 (-2,4)2/5,6 (0,1)2/5,1

Blond Bruns Noir RouxBleus 5,11 1,69 2,66 0,01Vert 0,96 0,33 0,52 0,01

Marron 2,07 0,66 1,04 0,00

Page 18: 1 1 Problème 1.Garçons ou filles : qui réussi le mieux au bac ? 2.Cigarette et cancer : y a t il un lien ? 3.Prévention routière : moins daccident chez.

1818

5 : 25 : 2

2 =(ecart brut)2

effectif théorique

2 =5,11+0,96+2,07+1,69+0,33+0,66+2,66+0,52+1,04+0,01+0,00+0,00=15,05

Blond Bruns Noir RouxBleus 5,11 1,69 2,66 0,01Vert 0,96 0,33 0,52 0,01

Marron 2,07 0,66 1,04 0,00

Page 19: 1 1 Problème 1.Garçons ou filles : qui réussi le mieux au bac ? 2.Cigarette et cancer : y a t il un lien ? 3.Prévention routière : moins daccident chez.

1919

6 : DDL6 : DDL• DDL=Degré de liberté

DDL=(Nombre de colonnes-1)x(Nombre de lignes-1)

DDL = (2-1)x(2-1) = 1 DDL=(4-1)x(3-1)=6

Blond Bruns Noir RouxBleus 16,0 13,8 7,5 6,7

Vert 17,1 14,8 8,0 7,2

Marron 12,0 10,4 5,6 5,1

Garçons FillesRefusés 5 18Admis 10 42

Page 20: 1 1 Problème 1.Garçons ou filles : qui réussi le mieux au bac ? 2.Cigarette et cancer : y a t il un lien ? 3.Prévention routière : moins daccident chez.

2020

Lecture de la tableLecture de la table

2=0,63 avec DDL=1 : il y a entre 50% et 10% de chances que les différences observées entre garçons et filles soient dues au hasard. C’est trop faible :

On ne peut pas conclure

Pourcentage50% 10% 5% 1%

1 0,455 2,706 3,841 6,635

2 1,386 4,605 5,991 9,21

DDL 3 2,366 6,251 7,815 11,3454 3,357 7,779 9,488 13,2775 4,351 9,236 11,07 15,0866 … … … …

Garçons FillesRefusés 5 18Admis 10 42

Page 21: 1 1 Problème 1.Garçons ou filles : qui réussi le mieux au bac ? 2.Cigarette et cancer : y a t il un lien ? 3.Prévention routière : moins daccident chez.

2121

TableTable

2=15,05 avec DDL=6 : il y a entre 5% et 1% de chances que les différences observées entre fumeurs et non fumeurs soient dues au hasard. C’est suffisant :

On peut conclure :

Il y a un lien entre les variables Cancer et Fumeur

Pourcentage50% 10% 5% 1%

1 0,455 2,706 3,841 6,635

2 1,386 4,605 5,991 9,21

DDL 3 2,366 6,251 7,815 11,3454 3,357 7,779 9,488 13,2775 4,351 9,236 11,07 15,0866 … … … …

Blond Bruns Noir RouxBleus 16,0 13,8 7,5 6,7

Vert 17,1 14,8 8,0 7,2

Marron 12,0 10,4 5,6 5,1