Test 2
description
Transcript of Test 2
TEST 2
QUAND UTILISE-T-ON LE 2
On a deux variables quantitatives.
On cherche s’il y a un lien entre les 2 variables
PROBLÈME
1. Garçons ou filles : qui réussi le mieux au bac ?
2. Cigarette et cancer : y a t il un lien ?3. Prévention routière : moins d’accident
chez les verbalisés ?
Autre formulation :
4. Y a t il un lien entre sexe et réussite au bac ?
5. Y a t il un lien entre cancer et cigarette ?6. Y a t il un lien entre accident et
verbalisation ?
1. H0 H0 : il n’y a pas de lien entre la variable sexe et la variable résultat.
2. MESURES
EffectifAdmis Garçon 10Admis Fille 42Refusé Garçon 5Refusé Fille 18
Garçons FillesRefusés 5 18Admis 10 42
Résultat SexeIsabelle Ref FSylvain Adm GLucie Adm Fjean Ref GZoé Adm F… … …
Données brutesTableau des effectifs
Tableau croisé
VB OR NOT VB ? THIS IS THE QUESTION
Garçons FillesRefusés 5 18Admis 10 42
Garçons FillesRefusés 50 10Admis 50 70
Garçons FillesRefusés 30 15Admis 30 15
Dans notre lycée :
Pas de différenceH0 n’est pas rejetable
Différence énorme On rejette H0
Variabilité biologique ?Différence significative ?
PROBLÈME On veut un indice qui reflète les disparités de
notre tableau.
On veut qu’il soit grand pour
et petit pour :
Garçons FillesRefusés 50 10Admis 50 70
Garçons FillesRefusés 30 15Admis 30 15
SOLUTION : 2 Pour le calculer :1. Tableau des effectifs observés (tableau croisé) 2. Tableau des effectifs attendus3. Tableau des écarts4. Tableau des écarts au carré et pondérés5. 2
2 : CALCUL
T1 : EFFECTIFS OBSERVÉSGarçons Filles Total
Refusés 5 18 23Admis 10 42 52Total 15 60 75
T2 : EFFECTIFS ATTENDUS
Résultats
Pour chaque case : effectif attendu = total colonne x total lignetotal général
Garçons Filles TotalRefusés 23Admis 52Total 15 60 75
Garçons Filles TotalRefusés 15x23/75 6x23/75 23Admis 15x52/75 60x52/75 52Total 15 60 75
Garçons Filles TotalRefusés 4,6 18,4 23Admis 10,4 41,6 52Total 15 60 75
Totaux
Calcul par case
T3 : ÉCARTS BRUTS Pour chaque case :
écart brut = effectifs observés – effectifs attendus
–
=Effectifs attendusEffectifs observés
Tableau des écarts bruts
Garçons FillesRefusés 4,6 18,4Admis 10,4 41,6
Garçons FillesRefusés 5 18Admis 10 42
Garçons FillesRefusés 0,4 -0,4Admis -0,4 0,4
T4 : ÉCARTS AU CARRÉ ET PONDÉRÉS
Pour chaque case : Écart au carré pondéré =
Garçons FillesRefusés (0,4)2/4,6 (-0,4)2/18,4Admis (-0,4)2/10,4 (0,4)2/41,6
(écart brut)2
effectif attendu
Garçons FillesRefusés 0,035 0,009Admis 0,015 0,004
FINAL : 2
Le 2 est la somme des écarts au carré pondérés
2 = (Écart au carré pondéré)
2 =0,035+0,015+0,009+0,004=0,63
Garçons FillesRefusés 0,035 0,009Admis 0,015 0,004
GÉNÉRALISATION Y a t il un lien entre couleur des yeux et
des cheveux ?
H0 : il n’y a pas de lien entre la couleur des yeux et celle des cheveux
T1 : EFFECTIFS OBSERVÉS
CheveuxBlond Bruns Noir Roux Total
Bleus 25 9 3 7 44Yeux Vert 13 17 10 7 47
Marron 7 13 8 5 33Total 45 39 21 19 124
T2 : EFFECTIFS ATTENDUS
CheveuxBlond Bruns Noir Roux Total
Bleus 44Yeux Vert 47
Marron 33Total 45 39 21 19 124
CheveuxBlond Bruns Noir Roux Total
Bleus 16,0 13,8 7,5 6,7 44Yeux Vert 17,1 14,8 8,0 7,2 47
Marron 12,0 10,4 5,6 5,1 33Total 45 39 21 19 124
Pour chaque case : effectif attendus = total colonne x total ligne
total général
T3 : ÉCARTS BRUTS Pour chaque case :
écart brut = effectif observé – effectif attendu
–
=Effectifs attendusEffectifs observés
Tableau des écarts bruts
Blond Bruns Noir RouxBleus 25 9 3 7
Vert 13 17 10 7Marron 7 13 8 5
Blond Bruns Noir RouxBleus 16,0 13,8 7,5 6,7
Vert 17,1 14,8 8,0 7,2
Marron 12,0 10,4 5,6 5,1
Blond Bruns Noir RouxBleus 9,0 -4,8 -4,5 0,3Vert -4,1 2,2 2,0 -0,2
Marron -5,0 2,6 2,4 -0,1
T4 : ÉCARTS AU CARRÉ ET PONDÉRÉS
Pour chaque case : Ecart au carré pondéré = (écart brut)2
effectif attendu
Blond Bruns Noir RouxBleus (9,0)2/16,0 (-4,8)2/13,8 (-4,5)2/7,5 (0,3)2/6,7
Vert (-4,1)2/17,1 (2,2)2/14,8 (2,0)2/8,0 (-0,2)2/7,2Marron (-5,0)2/12,0 (2,6)2/10,4 (2,4)2/5,6 (-0,1)2/5,1
Blond Bruns Noir RouxBleus 5,11 1,69 2,66 0,01Vert 0,96 0,33 0,52 0,01
Marron 2,07 0,66 1,04 0,00
FINAL : 2
2 = (écart au carré pondéré)
2 = 5,11+1,69+2,66+0,01+ 0,96+0,33+0,52+0,01+ 2,07+0,66+1,04+0,00 = 15,05
Blond Bruns Noir RouxBleus 5,11 1,69 2,66 0,01Vert 0,96 0,33 0,52 0,01
Marron 2,07 0,66 1,04 0,00
2 EN BREF
2Obs
= (effectifs observés – effectifs théoriques)2
effectif théorique
2 : DDL
PROBLÈME Quand un 2 est-il grand ?
A B C D ETrès grand 0,3 0,2 0,3 0,2 0,1Grand 0,2 0,1 0,1 0,1 0,3Moyen 0,3 0,3 0,2 0,3 0,1Petit 0,1 0,3 0,1 0,2 0,3Très petit 0,2 0,2 0,3 0,3 0,2
Homme FemmeAdmis 0,2 0,1Refusé 0,1 2,2
2=2,6 2=5,3
DDL DDL=Degrés de liberté
DDL=(Nombre de colonnes-1)x(Nombre de lignes-1)
DDL = (2-1)x(2-1) = 1 DDL=(4-1)x(3-1) = 6 Blond Bruns Noir Roux
Bleus 16,0 13,8 7,5 6,7
Vert 17,1 14,8 8,0 7,2
Marron 12,0 10,4 5,6 5,1
Garçons FillesRefusés 5 18Admis 10 42
4. PROBABILITÉ
R : chisq.test(effectifs Observés)
χ2 1 2 3 4 5 6 7 8 9 10 11 12 130,00 100,00% 100,00% 100,00% 100,00% 100,00% 100,00% 100,00% 100,00% 100,00% 100,00% 100,00% 100,00% 100,00%0,50 47,95% 77,88% 91,89% 97,35% 99,21% 99,78% 99,94% 99,99% 100,00% 100,00% 100,00% 100,00% 100,00%
1,00 31,73% 60,65% 80,13% 90,98% 96,26% 98,56% 99,48% 99,82% 99,94% 99,98% 99,99% 100,00% 100,00%1,50 22,07% 47,24% 68,23% 82,66% 91,31% 95,95% 98,23% 99,27% 99,71% 99,89% 99,96% 99,99% 100,00%
2,00 15,73% 36,79% 57,24% 73,58% 84,91% 91,97% 95,98% 98,10% 99,15% 99,63% 99,85% 99,94% 99,98%
2,50 11,38% 28,65% 47,53% 64,46% 77,65% 86,85% 92,71% 96,17% 98,09% 99,09% 99,58% 99,82% 99,92%
3,00 8,33% 22,31% 39,16% 55,78% 70,00% 80,88% 88,50% 93,44% 96,43% 98,14% 99,07% 99,55% 99,79%3,50 6,14% 17,38% 32,08% 47,79% 62,34% 74,40% 83,52% 89,92% 94,11% 96,71% 98,23% 99,09% 99,54%
4,00 4,55% 13,53% 26,15% 40,60% 54,94% 67,67% 77,98% 85,71% 91,14% 94,73% 96,99% 98,34% 99,12%
4,50 3,39% 10,54% 21,23% 34,25% 47,99% 60,93% 72,07% 80,94% 87,55% 92,20% 95,29% 97,26% 98,46%
5,00 2,53% 8,21% 17,18% 28,73% 41,59% 54,38% 66,00% 75,76% 83,43% 89,12% 93,12% 95,80% 97,52%
5,50 1,90% 6,39% 13,86% 23,97% 35,79% 48,15% 59,92% 70,30% 78,87% 85,54% 90,46% 93,92% 96,25%
Probabilité qu'il n'y ait pas de lien entre les deux variables
DDL
χ2
2=2,6DDL=1p=0,11
2=5,3DDL=6p=0,51
Sexe / Réussite : 2
Obs=0,63 et DDL=1 P=0.11
Þ On ne peut pas rejeter H0,Il n’y a pas de lien entre Sexe et Réussite
C. Cheveux / C. Yeux : 2
Obs=15,05 et DDL=6 P=0,0167
Þ On peut rejeter H0,
Il y a un lien entre C. Cheveux et C. Yeux
5. CONCLUSION
>5%
<5%
INTERPRÉTATION
POURQUOI UN 2 EST-IL GRAND ?
Écarts au carré pondérés
Parce que Blond / Bleus = 5,11 et que Noir / Bleus = 2,66 Ces deux cases « apportent » beaucoup au 2
Blond Bruns Noir RouxBleus 5,11 1,69 2,66 0,01Vert 0,96 0,33 0,52 0,01
Marron 2,07 0,66 1,04 0,00
Cases qui apportent beaucoup : Sur le tableau des écarts au carré pondéré
Apport positif ou négatifs ? Sur le tableau des écarts, Blonds / Bleus = + 9 : il y en a beaucoup.
On dit qu’ils sont sur-représentés
Sur le tableau des écarts, Noirs / Bleus = - 4,5 : il en manque beaucoup. On dit qu’ils sont
sous-représentés
SOUS / SUR REPRÉSENTÉBlond Bruns Noir Roux
Bleus 9,0 -4,8 -4,5 0,3Vert -4,1 2,2 2,0 -0,2
Marron -5,0 2,6 2,4 -0,1
Blond Bruns Noir RouxBleus 5,11 1,69 2,66 0,01Vert 0,96 0,33 0,52 0,01
Marron 2,07 0,66 1,04 0,00
Écarts au carré pondérés Écarts