1. Le khi2 et la mesure des écarts à l’indépendance. Word - mod6-cap1.docx Created Date...
Transcript of 1. Le khi2 et la mesure des écarts à l’indépendance. Word - mod6-cap1.docx Created Date...
1
MODULE 6 : Deux variables sont-elles liées ?
Nousavonsvuprécédemmentcommentcomposeruntableaudecontingence,permettantdevisualiser l’interactionentredeuxvariables.Apriori,voussavezmêmecommentlirecegenredetableaux,nonpasuniquementencomparantligneparligneoucolonneparcolonne,maisbienenvérifiantsilecomportementdechaquecelluleestconformeàceluidel’ensembledel’échantillon.Maisavantdelireuntableau,ilestintéressantdesavoirsi,entouterigueur,ladistributiondechacunedesvariablesquiyestreprésentéeestdueauhasardounon.Sic’estlecas,iln’yaurapasd’interactionentre lesvariables.Plusexactement, ilyadesrisquesqu’uneinterprétationnesoitpaspossibleavecuneassezgrandefiabilité.Ilexistedifférentstestspermettantdes’assurerdecettefiabilitéetdel’interactionentredeuxvariables,sansmêmeavoiràregarderletableaudanssonensemble.Lepluscélèbredecestestsportelenomde«Khi2».Ilpermetdetesterl’interactiondedeuxoutroisvariablesdansuntableauetdoncdesavoirs’ilvautlapeined’êtreétudiéoubiens’ilfautessayerdelerecomposerdifféremment.Celaesttrèspratiquelorsqu’ilyabeaucoupdetableauxàanalyserdansuneenquête.Imaginezeneffetquevousposiez50questionsdansuneenquête.Ces 50 questions débouchent sur un nombre supérieur de variables. Disons 70. Si vous croisez ces 70 variables entre elles (ce qui,reconnaissons-le, n’aurait pas toujours du sens), vous obtiendriez 70x70=4900 tableaux! Supprimons tous ceux qui n’auraient aucun sens.Vousaurieztoutdemêmeplusieurscentainesdetableauxdignesd’intérêt.Pourcommenceràlestrieretàorganiservotretravailletestdukhi2estprécieux.Onl’assortigénéralementd’unautretest, letestdeCramer,quipermetquantàluideconnaîtrel’intensitéd’unerelationentrelesvariablesd’untableaucroisé.
Pourfairesimple,disonsqueletestduKhi2permetdesavoirsidesvariablesagissentlesunessurlesautres,etqueletestdeCramerpermetdemesurerl’intensitédeceseffets.
Regardonsceladansledétail.
1 . L e kh i2 e t l a me sure d e s é c art s à l ’ i nd é p endance . Pour comprendre le test du khi2, il faut imaginer ce qui se passerait dans un tableau de contingence… s’il ne s’y passait rien. Si les deuxvariables qui y sont exposées étaient totalement indépendantes l’une de l’autre. Valider le test du khi2 revient à «écarter l’hypothèse del’indépendanceentrelesvariables».
Examinonscelaavecunexemple.
2
TABLEAU1–triscroisésentimentdebonheur/niveauderevenuseneffectifs–situationobservée
Reprenonsnotre tableaucroiséexposant la relationentreniveauderevenusetsentimentdebonheur.Cepremier tableaucorrespondà lasituationobservéedansnotreenquête.
Aquoiressembleraitcetableausiriennesepassait.Pourlesavoir,ilfautcomposeruntableaudit«desituationàl’indépendance».Laplupartdeslogicielsdetraitementsstatistiquesvousproposentdelefaire,maisilestassezaisédelefairesoi-même.Faisonscela,carcelapermetdebiencomprendrelalogiqueducalculdukhi2.
Si la variable«niveaude revenusen3»n’agissaitpas sur la variable«niveaudebonheur»,ondevraitobserverunedistributionde cettedernièreanaloguedanschacunedeslignesderevenus.
3
Prenons la ligne«Jusqu’à1900euros».Nousavons271 individusà répartirdans les4 colonnesde la variable«sentimentsdebonheur».Commenousavons188individusautotalquisedéclarent«trèsheureux»,pourconnaîtrelarépartitionprobabled’enavoirparmiceuxquigagnent1900euros,ilfautappliquerlaformulemathématiquesuivante:188*271/826.Celanousdonneuneffectifde62.Entoutelogiques,nous devrions avoir 62 individus se déclarant très heureux parmi ceux qui gagnent jusqu’à 1900 euros, au lieu de 44 individus observés.Appliquonscettelogiquesurl’ensembledutableau.
4
TABLEAU2–triscroisésentimentdebonheur/niveauderevenuseneffectifs–situationàl’indépendance
Onobservedesbiendesécartsensituationobservéeetsituationà l’indépendanceauseindechacunedescellules.Letestdukhi2estunemesuredel’ensembledecesécarts.Afindemesureraussibienlesécartspositifsquenégatifs,onélèvetouscesécartsaucarré.
5
TABLEAU3–triscroisésentimentdebonheur/niveauderevenuseneffectifs–écartsàl’indépendanceélevésaucarré
6
Enfin, on rapporte cette différence à l’effectif théorique (celui qui correspond l’indépendance) de chaque cellule en le divisant. Le tableauobtenus’appelle«tableaudescontributionsabsolues»
TABLEAU4–triscroisésentimentdebonheur/niveauderevenuseneffectifs–contributionsabsolues
7
Lekhi2correspondàl’additiondetouscesécartsàl’indépendanceélevésaucarréetdivisésparl’effectifthéorique.Autrementdit,lekhi2estlasommedetouteslescellulesdenotretableau.Mettezsurpause,sortezvotrecalculatriceetadditionnez:vousobtiendrezlechiffrede69.Cechiffrecorrespondau«khi2calculé»,soitàlasommedescontributionsabsolues.