1. Le khi2 et la mesure des écarts à l’indépendance. Word - mod6-cap1.docx Created Date...

Post on 15-Apr-2018

214 views 1 download

Transcript of 1. Le khi2 et la mesure des écarts à l’indépendance. Word - mod6-cap1.docx Created Date...

1

MODULE 6 : Deux variables sont-elles liées ?

Nousavonsvuprécédemmentcommentcomposeruntableaudecontingence,permettantdevisualiser l’interactionentredeuxvariables.Apriori,voussavezmêmecommentlirecegenredetableaux,nonpasuniquementencomparantligneparligneoucolonneparcolonne,maisbienenvérifiantsilecomportementdechaquecelluleestconformeàceluidel’ensembledel’échantillon.Maisavantdelireuntableau,ilestintéressantdesavoirsi,entouterigueur,ladistributiondechacunedesvariablesquiyestreprésentéeestdueauhasardounon.Sic’estlecas,iln’yaurapasd’interactionentre lesvariables.Plusexactement, ilyadesrisquesqu’uneinterprétationnesoitpaspossibleavecuneassezgrandefiabilité.Ilexistedifférentstestspermettantdes’assurerdecettefiabilitéetdel’interactionentredeuxvariables,sansmêmeavoiràregarderletableaudanssonensemble.Lepluscélèbredecestestsportelenomde«Khi2».Ilpermetdetesterl’interactiondedeuxoutroisvariablesdansuntableauetdoncdesavoirs’ilvautlapeined’êtreétudiéoubiens’ilfautessayerdelerecomposerdifféremment.Celaesttrèspratiquelorsqu’ilyabeaucoupdetableauxàanalyserdansuneenquête.Imaginezeneffetquevousposiez50questionsdansuneenquête.Ces 50 questions débouchent sur un nombre supérieur de variables. Disons 70. Si vous croisez ces 70 variables entre elles (ce qui,reconnaissons-le, n’aurait pas toujours du sens), vous obtiendriez 70x70=4900 tableaux! Supprimons tous ceux qui n’auraient aucun sens.Vousaurieztoutdemêmeplusieurscentainesdetableauxdignesd’intérêt.Pourcommenceràlestrieretàorganiservotretravailletestdukhi2estprécieux.Onl’assortigénéralementd’unautretest, letestdeCramer,quipermetquantàluideconnaîtrel’intensitéd’unerelationentrelesvariablesd’untableaucroisé.

Pourfairesimple,disonsqueletestduKhi2permetdesavoirsidesvariablesagissentlesunessurlesautres,etqueletestdeCramerpermetdemesurerl’intensitédeceseffets.

Regardonsceladansledétail.

1 . L e kh i2 e t l a me sure d e s é c art s à l ’ i nd é p endance . Pour comprendre le test du khi2, il faut imaginer ce qui se passerait dans un tableau de contingence… s’il ne s’y passait rien. Si les deuxvariables qui y sont exposées étaient totalement indépendantes l’une de l’autre. Valider le test du khi2 revient à «écarter l’hypothèse del’indépendanceentrelesvariables».

Examinonscelaavecunexemple.

2

TABLEAU1–triscroisésentimentdebonheur/niveauderevenuseneffectifs–situationobservée

Reprenonsnotre tableaucroiséexposant la relationentreniveauderevenusetsentimentdebonheur.Cepremier tableaucorrespondà lasituationobservéedansnotreenquête.

Aquoiressembleraitcetableausiriennesepassait.Pourlesavoir,ilfautcomposeruntableaudit«desituationàl’indépendance».Laplupartdeslogicielsdetraitementsstatistiquesvousproposentdelefaire,maisilestassezaisédelefairesoi-même.Faisonscela,carcelapermetdebiencomprendrelalogiqueducalculdukhi2.

Si la variable«niveaude revenusen3»n’agissaitpas sur la variable«niveaudebonheur»,ondevraitobserverunedistributionde cettedernièreanaloguedanschacunedeslignesderevenus.

3

Prenons la ligne«Jusqu’à1900euros».Nousavons271 individusà répartirdans les4 colonnesde la variable«sentimentsdebonheur».Commenousavons188individusautotalquisedéclarent«trèsheureux»,pourconnaîtrelarépartitionprobabled’enavoirparmiceuxquigagnent1900euros,ilfautappliquerlaformulemathématiquesuivante:188*271/826.Celanousdonneuneffectifde62.Entoutelogiques,nous devrions avoir 62 individus se déclarant très heureux parmi ceux qui gagnent jusqu’à 1900 euros, au lieu de 44 individus observés.Appliquonscettelogiquesurl’ensembledutableau.

4

TABLEAU2–triscroisésentimentdebonheur/niveauderevenuseneffectifs–situationàl’indépendance

Onobservedesbiendesécartsensituationobservéeetsituationà l’indépendanceauseindechacunedescellules.Letestdukhi2estunemesuredel’ensembledecesécarts.Afindemesureraussibienlesécartspositifsquenégatifs,onélèvetouscesécartsaucarré.

5

TABLEAU3–triscroisésentimentdebonheur/niveauderevenuseneffectifs–écartsàl’indépendanceélevésaucarré

6

Enfin, on rapporte cette différence à l’effectif théorique (celui qui correspond l’indépendance) de chaque cellule en le divisant. Le tableauobtenus’appelle«tableaudescontributionsabsolues»

TABLEAU4–triscroisésentimentdebonheur/niveauderevenuseneffectifs–contributionsabsolues

7

Lekhi2correspondàl’additiondetouscesécartsàl’indépendanceélevésaucarréetdivisésparl’effectifthéorique.Autrementdit,lekhi2estlasommedetouteslescellulesdenotretableau.Mettezsurpause,sortezvotrecalculatriceetadditionnez:vousobtiendrezlechiffrede69.Cechiffrecorrespondau«khi2calculé»,soitàlasommedescontributionsabsolues.

8

Jevousindiquelaformuledukhi2pourplusdeclarté,mêmesitousleslogicielsdetraitementsstatistiquesvouspermettentdeleproduireenunquartdesecondes.