ANOVA_partie1.pdf

78
Analyse de la Variance Partie 1 Mohammed El Haj Tirari [email protected] INSEA 2013-2014 Mohammed El Haj [email protected] Analyse de la Variance Partie 1

Transcript of ANOVA_partie1.pdf

  • Analyse de la VariancePartie 1

    Mohammed El Haj [email protected]

    INSEA

    2013-2014

    Mohammed El Haj [email protected] Analyse de la Variance Partie 1

  • IntroductionAnalyse de la Variance un facteur

    Introduction

    LAnalyse de la Variance (ANOVA) est une technique quon utilisepour tudier leffet dune variable qualitative sur une variablequantitative :

    Variable dpendante : variable quantitative. Variable indpendante : variable qualitative (avec plusieurs

    catgories).

    Par exemple : Impact du niveau dinstruction (variable qualitativequalitative) sur le revenu (variable quantitative).

    On peut conclure quil existe une relation si les moyennes derevenus des gens ne sont pas les mmes dans les diffrentescatgories.

    Chaque variable indpendante est appele un facteur et chaquefacteur peut avoir deux ou plusieurs niveaux ou traitements.

    Mohammed El Haj [email protected] Analyse de la Variance Partie 1

  • IntroductionAnalyse de la Variance un facteur

    Introduction

    Lanalyse de variance peut tre vue comme une comparaisonmultiple de moyennes. Dans tous les cas, la variable tudie est uncaractre quantitatif de type continu qui suit une loi normale.

    Une ANOVA teste si toutes les moyennes sont gales :H0 : galit contre H1 : au moins une diffrence

    On note que si H0 est rejete pour un seuil donn, lANOVA ne ditpas o sont les diffrences.

    LANOVA est utilise quand le nombre de niveaux est suprieur deux.

    Il existe diffrents types dANOVA qui se distinguent par le nombrede facteurs tudis (un facteur, deux facteurs, deux facteurs avecrptitions, etc) et la nature des modalits associes au facteur(modle fixe, modle alatoire, modle mixte).

    Mohammed El Haj [email protected] Analyse de la Variance Partie 1

  • IntroductionAnalyse de la Variance un facteur

    Les diffrents types dANOVA

    Type I : "effets fixes"

    Pour ce type dANOVA, les traitements sont dtermins par lechercheur.

    Exemple : Ltude de leffet de diffrents types dalimentation(Paille, Foin, Herbe) sur le rendement des vaches laitires :

    3 traitements (types dalimentations) dtermins par lechercheur.

    la variable dpendante est la quantit de lait produites (Y ), etle facteur (T ) est le type de lalimentation

    Les modalits du facteur correspondent diffrentes valeurs prisespar une variable alatoire dont les valeurs sont fixes parlexprimentateur.

    Mohammed El Haj [email protected] Analyse de la Variance Partie 1

  • IntroductionAnalyse de la Variance un facteur

    Les diffrents types dANOVA

    Type II : "effets alatoires"

    Pour ce type dANOVA, les traitements ne sont pas sous le contrlede lexprimentateur ou le chercheur.

    Exemple : Ltude de leffet de la rgion dlevage (3 rgionschoisies alatoirement) sur le rendement des vaches laitires :

    les 3 traitements (rgions dlevage) sont choisiesalatoirement par le chercheur.

    la variable dpendante est la quantit de lait produites (Y ), etle facteur (T ) est la rgion dlevage.

    Les modalits du facteur correspondent diffrentes valeursobserves pour une variable alatoire dont les valeurs ne sont pasfixes par lexprimentateur.

    Mohammed El Haj [email protected] Analyse de la Variance Partie 1

  • IntroductionAnalyse de la Variance un facteur

    Les diffrents types dANOVA

    Type III : "effets mixtes"

    Ce type dANOVA correspond au cas dANOVA plusieurs facteurso on dispose dau moins un facteur du Type I et au moins un duType II.

    Exemple : Ltude de leffet de diffrents types dalimentation(Paille, Foin, Herbe) et de leffet de la rgion dlevage (3 rgionschoisies alatoirement) sur le rendement des vaches laitires :

    On dispose dun facteur fixe et dun facteur alatoire. la variable dpendante est la quantit de lait produites (Y ), et

    les facteurs sont T1 : le type dalimentation et T2 : la rgiondlevage.

    Mohammed El Haj [email protected] Analyse de la Variance Partie 1

  • IntroductionAnalyse de la Variance un facteur

    Anova un facteur fixeAnova un facteur alatoire

    Analyse de la Variance un facteur

    Mohammed El Haj [email protected] Analyse de la Variance Partie 1

  • IntroductionAnalyse de la Variance un facteur

    Anova un facteur fixeAnova un facteur alatoire

    Introduction

    Lanalyse de variance un facteur ou ANOVA1 a pour objectif detester leffet dun facteur A sur une variable alatoire continue.

    Ceci revient comparer les moyennes de plusieurs populationsnormales et de mme variance partir dchantillons alatoires etindpendants les uns des autres.

    Chaque chantillon correspond une modalit du facteur A.

    Le terme ANOVA indique que la comparaison multiple de moyennescorrespond en faite la comparaison de deux variances.

    Pour cette premire partie, nous allons considrer dans un premiertemps le cas de lANOVA un facteur fixe.

    Mohammed El Haj [email protected] Analyse de la Variance Partie 1

  • IntroductionAnalyse de la Variance un facteur

    Anova un facteur fixeAnova un facteur alatoire

    Structure des donnes

    Si le facteur A est compos de p modalits (on parle aussi detraitements), Les donnes relatives une analyse de variance unfacteur sont structures dans un tableau du type suivant :

    Facteur Amodalit 1 . . . modalit i . . . modalit p

    y11 . . . yi1 . . . yp1...

    ......

    ......

    y1j . . . yij . . . ypj...

    ......

    ......

    y1n1 . . . yini . . . ypnpy1 . . . yi . . . yp

    Leffectif dune modalit i est not ni. Les effectifs des modalits dufacteur ne sont pas forcment les mmes.

    Mohammed El Haj [email protected] Analyse de la Variance Partie 1

  • IntroductionAnalyse de la Variance un facteur

    Anova un facteur fixeAnova un facteur alatoire

    Exemple de donnes

    Un leveur souhaite acheter de nouvelles vaches pour sa productionlaitire. Il possde trois races diffrentes de vaches et se pose donc laquestion de savoir si la race est importante pour son choix. Il possdecomme informations la race de chacune de ses btes (cest la variableexplicative discrte ou facteur, qui peut prendre 3 valeurs diffrentes) etleurs productions de lait journalires (cest la variable expliquercontinue, qui correspond au volume de lait en litre).

    Mohammed El Haj [email protected] Analyse de la Variance Partie 1

  • IntroductionAnalyse de la Variance un facteur

    Anova un facteur fixeAnova un facteur alatoire

    Exemple de donnes

    Dans cet exemple, lhypothse nulle revient considrer que toutes lesvaches produisent la mme quantit de lait journalire (au facteuralatoire prs) quelle que soit la race. Lhypothse alternative revient considrer quune des races produit significativement plus ou moins delait que les autres. Supposons que les productions sont :

    La race des vachesRace A Race B Race C20,1 22,6 31,219,8 24,1 31,621,3 23,8 31,020,7 22,5 32,1

    23,4 31,424,522,9

    Mohammed El Haj [email protected] Analyse de la Variance Partie 1

  • IntroductionAnalyse de la Variance un facteur

    Anova un facteur fixeAnova un facteur alatoire

    Modle thorique

    Le modle linaire correspondant une analyse de la variance unfacteur est donn par

    yij = i + ij = + i + ij

    o

    yij est la valeur observe pour le sujet j du groupe i. est la moyenne gnrale.i est linfluence du traitement Ai sur le groupe i(i = i ).ij est lerreur ou les rsidus (selon les hypothses, ils sontdistribus de manire normale avec une moyenne = 0 et unevariance 2).

    Mohammed El Haj [email protected] Analyse de la Variance Partie 1

  • IntroductionAnalyse de la Variance un facteur

    Anova un facteur fixeAnova un facteur alatoire

    Modle thorique

    Dans le cas dune analyse de la variance effet alatoire, la variableest issue dune loi suppose normale qui sajoute la valeur fixe. Lemodle linaire devient :

    yij = + i + ij

    avec i = + et = N(0, 2)

    Un modle bas sur des variables explicatives effets fixes et effetsalatoires est appel modle mixte.

    Mohammed El Haj [email protected] Analyse de la Variance Partie 1

  • IntroductionAnalyse de la Variance un facteur

    Anova un facteur fixeAnova un facteur alatoire

    Conditions dapplication dune ANOVA

    Les hypothses relatives au modle danalyse de la variance sontnombreuses.

    Lanalyse des rsidus ij = yij i est particulirement utile pourrpondre aux hypothses de normalit et dhomoscdasticit.

    On note que dans le cas dun modle effet fixe, il est quivalent detester ces hypothses sur la variable yij .

    Mohammed El Haj [email protected] Analyse de la Variance Partie 1

  • IntroductionAnalyse de la Variance un facteur

    Anova un facteur fixeAnova un facteur alatoire

    Conditions dapplication dune ANOVA

    Hypothse 1 : lIndpendance

    Lindpendance entre les diffrentes valeurs de la variable mesure yij estune condition essentielle la ralisation de lanalyse de variance.

    Les p chantillons compars sont indpendants. Lensemble des n individus est rparti au hasard entre les p

    modalits du facteur contrl A et les ni individus correspondant une modalit Ai recoivent le mme traitement i.

    Mohammed El Haj [email protected] Analyse de la Variance Partie 1

  • IntroductionAnalyse de la Variance un facteur

    Anova un facteur fixeAnova un facteur alatoire

    Conditions dapplication dune ANOVA

    Hypothse 2 : la Normalit

    La variable quantitative tudie suit une loi normale dans les ppopulations compares.

    La variable alatoire tudie Y dont yij est une reprsentation,suit une loi normale N (i, ).

    La normalit de la variable pourra tre teste laide du test deKolmogorov-Smirnov ou avec le test Khi-deux dajustement si leseffectifs sont suffisamment importants. Sinon le test nonparamtrique de Lilliefors permet de tester lajustement loinormale lorsque les effectifs sont faibles.

    Si la normalit de la variable nest pas vrifie, soit on peuttransformer cette dernire, soit avoir recours lquivalent nonparamtrique de lANOVA, le test de Kruskall-Wallis.

    Mohammed El Haj [email protected] Analyse de la Variance Partie 1

  • IntroductionAnalyse de la Variance un facteur

    Anova un facteur fixeAnova un facteur alatoire

    Conditions dapplication dune ANOVA

    Hypothse 3 : lHomoscdasticit

    Les variances dans les p populations compares sont les mmes.

    Le facteur A agt seulement sur la moyenne de la variable Y etne change pas sa variance.

    Plusieurs tests diffrents permettent de vrifier lgalit desvariances relatives aux p populations compares :

    H0 : 1 = 2 = = i = = p =

    Mohammed El Haj [email protected] Analyse de la Variance Partie 1

  • IntroductionAnalyse de la Variance un facteur

    Anova un facteur fixeAnova un facteur alatoire

    Conditions dapplication dune ANOVA

    Hypothse 3 : lHomoscdasticit (suite)

    Le test de Levne est le test le plus satisfaisant pour effectuer lacomparaison multiple de variances mais sa ralisation est assezlongue car il correspond une ANOVA1 sur les rsidus eij .

    Le test de Bartlett est ddi la comparaison multiple de variancesavec un nombre de rptitions ni diffrent selon les modalits i dufacteur. Mais ce test est trs sensible lhypothse de normalit desp populations (peu robuste).

    Le test de Hartley est ddi la comparaison multiple de variancesavec un nombre de rptitions ni identiques selon les modalits i dufacteur. Mais ce test est trs sensible lhypothse de normalit desp populations (peu robuste).

    On note que si lhtrognti entre variances est trs importantes,on peut avoir recours aux statistiques non paramtriques, test deKruskal-Wallis.

    Mohammed El Haj [email protected] Analyse de la Variance Partie 1

  • IntroductionAnalyse de la Variance un facteur

    Anova un facteur fixeAnova un facteur alatoire

    Robustesse dune ANOVA

    Hypothses Test RobustesseNormalit de Y Test du 2 Trs robuste si indpendance

    dajustement et galit des variancesHomoscdasticit des Test de Levne Trs robuste

    p distributions ou de Bartlett lingalit des variancesIndpendance des Plan exprimental Pas robustep distributions

    On note cependant que lanalyse de variance un facteur contrl estrelativement peu sensible lingalit des variances ainsi qu la nonnormalit lorsque les chantillons compars sont de grandes tailles.

    Mohammed El Haj [email protected] Analyse de la Variance Partie 1

  • IntroductionAnalyse de la Variance un facteur

    Anova un facteur fixeAnova un facteur alatoire

    Modle de lanalyse de la variance

    Sous lhypothse dhomognit des donnes, lANOVA un facteurteste leffet dun facteur contrl A ayant p modalits sur lesmoyennes dune variable quantitative Y .

    Lhypothse nulle teste est la suivante : il ny a pas deffet dufacteur A et les p moyennes sont gales une mme moyenne

    H0 : 1 = 2 = = i = = p = Sous lhypothse H0, on a alors

    yij = + eij

    avec eij sont des variables alatoires indpendantes suivant unemme loi Normale N (0, 2) Les rsidus eij correspondent aux fluctuations exprimentales

    pour chaque valeur de la variable yij mesure : Souslhypothse eij N (0, 2), on montre que yij N (, 2).

    Mohammed El Haj [email protected] Analyse de la Variance Partie 1

  • IntroductionAnalyse de la Variance un facteur

    Anova un facteur fixeAnova un facteur alatoire

    Modle de lanalyse de la variance

    Sous lhypothse dhtrognit des donnes, lhypothsealternative est la suivante : il y a un effet du facteur A et il existeau moins deux moyennes significativement diffrentes.

    H1 : il existe i 6= j

    Sous lhypothse H1, on a alors yij = i + eij = + ai + eijavec eij sont des variables alatoires indpendantes suivant unemme loi Normale N (0, 2) et ai est leffet de la modalit i dufacteur A sur la variable Y

    Sous lhypothse que eij N (0, 2), on peut montrer queyij N (+ ai, 2). Ainsi il existe une diffrence entre lesmoyennes de la variable selon les modalits du facteurcontrol.

    On note que tester lhypothse nulle "absence deffet surfacteur A" revient tester H0 : les ai sont tous nuls.

    Mohammed El Haj [email protected] Analyse de la Variance Partie 1

  • IntroductionAnalyse de la Variance un facteur

    Anova un facteur fixeAnova un facteur alatoire

    Equation fondamentale de lANOVA

    Estimation des paramtres des modles

    Sous H0 : yij = + eij

    = y o y =1n

    pi=1

    nij=1

    yij avec n =pi=1

    ni

    Lensemble des donnes du tableau peuvent tre estimes partirde la moyenne totale des yij laquelle sajoute la part dalatoiredans les mesures eij .

    Mohammed El Haj [email protected] Analyse de la Variance Partie 1

  • IntroductionAnalyse de la Variance un facteur

    Anova un facteur fixeAnova un facteur alatoire

    Equation fondamentale de lANOVA

    Estimation des paramtres des modles (suite)

    Sous H1 : yij = + ai + eij

    + ai = yi o yi =1ni

    nij=1

    yij

    Ainsi,ai = yi y

    eteij = yij ai = yij yi

    Mohammed El Haj [email protected] Analyse de la Variance Partie 1

  • IntroductionAnalyse de la Variance un facteur

    Anova un facteur fixeAnova un facteur alatoire

    Equation fondamentale de lANOVA

    Dcomposition de la variation totale

    Lquation fondamentale sur laquelle se base lanalyse de variance est

    pi=1

    nij=1

    (yij y)2 SCEtotale

    =pi=1

    nij=1

    (yij yi)2 SCEintra

    +pi=1

    ni(yi y)2 SCEinter

    o

    ? SCEtotale : la somme des carts totaux ou la variation totale = ns2y

    ? SCEintra : la somme des carts rsiduelles ou la variation intra(interne chaque modalit)

    ? SCEinter : la somme des carts lis aux effets du facteur A ou lavariation inter (entre modalits).

    Mohammed El Haj [email protected] Analyse de la Variance Partie 1

  • IntroductionAnalyse de la Variance un facteur

    Anova un facteur fixeAnova un facteur alatoire

    Equation fondamentale de lANOVA

    Dcomposition de la variation totale

    Mohammed El Haj [email protected] Analyse de la Variance Partie 1

  • IntroductionAnalyse de la Variance un facteur

    Anova un facteur fixeAnova un facteur alatoire

    Equation fondamentale de lANOVA

    Le rapport de corrlation

    Le rapport de corrlation donne la part de la variabilit totale desdonnes explique par leffet du facteur A :

    2 =SCEinterSCEtotale

    ? Cest un indice de liaison, pas ncessairement linaire entre lesvariables tudies qui varie entre 0 et 1.

    ? Il mesure la qualit de lajustement des effets du facteur au traversdes moyennes.

    Mohammed El Haj [email protected] Analyse de la Variance Partie 1

  • IntroductionAnalyse de la Variance un facteur

    Anova un facteur fixeAnova un facteur alatoire

    Application de lquation fondamentale de lANOVA

    ? Lanalyse de variance un facteur teste leffet dun facteurcontrl A ayant p modalits sur les moyennes dune variablequantitative Y .

    ? Le test dhypothse ralis est le suivant :{H0 : 1 = 2 = = i = = p = H1 : il existe i 6= j

    ? Pour raliser ce test, on peut faire recours la loi de Fisher(test de Fisher).

    Mohammed El Haj [email protected] Analyse de la Variance Partie 1

  • IntroductionAnalyse de la Variance un facteur

    Anova un facteur fixeAnova un facteur alatoire

    Application de lquation fondamentale de lANOVA

    ? En effet, sous lhypothse de normalit nous avons

    yij = i + eij = yij N (i, 2)

    ? Ainsi, nous avons

    yi =1ni

    nij=1

    yij N (i, 2

    ni)

    y =1n

    pi=1

    nij=1

    yij N (, 2

    n)

    avec

    n =p

    i=1

    ni et =1n

    pi=1

    nii

    Mohammed El Haj [email protected] Analyse de la Variance Partie 1

  • IntroductionAnalyse de la Variance un facteur

    Anova un facteur fixeAnova un facteur alatoire

    Application de lquation fondamentale de lANOVA

    ? Par consquent, sous lhypothse :

    H0 : 1 = 2 = = i = = p =

    nous avons

    yij N (, 2) = zij = yij

    N (0, 1)

    yi N (,2

    ni) = zi = ni yi

    N (0, 1)

    y N (, 2

    n) = z = ny

    N (0, 1)

    Mohammed El Haj [email protected] Analyse de la Variance Partie 1

  • IntroductionAnalyse de la Variance un facteur

    Anova un facteur fixeAnova un facteur alatoire

    Application de lquation fondamentale de lANOVA

    ? En tenant compte du modle, la dcomposition de la variationtotale peut tre vue comme

    pi=1

    nij=1

    (yij y)2 SCEtotale

    =pi=1

    ni(yi y)2 SCEfacteur

    +pi=1

    nij=1

    (yij yi)2 SCEresidu

    ? Nous avons donc sous lhypothse H0,

    SCEfacteur =pi=1

    ni(yi y)2 = 2[(

    pi=1

    z2i

    ) z2

    ] 22p1

    SCEresidu =pi=1

    nij=1

    (yij yi)2 = 2pi=1

    nij=1

    (z2ij) z2i

    22npMohammed El Haj [email protected] Analyse de la Variance Partie 1

  • IntroductionAnalyse de la Variance un facteur

    Anova un facteur fixeAnova un facteur alatoire

    Application de lquation fondamentale de lANOVA

    ? Ainsi, les variances relatives chaque terme sont

    Variance totale :

    S2totale =SCEtotalen 1 avec n =

    pi=1

    ni

    Variance due au facteur A : qui est un estimateur sans biais de si H0 est vraie

    S2facteur =SCEfacteur

    p 1 Variance rsiduelle : qui est un estimateur sans biais de

    quelque soit le modle

    S2residu =SCEresidun p

    Mohammed El Haj [email protected] Analyse de la Variance Partie 1

  • IntroductionAnalyse de la Variance un facteur

    Anova un facteur fixeAnova un facteur alatoire

    Application de lquation fondamentale de lANOVA

    ? La Loi de Fisher tant dfini comme le rapport de deux lois du 2

    divise par leur degr de libert

    Sous lhypothse H0, S2facteur

    S2residusuit une loi de Fisher :

    F =S2facteurS2residu

    =SCEfacteur

    p1SCEresidu

    np=2p12np

    F (p 1, n p)

    ? En pratique, on obtient une valeur du rapport S2facteur

    S2residuquon

    compare une loi de Fisher F , en se donnant un risque .

    Si la valeur obtenue est trop grande, on en dduit que lerapport ne suit vraisemblablement pas une loi de Fisher F etque le facteur A a un effet.On conclut donc une diffrence des moyennes.

    Mohammed El Haj [email protected] Analyse de la Variance Partie 1

  • IntroductionAnalyse de la Variance un facteur

    Anova un facteur fixeAnova un facteur alatoire

    Table de lANOVA

    La table dANOVA permet de rsumer les calculs ncessaires :

    Source de Somme des Degr de Variance F p-valuela variance carrs des carts libert

    Inter-classes SCEfacteur DDLf S2f =

    SCEfacteurDDLf

    F =S2fS2r

    PH0 (F > Fobs)

    Intra-classes SCEresidu DDLr S2r =

    SCEresiduDDLr

    Total SCEtotal DDLtotal

    Mohammed El Haj [email protected] Analyse de la Variance Partie 1

  • IntroductionAnalyse de la Variance un facteur

    Anova un facteur fixeAnova un facteur alatoire

    Exemple illustratif dANOVA un facteur

    Pour illustrer la mise en oeuvre de lANOVA, considrons lexemple delleveur qui souhaite acheter de nouvelles vaches pour sa productionlaitire. Il possde trois races diffrentes de vaches et se pose donc laquestion de savoir si la race est importante pour son choix. Il possdecomme informations la race de chacune de ses btes (cest la variableexplicative discrte ou facteur) et leurs productions de lait journalires(cest la variable expliquer continue). Ces productions sont :

    La race des vachesRace A Race B Race C20,1 22,6 31,219,8 24,1 31,621,3 23,8 31,020,7 22,5 32,1

    23,4 31,424,522,9

    Mohammed El Haj [email protected] Analyse de la Variance Partie 1

  • IntroductionAnalyse de la Variance un facteur

    Anova un facteur fixeAnova un facteur alatoire

    Exemple illustratif dANOVA un facteur

    ? Nous avons donc,

    Race Taille Moyenne VarianceA 4 20,475 0,4425B 7 23,4 0,5933C 5 31,46 0,1780

    Total 25,1875 32,1 20,8012

    ? La table dANOVA est la suivante :

    Source de Somme des Degr de Variance F p-valuela variance carrs des carts libertInter-classes 307,918 2 153,959 357,44 < 0, 001Intra-classes 5,6 13 0,431

    Total 313,518 15

    Mohammed El Haj [email protected] Analyse de la Variance Partie 1

  • IntroductionAnalyse de la Variance un facteur

    Anova un facteur fixeAnova un facteur alatoire

    Mise en oeuvre dune ANOVA un facteur avec SPSS

    ? Pour illustrer la mise en oeuvre dune ANOVA avec SPSS, lesdonnes utilises correspondent une tude ralise sur 48 enfantset adolescents souffrant dun traumatisme suite un accidentdomestique ou un accident de circulation.

    ? Lobjet de cette tude est de mesurer leffet du traitementadministr (4 types de traitement) sur la gurison du traumatismeengendr par laccident.

    ? Le degr du traumatisme engendr par laccident est mesur enposant 10 questions sur les enfants victimes dun accident o, pourchaque question, ils doivent rpondre en suivant une chelle variantde 0 5. Plus le total des rponses sur les dix rponses est grand,plus le degr des troubles subis est important.

    Mohammed El Haj [email protected] Analyse de la Variance Partie 1

  • IntroductionAnalyse de la Variance un facteur

    Anova un facteur fixeAnova un facteur alatoire

    Mise en oeuvre dune ANOVA un facteur avec SPSS

    ? Les informations observes sont les suivantes :

    Genre : Genre de lenfant (1=fille, 2=garon). Accident : Type daccident (1=accident de la circulation,

    2=autre type daccident). Traitement : Type de traitement (1=traitement1,

    2=traitement2, 3=traitement3, 4=traitement4). Age : Age de lenfant au moment du laccident. Temps : Temps coul entre laccident et le dbut du

    traitement (en mois). SveritAvant : Sverit du traumatisme avant le traitement. SveritAprs : Sverit du traumatisme aprs le traitement.

    Mohammed El Haj [email protected] Analyse de la Variance Partie 1

  • IntroductionAnalyse de la Variance un facteur

    Anova un facteur fixeAnova un facteur alatoire

    Mise en oeuvre dune ANOVA un facteur avec SPSS

    ? Ainsi, afin de pouvoir mesurer leffet du traitement administr sur lasvrit, nous allons la variable :Amlioration = SveritAvant - SveritAprs

    ? Le test de leffet du type du traitement administr peut tre ralisavec une ANOVA un facteur effet fixe o "Amlioration" est lavariable dpendante et la variable "Traitement" est le facteur.

    ? On note que lors de la ralisation dune ANOVA, il faut toujoursvrifier au moins lhypothse de Normalit ainsi celle delHomoscdasticit pour la variable dpendante.

    ? Sous SPSS, la vrification de ces deux hypothses peut se faire enchoisissant :

    Analyse| Statistiques descriptives|Explorer : Diagrammes

    Mohammed El Haj [email protected] Analyse de la Variance Partie 1

  • IntroductionAnalyse de la Variance un facteur

    Anova un facteur fixeAnova un facteur alatoire

    Mise en oeuvre dune ANOVA un facteur avec SPSS

    Hypothse de Normalit : test de Kolmogorov Smirnov

    ? Le test de conformit de Kolmogorov Smirnov est parmi les tests lesplus utiliss pour tester la normalit des donnes.

    ? Ce test se base sur la statistique

    D = supx| Fs(x) FT (x) |

    qui reprsente le plus grand cart entre la frquence observe Fs(x)et la frquence thorique FT (x) de la distribution Normale.

    ? La valeur observe de la statistique D est compare avec sa valeurthorique (quon trouve dans la table statistique relative lastatistique D de Kolomogorov).

    On dcide que la distribution de la variable tudie ne suit pasune loi normale quand la valeur observe de D est suprieure sa valeur thorique.

    Mohammed El Haj [email protected] Analyse de la Variance Partie 1

  • IntroductionAnalyse de la Variance un facteur

    Anova un facteur fixeAnova un facteur alatoire

    Mise en oeuvre dune ANOVA un facteur avec SPSS

    Hypothse de Normalit : test de Kolmogorov Smirnov

    Mohammed El Haj [email protected] Analyse de la Variance Partie 1

  • IntroductionAnalyse de la Variance un facteur

    Anova un facteur fixeAnova un facteur alatoire

    Mise en oeuvre dune ANOVA un facteur avec SPSS

    Hypothse de Normalit : test de Kolmogorov Smirnov

    Mohammed El Haj [email protected] Analyse de la Variance Partie 1

  • IntroductionAnalyse de la Variance un facteur

    Anova un facteur fixeAnova un facteur alatoire

    Mise en oeuvre dune ANOVA un facteur avec SPSS

    Hypothse de Normalit : test de Kolmogorov Smirnov

    Mohammed El Haj [email protected] Analyse de la Variance Partie 1

  • IntroductionAnalyse de la Variance un facteur

    Anova un facteur fixeAnova un facteur alatoire

    Mise en oeuvre dune ANOVA un facteur avec SPSS

    Hypothse dHomoscdasticit : test de Levne

    ? Le test de Levne est parmi les tests les plus utiliss pour testerlhomoscdasticit travers la comparaison des variances dans les pchantillons relatives aux modalits du facteur A de lANOVA.

    ? Ce test consiste tester lhypothse

    H0 : 21 = = 2i = = 2pcontre lhypothse alternative H1 : il existe 2i 6= 2j

    ? Sous SPSS, ce test peut tre ralis travers la caseDispersion/Niveau avec test de Levene

    de la bote de dialogue obtenue partir deAnalyse| Statistiques descriptives|Explorer : Diagrammes

    Mohammed El Haj [email protected] Analyse de la Variance Partie 1

  • IntroductionAnalyse de la Variance un facteur

    Anova un facteur fixeAnova un facteur alatoire

    Mise en oeuvre dune ANOVA un facteur avec SPSS

    Hypothse dHomoscdasticit : test de Levne

    Mohammed El Haj [email protected] Analyse de la Variance Partie 1

  • IntroductionAnalyse de la Variance un facteur

    Anova un facteur fixeAnova un facteur alatoire

    Mise en oeuvre dune ANOVA un facteur avec SPSS

    Hypothse dHomoscdasticit : test de Levne

    Mohammed El Haj [email protected] Analyse de la Variance Partie 1

  • IntroductionAnalyse de la Variance un facteur

    Anova un facteur fixeAnova un facteur alatoire

    Mise en oeuvre dune ANOVA un facteur avec SPSS

    Hypothse dHomoscdasticit : test de Levne

    Mohammed El Haj [email protected] Analyse de la Variance Partie 1

  • IntroductionAnalyse de la Variance un facteur

    Anova un facteur fixeAnova un facteur alatoire

    Mise en oeuvre dune ANOVA un facteur avec SPSS

    Mohammed El Haj [email protected] Analyse de la Variance Partie 1

  • IntroductionAnalyse de la Variance un facteur

    Anova un facteur fixeAnova un facteur alatoire

    Mise en oeuvre dune ANOVA un facteur avec SPSS

    Mohammed El Haj [email protected] Analyse de la Variance Partie 1

  • IntroductionAnalyse de la Variance un facteur

    Anova un facteur fixeAnova un facteur alatoire

    Mise en oeuvre dune ANOVA un facteur avec SPSS

    Mohammed El Haj [email protected] Analyse de la Variance Partie 1

  • IntroductionAnalyse de la Variance un facteur

    Anova un facteur fixeAnova un facteur alatoire

    Mise en oeuvre dune ANOVA un facteur avec SPSS

    Mohammed El Haj [email protected] Analyse de la Variance Partie 1

  • IntroductionAnalyse de la Variance un facteur

    Anova un facteur fixeAnova un facteur alatoire

    Les comparaisons multiples a posteriori (ou post hoc tests)

    ? Lanalyse de variance permet simplement de rpondre la questionde savoir sil y a des diffrences entre les moyennes, elle ne permetpas de dterminer o ces diffrences se situent.

    ? Or, lobjectif du chercheur est moins de savoir sil existe desdiffrences significatives que didentifier quelles diffrences le sonteffectivement et dans quelle direction.

    Il est donc important de disposer dune procdure permettantde dissocier les diffrences rellement significatives de celles quine le sont pas.

    ? Cest pourquoi on effectue gnralement des comparaisons multiplesou des contrastes lorsquun facteur a plus de trois niveaux.

    Mohammed El Haj [email protected] Analyse de la Variance Partie 1

  • IntroductionAnalyse de la Variance un facteur

    Anova un facteur fixeAnova un facteur alatoire

    Les comparaisons multiples a posteriori (ou post hoc tests)

    ? Les comparaisons multiples a posteriori consistent effectuer descomparaisons entre tous les groupes de sujets correspondant unfacteur. Par exemple, dans le cas dun facteur trois valeurs, il y atrois comparaisons qui sont faites.

    ? Toutefois, ces comparaisons sont effectues en contrlant le risquedeffectuer une erreur de premire espce = P (RH0 | H0 vrai),cest--dire de dclarer que des moyennes sont diffrentes alorsquen fait elles ne sont pas.

    ? On note que lerreur tend augmenter avec le nombre decomparaisons effectuer, si on garde le mme seuil pour chaquecomparaison. Effectivement, sil faut faire 3 comparaisons, on risque de se

    "tromper" 3 fois, si on en fait 6, on risque de se "tromper" 6fois. Si par exemple, on prend un seuil de 0.01 dans le premiercas, lerreur risque dapprocher 0.03 dans le premier cas mais0.06 dans le second.

    Mohammed El Haj [email protected] Analyse de la Variance Partie 1

  • IntroductionAnalyse de la Variance un facteur

    Anova un facteur fixeAnova un facteur alatoire

    Les comparaisons multiples a posteriori (ou post hoc tests)

    ? Les tests de comparaisons multiples a posteriori est unegnralisation k populations du test t de Student de comparaisonde moyennes de deux chantillons avec ajustement de lerreur.

    ? Pour maintenir lerreur de premire espce , les tests decomparaisons mutiples a posteriori renforcent lexigence du seuilchoisi pour chaque comparaison en fonction du nombre decomparaisons effectuer.

    Sil y en a 6, ils pourraient par exemple exiger un seuil de0.05/6 alors que sil y en a deux, un seuil de 0.05/2 (ceci est lecas particulier du test de Bonferroni).

    Par consquent, mesure que le nombre de comparaisonsaugmente, ces tests exigeront une diffrence plus importanteentre deux conditions pour dclarer que celle-ci estsignificative.

    Mohammed El Haj [email protected] Analyse de la Variance Partie 1

  • IntroductionAnalyse de la Variance un facteur

    Anova un facteur fixeAnova un facteur alatoire

    Les comparaisons multiples a posteriori (ou post hoc tests)

    ? Il existe plusieurs tests de comparaisons multiples a posteriori. Deuxapproches sont considres :

    modifier le risque de premire espce pour que le risque total(risque exprimental) demeure 0.05 : mthode deBonferroni.

    adapter la statistique de test (plus conservateur) : mthodeHSD de Tukey.

    ? Parmi les tests de comparaison multiples a posteriori,

    le plus conservateur est le test "Honestly SignificantDifference" (HSD) de Tukey : il contrle trs bien lerreur maisrisque de ne pas dtecter des diffrences significatives.

    le plus tolrant est le "Least Significant Difference" (LSD) : cetest risque de dtecter des diffrences qui nexistent pas.

    le test de Student Newman Keuls (SNK) est un compromisentre les deux prcdents.

    Mohammed El Haj [email protected] Analyse de la Variance Partie 1

  • IntroductionAnalyse de la Variance un facteur

    Anova un facteur fixeAnova un facteur alatoire

    Les comparaisons multiples a posteriori (ou post hoc tests)

    Exemple 1 : Test de Bonferroni

    Objectif : Comparer deux deux toutes les moyennes possibles des pclasses.

    1 Calculer le nombre de comparaisons : nc = p(p 1)/22 Erreur de premire espce globale : = 5% = 0, 05

    3 Erreur pour chaque test : = 0, 05/nc

    4 Hypothses : H0 : i = j contre H1 : i 6= j5 Statistique de test : tobs =

    yiyjS2r

    (1ni

    + 1nj

    )6 Rgle de dcision : Accepter H0 si | tobs |< tnp,1/2

    Mohammed El Haj [email protected] Analyse de la Variance Partie 1

  • IntroductionAnalyse de la Variance un facteur

    Anova un facteur fixeAnova un facteur alatoire

    Les comparaisons multiples a posteriori (ou post hoc tests)

    Exemple 2 : Test de Student-Newman-Keuls

    Objectif : Classer les traitements par classes qui sont significativementdiffrentes. La mthode est la suivante :

    Etape 1 : Ordonner les moyennes et calculer toutes les diffrencesdeux deux entre moyennes.

    Etape 2 : Calculer pour r = 2 p les diffrences minimumsignificatives Wr qui est une fonction de lcart yi yj avecr = i j + 1.Etape 3 : Dans le tableau des diffrences, rechercher toutes lesdiffrences significatives en fonction de leur distance r.

    Etape 4 : Classer les traitements par groupes significativementdiffrents.

    Mohammed El Haj [email protected] Analyse de la Variance Partie 1

  • IntroductionAnalyse de la Variance un facteur

    Anova un facteur fixeAnova un facteur alatoire

    Les comparaisons multiples a posteriori (ou post hoc tests)

    Mise en oeuvre avec SPSS

    Mohammed El Haj [email protected] Analyse de la Variance Partie 1

  • IntroductionAnalyse de la Variance un facteur

    Anova un facteur fixeAnova un facteur alatoire

    Les comparaisons multiples a posteriori (ou post hoc tests)

    Mise en oeuvre avec SPSS

    Mohammed El Haj [email protected] Analyse de la Variance Partie 1

  • IntroductionAnalyse de la Variance un facteur

    Anova un facteur fixeAnova un facteur alatoire

    Les comparaisons multiples a posteriori (ou post hoc tests)

    Mise en oeuvre avec SPSS : Test de Bonferroni

    Mohammed El Haj [email protected] Analyse de la Variance Partie 1

  • IntroductionAnalyse de la Variance un facteur

    Anova un facteur fixeAnova un facteur alatoire

    Les comparaisons multiples a posteriori (ou post hoc tests)

    Mise en oeuvre avec SPSS : Test de SNK

    Mohammed El Haj [email protected] Analyse de la Variance Partie 1

  • IntroductionAnalyse de la Variance un facteur

    Anova un facteur fixeAnova un facteur alatoire

    Les comparaisons multiples a posteriori (ou post hoc tests)

    Mise en oeuvre avec SPSS : Test de Tukey

    Mohammed El Haj [email protected] Analyse de la Variance Partie 1

  • IntroductionAnalyse de la Variance un facteur

    Anova un facteur fixeAnova un facteur alatoire

    Les comparaisons multiples a posteriori (ou post hoc tests)

    Mise en oeuvre avec SPSS : Test LSD

    Mohammed El Haj [email protected] Analyse de la Variance Partie 1

  • IntroductionAnalyse de la Variance un facteur

    Anova un facteur fixeAnova un facteur alatoire

    Les comparaisons multiples a posteriori (ou post hoc tests)

    Mise en oeuvre avec SPSS : Test de Dunnett

    Mohammed El Haj [email protected] Analyse de la Variance Partie 1

  • IntroductionAnalyse de la Variance un facteur

    Anova un facteur fixeAnova un facteur alatoire

    Mthode des contrastes

    ? Comme nous lavons vu, les tests de comparaisons multipleseffectuent TOUTES les comparaisons et maintiennent le risquedeffectuer une erreur de premire espce en dfinissant un seuil plusexigeant pour chaque comparaison.

    ? Une autre faon de maintenir ce risque est tout simplementdeffectuer moins de comparaisons. Cest la solution offerte par lescontrastes.

    ? Lun des intrts des contrastes rside dans le fait quils permettentsoit de comparer deux moyennes entre elles, soit de comparerplusieurs moyennes simultanment une autre.

    Mohammed El Haj [email protected] Analyse de la Variance Partie 1

  • IntroductionAnalyse de la Variance un facteur

    Anova un facteur fixeAnova un facteur alatoire

    Mthode des contrastes

    ? Dans le cas dun facteur p valeurs, un contraste est dfini par

    L =pi=1

    cii avecpi=1

    ci = 0

    Exemples : L = 1 3, L = 1 + 2 3 4? Deux contrastes sont orthogonaux si le produit de leur coefficients

    de contraste est nul.

    On peut construire p 1 contrastes orthogonaux pour unfacteur q valeurs.

    ? Les contrastes sont des mthodes quon qualifie da priori car ilssont guids par des hypothses que lon a formules pralablement ltude elle-mme. On les dfinit donc sans avoir observ lesmoyennes et sur base uniquement de ses hypothses thoriques.

    Mohammed El Haj [email protected] Analyse de la Variance Partie 1

  • IntroductionAnalyse de la Variance un facteur

    Anova un facteur fixeAnova un facteur alatoire

    Mthode des contrastes

    ? Cest pour cela, on opte pour les comparaisons multiples lorsquonna pas dhypothse(s) claire(s) quant aux diffrences que loncompte observer ou lorsque la configuration des rsultats va lencontre des hypothses.

    ? Lavantage des contrastes rside dans le fait quils sont pluspuissants que les comparaisons multiples : ils permettent donc plusfacilement de dtecter une diffrence.

    ? En revanche, ils prsentent le dsavantage dtre trs slectifs : onne peut effectuer que quelques contrastes alors que les comparaisonsmultiples impliquent tous les groupes. En effectuant des contrastes,on sinterdit donc de comparer certains groupes, bien que celapuisse tre intressant.

    Mohammed El Haj [email protected] Analyse de la Variance Partie 1

  • IntroductionAnalyse de la Variance un facteur

    Anova un facteur fixeAnova un facteur alatoire

    Mthode des contrastes

    Test dhypothses sur un contraste

    Soit un contraste L = c11 + c22 + + cpp.1 Lhypothse nulle :H0 : L = c11 + c22 + + cpp = 0contre lhypothse alternativeH1 : L 6= 0

    2 Statistique de test : Lobs = c1y1 + c2y2 + + cpyp

    tobs =Lobs

    S2r

    (pi=1

    a2ini

    ) sous H0

    tnp

    3 Rgle de dcision : Accepter H0 si | tobs |< tnp,1/2

    Mohammed El Haj [email protected] Analyse de la Variance Partie 1

  • IntroductionAnalyse de la Variance un facteur

    Anova un facteur fixeAnova un facteur alatoire

    Mthode des contrastes

    Mise en oeuvre avec SPSS

    ? Pour illustrer la mise en oeuvre de la mthode des contrastes avecSPSS, nous allons utiliser les donnes de ltude ralise sur 48enfants souffrant dun traumatisme suite un accident.

    ? On se place dans le cas o le medecin qui traite ces 48 enfants veuttester lutilisation de deux traitements la fois sur une mmepersonne et se demande sur la diffrence entre leffet dutiliser lestraitements 1 et 2 et celui dutiliser les traitements 3 et 4.

    Pour cela, il peut faire recours lutilisation du contrasteL = 1 + 2 3 4 o le test dhypothses utilis estH0 : L = 1 + 2 3 4 = 0 contre H1 : L 6= 0

    Mohammed El Haj [email protected] Analyse de la Variance Partie 1

  • IntroductionAnalyse de la Variance un facteur

    Anova un facteur fixeAnova un facteur alatoire

    Mthode des contrastes

    Mise en oeuvre avec SPSS

    Mohammed El Haj [email protected] Analyse de la Variance Partie 1

  • IntroductionAnalyse de la Variance un facteur

    Anova un facteur fixeAnova un facteur alatoire

    Mthode des contrastes

    Mise en oeuvre avec SPSS

    Mohammed El Haj [email protected] Analyse de la Variance Partie 1

  • IntroductionAnalyse de la Variance un facteur

    Anova un facteur fixeAnova un facteur alatoire

    Analyse de la Variance un facteur

    alatoire

    Mohammed El Haj [email protected] Analyse de la Variance Partie 1

  • IntroductionAnalyse de la Variance un facteur

    Anova un facteur fixeAnova un facteur alatoire

    Modle thorique

    Nous avons vu que dans le cas dune analyse de la variance unfacteur fixe, le modle linaire correspondant est donn par

    yij = i + ij = + i + ij

    o

    yij est la valeur observe pour le sujet j du groupe i. est la moyenne gnrale.i est linfluence du traitement Ai sur le groupe i(i = i ).ij est lerreur ou les rsidus qui suit la loi N(0, 2).

    Sous ce modle, nous avons

    yij N(i, 2)

    Mohammed El Haj [email protected] Analyse de la Variance Partie 1

  • IntroductionAnalyse de la Variance un facteur

    Anova un facteur fixeAnova un facteur alatoire

    Modle thorique

    Dans le cas dune analyse de la variance effet alatoire, lesmodalits du facteur sont elles-mmes alatoires et le modlelinaire correspondant devient :

    yij = + i + ij

    aveci N(0, 2) pour i = 1, . . . , p.ij N(0, 2) pour i = 1, . . . , p et j = 1, . . . , ni.i et ij sont indpendants pour i = 1, . . . , p et j = 1, . . . , ni.

    Sous ce modle, nous avons

    yij N(, 2 + 2)

    On dit alors que 2 et 2 sont les composantes de la variance. Unepartie de la variabilit de Y est explique par la variabilit entre lestraitements (2), lautre par la variabilit rsiduelle (2).

    Mohammed El Haj [email protected] Analyse de la Variance Partie 1

  • IntroductionAnalyse de la Variance un facteur

    Anova un facteur fixeAnova un facteur alatoire

    Test dhypothses

    Dans lANOVA un facteur fixe, on considre lhypothse

    H0 : 1 = 2 = = pCette hypothse na plus de sens dans le contexte dune ANOVA un facteur alatoire puisque les modalits sont elles-mmesalatoires.

    On veut tester si le facteur influence la variabilit de Y . Le testdhypothses scrit donc

    H0 : 2 = 0 contre H1 : 2 > 0

    Bien que les deux scnarios soient trs diffrents lun de lautre, onutilise la mme rgle de dcision dans les deux cas, cest dire :

    On rejette H0 si F =S2interS2intra

    =SCEinterp1

    SCEintranp

    > Fp1,np,1

    Mohammed El Haj [email protected] Analyse de la Variance Partie 1

  • IntroductionAnalyse de la Variance un facteur

    Anova un facteur fixeAnova un facteur alatoire

    Les statistiques et la rgle de dcision

    En effet, nous avons

    yij = + i + ij = yij N (, 2 + 2)

    yi =1ni

    nij=1

    yij = + i +1ni

    nij=1

    ij = yi N(, 2 +

    2

    ni

    )

    y = +1n

    pi=1

    i+1n

    pi=1

    nij=1

    ij = y N(,2

    n+ 2

    pi=1

    n2in2

    )

    Mohammed El Haj [email protected] Analyse de la Variance Partie 1

  • IntroductionAnalyse de la Variance un facteur

    Anova un facteur fixeAnova un facteur alatoire

    Les statistiques et la rgle de dcision

    Ainsi,

    yij yi = ij 1ni

    nij=1

    ij

    avec

    ij N(0, 2

    )et

    1ni

    nij=1

    ij N(0,2

    ni

    )

    Nous avons donc

    SCEintra =pi=1

    nij=1

    (yij yi)2 =pi=1

    nij=1

    ij 1ni

    nij=1

    ij

    2= 22np

    Mohammed El Haj [email protected] Analyse de la Variance Partie 1

  • IntroductionAnalyse de la Variance un facteur

    Anova un facteur fixeAnova un facteur alatoire

    Les statistiques et la rgle de dcision

    De plus, sous lhypothse

    H0 : 2 = 0

    nous avons

    yi N(,2

    ni

    )et y N

    (,2

    n

    )

    Nous avons donc

    SCEinter =pi=1

    ni (yi y)2 = 22p1

    Par consquent,

    F =S2facteurS2residu

    =SCEinterp1

    SCEintranp

    =2p12np

    Fp1,np

    Mohammed El Haj [email protected] Analyse de la Variance Partie 1

  • IntroductionAnalyse de la Variance un facteur

    Anova un facteur fixeAnova un facteur alatoire

    Remarques

    1 La dmarche pratique est donc la mme que dans lanalyse unfacteur effets fixes.

    2 Cependant, les comparaisons multiples, lorsque lhypothsealternative (H1) est accepte, nont plus de sens et ne doivent pastre effectues.

    3 La normalit des rsidus ne peut plus tre teste.

    4 En revanche, la normalit des Yij , quantits qui sont estimespar yij y, peut tre teste.

    Mohammed El Haj [email protected] Analyse de la Variance Partie 1

    Main TalkIntroductionAnalyse de la Variance un facteurAnova un facteur fixeAnova un facteur alatoire