ANOVA_partie1.pdf
Transcript of ANOVA_partie1.pdf
-
Analyse de la VariancePartie 1
Mohammed El Haj [email protected]
INSEA
2013-2014
Mohammed El Haj [email protected] Analyse de la Variance Partie 1
-
IntroductionAnalyse de la Variance un facteur
Introduction
LAnalyse de la Variance (ANOVA) est une technique quon utilisepour tudier leffet dune variable qualitative sur une variablequantitative :
Variable dpendante : variable quantitative. Variable indpendante : variable qualitative (avec plusieurs
catgories).
Par exemple : Impact du niveau dinstruction (variable qualitativequalitative) sur le revenu (variable quantitative).
On peut conclure quil existe une relation si les moyennes derevenus des gens ne sont pas les mmes dans les diffrentescatgories.
Chaque variable indpendante est appele un facteur et chaquefacteur peut avoir deux ou plusieurs niveaux ou traitements.
Mohammed El Haj [email protected] Analyse de la Variance Partie 1
-
IntroductionAnalyse de la Variance un facteur
Introduction
Lanalyse de variance peut tre vue comme une comparaisonmultiple de moyennes. Dans tous les cas, la variable tudie est uncaractre quantitatif de type continu qui suit une loi normale.
Une ANOVA teste si toutes les moyennes sont gales :H0 : galit contre H1 : au moins une diffrence
On note que si H0 est rejete pour un seuil donn, lANOVA ne ditpas o sont les diffrences.
LANOVA est utilise quand le nombre de niveaux est suprieur deux.
Il existe diffrents types dANOVA qui se distinguent par le nombrede facteurs tudis (un facteur, deux facteurs, deux facteurs avecrptitions, etc) et la nature des modalits associes au facteur(modle fixe, modle alatoire, modle mixte).
Mohammed El Haj [email protected] Analyse de la Variance Partie 1
-
IntroductionAnalyse de la Variance un facteur
Les diffrents types dANOVA
Type I : "effets fixes"
Pour ce type dANOVA, les traitements sont dtermins par lechercheur.
Exemple : Ltude de leffet de diffrents types dalimentation(Paille, Foin, Herbe) sur le rendement des vaches laitires :
3 traitements (types dalimentations) dtermins par lechercheur.
la variable dpendante est la quantit de lait produites (Y ), etle facteur (T ) est le type de lalimentation
Les modalits du facteur correspondent diffrentes valeurs prisespar une variable alatoire dont les valeurs sont fixes parlexprimentateur.
Mohammed El Haj [email protected] Analyse de la Variance Partie 1
-
IntroductionAnalyse de la Variance un facteur
Les diffrents types dANOVA
Type II : "effets alatoires"
Pour ce type dANOVA, les traitements ne sont pas sous le contrlede lexprimentateur ou le chercheur.
Exemple : Ltude de leffet de la rgion dlevage (3 rgionschoisies alatoirement) sur le rendement des vaches laitires :
les 3 traitements (rgions dlevage) sont choisiesalatoirement par le chercheur.
la variable dpendante est la quantit de lait produites (Y ), etle facteur (T ) est la rgion dlevage.
Les modalits du facteur correspondent diffrentes valeursobserves pour une variable alatoire dont les valeurs ne sont pasfixes par lexprimentateur.
Mohammed El Haj [email protected] Analyse de la Variance Partie 1
-
IntroductionAnalyse de la Variance un facteur
Les diffrents types dANOVA
Type III : "effets mixtes"
Ce type dANOVA correspond au cas dANOVA plusieurs facteurso on dispose dau moins un facteur du Type I et au moins un duType II.
Exemple : Ltude de leffet de diffrents types dalimentation(Paille, Foin, Herbe) et de leffet de la rgion dlevage (3 rgionschoisies alatoirement) sur le rendement des vaches laitires :
On dispose dun facteur fixe et dun facteur alatoire. la variable dpendante est la quantit de lait produites (Y ), et
les facteurs sont T1 : le type dalimentation et T2 : la rgiondlevage.
Mohammed El Haj [email protected] Analyse de la Variance Partie 1
-
IntroductionAnalyse de la Variance un facteur
Anova un facteur fixeAnova un facteur alatoire
Analyse de la Variance un facteur
Mohammed El Haj [email protected] Analyse de la Variance Partie 1
-
IntroductionAnalyse de la Variance un facteur
Anova un facteur fixeAnova un facteur alatoire
Introduction
Lanalyse de variance un facteur ou ANOVA1 a pour objectif detester leffet dun facteur A sur une variable alatoire continue.
Ceci revient comparer les moyennes de plusieurs populationsnormales et de mme variance partir dchantillons alatoires etindpendants les uns des autres.
Chaque chantillon correspond une modalit du facteur A.
Le terme ANOVA indique que la comparaison multiple de moyennescorrespond en faite la comparaison de deux variances.
Pour cette premire partie, nous allons considrer dans un premiertemps le cas de lANOVA un facteur fixe.
Mohammed El Haj [email protected] Analyse de la Variance Partie 1
-
IntroductionAnalyse de la Variance un facteur
Anova un facteur fixeAnova un facteur alatoire
Structure des donnes
Si le facteur A est compos de p modalits (on parle aussi detraitements), Les donnes relatives une analyse de variance unfacteur sont structures dans un tableau du type suivant :
Facteur Amodalit 1 . . . modalit i . . . modalit p
y11 . . . yi1 . . . yp1...
......
......
y1j . . . yij . . . ypj...
......
......
y1n1 . . . yini . . . ypnpy1 . . . yi . . . yp
Leffectif dune modalit i est not ni. Les effectifs des modalits dufacteur ne sont pas forcment les mmes.
Mohammed El Haj [email protected] Analyse de la Variance Partie 1
-
IntroductionAnalyse de la Variance un facteur
Anova un facteur fixeAnova un facteur alatoire
Exemple de donnes
Un leveur souhaite acheter de nouvelles vaches pour sa productionlaitire. Il possde trois races diffrentes de vaches et se pose donc laquestion de savoir si la race est importante pour son choix. Il possdecomme informations la race de chacune de ses btes (cest la variableexplicative discrte ou facteur, qui peut prendre 3 valeurs diffrentes) etleurs productions de lait journalires (cest la variable expliquercontinue, qui correspond au volume de lait en litre).
Mohammed El Haj [email protected] Analyse de la Variance Partie 1
-
IntroductionAnalyse de la Variance un facteur
Anova un facteur fixeAnova un facteur alatoire
Exemple de donnes
Dans cet exemple, lhypothse nulle revient considrer que toutes lesvaches produisent la mme quantit de lait journalire (au facteuralatoire prs) quelle que soit la race. Lhypothse alternative revient considrer quune des races produit significativement plus ou moins delait que les autres. Supposons que les productions sont :
La race des vachesRace A Race B Race C20,1 22,6 31,219,8 24,1 31,621,3 23,8 31,020,7 22,5 32,1
23,4 31,424,522,9
Mohammed El Haj [email protected] Analyse de la Variance Partie 1
-
IntroductionAnalyse de la Variance un facteur
Anova un facteur fixeAnova un facteur alatoire
Modle thorique
Le modle linaire correspondant une analyse de la variance unfacteur est donn par
yij = i + ij = + i + ij
o
yij est la valeur observe pour le sujet j du groupe i. est la moyenne gnrale.i est linfluence du traitement Ai sur le groupe i(i = i ).ij est lerreur ou les rsidus (selon les hypothses, ils sontdistribus de manire normale avec une moyenne = 0 et unevariance 2).
Mohammed El Haj [email protected] Analyse de la Variance Partie 1
-
IntroductionAnalyse de la Variance un facteur
Anova un facteur fixeAnova un facteur alatoire
Modle thorique
Dans le cas dune analyse de la variance effet alatoire, la variableest issue dune loi suppose normale qui sajoute la valeur fixe. Lemodle linaire devient :
yij = + i + ij
avec i = + et = N(0, 2)
Un modle bas sur des variables explicatives effets fixes et effetsalatoires est appel modle mixte.
Mohammed El Haj [email protected] Analyse de la Variance Partie 1
-
IntroductionAnalyse de la Variance un facteur
Anova un facteur fixeAnova un facteur alatoire
Conditions dapplication dune ANOVA
Les hypothses relatives au modle danalyse de la variance sontnombreuses.
Lanalyse des rsidus ij = yij i est particulirement utile pourrpondre aux hypothses de normalit et dhomoscdasticit.
On note que dans le cas dun modle effet fixe, il est quivalent detester ces hypothses sur la variable yij .
Mohammed El Haj [email protected] Analyse de la Variance Partie 1
-
IntroductionAnalyse de la Variance un facteur
Anova un facteur fixeAnova un facteur alatoire
Conditions dapplication dune ANOVA
Hypothse 1 : lIndpendance
Lindpendance entre les diffrentes valeurs de la variable mesure yij estune condition essentielle la ralisation de lanalyse de variance.
Les p chantillons compars sont indpendants. Lensemble des n individus est rparti au hasard entre les p
modalits du facteur contrl A et les ni individus correspondant une modalit Ai recoivent le mme traitement i.
Mohammed El Haj [email protected] Analyse de la Variance Partie 1
-
IntroductionAnalyse de la Variance un facteur
Anova un facteur fixeAnova un facteur alatoire
Conditions dapplication dune ANOVA
Hypothse 2 : la Normalit
La variable quantitative tudie suit une loi normale dans les ppopulations compares.
La variable alatoire tudie Y dont yij est une reprsentation,suit une loi normale N (i, ).
La normalit de la variable pourra tre teste laide du test deKolmogorov-Smirnov ou avec le test Khi-deux dajustement si leseffectifs sont suffisamment importants. Sinon le test nonparamtrique de Lilliefors permet de tester lajustement loinormale lorsque les effectifs sont faibles.
Si la normalit de la variable nest pas vrifie, soit on peuttransformer cette dernire, soit avoir recours lquivalent nonparamtrique de lANOVA, le test de Kruskall-Wallis.
Mohammed El Haj [email protected] Analyse de la Variance Partie 1
-
IntroductionAnalyse de la Variance un facteur
Anova un facteur fixeAnova un facteur alatoire
Conditions dapplication dune ANOVA
Hypothse 3 : lHomoscdasticit
Les variances dans les p populations compares sont les mmes.
Le facteur A agt seulement sur la moyenne de la variable Y etne change pas sa variance.
Plusieurs tests diffrents permettent de vrifier lgalit desvariances relatives aux p populations compares :
H0 : 1 = 2 = = i = = p =
Mohammed El Haj [email protected] Analyse de la Variance Partie 1
-
IntroductionAnalyse de la Variance un facteur
Anova un facteur fixeAnova un facteur alatoire
Conditions dapplication dune ANOVA
Hypothse 3 : lHomoscdasticit (suite)
Le test de Levne est le test le plus satisfaisant pour effectuer lacomparaison multiple de variances mais sa ralisation est assezlongue car il correspond une ANOVA1 sur les rsidus eij .
Le test de Bartlett est ddi la comparaison multiple de variancesavec un nombre de rptitions ni diffrent selon les modalits i dufacteur. Mais ce test est trs sensible lhypothse de normalit desp populations (peu robuste).
Le test de Hartley est ddi la comparaison multiple de variancesavec un nombre de rptitions ni identiques selon les modalits i dufacteur. Mais ce test est trs sensible lhypothse de normalit desp populations (peu robuste).
On note que si lhtrognti entre variances est trs importantes,on peut avoir recours aux statistiques non paramtriques, test deKruskal-Wallis.
Mohammed El Haj [email protected] Analyse de la Variance Partie 1
-
IntroductionAnalyse de la Variance un facteur
Anova un facteur fixeAnova un facteur alatoire
Robustesse dune ANOVA
Hypothses Test RobustesseNormalit de Y Test du 2 Trs robuste si indpendance
dajustement et galit des variancesHomoscdasticit des Test de Levne Trs robuste
p distributions ou de Bartlett lingalit des variancesIndpendance des Plan exprimental Pas robustep distributions
On note cependant que lanalyse de variance un facteur contrl estrelativement peu sensible lingalit des variances ainsi qu la nonnormalit lorsque les chantillons compars sont de grandes tailles.
Mohammed El Haj [email protected] Analyse de la Variance Partie 1
-
IntroductionAnalyse de la Variance un facteur
Anova un facteur fixeAnova un facteur alatoire
Modle de lanalyse de la variance
Sous lhypothse dhomognit des donnes, lANOVA un facteurteste leffet dun facteur contrl A ayant p modalits sur lesmoyennes dune variable quantitative Y .
Lhypothse nulle teste est la suivante : il ny a pas deffet dufacteur A et les p moyennes sont gales une mme moyenne
H0 : 1 = 2 = = i = = p = Sous lhypothse H0, on a alors
yij = + eij
avec eij sont des variables alatoires indpendantes suivant unemme loi Normale N (0, 2) Les rsidus eij correspondent aux fluctuations exprimentales
pour chaque valeur de la variable yij mesure : Souslhypothse eij N (0, 2), on montre que yij N (, 2).
Mohammed El Haj [email protected] Analyse de la Variance Partie 1
-
IntroductionAnalyse de la Variance un facteur
Anova un facteur fixeAnova un facteur alatoire
Modle de lanalyse de la variance
Sous lhypothse dhtrognit des donnes, lhypothsealternative est la suivante : il y a un effet du facteur A et il existeau moins deux moyennes significativement diffrentes.
H1 : il existe i 6= j
Sous lhypothse H1, on a alors yij = i + eij = + ai + eijavec eij sont des variables alatoires indpendantes suivant unemme loi Normale N (0, 2) et ai est leffet de la modalit i dufacteur A sur la variable Y
Sous lhypothse que eij N (0, 2), on peut montrer queyij N (+ ai, 2). Ainsi il existe une diffrence entre lesmoyennes de la variable selon les modalits du facteurcontrol.
On note que tester lhypothse nulle "absence deffet surfacteur A" revient tester H0 : les ai sont tous nuls.
Mohammed El Haj [email protected] Analyse de la Variance Partie 1
-
IntroductionAnalyse de la Variance un facteur
Anova un facteur fixeAnova un facteur alatoire
Equation fondamentale de lANOVA
Estimation des paramtres des modles
Sous H0 : yij = + eij
= y o y =1n
pi=1
nij=1
yij avec n =pi=1
ni
Lensemble des donnes du tableau peuvent tre estimes partirde la moyenne totale des yij laquelle sajoute la part dalatoiredans les mesures eij .
Mohammed El Haj [email protected] Analyse de la Variance Partie 1
-
IntroductionAnalyse de la Variance un facteur
Anova un facteur fixeAnova un facteur alatoire
Equation fondamentale de lANOVA
Estimation des paramtres des modles (suite)
Sous H1 : yij = + ai + eij
+ ai = yi o yi =1ni
nij=1
yij
Ainsi,ai = yi y
eteij = yij ai = yij yi
Mohammed El Haj [email protected] Analyse de la Variance Partie 1
-
IntroductionAnalyse de la Variance un facteur
Anova un facteur fixeAnova un facteur alatoire
Equation fondamentale de lANOVA
Dcomposition de la variation totale
Lquation fondamentale sur laquelle se base lanalyse de variance est
pi=1
nij=1
(yij y)2 SCEtotale
=pi=1
nij=1
(yij yi)2 SCEintra
+pi=1
ni(yi y)2 SCEinter
o
? SCEtotale : la somme des carts totaux ou la variation totale = ns2y
? SCEintra : la somme des carts rsiduelles ou la variation intra(interne chaque modalit)
? SCEinter : la somme des carts lis aux effets du facteur A ou lavariation inter (entre modalits).
Mohammed El Haj [email protected] Analyse de la Variance Partie 1
-
IntroductionAnalyse de la Variance un facteur
Anova un facteur fixeAnova un facteur alatoire
Equation fondamentale de lANOVA
Dcomposition de la variation totale
Mohammed El Haj [email protected] Analyse de la Variance Partie 1
-
IntroductionAnalyse de la Variance un facteur
Anova un facteur fixeAnova un facteur alatoire
Equation fondamentale de lANOVA
Le rapport de corrlation
Le rapport de corrlation donne la part de la variabilit totale desdonnes explique par leffet du facteur A :
2 =SCEinterSCEtotale
? Cest un indice de liaison, pas ncessairement linaire entre lesvariables tudies qui varie entre 0 et 1.
? Il mesure la qualit de lajustement des effets du facteur au traversdes moyennes.
Mohammed El Haj [email protected] Analyse de la Variance Partie 1
-
IntroductionAnalyse de la Variance un facteur
Anova un facteur fixeAnova un facteur alatoire
Application de lquation fondamentale de lANOVA
? Lanalyse de variance un facteur teste leffet dun facteurcontrl A ayant p modalits sur les moyennes dune variablequantitative Y .
? Le test dhypothse ralis est le suivant :{H0 : 1 = 2 = = i = = p = H1 : il existe i 6= j
? Pour raliser ce test, on peut faire recours la loi de Fisher(test de Fisher).
Mohammed El Haj [email protected] Analyse de la Variance Partie 1
-
IntroductionAnalyse de la Variance un facteur
Anova un facteur fixeAnova un facteur alatoire
Application de lquation fondamentale de lANOVA
? En effet, sous lhypothse de normalit nous avons
yij = i + eij = yij N (i, 2)
? Ainsi, nous avons
yi =1ni
nij=1
yij N (i, 2
ni)
y =1n
pi=1
nij=1
yij N (, 2
n)
avec
n =p
i=1
ni et =1n
pi=1
nii
Mohammed El Haj [email protected] Analyse de la Variance Partie 1
-
IntroductionAnalyse de la Variance un facteur
Anova un facteur fixeAnova un facteur alatoire
Application de lquation fondamentale de lANOVA
? Par consquent, sous lhypothse :
H0 : 1 = 2 = = i = = p =
nous avons
yij N (, 2) = zij = yij
N (0, 1)
yi N (,2
ni) = zi = ni yi
N (0, 1)
y N (, 2
n) = z = ny
N (0, 1)
Mohammed El Haj [email protected] Analyse de la Variance Partie 1
-
IntroductionAnalyse de la Variance un facteur
Anova un facteur fixeAnova un facteur alatoire
Application de lquation fondamentale de lANOVA
? En tenant compte du modle, la dcomposition de la variationtotale peut tre vue comme
pi=1
nij=1
(yij y)2 SCEtotale
=pi=1
ni(yi y)2 SCEfacteur
+pi=1
nij=1
(yij yi)2 SCEresidu
? Nous avons donc sous lhypothse H0,
SCEfacteur =pi=1
ni(yi y)2 = 2[(
pi=1
z2i
) z2
] 22p1
SCEresidu =pi=1
nij=1
(yij yi)2 = 2pi=1
nij=1
(z2ij) z2i
22npMohammed El Haj [email protected] Analyse de la Variance Partie 1
-
IntroductionAnalyse de la Variance un facteur
Anova un facteur fixeAnova un facteur alatoire
Application de lquation fondamentale de lANOVA
? Ainsi, les variances relatives chaque terme sont
Variance totale :
S2totale =SCEtotalen 1 avec n =
pi=1
ni
Variance due au facteur A : qui est un estimateur sans biais de si H0 est vraie
S2facteur =SCEfacteur
p 1 Variance rsiduelle : qui est un estimateur sans biais de
quelque soit le modle
S2residu =SCEresidun p
Mohammed El Haj [email protected] Analyse de la Variance Partie 1
-
IntroductionAnalyse de la Variance un facteur
Anova un facteur fixeAnova un facteur alatoire
Application de lquation fondamentale de lANOVA
? La Loi de Fisher tant dfini comme le rapport de deux lois du 2
divise par leur degr de libert
Sous lhypothse H0, S2facteur
S2residusuit une loi de Fisher :
F =S2facteurS2residu
=SCEfacteur
p1SCEresidu
np=2p12np
F (p 1, n p)
? En pratique, on obtient une valeur du rapport S2facteur
S2residuquon
compare une loi de Fisher F , en se donnant un risque .
Si la valeur obtenue est trop grande, on en dduit que lerapport ne suit vraisemblablement pas une loi de Fisher F etque le facteur A a un effet.On conclut donc une diffrence des moyennes.
Mohammed El Haj [email protected] Analyse de la Variance Partie 1
-
IntroductionAnalyse de la Variance un facteur
Anova un facteur fixeAnova un facteur alatoire
Table de lANOVA
La table dANOVA permet de rsumer les calculs ncessaires :
Source de Somme des Degr de Variance F p-valuela variance carrs des carts libert
Inter-classes SCEfacteur DDLf S2f =
SCEfacteurDDLf
F =S2fS2r
PH0 (F > Fobs)
Intra-classes SCEresidu DDLr S2r =
SCEresiduDDLr
Total SCEtotal DDLtotal
Mohammed El Haj [email protected] Analyse de la Variance Partie 1
-
IntroductionAnalyse de la Variance un facteur
Anova un facteur fixeAnova un facteur alatoire
Exemple illustratif dANOVA un facteur
Pour illustrer la mise en oeuvre de lANOVA, considrons lexemple delleveur qui souhaite acheter de nouvelles vaches pour sa productionlaitire. Il possde trois races diffrentes de vaches et se pose donc laquestion de savoir si la race est importante pour son choix. Il possdecomme informations la race de chacune de ses btes (cest la variableexplicative discrte ou facteur) et leurs productions de lait journalires(cest la variable expliquer continue). Ces productions sont :
La race des vachesRace A Race B Race C20,1 22,6 31,219,8 24,1 31,621,3 23,8 31,020,7 22,5 32,1
23,4 31,424,522,9
Mohammed El Haj [email protected] Analyse de la Variance Partie 1
-
IntroductionAnalyse de la Variance un facteur
Anova un facteur fixeAnova un facteur alatoire
Exemple illustratif dANOVA un facteur
? Nous avons donc,
Race Taille Moyenne VarianceA 4 20,475 0,4425B 7 23,4 0,5933C 5 31,46 0,1780
Total 25,1875 32,1 20,8012
? La table dANOVA est la suivante :
Source de Somme des Degr de Variance F p-valuela variance carrs des carts libertInter-classes 307,918 2 153,959 357,44 < 0, 001Intra-classes 5,6 13 0,431
Total 313,518 15
Mohammed El Haj [email protected] Analyse de la Variance Partie 1
-
IntroductionAnalyse de la Variance un facteur
Anova un facteur fixeAnova un facteur alatoire
Mise en oeuvre dune ANOVA un facteur avec SPSS
? Pour illustrer la mise en oeuvre dune ANOVA avec SPSS, lesdonnes utilises correspondent une tude ralise sur 48 enfantset adolescents souffrant dun traumatisme suite un accidentdomestique ou un accident de circulation.
? Lobjet de cette tude est de mesurer leffet du traitementadministr (4 types de traitement) sur la gurison du traumatismeengendr par laccident.
? Le degr du traumatisme engendr par laccident est mesur enposant 10 questions sur les enfants victimes dun accident o, pourchaque question, ils doivent rpondre en suivant une chelle variantde 0 5. Plus le total des rponses sur les dix rponses est grand,plus le degr des troubles subis est important.
Mohammed El Haj [email protected] Analyse de la Variance Partie 1
-
IntroductionAnalyse de la Variance un facteur
Anova un facteur fixeAnova un facteur alatoire
Mise en oeuvre dune ANOVA un facteur avec SPSS
? Les informations observes sont les suivantes :
Genre : Genre de lenfant (1=fille, 2=garon). Accident : Type daccident (1=accident de la circulation,
2=autre type daccident). Traitement : Type de traitement (1=traitement1,
2=traitement2, 3=traitement3, 4=traitement4). Age : Age de lenfant au moment du laccident. Temps : Temps coul entre laccident et le dbut du
traitement (en mois). SveritAvant : Sverit du traumatisme avant le traitement. SveritAprs : Sverit du traumatisme aprs le traitement.
Mohammed El Haj [email protected] Analyse de la Variance Partie 1
-
IntroductionAnalyse de la Variance un facteur
Anova un facteur fixeAnova un facteur alatoire
Mise en oeuvre dune ANOVA un facteur avec SPSS
? Ainsi, afin de pouvoir mesurer leffet du traitement administr sur lasvrit, nous allons la variable :Amlioration = SveritAvant - SveritAprs
? Le test de leffet du type du traitement administr peut tre ralisavec une ANOVA un facteur effet fixe o "Amlioration" est lavariable dpendante et la variable "Traitement" est le facteur.
? On note que lors de la ralisation dune ANOVA, il faut toujoursvrifier au moins lhypothse de Normalit ainsi celle delHomoscdasticit pour la variable dpendante.
? Sous SPSS, la vrification de ces deux hypothses peut se faire enchoisissant :
Analyse| Statistiques descriptives|Explorer : Diagrammes
Mohammed El Haj [email protected] Analyse de la Variance Partie 1
-
IntroductionAnalyse de la Variance un facteur
Anova un facteur fixeAnova un facteur alatoire
Mise en oeuvre dune ANOVA un facteur avec SPSS
Hypothse de Normalit : test de Kolmogorov Smirnov
? Le test de conformit de Kolmogorov Smirnov est parmi les tests lesplus utiliss pour tester la normalit des donnes.
? Ce test se base sur la statistique
D = supx| Fs(x) FT (x) |
qui reprsente le plus grand cart entre la frquence observe Fs(x)et la frquence thorique FT (x) de la distribution Normale.
? La valeur observe de la statistique D est compare avec sa valeurthorique (quon trouve dans la table statistique relative lastatistique D de Kolomogorov).
On dcide que la distribution de la variable tudie ne suit pasune loi normale quand la valeur observe de D est suprieure sa valeur thorique.
Mohammed El Haj [email protected] Analyse de la Variance Partie 1
-
IntroductionAnalyse de la Variance un facteur
Anova un facteur fixeAnova un facteur alatoire
Mise en oeuvre dune ANOVA un facteur avec SPSS
Hypothse de Normalit : test de Kolmogorov Smirnov
Mohammed El Haj [email protected] Analyse de la Variance Partie 1
-
IntroductionAnalyse de la Variance un facteur
Anova un facteur fixeAnova un facteur alatoire
Mise en oeuvre dune ANOVA un facteur avec SPSS
Hypothse de Normalit : test de Kolmogorov Smirnov
Mohammed El Haj [email protected] Analyse de la Variance Partie 1
-
IntroductionAnalyse de la Variance un facteur
Anova un facteur fixeAnova un facteur alatoire
Mise en oeuvre dune ANOVA un facteur avec SPSS
Hypothse de Normalit : test de Kolmogorov Smirnov
Mohammed El Haj [email protected] Analyse de la Variance Partie 1
-
IntroductionAnalyse de la Variance un facteur
Anova un facteur fixeAnova un facteur alatoire
Mise en oeuvre dune ANOVA un facteur avec SPSS
Hypothse dHomoscdasticit : test de Levne
? Le test de Levne est parmi les tests les plus utiliss pour testerlhomoscdasticit travers la comparaison des variances dans les pchantillons relatives aux modalits du facteur A de lANOVA.
? Ce test consiste tester lhypothse
H0 : 21 = = 2i = = 2pcontre lhypothse alternative H1 : il existe 2i 6= 2j
? Sous SPSS, ce test peut tre ralis travers la caseDispersion/Niveau avec test de Levene
de la bote de dialogue obtenue partir deAnalyse| Statistiques descriptives|Explorer : Diagrammes
Mohammed El Haj [email protected] Analyse de la Variance Partie 1
-
IntroductionAnalyse de la Variance un facteur
Anova un facteur fixeAnova un facteur alatoire
Mise en oeuvre dune ANOVA un facteur avec SPSS
Hypothse dHomoscdasticit : test de Levne
Mohammed El Haj [email protected] Analyse de la Variance Partie 1
-
IntroductionAnalyse de la Variance un facteur
Anova un facteur fixeAnova un facteur alatoire
Mise en oeuvre dune ANOVA un facteur avec SPSS
Hypothse dHomoscdasticit : test de Levne
Mohammed El Haj [email protected] Analyse de la Variance Partie 1
-
IntroductionAnalyse de la Variance un facteur
Anova un facteur fixeAnova un facteur alatoire
Mise en oeuvre dune ANOVA un facteur avec SPSS
Hypothse dHomoscdasticit : test de Levne
Mohammed El Haj [email protected] Analyse de la Variance Partie 1
-
IntroductionAnalyse de la Variance un facteur
Anova un facteur fixeAnova un facteur alatoire
Mise en oeuvre dune ANOVA un facteur avec SPSS
Mohammed El Haj [email protected] Analyse de la Variance Partie 1
-
IntroductionAnalyse de la Variance un facteur
Anova un facteur fixeAnova un facteur alatoire
Mise en oeuvre dune ANOVA un facteur avec SPSS
Mohammed El Haj [email protected] Analyse de la Variance Partie 1
-
IntroductionAnalyse de la Variance un facteur
Anova un facteur fixeAnova un facteur alatoire
Mise en oeuvre dune ANOVA un facteur avec SPSS
Mohammed El Haj [email protected] Analyse de la Variance Partie 1
-
IntroductionAnalyse de la Variance un facteur
Anova un facteur fixeAnova un facteur alatoire
Mise en oeuvre dune ANOVA un facteur avec SPSS
Mohammed El Haj [email protected] Analyse de la Variance Partie 1
-
IntroductionAnalyse de la Variance un facteur
Anova un facteur fixeAnova un facteur alatoire
Les comparaisons multiples a posteriori (ou post hoc tests)
? Lanalyse de variance permet simplement de rpondre la questionde savoir sil y a des diffrences entre les moyennes, elle ne permetpas de dterminer o ces diffrences se situent.
? Or, lobjectif du chercheur est moins de savoir sil existe desdiffrences significatives que didentifier quelles diffrences le sonteffectivement et dans quelle direction.
Il est donc important de disposer dune procdure permettantde dissocier les diffrences rellement significatives de celles quine le sont pas.
? Cest pourquoi on effectue gnralement des comparaisons multiplesou des contrastes lorsquun facteur a plus de trois niveaux.
Mohammed El Haj [email protected] Analyse de la Variance Partie 1
-
IntroductionAnalyse de la Variance un facteur
Anova un facteur fixeAnova un facteur alatoire
Les comparaisons multiples a posteriori (ou post hoc tests)
? Les comparaisons multiples a posteriori consistent effectuer descomparaisons entre tous les groupes de sujets correspondant unfacteur. Par exemple, dans le cas dun facteur trois valeurs, il y atrois comparaisons qui sont faites.
? Toutefois, ces comparaisons sont effectues en contrlant le risquedeffectuer une erreur de premire espce = P (RH0 | H0 vrai),cest--dire de dclarer que des moyennes sont diffrentes alorsquen fait elles ne sont pas.
? On note que lerreur tend augmenter avec le nombre decomparaisons effectuer, si on garde le mme seuil pour chaquecomparaison. Effectivement, sil faut faire 3 comparaisons, on risque de se
"tromper" 3 fois, si on en fait 6, on risque de se "tromper" 6fois. Si par exemple, on prend un seuil de 0.01 dans le premiercas, lerreur risque dapprocher 0.03 dans le premier cas mais0.06 dans le second.
Mohammed El Haj [email protected] Analyse de la Variance Partie 1
-
IntroductionAnalyse de la Variance un facteur
Anova un facteur fixeAnova un facteur alatoire
Les comparaisons multiples a posteriori (ou post hoc tests)
? Les tests de comparaisons multiples a posteriori est unegnralisation k populations du test t de Student de comparaisonde moyennes de deux chantillons avec ajustement de lerreur.
? Pour maintenir lerreur de premire espce , les tests decomparaisons mutiples a posteriori renforcent lexigence du seuilchoisi pour chaque comparaison en fonction du nombre decomparaisons effectuer.
Sil y en a 6, ils pourraient par exemple exiger un seuil de0.05/6 alors que sil y en a deux, un seuil de 0.05/2 (ceci est lecas particulier du test de Bonferroni).
Par consquent, mesure que le nombre de comparaisonsaugmente, ces tests exigeront une diffrence plus importanteentre deux conditions pour dclarer que celle-ci estsignificative.
Mohammed El Haj [email protected] Analyse de la Variance Partie 1
-
IntroductionAnalyse de la Variance un facteur
Anova un facteur fixeAnova un facteur alatoire
Les comparaisons multiples a posteriori (ou post hoc tests)
? Il existe plusieurs tests de comparaisons multiples a posteriori. Deuxapproches sont considres :
modifier le risque de premire espce pour que le risque total(risque exprimental) demeure 0.05 : mthode deBonferroni.
adapter la statistique de test (plus conservateur) : mthodeHSD de Tukey.
? Parmi les tests de comparaison multiples a posteriori,
le plus conservateur est le test "Honestly SignificantDifference" (HSD) de Tukey : il contrle trs bien lerreur maisrisque de ne pas dtecter des diffrences significatives.
le plus tolrant est le "Least Significant Difference" (LSD) : cetest risque de dtecter des diffrences qui nexistent pas.
le test de Student Newman Keuls (SNK) est un compromisentre les deux prcdents.
Mohammed El Haj [email protected] Analyse de la Variance Partie 1
-
IntroductionAnalyse de la Variance un facteur
Anova un facteur fixeAnova un facteur alatoire
Les comparaisons multiples a posteriori (ou post hoc tests)
Exemple 1 : Test de Bonferroni
Objectif : Comparer deux deux toutes les moyennes possibles des pclasses.
1 Calculer le nombre de comparaisons : nc = p(p 1)/22 Erreur de premire espce globale : = 5% = 0, 05
3 Erreur pour chaque test : = 0, 05/nc
4 Hypothses : H0 : i = j contre H1 : i 6= j5 Statistique de test : tobs =
yiyjS2r
(1ni
+ 1nj
)6 Rgle de dcision : Accepter H0 si | tobs |< tnp,1/2
Mohammed El Haj [email protected] Analyse de la Variance Partie 1
-
IntroductionAnalyse de la Variance un facteur
Anova un facteur fixeAnova un facteur alatoire
Les comparaisons multiples a posteriori (ou post hoc tests)
Exemple 2 : Test de Student-Newman-Keuls
Objectif : Classer les traitements par classes qui sont significativementdiffrentes. La mthode est la suivante :
Etape 1 : Ordonner les moyennes et calculer toutes les diffrencesdeux deux entre moyennes.
Etape 2 : Calculer pour r = 2 p les diffrences minimumsignificatives Wr qui est une fonction de lcart yi yj avecr = i j + 1.Etape 3 : Dans le tableau des diffrences, rechercher toutes lesdiffrences significatives en fonction de leur distance r.
Etape 4 : Classer les traitements par groupes significativementdiffrents.
Mohammed El Haj [email protected] Analyse de la Variance Partie 1
-
IntroductionAnalyse de la Variance un facteur
Anova un facteur fixeAnova un facteur alatoire
Les comparaisons multiples a posteriori (ou post hoc tests)
Mise en oeuvre avec SPSS
Mohammed El Haj [email protected] Analyse de la Variance Partie 1
-
IntroductionAnalyse de la Variance un facteur
Anova un facteur fixeAnova un facteur alatoire
Les comparaisons multiples a posteriori (ou post hoc tests)
Mise en oeuvre avec SPSS
Mohammed El Haj [email protected] Analyse de la Variance Partie 1
-
IntroductionAnalyse de la Variance un facteur
Anova un facteur fixeAnova un facteur alatoire
Les comparaisons multiples a posteriori (ou post hoc tests)
Mise en oeuvre avec SPSS : Test de Bonferroni
Mohammed El Haj [email protected] Analyse de la Variance Partie 1
-
IntroductionAnalyse de la Variance un facteur
Anova un facteur fixeAnova un facteur alatoire
Les comparaisons multiples a posteriori (ou post hoc tests)
Mise en oeuvre avec SPSS : Test de SNK
Mohammed El Haj [email protected] Analyse de la Variance Partie 1
-
IntroductionAnalyse de la Variance un facteur
Anova un facteur fixeAnova un facteur alatoire
Les comparaisons multiples a posteriori (ou post hoc tests)
Mise en oeuvre avec SPSS : Test de Tukey
Mohammed El Haj [email protected] Analyse de la Variance Partie 1
-
IntroductionAnalyse de la Variance un facteur
Anova un facteur fixeAnova un facteur alatoire
Les comparaisons multiples a posteriori (ou post hoc tests)
Mise en oeuvre avec SPSS : Test LSD
Mohammed El Haj [email protected] Analyse de la Variance Partie 1
-
IntroductionAnalyse de la Variance un facteur
Anova un facteur fixeAnova un facteur alatoire
Les comparaisons multiples a posteriori (ou post hoc tests)
Mise en oeuvre avec SPSS : Test de Dunnett
Mohammed El Haj [email protected] Analyse de la Variance Partie 1
-
IntroductionAnalyse de la Variance un facteur
Anova un facteur fixeAnova un facteur alatoire
Mthode des contrastes
? Comme nous lavons vu, les tests de comparaisons multipleseffectuent TOUTES les comparaisons et maintiennent le risquedeffectuer une erreur de premire espce en dfinissant un seuil plusexigeant pour chaque comparaison.
? Une autre faon de maintenir ce risque est tout simplementdeffectuer moins de comparaisons. Cest la solution offerte par lescontrastes.
? Lun des intrts des contrastes rside dans le fait quils permettentsoit de comparer deux moyennes entre elles, soit de comparerplusieurs moyennes simultanment une autre.
Mohammed El Haj [email protected] Analyse de la Variance Partie 1
-
IntroductionAnalyse de la Variance un facteur
Anova un facteur fixeAnova un facteur alatoire
Mthode des contrastes
? Dans le cas dun facteur p valeurs, un contraste est dfini par
L =pi=1
cii avecpi=1
ci = 0
Exemples : L = 1 3, L = 1 + 2 3 4? Deux contrastes sont orthogonaux si le produit de leur coefficients
de contraste est nul.
On peut construire p 1 contrastes orthogonaux pour unfacteur q valeurs.
? Les contrastes sont des mthodes quon qualifie da priori car ilssont guids par des hypothses que lon a formules pralablement ltude elle-mme. On les dfinit donc sans avoir observ lesmoyennes et sur base uniquement de ses hypothses thoriques.
Mohammed El Haj [email protected] Analyse de la Variance Partie 1
-
IntroductionAnalyse de la Variance un facteur
Anova un facteur fixeAnova un facteur alatoire
Mthode des contrastes
? Cest pour cela, on opte pour les comparaisons multiples lorsquonna pas dhypothse(s) claire(s) quant aux diffrences que loncompte observer ou lorsque la configuration des rsultats va lencontre des hypothses.
? Lavantage des contrastes rside dans le fait quils sont pluspuissants que les comparaisons multiples : ils permettent donc plusfacilement de dtecter une diffrence.
? En revanche, ils prsentent le dsavantage dtre trs slectifs : onne peut effectuer que quelques contrastes alors que les comparaisonsmultiples impliquent tous les groupes. En effectuant des contrastes,on sinterdit donc de comparer certains groupes, bien que celapuisse tre intressant.
Mohammed El Haj [email protected] Analyse de la Variance Partie 1
-
IntroductionAnalyse de la Variance un facteur
Anova un facteur fixeAnova un facteur alatoire
Mthode des contrastes
Test dhypothses sur un contraste
Soit un contraste L = c11 + c22 + + cpp.1 Lhypothse nulle :H0 : L = c11 + c22 + + cpp = 0contre lhypothse alternativeH1 : L 6= 0
2 Statistique de test : Lobs = c1y1 + c2y2 + + cpyp
tobs =Lobs
S2r
(pi=1
a2ini
) sous H0
tnp
3 Rgle de dcision : Accepter H0 si | tobs |< tnp,1/2
Mohammed El Haj [email protected] Analyse de la Variance Partie 1
-
IntroductionAnalyse de la Variance un facteur
Anova un facteur fixeAnova un facteur alatoire
Mthode des contrastes
Mise en oeuvre avec SPSS
? Pour illustrer la mise en oeuvre de la mthode des contrastes avecSPSS, nous allons utiliser les donnes de ltude ralise sur 48enfants souffrant dun traumatisme suite un accident.
? On se place dans le cas o le medecin qui traite ces 48 enfants veuttester lutilisation de deux traitements la fois sur une mmepersonne et se demande sur la diffrence entre leffet dutiliser lestraitements 1 et 2 et celui dutiliser les traitements 3 et 4.
Pour cela, il peut faire recours lutilisation du contrasteL = 1 + 2 3 4 o le test dhypothses utilis estH0 : L = 1 + 2 3 4 = 0 contre H1 : L 6= 0
Mohammed El Haj [email protected] Analyse de la Variance Partie 1
-
IntroductionAnalyse de la Variance un facteur
Anova un facteur fixeAnova un facteur alatoire
Mthode des contrastes
Mise en oeuvre avec SPSS
Mohammed El Haj [email protected] Analyse de la Variance Partie 1
-
IntroductionAnalyse de la Variance un facteur
Anova un facteur fixeAnova un facteur alatoire
Mthode des contrastes
Mise en oeuvre avec SPSS
Mohammed El Haj [email protected] Analyse de la Variance Partie 1
-
IntroductionAnalyse de la Variance un facteur
Anova un facteur fixeAnova un facteur alatoire
Analyse de la Variance un facteur
alatoire
Mohammed El Haj [email protected] Analyse de la Variance Partie 1
-
IntroductionAnalyse de la Variance un facteur
Anova un facteur fixeAnova un facteur alatoire
Modle thorique
Nous avons vu que dans le cas dune analyse de la variance unfacteur fixe, le modle linaire correspondant est donn par
yij = i + ij = + i + ij
o
yij est la valeur observe pour le sujet j du groupe i. est la moyenne gnrale.i est linfluence du traitement Ai sur le groupe i(i = i ).ij est lerreur ou les rsidus qui suit la loi N(0, 2).
Sous ce modle, nous avons
yij N(i, 2)
Mohammed El Haj [email protected] Analyse de la Variance Partie 1
-
IntroductionAnalyse de la Variance un facteur
Anova un facteur fixeAnova un facteur alatoire
Modle thorique
Dans le cas dune analyse de la variance effet alatoire, lesmodalits du facteur sont elles-mmes alatoires et le modlelinaire correspondant devient :
yij = + i + ij
aveci N(0, 2) pour i = 1, . . . , p.ij N(0, 2) pour i = 1, . . . , p et j = 1, . . . , ni.i et ij sont indpendants pour i = 1, . . . , p et j = 1, . . . , ni.
Sous ce modle, nous avons
yij N(, 2 + 2)
On dit alors que 2 et 2 sont les composantes de la variance. Unepartie de la variabilit de Y est explique par la variabilit entre lestraitements (2), lautre par la variabilit rsiduelle (2).
Mohammed El Haj [email protected] Analyse de la Variance Partie 1
-
IntroductionAnalyse de la Variance un facteur
Anova un facteur fixeAnova un facteur alatoire
Test dhypothses
Dans lANOVA un facteur fixe, on considre lhypothse
H0 : 1 = 2 = = pCette hypothse na plus de sens dans le contexte dune ANOVA un facteur alatoire puisque les modalits sont elles-mmesalatoires.
On veut tester si le facteur influence la variabilit de Y . Le testdhypothses scrit donc
H0 : 2 = 0 contre H1 : 2 > 0
Bien que les deux scnarios soient trs diffrents lun de lautre, onutilise la mme rgle de dcision dans les deux cas, cest dire :
On rejette H0 si F =S2interS2intra
=SCEinterp1
SCEintranp
> Fp1,np,1
Mohammed El Haj [email protected] Analyse de la Variance Partie 1
-
IntroductionAnalyse de la Variance un facteur
Anova un facteur fixeAnova un facteur alatoire
Les statistiques et la rgle de dcision
En effet, nous avons
yij = + i + ij = yij N (, 2 + 2)
yi =1ni
nij=1
yij = + i +1ni
nij=1
ij = yi N(, 2 +
2
ni
)
y = +1n
pi=1
i+1n
pi=1
nij=1
ij = y N(,2
n+ 2
pi=1
n2in2
)
Mohammed El Haj [email protected] Analyse de la Variance Partie 1
-
IntroductionAnalyse de la Variance un facteur
Anova un facteur fixeAnova un facteur alatoire
Les statistiques et la rgle de dcision
Ainsi,
yij yi = ij 1ni
nij=1
ij
avec
ij N(0, 2
)et
1ni
nij=1
ij N(0,2
ni
)
Nous avons donc
SCEintra =pi=1
nij=1
(yij yi)2 =pi=1
nij=1
ij 1ni
nij=1
ij
2= 22np
Mohammed El Haj [email protected] Analyse de la Variance Partie 1
-
IntroductionAnalyse de la Variance un facteur
Anova un facteur fixeAnova un facteur alatoire
Les statistiques et la rgle de dcision
De plus, sous lhypothse
H0 : 2 = 0
nous avons
yi N(,2
ni
)et y N
(,2
n
)
Nous avons donc
SCEinter =pi=1
ni (yi y)2 = 22p1
Par consquent,
F =S2facteurS2residu
=SCEinterp1
SCEintranp
=2p12np
Fp1,np
Mohammed El Haj [email protected] Analyse de la Variance Partie 1
-
IntroductionAnalyse de la Variance un facteur
Anova un facteur fixeAnova un facteur alatoire
Remarques
1 La dmarche pratique est donc la mme que dans lanalyse unfacteur effets fixes.
2 Cependant, les comparaisons multiples, lorsque lhypothsealternative (H1) est accepte, nont plus de sens et ne doivent pastre effectues.
3 La normalit des rsidus ne peut plus tre teste.
4 En revanche, la normalit des Yij , quantits qui sont estimespar yij y, peut tre teste.
Mohammed El Haj [email protected] Analyse de la Variance Partie 1
Main TalkIntroductionAnalyse de la Variance un facteurAnova un facteur fixeAnova un facteur alatoire