2w ANOVA Stas-ques CM2 ANCOVA MANOVA CM2 Sébas-en COUETTE Master 1 AGES SE GBS VVT ANOVA à 2...
Transcript of 2w ANOVA Stas-ques CM2 ANCOVA MANOVA CM2 Sébas-en COUETTE Master 1 AGES SE GBS VVT ANOVA à 2...
2wANOVAANCOVAMANOVA
Sta-s-quesCM2
Sébas-enCOUETTE
Master1AGES SE GBS VVT
ANOVAà2facteurs
Comparaison de 2 groupes (apparié ou non)
ANOVA Corrélation Régression
Paramétrique Test de Student (apparié ou non)
ANOVA paramétrique
Corrélation de Pearson
Régression
Non paramétrique
Test de Wilcoxon (apparié ou non)
ANOVA de Kruskall-Wallis
Corrélation de Spearman ou de Kendall
________
X
Y
+ TEST DE CHI-DEUX ou TEST DE FISHER pour Tables de contingences
ANOVAà2facteurs
Rappel:l’ANOVAà1facteur
Rappel:l’ANOVAà1facteur
ANOVAà2facteurs
Comparaison de 2 groupes (apparié ou non)
ANOVA Corrélation Régression
Paramétrique Test de Student (apparié ou non)
ANOVA paramétrique
Corrélation de Pearson
Régression
Non paramétrique
Test de Wilcoxon (apparié ou non)
ANOVA de Kruskall-Wallis
Corrélation de Spearman ou de Kendall
________
X Y
ANOVAà2facteurs
1varquan-/1varquali
1varquan-
2ou
plusvarq
uali ANOVAà2facteurs
ANOVAà2facteurs
ANOVAà2facteurs
ANOVAà2facteurs
Exemple:
Unvi-culteurchercheàaméliorersaproduc-on.Ilapplique4traitementsdifférentsà5desescépagesetregarde,sur2années,sonrendementmoyen.
-Premierfacteurà4modalités:traitement(αi)
-Deuxièmefacteurà5modalités:cépage(βj)
-Variablequan-ta-ve:rendementmoyen(Yijk)
ANOVAà2facteurs
Exemple:
cépageTraitement
ANOVAà2facteurs
ANOVAà2facteurs
Graphiquedesinterac-onstraitementsetcépages
Lerendementmoyenparcépagediffèrepartraitementetviceversa
ANOVAà2facteurs
TestdeShapirosurlesrésidus
Bartle`surlesrésidusparfacteur
4)N>30
ANOVAà2facteurs
ANOVAà2facteurs
ANOVAà2facteurs
ANOVAà2facteurs
Rendement
TraitementCépage
ANOVAà2facteurs
Icilesp-value<0,05donconaccepteH1.→Ainsilesfacteurscépageettraitementainsiqueleurinterac;onontuneffetsignifica-fsurlerendement.→L'effetdutraitementsurlerendementdiffèrelecépage,etviceversa.
ANCOVA
Modèles linéaires simples
Procédure Variable dépendante
Variable(s) independante(s)
Régression simple 1 continue 1 continue ANOVA à un facteur 1 continue 1 discrète ANOVA à facteurs multiples
1 continue 2 ou plus discrètes
ANCOVA 1 continue Au moins 1 discrète et au moins une 1 continue
Régression multiple 1 continue 2 ou plus continues
ANCOVA
Comparaison de 2 groupes (apparié ou non)
ANOVA Corrélation Régression
Paramétrique Test de Student (apparié ou non)
ANOVA paramétrique
Corrélation de Pearson
Régression
Non paramétrique
Test de Wilcoxon (apparié ou non)
ANOVA de Kruskall-Wallis
Corrélation de Spearman ou de Kendall
________
X Y
2varquan-
1varq
uali
ANCOVA
ANCOVA
Utilisation de l’ANCOVA
• Afin de comparer une relation entre une variable dépendante (Y) et une variable indépendante (X1) pour différents niveaux d’une variable discrète (X2)
• ex: la relation entre le poids (Y) et la taille (X1) pour différents groupes taxonomiques (oiseaux et mammifères, X2)
Taille
Mas
se
Taille
ANCOVA
• Lorsque l’on fait ces comparaisons, on suppose que les modèles sont qualitativement similaires pour tous les niveaux de la variable discrète...
• …autrement ce serait comme comparer des pommes et des oranges!
X1
Y Modèles qualitativement différents
Y Modèles qualitativement similaires
Utilisation de l’ANCOVA
ANCOVA
Le modèle de la régression simple
• Le modèle de la régression:
• toutes les régressions simples sont décrites par 2 paramètres: l’ordonnée à l’origine (a) et la pente (b)
Y a bX ei i i= + +
X ΔX
ΔY
b = ΔY/ΔX (pente)
a(ordonnée
à l’origine)
ei
Xi
Yi
Observées Prédites
ANCOVA
X1
Y a diffèrent même b
X1
Y a & b diffèrent
X1
Y même a, même b
X1
Y même a,différents b
ANCOVA
• Le modèle complet
• βi est la pente de la régression de Y sur X1 estimée pour le niveau i de la variable discrète X2
• αi est la différence entre les moyennes de la variable discrète X2 pour chaque niveau i et la moyenne générale.
Le modèle complet
Y X Xij i i ij i ij= + + − +µ α β ε( )
Niveau 1 de la variable X2 Niveau 2 de la variable X2
µ
Y1
Y2
X1 X 2
α1
ε1 j
X j1
X Xj1 1−
α 2
β1 β 2
ANCOVA
Le modèle complet
• Pour le modèle complet contenant 2 variables indépendantes, on a 3 hypothèses nulles:
0:constante,:
, les pour tous 0:
03
02
01
==
=
=
ββ
β
α
i
i
i
HH
iH
Niveau 1 de la variable X2 Niveau 2 de la variable X2
µ
Y1
Y2
X1 X 2
α1
ε1 j
X j1
X Xj1 1−
α 2
β1 β 2hypothèses nulles
ANCOVA
HH constanteH
i
i
i
01
02
03
0
0
: ,::
α
β
β β
=
=
= =
,
HH constanteH
i
i
i
01
02
03
0
0
: ,::
α
β
β β
=
=
= =
,
HH constanteH
i
i
i
01
02
03
0
0
: ,::
α
β
β β
=
=
= =
, Y
Y
Y
Le modèle complet
ANCOVA
Conditions d’application
• Les résidus sont indépendants et distribués normalement
• La variance des résidus est égale pour toutes les valeurs de X et indépendantes des valeurs de la variable discontinue (homoscedasticité)
• pas d’erreur sur les variables indépendantes
Le modèle complet
ANCOVA
• Ajuster le modèle complet, tester la différence entre les pentes
• Si H02 est rejetée, faire des régressions séparées pour chaque niveau de la variable catégorique
• Si H02 est acceptée, ajuster le modèle d’ ANCOVA.
Niveau 1 de la variable X2 Niveau 2 de la variable X2
X1
Y
ANCOVA Régressions
séparées
H02 acceptée H02 rejetéee
H i02:β = constante
Le modèle complet
ANCOVA
Exemple
• Q1: la pente de la régression de LFKL sur LAGE est la même pour les deux sexes?
1.0 1.1 1.2 1.3 1.4 1.5 1.6 1.7LAGE
1.5
1.6
1.7
1.8
LFKL
1.0 1.1 1.2 1.3 1.4 1.5 1.6 1.7 1.8LAGE
1.5
1.6
1.7
1.8
1.9
LFKL
Femelles
Mâles
age, sexe et longueur de l’esturgeon
Le modèle complet
ANCOVA
SEX$*LAGE 0.000 1 0.000 0.337 0.563
Conclusion 1: la pente est la même pour les deux sexes (accepter H02 ) p(SEX$*LAGE) > 0.05
Q2: l’ordonnée à l’origine est-elle la même?
Exemple Dep Var: LFKL N: 92 Multiple R: 0.835 Squared multiple R: 0.697
Analysis of Variance
Source Sum-of-Squares df Mean-Square F-ratio P
LAGE 0.143 1 0.143 176.650 0.000SEX$ 0.000 1 0.000 0.504 0.479
Error 0.071 88 0.001
Le modèle complet
ANCOVA
• Le modèle:
• β est la pente de la régression de Y sur X1 regroupée pour tous les niveaux de la variable catégorique X2.
• αi est la différence entre la moyenne pour chaque niveau i et la moyenne générale
Y X Xij i ij i ij= + + − +µ α β ε( )µ
Y1
Y2
X1 X 2
α1
ε1 j
X j1
X Xj1 1−
α 2
β
€
Ù β int ra =
( (xij − x i)(yij − y i)j∑
i∑
( (xij − x i)2
j∑
i∑
Le modèle additif
ANCOVA
¡ PouruneANCOVAavec2variablesindépendantes,deuxhypothèsesnulles:
H pour tous les iH
i
i
01
02
00
: ,: α
β β
=
= =
Niveau 1 de la variable X2 Niveau 2 de la variable X2
µ
Y1
Y2
X1 X 2
α1
ε1 j
X j1
X Xj1 1−
α 2
β
Le modèle additif
hypothèses nulles
ANCOVA
H pour tous les iH
i
i
01
02
00
: ,: α
β β
=
= =
H pour tous les iH
i
i
01
02
00
: ,: α
β β
=
= =
Y
Y
Y
H pour tous les iH
i
i
01
02
00
: ,: α
β β
=
= =
Le modèle additif
ANCOVA
Conditions d’application du modèle additif
• les résidus sont indépendants et distribués normalement
• la variance des résidus est égale pour toutes les valeurs de X et indépendantes des valeurs de la variable catégorique (homoscedasticité)
• les pentes des régressions de Y sur X sont les mêmes pour tous les niveaux de la variable catégorique (ce n’est pas une condition d’application du modèle complet!!)
Le modèle additif
ANCOVA
Procédure
Niveau 1 de la variable X2 Niveau 2 de la variable X2
X1
Y
Régression commune
Régressions séparées
H01 acceptée H01 rejetée
¡ Ajusterlemodèled’ANCOVA,tester:
¡ SiH01estrejetée,séparerlesrégressionspourchaqueniveaudelavariablediscon-nue
¡ SiH01estacceptée,ajusterunerégressioncommune.
0 :01 =iH α
Le modèle additif
ANCOVA
Exemple
Conclusion 2: Ordonnée à l’origine est la même pour les deux sexes. H01 est acceptée. p(SEX$ > .05),
le meilleur modèle est la régression commune. la réduction du R2 est négligeable (.697 to .696).
Le modèle additif
LAGE 0.143 1 0.143 178.163 0.000
Dep Var: LFKL N: 92 Multiple R: 0.834 Squared multiple R: 0.696 Analysis of Variance
Source Sum-of-Squares df Mean-Square F-ratio P
SEX$ 0.001 1 0.001 1.851 0.177
Error 0.072 89 0.001
ANCOVA
Le modèle à droites confondues
¡ Lemodèle:
¡ βestlapentedelarégressiondeYsurX1,regroupéepourtouslesniveauxdelavariablediscrèteX2.
¡ estlamoyennegroupéedeX1.X
Niveau 1 de la variable X2 Niveau 2 de la variable X2
α
X
ε1 j
X j1
X Xj1 −
βµ Y X Xij i ij i ij= + + − +µ α β ε( )
ANCOVA
¡ Onadeuxhypothèsesnullespourlarégressioncommune:
HH01
02
0: ,: .α
β
=
= 0
Le modèle à droites confondues
hypothèses nulles
Niveau 1 de la variable X2 Niveau 2 de la variable X2
α
X
ε1 j
X j1
X Xj1 −
βµ
ANCOVA
1.211 0.031 0.0 . 39.191 0.000LAGE 0.336 0.024 0.830 1.000 14.144 0.000
Exemple
Le modèle à droites confondues
Dep Var: LFKL N: 92 Multiple R: 0.830 Squared multiple R: 0.690
Adjusted squared multiple R: 0.686 Standard error of estimate: 0.029 Effect Coefficient Std Error Std Coef Tolerance t P(2 Tail) CONSTANT
ANCOVA
Conditions d’application du modèle à droites confondues
• Les résidus sont indépendants et distribués normalement
• la variance des résidus est égale pour toutes les valeurs de X et indépendantes des valeurs de la variable discrète (homoscédasticité)
Le modèle à droites confondues
ANCOVA
Conclusion
• Aller du modèle complexe au modèle simple
• Donc choisir a priori les variables explicatives
ANCOVA
MANOVA
Comparaison de 2 groupes (apparié ou non)
ANOVA Corrélation Régression
Paramétrique Test de Student (apparié ou non)
ANOVA paramétrique
Corrélation de Pearson
Régression
Non paramétrique
Test de Wilcoxon (apparié ou non)
ANOVA de Kruskall-Wallis
Corrélation de Spearman ou de Kendall
________
X Y
Plusieursvariablesindépendantes
Plusieursv
ariablesdép
endantes
MANOVA
MANOVA
Sur le principe, une MANOVA est une ANOVA a plusieurs variables dépendantes
MANOVA
Variableindépendante
Varia
bledé
pend
ante
2groupes
Sur le principe, une MANOVA est une ANOVA a plusieurs variables dépendantes
MANOVA
Variableindépendante
Varia
bledé
pend
ante
2groupes
Avantage de la MANOVA, contrôler l’erreur de type I Un des protocole possible, tester l’effet « groupe » sur l’ensemble des VD. Si l’effet est significatif, examiner les variables ANOVA par ANOVA
MANOVA
Exemple: Variables mesurées sur des poissons provenant de sites différents. Les variables sont elles conjointement affectées par le fait d’appartenir a l’un ou l’autre site.
MANOVA
Sur le principe, une MANOVA est une ANOVA a plusieurs variables dépendantes
MANOVA
Variableindépendante
Varia
blesdép
endantes
Pasdedifférencesignifica-ve
Sur le principe, une MANOVA est une ANOVA a plusieurs variables dépendantes
MANOVA
Variableindépendante
Varia
blesdép
endantes
Effetsignifica-f
Sur le principe, une MANOVA est une ANOVA a plusieurs variables dépendantes
MANOVA
Variableindépendante
Varia
blesdép
endantes
Effetsignifica-fVecteurdesmoyennes
MANOVA
Pré-requis de la MANOVA: Très similaires à ceux de l’ANOVA - Normalité multivariée - Homogénéité des matrices de covariances (test M de Box) - Indépendance des observations - Linéarité Relation linéaire entre les variables dépendantes
MANOVA
Limitation des MANOVA: - Outliers Comme pour l’ANOVA les observations extrêmes affectent beaucoup le modèle - Multicolinéarité et singularité Une grande corrélation entre les variables dépendantes impliquent de la redondance
MANOVA
Décomposition de la variance On cherche une difference multivariée entre les groupes. Cela signifie que les vecteurs des moyennes de variables sont differents selon les groupes. La décomposition de la variance s’ecrit: T = W + B
Sommedescarrésetcarréscroisésintragroupe
Sommedescarrésetcarréscroisésintergroupe
Sommedescarrésetcarréscroiséstotaux
MANOVA
Décomposition de la variance De cette décomposition de la variance on en tire la statistique λ λ = W = W
T
λ suis une distribution connue aux degrés de liberté choisis. On a donc une valeur de λ seuil et un λ observé. On tombe dans la logique d’un test.
W + B
(m1<-manova(cbind(y1,y2)~group,manova.data))Call:manova(cbind(y1,y2)~group,manova.data)Terms:groupResidualsresp161.8666714.80000resp219.059.20Df29Residualstandarderror:1.2823591.01105Es-matedeffectsmaybeunbalanced>summary(m1,test="Wilks")DfWilksapproxFnumDfdenDfPr(>F)group20.08979.35754160.0004271Residuals9
MANOVA
1varquan-2ou
plusvarq
uali
ANOVAà2facteurs
Plusieursvariablesindépendantes
Plusieursv
ariablesdép
endantes
MANOVA
2varquan-
1varq
uali ANCOVA