LAnalyse de Covariance Modèle complet Le modèle dANCOVA Le modèle de la régression commune.

Post on 04-Apr-2015

113 views 0 download

Transcript of LAnalyse de Covariance Modèle complet Le modèle dANCOVA Le modèle de la régression commune.

L’Analyse de Covariance

Modèle completLe modèle d’ANCOVALe modèle de la régression commune

Modèles linéaires simples

Procédure Variable dépendante

Variable(s) independante(s)

Régression simple

1 continue 1 continue

ANOVA à un facteur

1 continue 1 discrète

ANOVA à facteurs multiples

1 continue 2 ou plus discrètes

ANCOVA 1 continue Au moins 1 discrète et au moins une 1 continue

Régression multiple

1 continue 2 ou plus continues

L’Analyse de Covariance

Utilisation de l’ANCOVA

Afin de comparer une relation entre une variable dépendante (Y) et une variable indépendante (X1) pour différents niveaux d’une variable discrète (X2)

ex: la relation entre le poids (Y) et la taille (X1) pour différents groupes taxonomiques (oiseaux et mammifères, X2)

Taille

Ma

ss

e

Taille

L’Analyse de Covariance

Lorsque l’on fait ces comparaisons, on suppose que les modèles sont qualitativement similaires pour tous les niveaux de la variable discrète...

…autrement ce serait comme comparer des pommes et des oranges!

X1

Y

Modèles qualitativement différents

Y

Modèles qualitativement similaires

L’Analyse de Covariance

Utilisation de l’ANCOVA

Le modèle de la régression simple

Le modèle de la régression:

toutes les régressions simples sont décrites par 2 paramètres: l’ordonnée à l’origine (a) et la pente (b)

Y a bX ei i i

X X

Y

b =YX(pente)

a(ordonnée à l’origine)

ei

Xi

Yi

ObservéesPrédites

L’Analyse de Covariance

X1

Ya diffèrentmêmeb

X1

Ya & b diffèrent

X1

Y

même a,mêmeb

X1

Y

même adifférents b

L’Analyse de Covariance

Ajustement au modèle

Commencer par un modèle d’ordre supérieur en incluant le plus de termes possible.

Ajuster un modèle réduit

Tester la signification du terme exclus

Modèle d’ordre supérieur

Modèle réduit

F

Terme exclus(p)

Terme inclus(p)

L’Analyse de Covariance

Le modèle complet

i est la pente de la régression de Y sur X1 estimée pour le niveau i de la variable discrète X2

i est la différence entre les moyennes de la variable discrète X2 pour chaque niveau i et la moyenne générale.

Le modèle complet

Y X Xij i i ij i ij ( )

L’Analyse de Covariance

Niveau 1 de la variable X2

Niveau 2 de la variable X2

Y1

Y2

X1 X2

1

1 j

X j1

X Xj1 1

2

1 2

Le modèle complet

Pour le modèle complet contenant 2 variables indépendantes, on a 3 hypothèses nulles:

0:

constante,:

, les pour tous 0:

03

02

01

i

i

i

H

H

iH

Niveau 1 de la variable X2

Niveau 2 de la variable X2

Y1

Y2

X1 X2

1

1 j

X j1

X Xj1 1

2

1 2

hypothèses nulles

L’Analyse de Covariance

H

H constante

H

i

i

i

01

02

03

0

0

: ,

:

:

,

H

H constante

H

i

i

i

01

02

03

0

0

: ,

:

:

,

H

H constante

H

i

i

i

01

02

03

0

0

: ,

:

:

, Y

Y

Y

L’Analyse de Covariance

Le modèle complet

Conditions d’application

Les résidus sont indépendants et distribués normalement

La variance des résidus est égale pour toutes les valeurs de X et indépendantes des valeurs de la variable discontinue (homoscedasticité)

pas d’erreur sur les variables indépendantes

L’Analyse de Covariance

Le modèle complet

Ajuster le modèle complet, tester la différence entre les pentes

Si H02 est rejetée, faire des régressions séparées pour chaque niveau de la variable catégorique

Si H02 est acceptée, ajuster le modèle d’ ANCOVA.

Niveau 1 de la variable X2

Niveau 2 de la variable X2

X1

Y

ANCOVARégressions

séparées

H02 acceptée H02 rejetéee

H i02: constante

L’Analyse de Covariance

Le modèle complet

Exemple

Q1: la pente de la régression de LFKL sur LAGE est la même pour les deux sexes?

1.0 1.1 1.2 1.3 1.4 1.5 1.6 1.7LAGE

1.5

1.6

1.7

1.8

LFK

L

1.0 1.1 1.2 1.3 1.4 1.5 1.6 1.7 1.8LAGE

1.5

1.6

1.7

1.8

1.9

LFK

L

Femelles

Mâles

age, sexe et longueur de l’esturgeon

L’Analyse de Covariance

Le modèle complet

SEX$*LAGE 0.000 1 0.000 0.337 0.563

Conclusion 1: la pente est la même pour les deux sexes (accepter H02 ) p(SEX$*LAGE) > 0.05

Q2: l’ordonnée à l’origine est-elle la même?

Exemple

L’Analyse de Covariance

Dep Var: LFKL N: 92 Multiple R: 0.835 Squared multiple R: 0.697

Analysis of Variance

Source Sum-of-Squares df Mean-Square F-ratio P

LAGE 0.143 1 0.143 176.650 0.000SEX$ 0.000 1 0.000 0.504 0.479

Error 0.071 88 0.001

Le modèle complet

Décomposition de la variation

TAij SCEryy )1()ˆ( 22

( ˆ y A B ˆ y A )2

( ˆ y AxB

ˆ y A B )2

(y ij ˆ y AxB

)2

( y ij y )2

(n-2)

(différence des ordonnées à l’origine)

Interaction A et B

(non parallélisme des droites)

Résidus autour des droites

Totale (n-1)

1

Effet facteur B/A

(var continue A)

Hors régression

Sources de variation

Modèle linéaire simple

SCE ddl

2)ˆ( yyA

(p-1)

(p-1)

(n-2p)

L’Analyse de Covariance

Le modèle complet

Le modèle:

est la pente de la régression de Y sur X1 regroupée pour tous les niveaux de la variable catégorique X2.

i est la différence entre la moyenne pour chaque niveau i et la moyenne générale

Y X Xij i ij i ij ( )

Y1

Y2

X1 X2

1

1 j

X j1

X Xj1 1

2

ˆ int ra ( (x ij x i)(y ij y i)

j

i

( (x ij x i)

2

j

i

L’Analyse de Covariance

Le modèle additif

Pour une ANCOVA avec 2 variables indépendantes, deux hypothèses nulles:

H pour tous les i

Hi

i

01

02

0

0

: ,

:

Niveau 1 de la variable X2

Niveau 2 de la variable X2

Y1

Y2

X1 X2

1

1 j

X j1

X Xj1 1

2

Le modèle additif

L’Analyse de Covariance

hypothèses nulles

H pour tous les i

Hi

i

01

02

0

0

: ,

:

H pour tous les i

Hi

i

01

02

0

0

: ,

:

Y

Y

Y

H pour tous les i

Hi

i

01

02

0

0

: ,

:

L’Analyse de Covariance

Le modèle additif

Conditions d’application du modèle additif

les résidus sont indépendants et distribués normalement

la variance des résidus est égale pour toutes les valeurs de X et indépendantes des valeurs de la variable catégorique (homoscedasticité)

les pentes des régressions de Y sur X sont les mêmes pour tous les niveaux de la variable catégorique (ce n’est pas une condition d’application du modèle complet!!)

L’Analyse de Covariance

Le modèle additif

Procédure

Niveau 1 de la variable X2

Niveau 2 de la variable X2

X1

Y

Régression commune

Régressionsséparées

H01 acceptée H01 rejetée

Ajuster le modèle d’ANCOVA, tester:

Si H01 est rejetée, séparer les régressions pour chaque niveau de la variable discontinue

Si H01 est acceptée, ajuster une régression commune.

0 :01 iH

L’Analyse de Covariance

Le modèle additif

Exemple

Conclusion 2: Ordonnée à l’origine est la même pour les deux sexes. H01 est acceptée. p(SEX$ > .05),

le meilleur modèle est la régression commune.la réduction du R2 est négligeable (.697 to .696).

L’Analyse de Covariance

Le modèle additif

LAGE 0.143 1 0.143 178.163 0.000

Dep Var: LFKL N: 92 Multiple R: 0.834 Squared multiple R: 0.696

Analysis of Variance

Source Sum-of-Squares df Mean-Square F-ratio P

SEX$ 0.001 1 0.001 1.851 0.177

Error 0.072 89 0.001

Le modèle à droites confondues

Le modèle:

est la pente de la régression de Y sur X1 , regroupée pour tous les niveaux de la variable discrète X2.

est la moyenne groupée de X1.

X

L’Analyse de Covariance

Niveau 1 de la variable X2

Niveau 2 de la variable X2

X

1 j

X j1

X Xj1

Y X Xij i ij i ij ( )

On a deux hypothèses nulles pour la régression commune:

H

H01

02

0: ,

: .

0

Le modèle à droites confondues

L’Analyse de Covariance

hypothèses nulles

Niveau 1 de la variable X2

Niveau 2 de la variable X2

X

1 j

X j1

X Xj1

1.211 0.031 0.0 . 39.191 0.000LAGE 0.336 0.024 0.830 1.000 14.144 0.000

Exemple

Le modèle à droites confondues

L’Analyse de Covariance

Dep Var: LFKL N: 92 Multiple R: 0.830 Squared multiple R: 0.690

Adjusted squared multiple R: 0.686 Standard error of estimate: 0.029 Effect Coefficient Std Error Std Coef Tolerance t P(2 Tail) CONSTANT

Conditions d’application du modèle à droites confondues

Les résidus sont indépendants et distribués normalement

la variance des résidus est égale pour toutes les valeurs de X et indépendantes des valeurs de la variable discrète (homoscédasticité)

Le modèle à droites confondues

L’Analyse de Covariance

Conclusion

Aller du modèle complexe au modèle simple

Donc choisir a priori les variables explicatives

L’Analyse de Covariance