LAnalyse de Variance 1 1.Généralités 2.Le modèle 3.Calculs pratiques 4.Conditions dapplication...

Post on 04-Apr-2015

105 views 1 download

Transcript of LAnalyse de Variance 1 1.Généralités 2.Le modèle 3.Calculs pratiques 4.Conditions dapplication...

L’Analyse de Variance 1

1. Généralités2. Le modèle3. Calculs pratiques4. Conditions d’application de l’ANOVA5. Mesure de la décomposition de la SCE

Le modèle linéaire simple

Projection : Y = a + bX1 + b2X2 +….+ ei X continue: régression linéaire simple X discrète: ANOVA Combinaisons: régression multiple, ANOVA2, ANCOVA

Les erreurs suivent une distribution : normale centrée de variance constante et sont indépendantes

L’Analyse de Variance 1

1. Généralités

Quand utiliser l’ANOVA

Pour tester l’effet d’une variable explicative discrète

variable explicative = facteur et chaque facteur a plusieurs niveaux ou traitements

l’ANOVA teste si toutes les moyennes sont égales

TémoinExpérimental (N)Expérimental (N+P)

Rendement

Fré

qu

en

ce

C N N+P

L’Analyse de Variance 1

1. Généralités

Possibilités et limites

Permet de tester si toutes les moyennes sont égales (au niveau )...

…mais si on rejette H0, l’ANOVA ne dit pas lesquelles

Rendement

Fré

qu

en

ce

C N N+P

Fré

qu

en

ce

C N

N+P

L’Analyse de Variance 1

1. Généralités

Types d’ANOVA

Fixe : les traitements sont déterminés (manipulés) par le chercheur

Aléatoires : les modalités sont choisies au hasard dans une population de modalités: on peut estimer l’effet du facteur pour d’autres modalités non étudiées

Données identiques, modèles différents, calculs identiques mais seulement pour l’ANOVA à un critère de classification!

L’Analyse de Variance 1

1. Généralités

ANOVA fixe : rendement agricole

sable argile terreau21 16 2320 18 3116 11 24

57 45 78 1803 3 3 9

19 15 26 20

ni

Ti.

y i.

= N

= T

L’Analyse de Variance 1

1. Généralités

ANOVA aléatoire: poids de l’ours noir

variable dépendante est le poids,

facteur (X) = site, p=3

Question = effet site, au-delà des sites étudiés

Po

ids

(kg

)120

160

200

240

280

RidingMountain

Kluane Algonquin

L’Analyse de Variance 1

1. Généralités

2. Le modèle

Les p moyennes sont-elles identiques?

Les modalités de A influencent-elles Y?

Y

A1 A2 A3 A4

Yij i eij

i

i

eij

eij

moyenne de Yeffet de la ième modalité (constante). Ho : i = 0erreur aléatoire

L’Analyse de Variance 1

Dans une ANOVA, la variance totale est répartie en deux composantes:

intergroupe: variance des moyennes des différents groupes (traitements)

intragroupe (erreur): variance des observations autour de la moyenne du groupe

2. Le modèle

L’Analyse de Variance 1

Répartition de la somme des carrés totale

Groupe 1Groupe 2Groupe 3

Y

SC Totale SC Modèle (Groupes) SC Erreur

L’Analyse de Variance 1

2. Le modèle

Ho : les p moyennes sont égalesHa : au moins une moyenne diffère des autres

Décomposition de la Somme des Carrés des Ecarts (SCE)

SCET = SCEA + SCER(=E)

= SCEinter + SCEintra

= SCEB + SCEW

(Yij Y ..j1

n i

i1

p

)2 (Y i. Y ..j1

n i

i1

p

)2 (Yij Y i.j1

n i

i1

p

)2

L’Analyse de Variance 1

2. Le modèle

Tableau d’ANOVA

Sources de variation

Somme des carrés

Carré moyen (CM)

Degré deliberté (ddl)

F

Totale

Résidus

n - 1

n - p

SCET/ddl

SCER/ddl

Facteur p - 1 SCEA/ddlCMA

CMR

i 1

k

ijj 1

n2(Y Y)

i

i ii

k

n Y Y( )

1

2

i 1

k

ij 1

n2(Y Yi)

i

j

L’Analyse de Variance 1

2. Le modèle

CMintergroupe mesure les différences moyennes au carré entre moyennes des groupes

CMrésiduel est une mesure de la précision

Rendement

Fre

qu

en

ce

C N N+P

Fre

qu

en

ce

C N

N+PF plus petit

F plus grand

L’Analyse de Variance 1

2. Le modèle

L’hypothèse nulle

H0: les moyennes de tous les groupes sont les mêmes, ou

H0: il n’y a pas d’effet des groupes, i =0 , ou

H0: F = CMintergroupe/ CMerreur = 1 pour p groupes et pour un

nombre d’observations N, on compare avec la distribution de F au niveau avec p - 1 et N - p degrés de liberté

Rendement

Fre

qu

en

ce

C N N+P

Fre

qu

en

ce

C N

N+PF plus petit

F plus grand

L’Analyse de Variance 1

2. Le modèle

SCET (Yij Y )2

ij

Yij2

ij

Y 2

ij

2 YijY ij

, or :

SCEA (Y i. Y )2

ij

ni(Y i. Y )2

i

Yij2

ij

NY 2 2Y Yij

ij

Yij

ij

NY

Yij2

ij

NY 2

L’Analyse de Variance 1

3. Calculs pratiques

22

N

TYSCE

ijijT

SCEA Ti.ni

2

i TN2

SCER SCET SCEA

Exemple

SCET 212 202 ....1802

9

sable argile terreau21 16 2320 18 3116 11 24

57 45 78 180

Ti.

SCEA 572

3452

3 ....

1802

9

= 264

= 186

L’Analyse de Variance 1

3. Calculs pratiques

L’Analyse de Variance 1

SV SCE ddl CM F

A 186 2 93 7,15

R 78 6 13

T 264 8

F6,0,052 5,14

Exemple

3. Calculs pratiques

eij aléatoires = indépendants et chaque ),0(: 2Neij

- indépendants : plan d’expérience :• modalités indépendantes• individus indépendants : pas de double mesure, tirage au hasard

- de moyenne nulle : par construction- de distribution normale : normalité de Y? étude graphique (TP)- de même variance : homoscédasticité

4. Conditions d’application de l’ANOVA

L’Analyse de Variance 1

Ces conditions s’appliquent aux résidus et non aux données brutes

…on doit tester les conditions d’application après que l’analyse soit faite et que les résidus soient obtenus

4. Conditions d’application de l’ANOVA

L’Analyse de Variance 1

5. Mesure de la décomposition de la SCE

Part de la variabilité de Y expliquée par l’ANOVA :

SCEA

SCET

2

2 inclue * SCET expliquée de façon linéaire : r2

* SCET expliquée de façon non linéaire : 2-r2

2 ≥ r2

02 1

L’Analyse de Variance 1

Part de la variabilité du rendement expliqué par le sol:

Exemple

2 186

2640,70

5. Mesure de la décomposition de la SCE

L’Analyse de Variance 1