Régression linéaire (STT-2400) Section 3 Distributions des formes quadratiques Version: 12...

12
Régression linéaire (STT- 2400) Section 3 Distributions des formes quadratiques Version: 12 février 2007

Transcript of Régression linéaire (STT-2400) Section 3 Distributions des formes quadratiques Version: 12...

Page 1: Régression linéaire (STT-2400) Section 3 Distributions des formes quadratiques Version: 12 février 2007.

Régression linéaire (STT-2400)

Section 3

Distributions des formes quadratiques

Version: 12 février 2007

Page 2: Régression linéaire (STT-2400) Section 3 Distributions des formes quadratiques Version: 12 février 2007.

STT-2400; Régression linéaire2

Introduction

L’objectif de cette section est de cerner les distributions de probabilité de quantités telle

De plus, on sera en mesure d’établir les distributions statistiques des différentes sommes de carrés dans la table d’ANOVA.

On va justifier la distribution F du test global dans la table d’ANOVA.

.1

ˆ 2

pn

RSS

Page 3: Régression linéaire (STT-2400) Section 3 Distributions des formes quadratiques Version: 12 février 2007.

STT-2400; Régression linéaire3

Remarque: hypothèse de normalité

Afin d’obtenir les distributions exactes on doit présumer:

Pour un vecteur aléatoire on considère sa norme:

La loi de la norme est telle que:

C’est un exemple de distribution khi-carrée centrée:

nN I0e

eXβy2,~

,

n

iin uN

1

22',~ uuuI0u

2

1

221

221

22

21

21 ~~,,~,~ n

n

iin uuuu

22222 ',~ nnN eeeI0e

Page 4: Régression linéaire (STT-2400) Section 3 Distributions des formes quadratiques Version: 12 février 2007.

STT-2400; Régression linéaire4

Distribution des estimateurs des moindres carrés

Considérons:

On a vu que l’estimateur des moindres carrés est:

nN I0e

eXβy2,~

,

yX'XX'β 1ˆ

12

1121

11

22

,~ˆ

,~ˆ

ˆ

,~,~

XX'ββ

XX'XX'XX'XβX'XX'β

X'XX'AyX'XX'β

AA'AXβAyIXβy

N

N

NN n

Page 5: Régression linéaire (STT-2400) Section 3 Distributions des formes quadratiques Version: 12 février 2007.

STT-2400; Régression linéaire5

Régions de confiance

Puisque la matrice X’X est symétrique, inversible et par conséquent définie positive, on peut écrire:

On rappelle que contient les valeurs propres de la matrice X’X.

CC'

PDP'PDP'

PDP'XX'

D0i

Page 6: Régression linéaire (STT-2400) Section 3 Distributions des formes quadratiques Version: 12 février 2007.

On rappelle: Ainsi:

Ceci implique que:

ICββC

IC'C'CCC'XX'C

C'XX'CCββC11

2

1

12

,~ˆ

,~ˆ

N

N

CC'XX'

21

221

2

21

221

2

21

21

~ˆ'ˆ~ˆ''ˆ

~ˆ'ˆ~ˆ

,~ˆ,~ˆ

pp

pp

pp NN

ββXX'ββββCCββ

ββCββCββC

I0ββCICββC

Page 7: Régression linéaire (STT-2400) Section 3 Distributions des formes quadratiques Version: 12 février 2007.

STT-2400; Régression linéaire7

Région de confiance quand la variance est connue

Considérons l’ensemble suivant:

L’ensemble précédent est appelé une région de confiance de niveau de confiance 1 –

En général il est difficile de représenter les régions de confiance graphiquement.

Les régions de confiance sont des ellipsoïdes.

.ˆ'ˆ 21,1

2 pββXX'βββ

Page 8: Régression linéaire (STT-2400) Section 3 Distributions des formes quadratiques Version: 12 février 2007.

STT-2400; Régression linéaire8

Définition: distribution chi-carrée décentrée

Définition: Soit un vecteur aléatoire

où le vecteur constant La loi de

est une chi-carrée à n degrés de liberté et paramètre de décentralité

On note

nnN Iθu ,~ '.,,, 21 n θ

n

iiu

1

22'uuu

n

ii

1

22' θθθ

θ'θu 22~ n

Page 9: Régression linéaire (STT-2400) Section 3 Distributions des formes quadratiques Version: 12 février 2007.

STT-2400; Régression linéaire9

Définition: distribution F de Fisher décentrée

Définition: Considérons U et V deux variables aléatoires indépendantes:

La loi de la variable aléatoire: est dite une loi de Fisher décentrée de degrés de liberté (m,n) et paramètre de décentralité .

On note

2

2

~

~

n

m

V

U

n

m

nV

mUF

n

m2

2

nmFF ,~

Page 10: Régression linéaire (STT-2400) Section 3 Distributions des formes quadratiques Version: 12 février 2007.

STT-2400; Régression linéaire10

Propriété 3.10

Soit . Soit A une matrice symétrique. Considérons la forme quadratique:

Alors nous avons le résultat suivant:

Dans un tel cas .

nnN Iθu ,~

Auu'Q

eidempotentest~2

222

AAθθ'Auu'

r

Q

Arangr

Page 11: Régression linéaire (STT-2400) Section 3 Distributions des formes quadratiques Version: 12 février 2007.

STT-2400; Régression linéaire11

Propriété 3.11: Indépendance entre deux formes quadratiques

Soit . Soient A1 et A2 deux matrices symétriques. Considérons les deux formes quadratiques suivantes:

On a alors le résultat suivant:

nnN Iθu ,~

uAu'QuAu'Q 2211 ,

0AA 21 tesindépendansontet 21 QQ

Page 12: Régression linéaire (STT-2400) Section 3 Distributions des formes quadratiques Version: 12 février 2007.

STT-2400; Régression linéaire12

Propriété 3.12: Théorème de Cochran

Soit . Considérons les p formes quadratiques suivantes:

où:

Le Théorème de Cochran affirme que

sont mutuellement indépendantes,

nnN Iθu ,~

uAu'uAu'uAu' ppQQQ ,,, 2211 npjjr IAAAA 21,rang

pQQQ ,,, 21

p

ijjjr

j rnQ

j1

22

2,~

θAθ' j