Post on 06-Nov-2015
description
Ralis par : JABER YASSINE
EXERCICE (1) :
Le tableau suivant donne les rsultats dune tude transversale sur dix rgions ; les ventes (Y)
du produit sont mises en relation avec les dpenses (X1) de publicit-presse et les dpenses
(X2) de publicit sur les lieux de vente (PLV). Lunit est 103 DH,
Observation (i) Ventes (Y) Publicit-presse (X1) PLV (X2)
1 2 3 4 5 6 7 8 9
10
30 22 29 35 25 40 24 21 32 15
2 1 6 4 3 2 6 2 7 1
6 3 2 5 3 8 1 2 2 1
Le Modle: = 0+11+22+
1) Mettre le modle sous-forme matricielle ?
2) Estimer les paramtres du modle ?
3) Calculer les rsidus puis en dduire lestimation de la variance rsiduelle 2 ?
4) Estimer la matrice des variances-covariance des coefficients ?
5) Quel est lintervalle de confiance pour la variance de lerreur ?
6) Les variables explicatives sont-elles significativement contributives pour expliquer la
variable endogne au risque de 5% ?
7) Les coefficients 1 et 2 sont-ils respectivement significativement diffrents de 1 et -
0,5 ?
8) Dresser le tableau de lanalyse de la variance ?
9) Calculer 2 , et dduire le coefficient de corrlation multiple et le coefficient de
dtermination corrig, test la validit du modle ?
10) Calculer les prvisions pour les priodes 11 et 12, et son intervalle de 95% sachant que
1 11 = 2 ; 1 12=3 ; 2 11=4 ; 2 12 = 5
Solution :
1) Nous disposons de 10 observations et deux variables explicatives le modle peut donc
scrire comme suit :
12
10
=
1 11 211 12 221
110
210
12
+
1
15
Do
3020
15
=
1 2 61 1 31
1
1
12
+
12
10
Dimensions :
10;1 = (10;3)(3;1) + (10:1)
2) Estimation des paramtres
On sait que = 1
= 1 1 12 1 16 3 1
1 2 61 1 31
1
1
= 10 34 3334 160 9733 97 157
1 = 0,8248 0,1122 0,10406
0,1122 0,02525 0,0079800,10406 0,007980 0,02331
Calcul de
(10) (1,10) 10 (2,10) 10
= 273976
1019 =
9,652,153,13
3) Calcul de 2
On sait que :
2 =
=
2
On a : e = Y e = Y X
Do = + 11 + 2 2
= 9,65 2,151 3,132
On peut donner les valeurs de 1 jusqu 10 observation mais dune manire gnrale :
= Do = 7941 9,15 2,15 3,13 273976
1019
= 155,18
2 =
155,18
103 = 22,17
4) La matrice des variances-covariances :
= E ( )( ) avec = 1XU
= 2 1
Donc :
= 22,17 0,8248 0,1122 0,10406
0,1122 0,02525 0,0079800,10406 0,007980 0,02331
= 18,28 2,49 2,302,49 0,559 0,1772,30 0,177 0,517
= 18,28
1 = 0,559
2 = 0,517
= 4,27 1 = 0,75
2 = 0,72
5) Lintervalle de confiance de la variance de lerreur est donne par :
IC = P (1)
2
2
2 ;(1)
2
1
2
2 avec X : loi de KH-deux
Dans notre exemple au risque 5% est de :
IC = (1021)22,17
16,01;
(1021)22,17
1,69
IC = 9,70 91,83
Soit 9,70 2 91,83, la variance vraie (mais inconnue)
2 de lerreur 95% de chance de
se situer lintervalle.
6) Il convient de calculer les deux ratios de student et de les comparer la valeur lue dans
la table pour un seuil de 5%
On sait que
~ une loi de student a n 1 degr de libert
Les hypothses tester est suivant :
0: 1 = 01 1 0
Et 0: 2 = 01 2 0
Donc, sous 0
=
1
1 =
2,15
0,75 = 2,867
=
2
2 =
3,13
0,72 = 4,347
Daprs la table de student, 1
2 = 103
2 = 2,365
On constate que les deux t-statistiques est suprieure t-lu sur la table de student. On accepte
1 donc ; les variables publicit-presse et publicit sur les lieux de vente sont bien expliquer
la variable endogne qui est la consommation.
Nous aurions pu tout aussi bien rpondre cette question en calculant les intervalles de
confiance de chacun des coefficients :
On sait que
=
2 =
2
=
2 +
Do lintervalle de confiance est de :
P (
2 +
2 ) = 1
Pour 1:
On a: 1= 0,75
Daprs la table de student : 1
2 = 103
2 = 2,365
Don : IC = P (0,4205 1 3,8795) = 0,95
De mme pour 2 :
IC = P (1,47 2 4,79) = 0,95
Donc on constate que la valeur zro nappartient pas lintervalle de confiance 95% de 1
et 2 , donc ces deux coefficients sont significativement diffrents de zro.
7) La formulation des hypothses est la suivante :
0: 1 = 11 1 1
Et 0: 2 = 0,51 2 0,5
Pour 1 :
Sous 0 : =
11
1 =
2,151
0,75 = 1,53 < 2,365 = 7
0,05
On accepte 0, 1 nest pas significativement diffrent de 1.
Pour 2 : =
22
2 =
3,13(0,5)
0,72 = 5,04 > 2,365
On accepte 1, le coefficient de rgression 2 est significativement diffrent de 0,5 :
8) Le tableau de lanalyse de la variance est prsent comme suit :
Source de variance Sommes des carrs Degr de libert Carrs moyens
1 , 2 SCE= 332,92 2 166,46 Rsidu SCR= 155,18 7 22,17
Total SCT= 488,1 9
On a 2 = 155, 18 SCT= 488,1 SCR= SCT SCE = 332,92
9) Calcul du 2
2 =
= 1
=
332,92
488,1 = 0, 68
Le coefficient du corrlation est de : r = 0,82
Le coefficient de dtermination corrig : 2 = 1 1
1(12)
2 = 1 9
7(1 0,68) = 0,58
Teste de 2 :
Lhypothse est de : 0:
2 = 0
1 2 0
Calcule le teste de Fisher :
= ( )2/1
2/
= 2/1
(12)/ do =
0,68
(10,68) (
7
2) = 7,4375
Or, daprs la table de FISHER SNEDECOR, F lu avec un risque de 5% et de degr de libert
pour le numrateur = 2 et degr de libert pour le dnominateur = 7. 2;70,05
= 4,74
Puisque > 2;70,05
= 4,74 donc on accepte 1 la rgression est globalement
significative.
10) La prvision pour les deux priodes est calcule partir du modle estim :
11 = 9,65 + 2,15 2 + 3,13 4 = 26,47
12 = 9,65 + 2,15 3 + 3,13 5 = 31,75
La variance de lerreur de prvision est donne par :
+2 =
2(1+ + ()1+)
Soit 11 = 124 ; 12 =
135
On a
()1 = 0,8248 0,1122 0,10406
0,1122 0,02525 0,0079800,10406 0,007980 0,02331
Donc :
112 = 22,17 1 + (1 2 4)()1
124 17,94
122 = 22,17 1 + 1 3 5 ()1
135 14,08
Lintervalle de prvision est donne par :
+ = + 1
2 +
Donc pour un seuil de 95% :
11= 26,47 2,365 17,94 11 = 16,45; 36,48
12 = 31,75 2,365 14,08 12= 22,87; 40,62
EXERCICE (2) :
Sur n = 100 observations et pour trois sries (Y ; 1 2 ) nous avons les rsultats
suivants :
V(y) = 1000 ; ;12 = 0,75 ; 1;2
2 = 0,45 ; ;22 = 0,85 ; = 12
1) Nous avons effectu la rgression : = 101 6
Le coefficient de 1 est-il significativement diffrent de zro ?
2) La rgression de y sur 2 donne = 42 + 8 le coefficient de 2 est-il
significativement diffrent de zro ?
3) Calculer les coefficients du modles : y = 0 + 11 + 22 + et le coefficient de
corrlation multiple ?
4) Les coefficients 1 et 2 sont-ils significativement diffrents de zro ?
5) La rgression est-elle globalement significative ?
Solution :
1) Dtermination de lcart-type de coefficient :
On sait que, dans une rgression simple la variance du coefficient de rgression est donne
par :
12 =
2
(1 )2
Nous savons que dans le cadre de rgression simple, il ya galit entre corrlation simple et
corrlation multiple, soit :
;12 =
( ;1 )2
(1) =
1 ( )2
( )2 (1 )2 = 2 =
= 1
= 0,75
Or v(y) = ( )2
= ( )2 = n v(y) ( )2 = 100 1000 =100000
Donc 2 = 1
100000 = 0,75 SCR = 25000
2 =
25000
1002 = 255,1
Dtermination de la variance de 1 :
On a : = 1 ( )
(1 )2 = 10 et ;1
2 = 1 ( )
2
( )2 (1 )2 = 0,75
Do 1 ( ) = 10 (1 )2
On remplace dans ;12
0,75 = 102 (1 )
4
( )2 (1 )2 0,75 =
100 (1 )2
( )2
Do
100 (1 )2 = 0,75100000
(1 )2 = 750 et 1 ( ) = 10 750 = 7500
V (1) = 7,5 et cov (1 ; ) = 75
Donc
12 =
2
(1 )2 =
255,1
75 = 0,34 = 0,58
Teste :
=
10
0,58 = 17,24 > >30
0,05= 1,96
Do le coefficient de rgression de y sur 1 est significativement diffrent de zro au risque
de 5%.
2) De mme pour 2 :
SCR = (1 0,85)100000 = 15000 2 =
15000
98 = 153,06
Dtermination de la variance de 2 :
= 2 ( )
(2 )2 = 4 2 ( ) = 4 (2 )
2
On a ;22 =
2 ( )2
( )2 (2 )2 = 0, 85 (2 )
2 = 5312, 5
V 2 = 53,125 et Cov (y; 2) = 212,5
Donc :
22 =
153,06
5312,5 = 0,0288 = 0,17
Teste : sous 0
=
4
0,17 = 23,53 > 0,05= 1,96 donc, le coefficient de rgression de y sur 2 est
significativement diffrent de zro.
3) Estimation des paramtres du modle
= 0 + 11+ 22
Nous raisonnons sur les donnes centres, donc les paramtres estimer peut scrire en
fonction des matrices des variances-covariances
1 2
= 1 1; 2
1; 2 2 1
; 1
; 2
Dtermination 1; 2 :
On a: 122 =
cov 1;2 2
1 2 = 0, 45
1 2 2 = 0, 45 1
2 2 2
= 0, 45 750 5312, 5 = 1792968, 75
1 2 = 1339, 01
Cov 1; 2 = 1339,01
100 = 13, 39
Nous connaissons donc:
V 1 = 7,5 et Cov ; 1 = 75 et Cov 12 = 13,39 et Cov ; 2 = 212,5 et
V 2 = 53,125
Do
1 2
= 7,5 13,39
13,39 53,125 1
75
212,5
1 2
= 1
219,14
53,125 13,3913,39 7,5
75
212,5
1 2
= 5,1972,69
La constante est donn par 0 = 1 1 2 2
Or = 12 et 1 = 12+6
10 = 1,8 et 2 =
128
4 = 1
Donc 0 = 12 5,197 1,8 2,69 1 = 0,032
Le modle estimer est de : = 0,032 + 5,1971 + 2,692 +
Dtermination de coefficient de dtermination :
2 =
=
=
=
1
2 =
2
Donc 2 = 5,197 2,69
750021250
100000 = 0,96
4) Calcule des cart-types de chacun des coefficients :
On sait que = 2 1 =
2 1 1; 2
1; 2 2 1
Dtermination de la variance de lerreur :
2 =
2
or 2 = 1
= 0,96 (1 0,96)SCT = SCR
SCR = 4000
Donc 2 =
4000
1003 = 41,24
Do
= 41,42 7,5 13,39
13,39 53,125 1
= 41,42 0,2424 0,0611
0,0611 0,0342
Do
12 = 41,42 0,2424 = 10 1 = 3,16
22 = 41,42 0,0342 = 1,41 2= 1,18
Teste : sous 0
1 =
1
1 =
5,197
3,16 = 1,64 < 0,05 = 1,96
2 =
2
2 =
2,69
1,18 = 2,27 > 0,05 = 1,96
Le coefficient 1 nest pas significativement diffrent de zro donc la variable 1 nest pas
contributive lexplication de y, il convient donc de la retirer de ce modle et de procder
une nouvelle estimation.
Alors que le coefficient 2 est bien explicatif la variable endogne y
Pour la rgression en doit calculer F :
=
21
1 2 1
= 0,96
31
10,96 10021
= 1164 > 2;970,05
= 3,10
F-calculer est largement suprieure F lu sur la table FISHER-SNEDECOR
Donc la rgression est globalement significative.
EXERCICE 3 :
Soit le modle trois variables explicatives suivant :
= 0 + 11 + 22 + 33 +
Nous disposons des donnes du tableau :
t Y 1 2 3 1
2
3
4
5
6
7
8
9
10
11
12
13
14
12
14
10
16
14
19
21
19
21
16
19
21
25
21
2
1
3
6
7
8
8
5
5
8
4
9
12
7
45
43
43
47
42
41
32
33
41
38
32
31
25
29
121
132
154
145
129
156
132
147
128
163
161
172
174
180
1) Mettre le modle sous forme matricielle ?
2) Estimer les paramtres du modle ?
3) Calculer les rsidus puis en dduire lestimation de la variance rsiduelle 2 ?
4) Estimer la matrice des variances-covariances des coefficients ?
5) Tester, commenter et donner les probabilits critiques (p-valeur) des testes suivants au
risque de 5% :
0 0 = 01 0 0
0 1 = 01 1 0
0 2 = 01 2 0
0 3 = 01 3 0
6) Dresser le tableau de lanalyse de la variance ?
7) Calculer le 2 et le 2 corrig, effectuer le teste globale au risque de 5% ?
Solution :
1) Forme matricielle :
Nous disposons de 14 observations et trois variables explicatives, le modle peut donc scrire
comme suit :
Y = X + U
Donc en peut crire :
1
14
=
1 2 45
1 7 29
121
180
0123
+
1
14
Dimensions :
14;1 = 14;4 4;1 + 14;1
2) Estimation des paramtres :
Soit le modle sous forme matricielle, comme suit :
Y = X + U
Et daprs la Mthode des Moindres Carrs Ordinaires (MCO), qui consiste minimiser la
somme des carrs des erreurs.
Donc, on a : = 1
Dtermination de 1 et
=
1 12
45
121 180
1 2 45
1 7 29
121
180
=
14 85 53285
532631
31263126
131322094 13132 78683
20941313278683
317950
1 =
20,168 0,015 0,2310,015
0,2310,013
0,00110,0011
0,003630,076 0,00094 0,000575
0,0760,000940,0005750,000401
Calcul de :
=
1 12
45
121 180
12
21
=
24816229202
37592
Calcul de
=
20,168 0,015 0,2310,015
0,2310,013
0,00110,0011
0,003630,076 0,00094 0,000575
0,0760,000940,0005750,000401
24816229202
37592
=
32,8910,8019
0,38130,0371
Donc :
= 32,9 + 0,801 0, 382 0,0373 +
3) Calcul des rsidus et la variance rsiduelle :
On sait que : = = X
Do = 32,9 0,801 + 0, 382 + 0,0373
Par exemple pour 1 :
1 = 12 32,9 0,802 + 0, 3845 + 0,037121 = 0,84
Ainsi de suite jusqu 14 .
Mais dune manire gnrale :
= Y
Donc : = 4620 32,9 0,80 0,381 0,0371
24816229202
37592
= 67,45
Donc :
2 =
=
67,45
144 = 6,745
4) Matrice variance-covariance :
La matrice des variances-covariances est donne par :
= E ( )( ) = 2 1
Donc :
= 6,745
20,168 0,015 0,2310,015
0,2310,013
0,00110,0011
0,003630,076 0,00094 0,000575
0,0760,000940,0005750,000401
Les variances des coefficients de rgression se trouvent sur la premire diagonale :
02 = 6,745 20,168 = 136,04 0 = 11,66
12 = 6,745 0,0132 = 0,089 1 = 0,29
22 = 6,745 0,00363 = 0,0245 2 = 0,15
32 = 6,745 0,000401 = 0,0027 3 = 0,05
5) Les testes :
On sait que :
~ Une loi de student a n 1 degr de libert
Do le t-statistique est de : sous 0
0 =
0
0 =
32,8913
11,66 = 2,82
1 =
1
1 =
0,8019
0,29 = 2,765
2 =
2
2 =
0,38136
0,15 = 2,5424
3 =
3
3 =
0,03713
0,05 = 0,7426
Le 100,05
lu sur la table de student avec un risque de 5% et de degr de libert de 10 (14
4) est : 100,05
= 2,228
Rgle de dcision :
> On accepte 1
< On accepte 0
On voit bien que, 1 et 2 sont significativement diffrents de zro, cest--dire que les
variables 1 et 2 sont contributive lexplication de Y
Alors que, 3 et non significativement diffrent de zro, donc la variable 3 nest pas
contributive lexplication de Y, il convient donc de la retirer de ce modle et de procder
une nouvelle estimation.
Dtermination de p-valeur :
Dans notre cas, il sagit ici dun test bilatral, donc p-valeur est donne comme suit :
p-valeur = 2 1 ( <
= 2 1 ()
Par exemple pour 2
On sait que = 2,54
On trouve daprs la table de student que les valeurs encadrent = 2,54, avec un DDL de
10 sont : 2,228 et 2,764.
0,975.x ?.....................0,99
10 ..2,228 ..2,542,764
Donc en procde une interpolation linaire :
x = 0,975 + (0,99 0,975) 2,542,228
2,7642,228 = 0,9837
Donc p-valeur = 2 1 0,9837 = 3,24%
Rgle de dcision p-valeur < au risque On accepte 1
p-valeur > au risque On accepte 0
Donc, notre cas : p-valeur < au risque , 0,0324 < 0,05 acceptation de 1 . Donc si la mme
dcision par apport a la premire de t-statistique.
6) Tableau de lanalyse de la variance :
Source de variance Sommes des carrs Degr de libert Carrs moyens
1 , 2 , 3 SCE= 159,40 3 53,13 Rsidu SCR= 67,45 10 6,745
Total SCT= 226,85 13
7) Calculer le 2 et le 2 corrig, effectuer le teste globale au risque de 5% ?
2 =
= 1-
= 1 67,45
226,85 = 0,702 = 70,2%
2 = 1 1
1(1 - 2 )
= 1 141
1431 (1 0,702) = 61,3%
Test :
Pour tester le modle ou bien le coefficient de dtermination2, on utilise le test de FISHER
SNEDECOR not F.
=
21
(1 2)
=
1
= 0,702
(10,702)
10
3 = 7,85
Le F lu avec un risque de 5% et de degr de libert pour le numrateur = 3 et de DDL pour le
dnominateur = 10 est de = 3,71
On constate que > = 3,71. Donc on accepte1 , la rgression est globalement
significative.
Exercice 4 :
On examine lvolution dune variable en fonction de deux exognes 1 et 2 . on
dispose de n observations de ces variables. On note X = 1 1 2 ou 1 est le vecteur
constante et 1 et 2 sont les vecteurs des variables explicatives.
1) On obtenu les rsultats suivants :
= 25 0 0? 9,3 5,4? ? 12,7
1 = 0,04 0 0
0 0,1428 0,06070 0,0607 0,1046
(a) Donner les valeurs manquantes ?
(b) Que vaut n ?
2) La rgression de Y sur la constante et les deux exognes donne :
= -1,61 + 0,611 + 0, 462 ; SCR =0,3 = 73,48 et = -1,6
(a) Calculer la somme des carrs expliqus (SCE), la somme des carrs totale (SCT), le
2 et le 2 ajust ?
(b) Dduire la matrice variance-covariance, et tester la significativit individuelle de
chaque paramtre ainsi que leur significativit conjointe ?
Solution :
1)
On sait que =
1 2 1 1
2 12 2 21 2
2
On a 1 = 0 et 2 = 0 21 = 12 = 5,4 n = 25
2)
a) On sait que SCT = SCE + SCR
SCT = - n 2 = 73,48 25(1,6)2 = 9,48
Donc SCE = SCT SCR = 9,48 0,3 = 9,18
2 =
=
9,18
9,48 = 0,968
2 = 1- 1
(1 - 2 ) = 1 -
24
23 (1- 0,968) = 0,966
b) La matrice variance covariance :
= 2 ()1
On sait que la 2 =
=
0,3
22 = 0,01363
Donc = 0,01363 0,04 0 0
0 0,1428 0,06070 0,0607 0,1046
Les variances des coefficients de rgression se trouvent sur la diagonale :
02 = 0,01363 0,04 = 5.452 104 0 = 0,0233
12 = 0,01363 0,1428 = 1.946364 103 1 = 0,0441
22 = 0,01363 0,1046 = 1.425698 103 2 = 0,03778
Teste : sous 0
0 =
0
0 =
1,61
0,0233 = 69,09
1 =
1
1 =
0,61
0,0441 = 13,83
2 =
2
2 =
0,42
0,03778 = 11,116
Le 10,05
= 220,05
= 2,074 lu sur la table de STUDENT FISHER.
On constate que est largement suprieure au 22
0,05 = 2,074. Donc les variables exognes
sont contributive lexplication de Y.