Cours Econométrie S6 polycopié à mettre sur Site-2013

39
UNIVERSITE HASSAN II Aïn Chock FACULTE DES SCIENCES JURIDIQUES ECONOMIQUES ET SOCIALES CASABLANCA INTRODUCTION AUX METHODES ECONOMETRIQUES (LES FONDEMENTS DE BASE DE L’ÉCONOMÉTRIE) Compléments du cours De Mr Fouzi Mourji Filière : Economie et Gestion Semestre 6 Année Universitaire 2012/2013 1

description

l:!;,;!,!;,!:;,

Transcript of Cours Econométrie S6 polycopié à mettre sur Site-2013

Page 1: Cours Econométrie S6 polycopié à mettre sur Site-2013

UNIVERSITE HASSAN II Aïn Chock FACULTE DES SCIENCES JURIDIQUES ECONOMIQUES ET

SOCIALESCASABLANCA

INTRODUCTION AUX METHODES ECONOMETRIQUES

(LES FONDEMENTS DE BASE DE L’ÉCONOMÉTRIE)

Compléments du coursDe

Mr Fouzi Mourji

Filière : Economie et Gestion

Semestre 6

Année Universitaire 2012/2013

Ensembles 1 et 2 1

Page 2: Cours Econométrie S6 polycopié à mettre sur Site-2013

AVERTISSEMENT

Ce polycopié a été établi à partir de notes prises au cours du professeur Monsieur Fouzi Mourji durant une année universitaire antérieure et a été actualisé depuis. Il a été préparé par les étudiants Mounia Bettah, Cisse Alassane et Makhlouk Rachid.

Il est conseillé de suivre les séances de cours pour procéder aux corrections à apporter à ces notes et pour les compléter grâce aux exemples donnés et aux explications détaillées. Les exemples permettront de mieux saisir les concepts exposés, l’économétrie étant par nature, une discipline d’application.

D’autres points sont traités dans le cours et ne sont pas abordés dans ce polycopié1. Il s’agit notamment des rappels sur les indices, des rappels de statistique descriptive et des méthodes de spécifications.

Bonne chance à toutes et à tous et bon travail, pour acquérir non seulement un diplôme, mais surtout des connaissances et un savoir-faire, déterminants pour votre insertion professionnelle.

1 Des annexes complètent le cours et sont également mis sur le site des de partage entre les étudiants des ensembles 1 et 2.

2

Page 3: Cours Econométrie S6 polycopié à mettre sur Site-2013

PLAN DU POLYCOPIE

Le cœur du cours d’introduction aux méthodes économétriques est constitué de deux chapitres : le 1er porte sur le modèle linéaire de régression simple et le 2nd sur la régression multiple. Nous y développons les méthodes basiques d’estimation des paramètres d’un modèle et les propriétés des estimateurs et introduisons également les techniques de validation des modèles.

Mais pour bien comprendre l’intérêt de cet apprentissage, nous présentons dans une annexe 1, les concepts de modèles et en particulier les modèles de politique économique. Nous montrons que les modèles que nous allons apprendre à construire dans ce cours, constituent des outils d’aide à la décision, que ce soit au niveau microéconomique ou macroéconomique.

Dans l’annexe 2, nous effectuons des rappels statistiques indispensables, nous y expliquons qu’avant tout travail de modélisation, il importe de procéder à des traitements préalables sur les séries statistiques ; en l’occurrence il importe de passer des séries en dirhams courants à des séries en dirhams constants.

L’annexe III comporte un certain nombre d’exercices complémentaires. Il s’agit d’exemples d’application, pour bien comprendre les techniques exposées dans le cours.

Notez que les éléments contenus dans ces trois annexes font partie intégrante du cours ; nous y ferons référence explicitement et les développerons en temps opportun au cours des différentes séances.

INTRODUCTION : Voir les séances de cours avec les définitions de base et la démarche en économétrie et l’annexe I qui traite de la typologie des modèles.

Chapitre I - Le MODELE LINEAIRE DE REGRESSION SIMPLE SECTION I – Présentation et hypothèses de base SECTION II –L’Estimation des paramètres et étude de leurs propriétés (cf. le cours et l’annexe II pour les traitements préalables sur les séries statistiques)SECTION III : Introduction à la validation des modèles

CHAPITRE II : MODELE LINEAIRE DE REGRESSION MULTIPLE

SECTION I I – Présentation SECTION II – Hypothèses dans le M.R.MSECTION III – Détermination et propriétés des estimateurs SECTION IV – Tests dans le Modèle Linéaire de Régression Multiple 

3

Page 4: Cours Econométrie S6 polycopié à mettre sur Site-2013

CHAPITRE I.   Le MODELE LINEAIRE DE REGRESSION SIMPLE (MLRS) :

INTRODUCTION Définition :Du point de vue étymologique, le terme « économétrie », comporte à la fois le terme « économie » (en tant que science) et le terme « mesure». Elle applique les méthodes statistiques aux données empiriques issues de l’observation de faits économiques, pour expliquer et prévoir l’évolution des variables. En reprenant Malinvaud (1970) : « l’économétrie utilise l’outil mathématique et l’induction statistique, pour vérifier des théories économiques ». L’objet de l’économétrie est donc de confronter une explication théorique à un ensemble de données. Ces données peuvent être : i) temporelles), ii) en coupe transversale (données d’enquêtes) ou iii) de panel etc...). Voir les exemples dans le cours. L'économétrie vise à quantifier les relations entre grandeurs économiques dont la théorie ou l’expérience affirme l'existence. Elle permet de connaître le sens et l’intensité des liens entre variables. ( Ex: voir le cours)L’économétrie permet de construire des modèles de prévision ou d’analyse / d’aide à la décision. Les principales phases de la modélisation en économétrie sont au nombre de quatre le schéma suivant  les résume:

Dans le cours, nous répondons à deux questions principales au niveau de chaque phase :1- En quoi elle consiste ?2- Comment y procéder ?

On souligne que le sens des « flèches » n’est pas unique dans la mesure où le travail de l’économétrie est un travail itératif.Cf. l’annexe I sur la typologie des modèles

SECTION I – Présentation et hypothèses de base

I - PRESENTATION GENERALE du MLRS:

Soit Y : variable endogène (variable à expliquer)X : variable exogène (variable explicative)

 : Variable aléatoire appelée résidu, elle est une mesure de l’ignorance.On dispose de “n” observations sur Y et X (i=1,2,…,n). Nous avons donc “n” couples ( ) qui sont des réalisations des variables Y et X.a et b sont des paramètres réels et inconnus que l’on se propose d’estimer à l’aide des observations

.Exemples : voir les développements du cours

4

Spécification Estimation Validation Utilisation

Page 5: Cours Econométrie S6 polycopié à mettre sur Site-2013

II. HYPOTHESES « CLASSIQUES » POUR LE MLRS :

Hypothèse 1 : Le modèle est correctement spécifié. Il y a une mauvaise spécification lorsqu’on effectue un mauvais choix des variables, la forme de la liaison entre la variable endogène et la variable exogène n’est pas correctement établie ou bien la définition des variables ( Niveau, Variation, Indice,…etc.) ne correspond pas au problème traité.Autrement dit, il faut que la variable explicative retenue soit la « meilleure » sans omission d’autres variables, la vraie relation soit une relation linéaire dans ou par rapport aux paramètres à estimer et enfin la variable aléatoire intervienne de manière additive.

Remarque : Une mauvaise spécification peut aussi provenir des tautologies.Expliquer les recettes touristiques en prenant le nombre des touristes comme variable explicative est une tautologie.

Exemple : Consommation des produits laitiers :

1ère étape :  : consommation de produits laitiers du ménages i dans l’agglomération du type j

 : revenu du ménage i dans l’agglomération de type j

vraie pour i = 1 et pour j= 1,2 ,3.

j=1 commune de taille <10000 habitants.j=2 10000 < taille <100000 habitants.j=3 +de 100000 habitants.

2ème étape : Meilleure prise en compte de l’urbanisation : écriture d’un modèle pour chaque type d’agglomération.

Remarque :Généralement, la régression par le Logarithme présente deux avantages. Elle permet de rendre linéaire une relation non linéaire. Elle fait aussi apparaître les coefficients de la droite de régression comme des coefficients d’élasticité.

Hypothèse 2  : Les et sont des grandeurs numériques observées sans erreur.Y est une variable aléatoire par l’introduction de .

Ce qui importe est que l’espérance athématique de soit nulle ou la même pour tout i. Cette hypothèse est une hypothèse de permanence structurelle.

La prise en considération de cette hypothèse de permanence structurelle rend compte de l’élimination de l’effet des fluctuations dans le cas d’un modèle estimé sur séries chronologiques.Dans le cadre d’un modèle estimé sur données individuelles, cette hypothèse rend compte de la représentativité de la population étudiée ainsi que de la stabilité des ‘‘comportements’’.La permanence structurelle doit être prise en considération dans le temps et dans l’espace.

5

Page 6: Cours Econométrie S6 polycopié à mettre sur Site-2013

Hypothèse 3   : L’homoscédasticité  

est distribuée selon une loi de probabilité indépendante de “i” et de .

Quantité finie

Hypothèse 3 reprend l’hypothèse 2 mais elle est plus forte . Si H3 n’est pas réalisée, on parle d’hétéroscédasticité.

Hypothèse 4 :   Hypothèse d’indépendance des erreurs (ou résidus) 

On suppose que le et les erreurs relatives à 2 observations différentes sont indépendantes entre elles c’est-à-dire

Plus tard, on utilisera le test de DURBIN & WASTON pour savoir s’il faut ou non refuser l’hypothèse 4.

Hypothèse 5  : Hypothèse de normalité   :

On suppose que les sont distribuées selon une loi normale.

Hypothèse 6  : Cette Hypothèse concerne la variable exogène 

Lorsque n tend vers l’infini, la suite des Xi est telle que

Cette hypothèse est utile pour l’étude des propriétés des estimateurs de a et b. sont des

estimateurs convergents.

Hypothèse 7  : On ne dispose d’aucune information (restriction) sur les paramètres a et b à estimer.

Ils peuvent prendre n’importe quelle valeur réelle positive, négative ou nulle.Avant la clôture de cette partie réservée aux hypothèses classiques pour les M.R.S on met en exergue un concepts important :

- la variabilité : « On n’étudie pas la variabilité d’un phénomène qui ne présente pas de variation ». Autrement dit, il importe que Σ (Yi - Y) soit différent de zéro. Pour des raisons identiques, il faut que

soit différente de 0.

Exemples : 1) La quantité consommée de sel n’est pas significativement différente d’un ménage à l’autre.

6

Page 7: Cours Econométrie S6 polycopié à mettre sur Site-2013

2) L’investissement en période t ( ) d’une entreprise est fonction du taux d’intérêt ( ) du profit de la

période t-1 ( ) et du taux de l’impôt sur la société ( )

Le taux de l’IS ne change pas significativement d’une année à l’autre.

SECTION II – L’Estimation des paramètres et Etude de leurs propriétés

I Détermination â et par les MOINDRES CARRES ORDINAIRES : (M.C.O)

Il s’agit de déterminer â et qui minimisent l’expression

Soit lorsqu’on remplace par sa formule.

Cela revient à minimiser la fonction F ( )=

(donc on minimise E = )

(1)

(2)

(1)

(2)

Ces deux dérivées sont nulles en â et donc on aura :

L’équation ( 2) donne :

En divisant le tout par n on aura :

on aura donc

On remplace par sa valeur dans l’équation (1) et on obtient :

7

Page 8: Cours Econométrie S6 polycopié à mettre sur Site-2013

D’où

En rappelant que ( ),de même que

on a :

Remarque   : â est une variable aléatoire puisque fonction de Yi elle même aléatoire. Idem pour .

Il faut ajouter les conditions de second ordre pour que F( ) soit minimale en â et .

NB : cf. l’annexe II sur les traitements préalables sur les séries statistiques

II- ETUDE DES PROPRIETES DE â ET  :

1°) Calcul de E (â) :

= - ( )

= ( ) - ( )

=

d’où

comme , on aura donc :

8

Page 9: Cours Econométrie S6 polycopié à mettre sur Site-2013

d’où

Comme , on aura donc :

E (â) = a

â est donc un estimateur sans biais de a

2°) Calcul de E ( )   :

On sait que

or et

donc

soit

d’où

or

Donc .

est un estimateur sans biais de b.

3°) Moment de 2 ème ordre de â et  :

a- Variance de â   :

Nous savons que

car et

9

Page 10: Cours Econométrie S6 polycopié à mettre sur Site-2013

donc

Comme

Quantité finie.

Car avec

et

b) Variance de :

Calculons ( -b)

On sait que :

Donc

On rappelle que

10

Page 11: Cours Econométrie S6 polycopié à mettre sur Site-2013

Donc

Comme les quantités V(â) et sont connues :

Il reste à déterminer pour connaître .

On sait que :

Donc :

Remarques   :

En vertu de l’hypothèse 6, X tend vers une valeur finie quand n tend vers l’infini.

tend vers 0 quand n tend vers l’infini.

Idem pour . Donc est un estimateur convergent

Si l’hypothèse d’indépendance des résidus n’est pas satisfaite (H 4 non satisfaite), la formule de V(â)

11

Page 12: Cours Econométrie S6 polycopié à mettre sur Site-2013

sous-estime celle-ci (donc surestime le T de Student pouvant nous amener à conclure hâtivement que

la variable explicative Xi est satisfaisante).« Le lecteur constate qu’il est faux de dire, comme on le fait souvent, que l’estimateur par les moindres carres suppose une distribution normale des aléas . En fait, la normalité des aléas est nécessaire seulement pour la justification de certains tests associés à la méthode des moindres carrés et non pour des formules des estimations.

III DETERMINATION D’UN ESTIMATEUR SANS BIAIS DE

est en général inconnue. Il est nécessaire de l’estimer pour avoir les variances estimées de â

et .

Soit le résidu de l’estimation tel que :

diffère de pour les termes qui dépendent des résidus de l’estimation.

Comme (converge en probabilité vers a) et alors la distribution des

converge en probabilité vers celle du et la valeur estimateur de la variance

des résidus.

n  : le nombre d’observation.n-2 : le nombre de degré de liberté.2  : le nombre des paramètres ( a et b).

SECTION III : Introduction à la validation des modèles

I – Le COEFFICIENT DE DETERMINATION 

Le principe de validation d’un modèle consiste à s’interroger sur l’égalité de

et

On dit que le modèle reproduit bien la réalité si , la différence s’explique par d’autres variables (X).

On ne peut pas dire qu’une variable ( ) explique un modèle, mais la variation de ( ) explique la variation de Y.

Rappel :

12

Page 13: Cours Econométrie S6 polycopié à mettre sur Site-2013

Revenons aux observés :

(3) avec

Divisons les 2 membres par n et rappelons que

On remarque ainsi que variance empirique des Yi est égale à la somme de la variance empirique des

et de la variance empirique des .

La variance empirique de est souvent appelée variance expliquée par la relation linéaire. Celle des

est la variance résiduelle.Il semble alors naturel de mesurer la qualité de la liaison linéaire par le rapport de la variance empirique

des iY

à celle des . Ce rapport sera noté .

Exemple : si l’on obtient =0.78 cela voudrait dire que le modèle permet d’expliquer 78% de la variabilité de Y.

est appelé coefficient de détermination (carré du coefficient de corrélation).On souligne que la logique du carré du coefficient de corrélation ( ) étudié en statistique descriptive n’est pas la même ici du fait qu’il y a ‘‘l’hypothèse de causalité’’ entre X et Y.Ce sont les X qui ont des effets de causalité sur Y. On mesure donc la qualité de l’approximation par le

modèle Y = ax + b, en évaluant la proximité entre Y et

La logique du R 2 en économétrie fait la différence entre la trajectoire de et celle de .

En divisant les termes de l’égalité (3) par  :

Nous verrons plus en détail dans la section 2 la signification et l’interprétation du . mesure la

qualité de la liaison entre les observées et les estimés ou calculés par le modèle.

13

Page 14: Cours Econométrie S6 polycopié à mettre sur Site-2013

II BREVE PRESENTATION DES TESTS DANS LE M.R.S. :1°) Enoncé du problème :Deux types de problème :

1er type :

Faut-il refuser l’hypothèse a=k ?

Pour k = 0, situation la plus fréquente : elle permet de tester la pertinence de la variable,2 réponses possibles :*il faut refuser a=0*il ne faut pas refuser a=0*Les hypothèses classiques sont nécessaires à la construction des tests et à la possibilité de répondre à la question posée.

2ème type : 1er modèle :

2ème modèle : *Faut-il refuser a1 = a2 ?*Faut-il refuser b1 = b2 ?*Faut-il refuser simultanément a1 = a2 et b1 = b2 ?

Remarques : On cherche toujours à tester a = k et pas â=k, cependant on utilise â pour la commodité des calculs du fait que ‘‘a’’ est inconnu. L’Intérêt de tester a=0 est pour savoir la pertinence de la variable X et sa capacité à expliquer Y. Cependant, on peut être amener à tester ‘‘a’’ par rapport à une quantité donnée différente de zéro.Exemple : soit le modèle suivant :

cours de l’action d’une entreprise.  : Dividende.  : L’investissement de cette entreprise.

 : L’indice générale de la bourse.

Ici, on cherchera pas forcément à tester , et par rapport à zéro mais par rapport à une autre quantité donnée.

2°)Construction du test   :

1 er étape   : Ecriture du test   :

On suppose que . Cela a des conséquences sur .

Nous avons sous les hypothèses et en appliquant les M.C.O :

Donc si , on aura :

On ne peut pas construire l’intervalle de confiance car est inconnue. On recourt à une « astuce » statistique. On cherche une variable aléatoire T telle que :

* T soit fonction de â * T suit une loi de probabilité connue

14

Page 15: Cours Econométrie S6 polycopié à mettre sur Site-2013

On va retenir :

Le numérateur est une variable normale centrée et réduite. Le dénominateur est une variable de Khi-Deux divisée par son nombre de d.d.I (n-2). Test donc par définition une variable de STUDENT à (n-2) d.d.I.

Dès lors, l’intervalle de confiance pour s’écrit :

Sous

Soit :

2 ème étape   : Solution du test   : Deux cas possibles

* appartient à l’intervalle non rejet de .

* n’appartient pas à cet intervalle, on rejette .

Remarque et exemple   : Soit le modèle Y = aX + b, expliquant la consommation Y, par le revenu X. On suppose qu’il a été estimé sur 26 ans.

4 6 a =4 et b =6

(0.6) (0.8) (..) écarts-types estimés des estimateurst tY X

P { - tα < T < tα }= 0,95 ; s’écrit dans notre cas :

P { - tα < 4/0,6 < tα }= 0,95 (dans la table, pour n = 26, t ≈ 2,0 (voir p 26)

Donc P { - 2 x 0,6 < 4 < 2 x 0,6 }= 0,95 ou encore { - 1,2 < 4 <1,2 }= 0,95 sous H0

“4” n’appartient pas à l’intervalle, on rejette l’hypothèse H0 qui accordait à cet évènement, une très faible probabilité (0,05). Donc on rejette l’hypothèse de nullité de a. On peut donc dire que le revenu X explique bien la consommation Y.

Souvent, on effectue une approximation : elle consiste à rapporter l’estimateur à son écart-type estimé. Si ce rapport est supérieur à 2, on rejette . S’il est inférieur à 2, on ne rejette pas .

Sous H 0 T = â / σ = 4 / 0,6 = 4,66 > 2

15

Page 16: Cours Econométrie S6 polycopié à mettre sur Site-2013

CHAPITRE II : MODELE LINEAIRE DE REGRESSION MULTIPLE (M.R.M)

Section I- PRESENTATION 

Les modèles linéaires sont fiables à court et moyen terme car le domaine de variation des variables est dans ce cas relativement restreint. La fiabilité de ces modèles (modèles linéaires)

sera plus ou moins réduite dans le temps et ce en fonction de la rapidité avec laquelle les variables prises en compte subissent des transformations.Les M.R.M. sont du type :

(1)

 : Variable endogène, aléatoire à cause de l’introduction de .

Sont les observations à chaque période t des variables exogènes

Est la partie déterministe ou systématique ou explicative du modèle.Ut est la partie aléatoire du modèle.

A partir des coefficients estimés et en utilisant les différents tests, on peut apprécier parmi les

variables du vecteur X celles qui sont les plus significatives.

Remarque   : Des hypothèses sont nécessaires pour justifier l’utilisation au MCO

Section II- HYPOTHESES DANS LE M.R.M :

Hypothèse 1   : Cf section 1 paragraphe II.

Hypothèse 2   : Les et les sont des grandeurs numériques observées sans erreur. quelque soient .

Hypothèse 3 : Hypothèse d’homoscédasticité est distribuée selon une loi indépendante de t et des , pour t=1,…n et i = 1,....p

est une quantité finie.

Hypothèse 4   : Indépendance des erreurs  

Hypothèse 5   : La loi de distribution de l’aléa est une loi gaussienne de moyenne nulle et l’écart-type fini.

Hypothèse 6   : Hypothèse sur les variables exogènes:

Absence de colinéarité des variables et E (vecteur unité).

Soit le modèle suivant : où est l’investissement public, est le taux d’intérêt,

la variation du PIB et enfin la variation de la consommation.

16

Page 17: Cours Econométrie S6 polycopié à mettre sur Site-2013

Ici, on a une forte colinéarité entre et dans la mesure où .

On souligne l’importance de la statistique descriptive où l’étude de la covariance des variables deux à deux est un outil pertinent pour soulever ce problème.

X(n,p) est de rang p (avec n>p) cela veut dire que existe.Avec n : ligne, p : colonne.

Cette hypothèse est utile pour l’étude des propriétés de .

Quand n tend vers l’infini, reste non singulière.

Hypothèse 7 : On n’introduit pas de restriction sur les estimateurs. Ils peuvent être positifs, négatifs ou nuls. RECAPITULONS   :

* pour tout t permet d’introduire une constante dans le M.R.M . L’exclusion d’une constante

dans un MLRM donne souvent un incorrect.

*Les p vecteurs et E ne sont pas colinéaires.

Ces vecteurs forment une variété linéaire non dégénérée à p dimensions dans qu’on appellera plan de régression.

La matrice pour t variant de 1 à n est de rang p.

*Ecriture matricielle :s’écrit pour chaque t et pour t = 1…n (2)Enfin, on aura :

(3)

D’où (4)

Avec

Section III - DETERMINATION ET PROPRIETES DES ESTIMATEURS 

1°) calcul de â par les M.C.O   :

La méthode consiste à chercher les paramètres tels que :

soit minimum.

Revenons à (4), le vecteur des écarts est orthogonal au plan de régression. Les équations normales

s’écrivent alors :

Elles expriment l’orthogonalité de û et des p vecteurs lignes et

17

Page 18: Cours Econométrie S6 polycopié à mettre sur Site-2013

Ces équations peuvent s’écrire :

En tenant compte de (4), on aura :

2°) Propriétés de â   :

Nous allons démontrer que par les MCO, â est l’estimateur efficace dans l’ensemble des estimateurs linéaires et sans biais de a. â sera dit BLUE (Best linear unbiased estimators)

Calcul de  :

or Donc

*Calcul de  :

Or où

donc

18

Page 19: Cours Econométrie S6 polycopié à mettre sur Site-2013

Le seul terme aléatoire dans l’expression de est UU’

donc :

on rappelle H3

Enfin

d’où (6)

On montre qu’une condition nécessaire et suffisante pour que â soit un estimateur convergent de a est que les vecteurs variables exogènes ne tendent pas à être colinéaires quand n tend vers l’infini.Autrement dit H6 reste valable quand n tend vers l’infini.

3°) â est BLUE

â est efficace dans la classe des estimateurs de a sans biais et linéaires en Y. Ce théorème de Gauss Markov justifie l’utilisation des M.C.O pour effectuer une estimation.

1- on va définir un estimateur linéaire sans biais de a et à variance minimale

2- on va montrer que est en fait équivalent à â.

Démonstration 1- soit a*un estimateur de a linéaire en Y

matrice quelconque a* doit être sans biais

a* ne sera sans biais que si L.X=0

Matrice des variances co-variances de a*

Or

or

donc

19

Page 20: Cours Econométrie S6 polycopié à mettre sur Site-2013

Remplaçons â par sa valeur

donc

enfin

On rappelle que  

d’où

Comme car a* est sans biaisAlors et

d’où

et finalement,sauf si , est une matrice semi-définie positive en d’autres termes

.

â est un estimateur convergent.

On montre la convergence de â en moyenne quadratique et cela implique sa convergence en probabilité.

Rappel   :

Soit une suite ordonnée de variables aléatoires

La variable aléatoire converge en moyenne quadratique vers le nombre certain si tend

vers et si tend vers 0 lorsque n tend vers l’infini.

Si a est une matrice symétrique et X est un vecteur de dimension n, l’expression qui est un scalaire est dite forme quadratique en X, si quelque soit  ; la forme quadratique et sa matrice sont dites semi définies positives.Pour que soit définie positive, la condition nécessaire et suffisante est que ses valeurs propres h i

soient toutes strictement positives.

Remarques   : La taille de l’échantillon n’intervient pas dans le calcul de â donc de Lorsque

n tend vers l’infini (1° condition)

Or

or

tend vers quand n tend vers l’infini ( quantité finie)

tend vers 0 quand n tend vers l’infini

Donc tend vers 0 quand n tend vers l’infini

20

Page 21: Cours Econométrie S6 polycopié à mettre sur Site-2013

4°) Détermination de estimateur de

1-Expression de  :

On sait que

(7)

d’ou

(8)

avec M est de format n.n signifie que M est une matrice symétrique

On dit que A est idempotente si or de M est idempotente

2-Expression de

d’après (8)

soit l’élément de la matrice M situé à l’intersection de la ligne i et de la colonne j

et

car on a quelque soit i et

3-Trace de M   :

or

donc

on avait

21

Page 22: Cours Econométrie S6 polycopié à mettre sur Site-2013

et

enfin

est un estimateur sans biais de p est le nombre de paramètres à estimern est le nombre d’observations

SECTION IV : TESTS DANS LE MODELE LINEAIRE DE REGRESSION MULTIPLE

Pour apprécier ou valider un modèle, on dispose d’indicateurs fournis par l’économétrie. Ils permettent de juger la qualité du modèle dans son ensemble, des paramètres obtenus par la régression et de chacune des variables explicatives retenues. Ils permettent également de tester certaines hypothèses économiques.

I . LE COEFFICIENT DE DETERMINATION

1°) Formulation :

Soit un modèle simple M1 de la forme : Soit un modèle plus sophistiqué de la forme :M 2 :

Pour M1 rend compte de la réalité avec une incertitude mesurée par ou

. Si l’on considère l’ensemble des observations on aura cela revient à considérer la

variation totale du phénomène Y.Pour M2 : on a pour une observation donnée

.

L’imprécision ou l’incertitude au niveau de M2 sera mesurée par

Il s’agit ici de distinguer entre les deus modèles M1 et M2Le coefficient de détermination d’un modèle représente le carré du coefficient de corrélation multiple R ; il mesure la qualité de l’ajustement des par la méthode des M.C.O. appliquée sur M2. Ici, il mesure le gain relatif de précision quand on utilise M2 au lieu de M1

2°) Interprétation :

22

Page 23: Cours Econométrie S6 polycopié à mettre sur Site-2013

Au numérateur est l’imprécision de M1 (la variance totale)

la mesure de l’imprécision de M2 (variance résiduelle). Plus cette dernière sera élevée,

plus elle se rapproche de la variance totale, d’où l’inutilité d’adopter M2 plutôt que M1 On remarque que 0<R<1.

Comme alors si R2 est proche de 1, cela signifie que R est encore plus proche de 1.

Remarque : R2 proche de 1 n’est pas une preuve de causalité. De même proche de 0 ne signifie pas absence de lien entre la variable expliquée et les variables explicatives, mais peut être la forme de liaison n’est pas adaptée.Bref, il faut être prudent durant l’interprétation de tout résultat.

II- Tests d’hypothèses dans le M.R.M / évaluation de la performances des variables exogènes :

A partir de (1), nous avons établi :

de même si on prend , on aura

(2)

et (3) avec

Sous l’hypothèse de normalité de la distribution des U (aléas)

On déduit que , , et suivent des lois normales dont on peut déterminer les paramètres.

1°) Test de l’hypothèse  :

a- Construction de test   :

Dire que , c’est dire que toutes les variables retenues ne sont pas explicatives donc si est vérifiée c’est-à-dire si , on peut écrire :

et

suit une loi khi-deux (n-p)

Si suit la loi khi-deux p. Ces deux khi-deux sont indépendants en probabilité. Or, on sait que

le rapport de 2 khi-deux est un F de FISHER. Donc, pour établir le test de , on construit la variable F qui suit une loi de Fisher.

tend vers un d.d.l

.b- Solution du Test   :

23

Page 24: Cours Econométrie S6 polycopié à mettre sur Site-2013

On compare le F théorique càd le F lu sur la table de distribution de Fisher et le F calculé à partir de nos observations

2 cas peuvent se présenter :* F calculé > F théorique ; on rejette . Cela veut dire que les variables retenues sont explicatives.

* F calculé < F théorique ; non rejet de .

Exemple   : Soit un modèle à 5 variables exogènes ( y compris la constante) et on suppose qu’il a été estimé sur 25 observations. Supposons enfin que le résultat obtenu est :

La valeur lue sur la table du F de Fisher pour 5 et 20 d.d.lEt 2,71 au seuil de 5% et 4,10 au seuil de 1%Nous allons rejeter au seuil de 5% ( car 3>2,71) mais on ne pourra pas la rejeter au seuil de 1% ( car 3<4,10)..

Remarque   : Ce qui importe, c’est de tester la portée explicative l’influence des « vraies variables exogènes » . Ce qu’il faut tester c’est la nullité du vecteur formé par les (p-1) premières composantes de a. On a toujours :

khi deux à (n-p) d.d.I si les (p-1) premières sont nulles

khi deux à p-1 ddl

Le rapport des 2khi deux sera donc un Fp-1;n-p

Exemple   : Au Maroc les importations sont fonction de la consommation, de la FBCF et des exportations.

n=14 ; =0.82

donc on rejette  : les variables exogènes peuvent être considérées comme explicatives dans l’ensemble.

c - Généralisation   :

Soient 2 modèles M1 et M2 tels que :

.

On pose

24

Page 25: Cours Econométrie S6 polycopié à mettre sur Site-2013

Faut-il refuser qui considère comme meilleur ; cela veut dire : dans les ( ) variables ne sont-elles pas en trop ? Pour répondre à cette question, on définit un F qui suit une loi de probabilité donnée ;

.

Ce rapport suit une loi de FISHER à ( ) et ( ) d.d.lEnsuite, on compare le F calculé ( ) et le F théorique ( ). Si , on rejette .

2°) Test Student : Significativité de chaque composante du vecteur a :

Ce test permet en fait d’apprécier la portée explicative de chaque variable exogène retenue.Soit le modèle :

Supposons que l’on s’intéresse à un coefficient déterminé du modèle. Nous avons démontré que

ou encore que  ; nous avons montré que .

Soit le Kième terme de la diagonale principale de , la variance d’un coefficient quelconque de régression s’écrit

et suit une loi normale de moyenne et d’écart-type

La quantité 

Mais on ne connaît pas la variance de U . II convient de l’estimer. nous savons que :

est un estimateur sans biais de la variance de u

En outre, donc suit un Khi Deux à ddI .

25

Page 26: Cours Econométrie S6 polycopié à mettre sur Site-2013

Comme la distribution de est indépendante de celle de L on a par définition : la variable

suit une loi de STUDENT à (n-p) ddI

On remarque que la quantité est une estimation De l’écart-type de

Lorsque on teste l’hypothèse , cela revient :

à partir du fait que

à poser et à déterminer une variable de STUDENT T (dans la formule ci-dessus cela revient à

remplacer par 0).

Solution du test   :

On écrit que

ou encore

2 cas possibles   :

* appartient à l’intervalle alors on ne refuse pas H0

* n’appartient pas à cet intervalle alors on refuse H0 .

Remarque   :

Nous avons utilisé le constat que la variable de Student T à (n-p) ddI converge en loi vers une loi normale centrée réduite quand (n-p) augmente. On peut sans commettre d’erreur notable utiliser l’approximation normale quand l’échantillon est grand.

T de Student ddI

95%

15 2.131 20 2.086

30 2.042 40 2.020 60 2.000

La table de la loi normale donne une valeur de 1.96 ; donc, en faisant une approximation, l’hypothèse de

26

Page 27: Cours Econométrie S6 polycopié à mettre sur Site-2013

nullité d’un coefficient (ou son égalité à une quantité donnée) sera rejetée pour un .

Exemple   :

pour n = 22, on a

comme n = 22, les T suivent une loi de Student à 19 ddI (22 – 3),

l’écriture

 ; donne ici ,

Discutons la pertinence de l’investissement :

le t lu sur la table à 95% est 2.093 et on remplace les écarts types par leur valeur, il vient : P( - 2,093x 0,81 < 3,07 < 2,093 x 0,81) = 0,95 ou P( - 1,695 < 3,07 < 1,695) = 0,95 , sous H0

Or la valeur â = 3,07 n’appartient pas à l’intervalle, donc rejet de H0 ; en d’autres termes coefficient a2

est différent de 0 et l’investissement est une variable pertinente pour expliquer le niveau des importations.

Pour la consommation, on utilise l’approximation :

* donc selon l’échantillon, la consommation n’explique pas le

niveau des importations.

3°) Test de DURBIN & WATSON : Problème de l’autocorrélation des résidus

Il y a autocorrélation des résidus quand le modèle est mal spécifié. On peut préciser que le risque d’autocorrélation des résidus augmente surtout dans les modèles estimés sur des séries chronologique. Elle sera d’ailleurs d’autant plus grande que la périodicité est courte.Dans le cas de l’omission d’une variable significative, les résidus ne sont plus distribués de façon aléatoire. Ils comportent l’effet des variables omises. De manière générale, l’autocorrélation des résidus provient d’une mauvaise spécification (forme de liaison inappropriée, définition des variables...).

Lorsqu’on a autocorrélation des aléas, on a tendance à sous-estimer les écart-types des coefficients ; en d’autres termes on surestime le T de Student. Dès lors, on risque de conclure «  hâtivement  » à la pertinence d’une variable proposée et testée.Les causes d’un mauvais DW sont de deux types, économique et statistique.Pour s’assurer du risque d’autocorrélation des erreurs, on procède au test de Durbin & Watson.

A - Principe d’estimation   : Il existe plusieurs procédures d’estimation. On suppose par exemple que les résidus U t sont corrélés selon un schéma autorégressif de 1er ordre. Soit donc :

avec et

On aura donc

d’où :

27

Page 28: Cours Econométrie S6 polycopié à mettre sur Site-2013

enfin

On démontre que dans le cas d’autocorrélation des erreurs, l’estimateur â est sans biais et il reste convergent.Mais, cela ne signifie pas qu’il a la variance minimum. La variance étant forte, l’estimation peut s’éloigner de son espérance mathématique avec une forte probabilité.Reprenons le modèle initial :

(1)

Soit obtenu par les MCO et

Pour une période, Ces résidus dépendent aussi bien de la suite des erreurs mais

également de la suite des .

Considérons la variable aléatoire définie comme suit :

(2)

est fonction de donc . Or, donc la limite en

probabilité de varie entre 2 valeurs 0 et 4.

On démontre que

En effet, de la formule (2), on peut déduire :

Cette statistique de D.W est utilisé pour donner la nature de la corrélation des résidus.* Quand il y a corrélation positive parfaite,

* Quand , il y a autocorrélation négative parfaite.

* Il y a indépendance lorsque dans ce cas

Tableau de décisions :

4

---------------------------------------------------------------------------------------------------- ! ! ! ! ! !! AUTOCORR  ! DOUTE ! INDEPENDACE ! DOUTE !AUTOCOR  !!ELATION  ! ! ! !RELATION  ! POSITIVE ! ! ! ! NÉGATIVE !

28

Page 29: Cours Econométrie S6 polycopié à mettre sur Site-2013

Les programmes de calcul donnent la valeur de .

B) Utilisation de la table de DURBIN & WASTON :

Nous allons tester l’hypothèse contre l’hypothèse à un seuil de signification . Durbin & Watson ont déterminé 2 valeurs d1 et d2 fonction de n et de p.

Donc on calcule à partir de sa formule et des résultats de l’estimation ; ensuite, nous serons face à

plusieurs éventualités :

* < d1 on rejette H0

* d1 < <d2 doute

> d2 non rejet H0 , absence d’autocorrélation des résidus.

n p=2 p=3 p=4 d1 d2 d1 d2 d1 d2

----------------------------------------------------------------------------------------------------15 1.08 1.36 0.95 1.54 0.82 1.7520 1.20 1.41 1.10 1.54 1.00 1.6830 1.35 1.49 1.28 1.57 1.21 1.6550 1.50 1.59 1.46 1.63 1.42 1.67100 1.65 1.69 1.63 1.72 1.61 1.74

Remarques   :

* La statistique de DW appliquée à un modèle contenant des variables endogènes retardées est biaisée vers 2 ce qui laisserait supposer que les erreurs sont moins souvent corrélées dans un processus autorégressif que dans un processus ordinaire.

* Dans le cas d’autocorrélation des aléas, il y a lieu d’opérer sur le modèle initial la transformation de COCHRANE ORCUTT.

Exemple   :

Log Mt = 0.469 Log Ct + 0.034 Log FBCFt + 0.471 Log Xt - 0.993 ^DW = 1.414 n = 15 et p = 4 d1=0.82 et d2=1.75

Comme 0.82 < ^DW < 1.75 , donc il y a doute

29

Page 30: Cours Econométrie S6 polycopié à mettre sur Site-2013

Bibliographie

Ø Ouvrages de base pour compléter le cours

« Méthodes statistiques de l’économétrie » Edmond MALINVAUD - Dunod / 1970« Introduction à l’économétrie » C. Labrousse – Dunod / 1976« Méthodes économétriques pour l’analyse économique et l’aide à la décision » Kamal HADADJ – Walada / 1994« Introduction à l’économétrie » Dormont B – Montchrestien (1999)« Métodes Econométriques », Tome 1 et 2, J.Johnston, Economica, 1985« Econométrie », Jean-François Brun, Jean Louis Combes et Claudio Araujo, Bréal, 2004« The theory and practice of econometrics » édition Wiley 1985Exercices pédagogiques de statistiques et économétrie » Claude Mouchot, Economice 1979

Plus tard, « Limted dependent and qualitative varaibles in econometrics » G.S.Madala , Cambrigde university Press, 1977.« A Guide to Econometrics » Peter Kenned , Third Edition , 1992« Econométrie appliquée », sous la direction de Claude Montmarquette, Economica, 1997

Ø Revues à consulter pour enrichir vos capacités en analyse économique Problèmes économiques Revue d’Économie du développement Revue d’économie politique Economie et prévisionPlus tard, pour ceux qui iront vers un 3ème cycle American Economic Review (AER) Journal of Political Economy World Bank Economic Review

Ø Journaux Il est conseillé de lire

Le Monde ( du Mardi) Le Figaro (pages saumon, économiques)

Voir aussi les sites, comme celui du NBER (National Bureau of Economic Research) pour des travaux de bons niveau (non encore publiés), ainsi que d’autres centres de recherche d’universités (working papers / documents de travails)... ou encore le site de la Direction de la Statistique (HCP), pour l’accès à des données ou des études /Maroc… ce sont des exemples seulement.

30