MASTER ECONOMETRIE ET STATISTIQUE …MASTER ECONOMETRIE ET STATISTIQUE APPLIQUEE (ESA) Université...

63
MASTER ECONOMETRIE ET STATISTIQUE APPLIQUEE (ESA) Université d’Orléans Macro-Econométrie Méthodes de Moments Christophe Hurlin Documents et Supports Année Universitaire 2006-2007 Master Econométrie et Statistique Appliquée (ESA) Université d’Orléans Faculté de Droit, d’Economie et de Gestion Bureau A 224 Rue de Blois – BP 6739 45067 Orléans Cedex 2 www.univ-orleans.fr/deg/masters/ESA/

Transcript of MASTER ECONOMETRIE ET STATISTIQUE …MASTER ECONOMETRIE ET STATISTIQUE APPLIQUEE (ESA) Université...

Page 1: MASTER ECONOMETRIE ET STATISTIQUE …MASTER ECONOMETRIE ET STATISTIQUE APPLIQUEE (ESA) Université d’Orléans Macro-Econométrie Méthodes de Moments Christophe Hurlin Documents

MASTER ECONOMETRIE ET STATISTIQUE APPLIQUEE (ESA)

Université d’Orléans

Macro-Econométrie

Méthodes de Moments

Christophe Hurlin

Documents et Supports

Année Universitaire 2006-2007

Master Econométrie et Statistique Appliquée (ESA) Université d’Orléans Faculté de Droit, d’Economie et de Gestion Bureau A 224 Rue de Blois – BP 6739 45067 Orléans Cedex 2 www.univ-orleans.fr/deg/masters/ESA/

Page 2: MASTER ECONOMETRIE ET STATISTIQUE …MASTER ECONOMETRIE ET STATISTIQUE APPLIQUEE (ESA) Université d’Orléans Macro-Econométrie Méthodes de Moments Christophe Hurlin Documents

January 26, 2005

Contents

1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11.1 Modèle à anticipations rationnelles : Définitions et problème d’es-

timation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21.2 Modèle à anticipations rationnelles : Biais des MCO . . . . . . . . 4

2 La Méthode de Moments Généralisés . . . . . . . . . . . . . . . . . . . 72.1 Exemple d’estimateurs des moments . . . . . . . . . . . . . . . . 72.2 La méthode des Moments Généralisés . . . . . . . . . . . . . . . . 10

2.2.1 Principe général : conditions d’orthogonalité, identificationet estimation . . . . . . . . . . . . . . . . . . . . . . . . . 10

2.2.2 Cas particulier : Moindre Carré Ordinaires . . . . . . . . . 132.2.3 Cas particulier : Variables Instrumentales . . . . . . . . . 14

2.3 Des moments conditionnels aux moments non conditionnels : Mod-èles Dynamiques sous Anticipations rationnelles . . . . . . . . . . 142.3.1 Des moments conditionnels aux moments non conditionnels 152.3.2 Cas Particulier : Système d’Equations Simultanées non

Linéaires et Modèle Dynamique sous AR . . . . . . . . . . 153 Matrice de poids optimale . . . . . . . . . . . . . . . . . . . . . . . . . 183.1 Méthode de GMM en deux étapes . . . . . . . . . . . . . . . . . . 203.2 Méthode de GMM itératif . . . . . . . . . . . . . . . . . . . . . . 203.3 Méthode de continuous-updating GMM . . . . . . . . . . . . . . . 213.4 Estimateurs de la matrice de poids en présence de corrélations . . 22

4 Distribution asymptotique des GMM . . . . . . . . . . . . . . . . . . . 254.1 Distribution asymptotique des GMM . . . . . . . . . . . . . . . . 254.2 Illustrations dans des cas particuliers . . . . . . . . . . . . . . . . 28

4.2.1 Cas particulier : Moindre Carré Ordinaires . . . . . . . . . 284.2.2 Cas particulier : Variables Instrumentales . . . . . . . . . 31

5 Résumé des GMM . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 326 Application SAS : procédure MODEL . . . . . . . . . . . . . . . . . . . 336.1 Spécification du modèle et des instruments . . . . . . . . . . . . . 346.2 La procédure d’estimation . . . . . . . . . . . . . . . . . . . . . . 376.3 Estimation du modèle d’Hansen et Singleton (1982) sous SAS . . 39

7 Inférence avec les GMM . . . . . . . . . . . . . . . . . . . . . . . . . . 43

Page 3: MASTER ECONOMETRIE ET STATISTIQUE …MASTER ECONOMETRIE ET STATISTIQUE APPLIQUEE (ESA) Université d’Orléans Macro-Econométrie Méthodes de Moments Christophe Hurlin Documents

Master ESA. Macro-Econometrie. Cours de C. Hurlin 2

7.1 Test de sur-identification . . . . . . . . . . . . . . . . . . . . . . . 437.2 Test de stabilité structurelle . . . . . . . . . . . . . . . . . . . . . 46

8 Maximum de Vraisemblance et GMM . . . . . . . . . . . . . . . . . . . 489 Méthodes de Moments Simulés . . . . . . . . . . . . . . . . . . . . . . . 489.1 Présentation de la Méthode des Moments Efficients (EMM) . . . . 489.2 Application SAS : Modèle de Volatilité Stochastique . . . . . . . . 50

9.2.1 Le contrôle de la matrice de poids . . . . . . . . . . . . . . 549.2.2 La procédure EMM sous SAS . . . . . . . . . . . . . . . . 56

10 Bibliographie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58

Page 4: MASTER ECONOMETRIE ET STATISTIQUE …MASTER ECONOMETRIE ET STATISTIQUE APPLIQUEE (ESA) Université d’Orléans Macro-Econométrie Méthodes de Moments Christophe Hurlin Documents

Master ESA. Macro-Econometrie. Cours de C. Hurlin 1

1. Introduction

Les anticipations, et plus particulièrement les anticipations rationnelles (AR parla suite), jouent un rôle essentiel en théorie économique, que ce soit en micro-économie, macro-économie, finance etc. Au niveau de l’application économétriquedes ces théories, on peut tout d’abord chercher à appliquer la théorie des ARde Muth qui suppose que l’on spécifie un modèle macro-économique completafin de déterminer de façon rationnelle les anticipations. Dans cette optiquefigurent les méthodes d’estimation dites à information complète commepar exemple le maximum de vraisemblance à information complète (FIML pourFull Information Maximum Likelihood). On doit alors spécifier le ”vrai” modèlecomplet de l’économie qui permet aux agents de former leurs anticipations defaçon compatible à ce modèle. Toute l’histoire est alors spécifiée : la relationentre variables anticipées et variables réalisées, le processus de formation desanticipations (AR) et le modèle (souvent appelé modèle auxiliaire) qui sertaux agents pour former leurs anticipations. Mais bien évidemment, ces méthodesne peuvent être appliquées que pour des ”petits modèles” comme par exemple lesmodèles de courbe de Phillips de type nouveau-keynesien.Au contraire de ces méthodes, la plupart des travaux appliqués se contentent

d’estimer une équation voir un système de quelques équations faisant intervenirquelques variables d’anticipations. On ne cherche pas alors à spécifier le modèlesous jacent qui permet aux agents de formuler leurs anticipations. On parle alorsde méthodes à information limitée, parmi lesquelles figurent notamment lesméthodes de moments et plus spécifiquement lesGMM. Par exemple, dans lathéorie des anticipations pures de la structure par terme des taux d’intérêt, le tauxlong sur les obligations dépend des anticpations sur les taux d’intérêt de courtterme. Suivant que l’on spécifie ou non un modèle permettant de former les ARsur les taux courts on parle d’approche à information complète ou à informationlimitée.

Dans le cadre de ce cours nous aborderons dans un premier temps les ap-proches à information limitée et plus spécifiquement les GMM. Mais avant deprésenter ces méthodes, nous commencerons par définir précisèment le conceptd’AR ce qui nous permettra dans un second temps d’évoquer les problèmes spé-cifiques d’estimation qui se posent dans un modèle où interviennent des variablesanticipées de façon rationnelle.

Page 5: MASTER ECONOMETRIE ET STATISTIQUE …MASTER ECONOMETRIE ET STATISTIQUE APPLIQUEE (ESA) Université d’Orléans Macro-Econométrie Méthodes de Moments Christophe Hurlin Documents

Master ESA. Macro-Econometrie. Cours de C. Hurlin 2

1.1. Modèle à anticipations rationnelles : Définitions et problème d’es-timation

Dans les modèles macro-économiques mais plus généralement dans l’ensembledes modèles d’anticipation, on souhaite estimer les paramètres structurels d’uneéquation unique ou d’un ensemble d’équations composé de termes d’anticipationsqui forment un sous ensemble d’un modèle plus général (d’où la distinctionméthodes à information complète et méthode à information limitée).Un exemple d’équation structurelle à anticipations est :

yt = β xet+j + µt (1.1)

où le terme d’anticipation xet+j est défini par :

xet+j = E [xt+j|Ωt] j ≥ 0 (1.2)

Ωt désigne l’ensemble complet d’informations pertinentes disponibles à la date t.Il y a alors deux options :

• Soit l’on dipose de données d’enquêtes sur E [xt+j|Ωt], et l’on peut estimerdirectement le modèle

• Soit l’on ne dipose pas de données sur E [xt+j|Ωt] et l’on pose des hy-pothèses auxiliaires sur cet terme d’anticipation. Il n’existe donc pas detest propre au modèle (1.1) : on testera à la fois le modèle et les hypothèsesauxiliaires sur E [xt+j|Ωt] (exemlple : théorie de la structure par terme destaux d’intérêt).

Quel que soit le modèle d’anticipation que lon retient, il existe trois principauxéléments :

• L’horizon des anticipations• La date et le contenu de l’ensemble d’information utilisé pour former lesanticipations

• La relation entre l’erreur d’anticipation et l’ensemble d’information

Les anticipations rationnelles (AR) introduites initiallement par Muth(1961) mais popularisées par Lucas (1972), présentent un certain nombre d’ax-iomes de base. Le premier axiome est celui de la spécification correcte. Siles agents forment des AR, ils agissent comme s’ils connaissaient la structure dumodèle complet jusqu’à un ensemble d’erreurs de type bruit blanc près.

Page 6: MASTER ECONOMETRIE ET STATISTIQUE …MASTER ECONOMETRIE ET STATISTIQUE APPLIQUEE (ESA) Université d’Orléans Macro-Econométrie Méthodes de Moments Christophe Hurlin Documents

Master ESA. Macro-Econometrie. Cours de C. Hurlin 3

Résultat En conséquence de quoi, (i) les anticipations rationnelles nesont pas biaisées en moyenne. (ii) Les erreurs de prévisions àune période successives ont une variance constante et ne sont pascorrélées entre elles et avec l’ensemble d’information utilisé pourformer les anticipations. Ainsi pour une anticipation à 1 péridode on :

xt+1 = xet+1 + ωt+1 (1.3)

avecE [ωt+1|Ωt] = 0 (1.4)

E ω2t+1 Ωt = σ2ω (1.5)

E ωt+1ωt+1+j Ωt = 0 ∀j (1.6)

L’erreur de prévision des AR pour la période suivante est donc un bruit blancou une innovation conditionnelle à l’ensemble d’information complet Ωt et estorthogonal à tout sous ensemble Λt ⊂ Ωt

E [ωt+1|Λt] = 0 Λt ⊂ Ωt (1.7)

Si l’on considère des AR à k périodes, les erreurs de prévisions sonta lrosautocorrélées et sont représentées par un processus MA (k − 1) . Supposons quele processus xt soit AR (1) :

xt+1 = φxt + εt+1 (1.8)

où ε est un bruit blanc vérifiant par conséquent E [εt+1|Ωt] = 0 et par conséquentE [εt+j|Ωt] , j > 0. En itérant vers le passé on a donc :

xt+j =

j−1

h=0

φhεt+j−h + φjxt

= φj + εt+j + φεt+j−1 + φ2εt+j−2 + ...+ φjεt+1 (1.9)

Par conséquent on montre que :

xt+1 − E [xt+1|Ωt] = εt+1

On retrouve le résultat selon lequel l’erreur de prévision à l’ordre 1 est un bruitεt+1 = ωt+1. Dans le cas général :

xt+j − E [xt+j|Ωt] =j−1

h=0

φhεt+j−h

= εt+j + φεt+j−1 + φ2εt+j−2 + ...+ φj−1εt+1

Page 7: MASTER ECONOMETRIE ET STATISTIQUE …MASTER ECONOMETRIE ET STATISTIQUE APPLIQUEE (ESA) Université d’Orléans Macro-Econométrie Méthodes de Moments Christophe Hurlin Documents

Master ESA. Macro-Econometrie. Cours de C. Hurlin 4

On retrouve ici l’écriture d’un modèle MA(j − 1) pour l’erreur de prévision àl’ordre j. On vérifie que toutes les erreurs de prévisions multi-périodiques sontindépendantes (ou orthogonales) à l’ensemble d’information Ωt :

E xt+j − E [xt+j|Ωt]|Ωt = E [xt+j|Ωt]− E [xt+j|Ωt] = 0 (1.10)

Il est une propriété supplémentaire qui est utile pour anlyser les AR qui con-cerne la révision des anticipations. La révision à une période des anticipa-tions dépend seulement de l’information qui arrive entre t et t+ 1. Eneffet :

E [xt+j|Ωt+1]−E [xt+j|Ωt] = φj−1εt+1 (1.11)

La révision à deux périodes dépend naturellement de εt+1 et εt+2 et estMA (1) .

E [xt+j|Ωt+2]−E [xt+j|Ωt] = φj−2εt+2 + φj−1εt+1 (1.12)

De façon générale, on a pour j > k :

E [xt+j|Ωt+k]−E [xt+j|Ωt] =j−k−1

h=0

φhεt+j−h −j−1

h=0

φhεt+j−h

=

j−1

h=j−k−1φhεt+j−h

1.2. Modèle à anticipations rationnelles : Biais des MCO

Il existe deux principaux problèmes liés à la présence de termes d AR : un prob-lème d’autocorrélation et une corrléation entre les regréesseurs et leterme d’erreur (endogeniété). Considérons le modèle :

yt = δ1xet+1 + δ2x

et+2 + µt (1.13)

xt+j = xet+j + εt+j (1.14)

où µt est i.i.d. 0,σ2µ . La méthode la plus utilisée pour estimer cette

équation est la méthode des erreurs dans les varaiables (EVM) où l’onremplace la variable anticipée xet+j non observable par la valeur observéext+j . On obteint ainsi une équation du type :

yt = δ1xt+1 + δ2xt+2 + vt (1.15)

vt = µt − δ1εt+1 − δ2εt+2 (1.16)

Page 8: MASTER ECONOMETRIE ET STATISTIQUE …MASTER ECONOMETRIE ET STATISTIQUE APPLIQUEE (ESA) Université d’Orléans Macro-Econométrie Méthodes de Moments Christophe Hurlin Documents

Master ESA. Macro-Econometrie. Cours de C. Hurlin 5

Naturellement, on sait que xt+j et εt+j sont corrélés par conséquent :

E (xt+1vt) = 0 E (xt+2vt) = 0 (1.17)

Les variables explicatives xt+1 et xt+2 ne sont pas indépendante du résidu vt : ona donc un problème d’endogénéité qui peut être régélé par une méthode de typevariable instrumentale. Mais en outre, il y a une auto-corrélation des résidus vtliée à la moyenne mobile des erreurs introduite par les erreurs de prévision. Si leprocessus xt est un vrai AR(1) de paramètre φ et d’innvoation ξt

εt+2 = xt+2 −E [xt+2|Ωt] =1

h=0

φhξt+2−h = ξt+2 + φξt+1

εt+1 = xt+1 − E [xt+1|Ωt] =0

h=0

φhξt+1−h = ξt+1

D’où

vt = µt − δ1εt+1 − δ2εt+2

= µt − δ1ξt+1 − δ2 ξt+2 + φξt+1

= µt − (δ1 + δ2) ξt+1 − δ2φξt+2

Par conséquent E (vtvt−1) = 0 même si ξt est i.i.d.

Evaluons à présent le biais des MCO lié au problème d’endogénéité. Consid-érons un modèle avec une seule anticpation :

yt = βxet+1 + µt (1.18)

où µt est i.i.d. 0, σ2µ . On suppose que

plim1

T

T

t=1

xt+1µt = 0 (1.19)

Si l’on retient l’hypothèse de RE, alors

xt+1 = xet+1 + εt+1 (1.20)

où l’erreur de prévision εt+1 est independante de l’ensemble d’information, E [εt+1|Ωt] .On obtient donc :

yt = βxt+1 + zt

zt = µt − βεt+1

Page 9: MASTER ECONOMETRIE ET STATISTIQUE …MASTER ECONOMETRIE ET STATISTIQUE APPLIQUEE (ESA) Université d’Orléans Macro-Econométrie Méthodes de Moments Christophe Hurlin Documents

Master ESA. Macro-Econometrie. Cours de C. Hurlin 6

Appliquons les MCO à cette équation :

β − β =T

t=1

x2t+1

−1 T

t=1

xt+1zt (1.21)

Or on sait que :

plim1

T

T

t=1

x2t+1 = plim1

T

T

t=1

xet+12+ plim

1

T

T

t=1

ε2t+1

De plus,

plim1

T

T

t=1

xt+1zt = plim1

T

T

t=1

xt+1µt − βplim1

T

T

t=1

xt+1εt+1

= −βplim 1

T

T

t=1

xt+1εt+1

= −βplim 1

T

T

t=1

xet+1 + εt+1 εt+1

= −βplim 1

T

T

t=1

ε2t+1

Dès lors, on montre que :

plim β − β = −β plim 1T

Tt=1 ε

2t+1

plim 1T

Tt=1 x

et+1

2+ plim 1

TTt=1 ε

2t+1

(1.22)

On a donc un biais négatif sur l’estimateur MCO Le biais est d’autant plus petitque la variance asymptotique des erreurs d’anticipations εt+1 est faible. Les MCOne sont donc pas convergents en raison de la corrélation entre la variable xt+1 etle terme d’erreur zt qui contient l’erreur de prévision des AR. La solution de ceproblème est d’utiliser un estimateur des variables instrumentales. Mais ce typed’estimateur ne peut être mis en place que sous l’hypothèse que les résidus sontnon auto-corrélés. Or ces derniers peuvent l’être dès lors que l’on fait inetrevenirdes anticipations sur plusieurs périodes ou que les erreurs structurelles µt sontelles mêmes auto-corrélées. Dans ce cas, il ne rest que deux solutions générales àce problème :

• La méthode des GMM d’Hansen (1982) qui permet de corriger la matricede variance covariance pour tenir compte des erreurs auto-corrélées

• La méthode des doubles moindres carrés à deux étapes (Cumby et al. 1983).Dans ce cours, nous présenterons la méthode des moments généralisés ou

GMM.

Page 10: MASTER ECONOMETRIE ET STATISTIQUE …MASTER ECONOMETRIE ET STATISTIQUE APPLIQUEE (ESA) Université d’Orléans Macro-Econométrie Méthodes de Moments Christophe Hurlin Documents

Master ESA. Macro-Econometrie. Cours de C. Hurlin 7

2. La Méthode de Moments Généralisés

Cette partie reprend intégralement la présentation proposée par Hamilton (1994).Commençons par considérer un exemple.

2.1. Exemple d’estimateurs des moments

Considérons l’exemple suivant. On considère une variable économique Yt dis-tribuée selon une distribution de Student à v degrés de liberté, dont la densitéest :

fYt (yt, v) =Γ v+1

2

(πv)1/2 Γ v2

1 +y2tv

−( v+12 )(2.1)

Où Γ (.) désigne la fonction gamma1. Supposons que l’on dispose d’un échantillonde T réalisations (y1, .., yT ) et que l’on désire à partir de cet échantillon estimerle nombre de degré de liberté v. La première approche que l’on pourrait qualifierd’approche à information complète consiste en une estimation par maximum devraisemblance (MV par la suite). La log-vraisemblance de l’échantillon s’écritdans ce cas :

L (v) =T

i=1

log fYt (yt, v)

et l’estimateur v est alors défini par :

v =ArgMaxv∈R+

L (v)

Une méthode alternative consiste au lieu d’exploiter l’information complètede la fonction de densité fYt (yt, v) , équivalente à la fonction génératrice des mo-ments, de n’exploiter qu’un nombre restreint de moments. On sait en effet quela connaissance de la densité fYt (yt, v) est équivalente à la connaissance de lafonction génératrice de moments g (h) :

g (h) = E Y h =∞

−∞yhfYt (yt, v) dy (2.2)

On sait en effet qu’il y a une équivalence entre donner la fonction de densitéfYt (yt, v) ou doner la fonction génératrice des moements g (h) telle que :

g (h) = E Y h =∞

−∞yht fYt (yt, v) dyt (2.3)

1On rappelle que :

Γ (r) =∞

0

e−xxr−1dx r > 0 Γ (α) = (α− 1)! siα ∈ N∗

Page 11: MASTER ECONOMETRIE ET STATISTIQUE …MASTER ECONOMETRIE ET STATISTIQUE APPLIQUEE (ESA) Université d’Orléans Macro-Econométrie Méthodes de Moments Christophe Hurlin Documents

Master ESA. Macro-Econometrie. Cours de C. Hurlin 8

Mais plutôt que d’utiliser l’ensemble des moments g (1) , g (2),.. g (h) pour estimerv on peut se contenter d’utiliser un sous ensemble de moments. Supposons quev > 2, alors on sait en particulier que les deux premiers moments (non centrés)sont tels que :

µ1 = E (Yt) = 0 µ2 = E Y 2t = var (Yt) =v

v − 2 (2.4)

Dans ce cas précis, si l’on connaît la valeur de E (Y 2t ) on peut end déuire lavaleur de v :

v =2E (Yt)

[E (Yt)− 1] (2.5)

Soit µ2,T le moment empirique non centré d’ordre deux :

µ2,T =1

T

T

i=1

y2t

On sait que cet estimateur est dans ce cas un estimateur convergent de µ2.

µ2,Tp−→

T→∞µ2 (2.6)

On peut en déduire que si T est très grand :v

v − 2 µ2,T

et que par conséquent on peut déuire du seul moment empirique µ2,Tun estimateurconvergent de v :

v =2µ2,Tµ2,T − 1

(2.7)

Cet estimateur existe dès lors que µ2,T > 1, c’est à dire dès lors que l’échantillonprésente une volatilité supérieure à celle d’une loi normale N (0, 1) qui corre-spond à la loi limite de Yt obtenue pour v → ∞. Cet estimateur v est qualifiéd’estimateur de la méthode des moments classique (classical method ofmoments).

De façon plus générale, si l’on considère un vecetur de paramètre β ∈ RKcaractérisant la densité fYt (yt,β) d’une variable Yt et si l’on suppose que Kmoments distincts dépendent de β :

E Y it = µi (β) i = i1,i2, .., iK (2.8)

alors l’estimateur βT de la méthode des moments classique (classical methodof moments) est obtenu par la résolution d’un système à K équations et K in-connues :

µi βT = µi,T (2.9)

Page 12: MASTER ECONOMETRIE ET STATISTIQUE …MASTER ECONOMETRIE ET STATISTIQUE APPLIQUEE (ESA) Université d’Orléans Macro-Econométrie Méthodes de Moments Christophe Hurlin Documents

Master ESA. Macro-Econometrie. Cours de C. Hurlin 9

où µi,T désigne l’estimateur du moment empirique :

µi,T =1

T

T

i=1

yit i = i1,i2, .., iK (2.10)

Présentons à prsént à partir de cet exemple, la méthode des moments genéral-isés ou GMM.

Dans l’exemple précédent, on estime un paramètre (v) en utilisant un seulmoment empirique (moment d’ordre deux µ2). On aurait pu utliser à la place dece moement n’importe quel autre moment de Yt dépendant lui aussi du paramètrev. Par exemple, dans le cas de la loi de Student dès lors que v > 4, on sait que lemoement centyré d’ordre 4 s’écrit :

µ4 (v) = E Y 4t =3v2

(v − 2) (v − 4) (2.11)

On aurait pu alors utiliser le moment empirique d’ordre 4, µ4,T = (1/T )Ti=1 y

4t

et résoudre l’équation :

µ4,T =3v2

(v − 2) (v − 4)afin d’en déduire l’estimateur des moments v.

Une autre possibilité consiste à déterminer un estimateur v qui permettentd’obtenir des valeurs des moments d’ordre deux et quatre aussi près que possibledes réalisations des moements empiriques µ2,T et µ4,T . Il n’est bien évidemmentpas possible d’égaliser les deux moments de façon conjointe et de trouver unevaleur unique de v permettant de résoudre le système :

µ2,T − vv−2 = 0

µ4,T − 3v2

(v−2)(v−4) = 0

Remarque C’est pourquoi on cherche à déterminer l’estimateur v qui minimiseune fonction critère de la forme :

Q (v, y1, y2, .., yT )(1,1)

= g(1,2)

W(2,2)

g(2,1)

(2.12)

où le vecteur g est défini par :

g =µ2,T − v

v−2µ4,T − 3v2

(v−2)(v−4)(2.13)

Page 13: MASTER ECONOMETRIE ET STATISTIQUE …MASTER ECONOMETRIE ET STATISTIQUE APPLIQUEE (ESA) Université d’Orléans Macro-Econométrie Méthodes de Moments Christophe Hurlin Documents

Master ESA. Macro-Econometrie. Cours de C. Hurlin 10

et où la matrice W est une matrice de poids symétrique et définie posi-tive qui reflète l’importance attribuée à chacun des deux moements que l’ondésire reproduire (match).

Un estimateur v est alors obtenu par le prgramme :

v = ArgMinv∈R+,v>4

Q (v, y1, y2, .., yT ) (2.14)

Un tel estimateur est appelé estimateur ”minimum chi-square” par Cramer(1976) ou ”minimum distance estimator” par Malinvaud (1970). Mais c’est sansconteste Hansen (1982) qui en donné la caractérisation la plus générale notam-ment dans le cas de processus avec dépendances temporelles. Il l’a appelé estima-teur des Moments Généralisés ouGeneralized Method of Moments (GMM).

2.2. La méthode des Moments Généralisés

Commençons par présenter les principe général des GMM avant d’étuider certainscas particuliers.

2.2.1. Principe général : conditions d’orthogonalité, identification etestimation

Soit wt un vecteur (h, 1) de variables économiques observées à la date t et soit θun vecteur (a, 1) de paramètres et h (θ, wt) une fonction à valeur de Ra×Rh dansRr. h (θ, wt) désigne donc un vecteur (r, 1) de variables aléatoires dès lors que wtest lui même aléatoire. Soit θ0 la vraie valeur du vecteur θ.

Definition 2.1. On appelle conditions d’orthogonalité les r conditionsdéfinies par le système:

E [h (θ0, wt)](r,1)

= 0(r,1)

(2.15)

Soit YT = wT , wT−1, .., w1 un vecteur (Th, 1) contenant toutes les ob-sersvations des h variables du système et soit g (YT , θ) le vecteur (r, 1)des moments empiriques correspondants tel que :

g (YT , θ) =1

T

T

t=1

h (θ, wt) (2.16)

L’idée de base des GMM consiste à déterminer une valeur de θ telle que lesr moments empiriques g (YT , θ) soient aussi proches que possible de zéro.

g (YT , θ) 0 pour θ = θT

Ainsi, on peut définir l’estimateur GMM de la façon suivante.

Page 14: MASTER ECONOMETRIE ET STATISTIQUE …MASTER ECONOMETRIE ET STATISTIQUE APPLIQUEE (ESA) Université d’Orléans Macro-Econométrie Méthodes de Moments Christophe Hurlin Documents

Master ESA. Macro-Econometrie. Cours de C. Hurlin 11

Definition 2.2. L’estimateur GMM θT du vecteur θ minimise une fonc-tion critère (ou fonction de perte) :

θT =ArgMinθ∈Ra

Q (θ, YT ) (2.17)

telle que :Q (θ, YT ) = [g (YT , θ)]

(1,r)

WT(r,r)

g (YT , θ)(r,1)

(2.18)

où WT∞T=1 désigne une séquence de matrices de poids symétriquesdéfinies positives qui peuvent être fonction de YT .

Dans la plupart des cas, ce programme de minimisation ne peut être mené àbien que numériquement. L’intuition est très simple. On sait que quelle que soitla valeur de θ, d’après la loi des grands nombres :

g (YT , θ)p−→

T→∞E [h (θ, wt)]

Supposons que E [h (θ, wt)] soit continue en θ et que θ0 soit la seule valeur telleque E [h (θ0, wt)] = 0. Dès lors, sous des conditions de stationnarité, de continuitéet des conditions sur les moements, la valeur θT qui rend minimum le critèreQ (θ, YT ) donne un estimateur convergent de θ0.

Exemple 1 : La méthode classique des moments de notre exemple précedentest un cas particulier de cette formule avec r = a = 1.

h (v, yt) = y2t −

v

v − 2telle que pour la vraie valeur v0 :

E [h (v0, yt)] = E y2t −v0

v0 − 2 = 0

L’équivalent empirique de cette condition d’orthogonalité est donnée par :

g (YT , v) =1

T

T

t=1

y2t −v

v − 2 (2.19)

En posant, WT = 1, on retrouve le programme de la méthode classique :

Q (v, YT ) =1

T

T

t=1

y2t −v

v − 2

2

(2.20)

Page 15: MASTER ECONOMETRIE ET STATISTIQUE …MASTER ECONOMETRIE ET STATISTIQUE APPLIQUEE (ESA) Université d’Orléans Macro-Econométrie Méthodes de Moments Christophe Hurlin Documents

Master ESA. Macro-Econometrie. Cours de C. Hurlin 12

La plus petite valeur admissible de Q (v, YT ) est 0 obtenue pour :

1

T

T

t=1

y2t =v

v − 2

soit

v =2µ2,Tµ2,T − 1

(2.21)

On retrouve donc l’estimateur de la méthode classique des moments.

De façon générale, on distingue deux cas suivant la valeur de a et r :

Definition 2.3. Lorsque il existe autant de conditions d’orthogonalitéque de paramètres (a = r) on dit que le système est juste identifiéet l’estimateur GMM se ramène au vecteur θT de dimension (r, 1) quipermet de résoudre le système à r équations :

g YT , θT = 0 (2.22)

Dans ce cas, il s’agit juste de résoudre un système éventuellement non linéaireà r équations et r inconnues. Le choix de la matrice de poids WT est totalementneutre, ce qui explique qu’elle ne soit pas spécifiée.

Definition 2.4. Lorsque il existe plus conditions d’orthogonalité que deparamètres (a > r) on dit que le système est sur-identifié. L’estimateurGMM dépend alors du choix de la matrice de poids WT.

Dans ce cas se pose le problème crucial du choix de la matrice de poids opti-male.

Résultat Un des nombreux avantages des GMM est que c’est uneméthode englobante permettant de retouver comme cas partic-uliers un grand nombre d’estimateurs usuelsparami lesquels- les Moindres Carrés Ordinaires- les Variables Instrumentales et Doubles Moindres Carrés- les Moindres Carrés non Linéaires- le Maximum de vraisemblance.

Considérons quelques exemples.

Page 16: MASTER ECONOMETRIE ET STATISTIQUE …MASTER ECONOMETRIE ET STATISTIQUE APPLIQUEE (ESA) Université d’Orléans Macro-Econométrie Méthodes de Moments Christophe Hurlin Documents

Master ESA. Macro-Econometrie. Cours de C. Hurlin 13

2.2.2. Cas particulier : Moindre Carré Ordinaires

Considérons un modèle de régression standard :

yt = xt β0 + ut (2.23)

où xt est un vecteur de dimension (k, 1) de variables explicatives. On supposeque la varie valeur du vecteur β est égale à β0. L’hypothèse centrale qui justifiel’emloi des MCO est la propriété d’orthogonalité des résidus théoriques parrapport aux variables explicatives :

E (xtut)(k,1)

= 0(k,1)

(2.24)

Donc pour la vraie valeur β0, on a :

E [xt (yt − xt β0)] = 0 (2.25)

ce qui représente une système de k conditions d’orthogonalité. Posons dansnos notations wt = (yt xt) et θ = β, on a :

h (θ, wt) = xt (yt − xt β)E [h (θ0, wt)] = 0

Dans ce cas le système est dit juste identifié puisque il y a a = k paramètresà estimer pour r = k conditions d’orthogonalité. Puisque le système est justeidentifié, l’estimateur GMM se ramène à déterminer θT tel que

g YT , θT = 0 (2.26)

où g (YT , θ) désigne le vecteur des moments empiriques correspondant aux k con-ditions d’orthogonalité.

g (YT , θ) =1

T

T

t=1

h (θ, wt) =1

T

T

t=1

xt (yt − xt β)

On a donc à résoudre le système suivant :

g YT , θT =1

T

T

t=1

xt yt − xt βT = 0

Ce qui peut se réécrire sous la forme :T

t=1

xt yt =T

t=1

xtxt βT

⇐⇒ βT =T

t=1

xtxt

−1 T

t=1

xt yt = βMCO (2.27)

On retrouve ainsi l’estimateur MCO βMCO.

Page 17: MASTER ECONOMETRIE ET STATISTIQUE …MASTER ECONOMETRIE ET STATISTIQUE APPLIQUEE (ESA) Université d’Orléans Macro-Econométrie Méthodes de Moments Christophe Hurlin Documents

Master ESA. Macro-Econometrie. Cours de C. Hurlin 14

2.2.3. Cas particulier : Variables Instrumentales

Considérons à nouveau un modèle de régression standard :

yt = zt β0 + ut (2.28)

où zt est un vecteur de dimension (k, 1) de variables explicatives. Supposonsqu’un certain nombre de variables explicatives soient endogènes c’est à dire queE (ztut) = 0. Soit xt un vecteur (r, 1) de variables explicatives prédeterminéescorrélées avec les variables zt mais non corrélées avec les résidus ut.

E (xtut) = 0 (2.29)

Cette contrainte nous définit r conditions d’orthogonalité :

E [xt (yt − zt β0)] = 0 (2.30)

On reconnait donc un cas particlier des GMM avec wt = (yt xt zt) et θ = β,

a = k.h (θ, wt) = xt (yt − zt β) (2.31)

E [h (θ0, wt)] = E [xt (yt − zt β0)] = 0Soit g (YT , θ) le vecteur des moments empiriques correspondant aux r condi-

tions d’orthogonalité.

g (YT , θ) =1

T

T

t=1

h (θ, wt) =1

T

T

t=1

xt (yt − zt β)

Si l’on suppose que le système est juste identifié (a = r) , alors l’estimateurGMM est obtenu par la résolution du système :

g YT , θT =1

T

T

t=1

xt yt − zt βT = 0 (2.32)

D’où l’on tire finallement que :

βT =T

t=1

xtzt

−1 T

t=1

xt yt = βIV (2.33)

On retrouve ainsi l’estimateur des variables instrumentales βIV .

2.3. Des moments conditionnels aux moments non conditionnels : Mod-èles Dynamiques sous Anticipations rationnelles

Jusqu’à présent nous n’avons présenté les GMM qu’en utilisant des momentsconditionnels. Or dans de nombreux modèles théoriques en macroéconomie, in-terviennent des moments conditionnels.

Page 18: MASTER ECONOMETRIE ET STATISTIQUE …MASTER ECONOMETRIE ET STATISTIQUE APPLIQUEE (ESA) Université d’Orléans Macro-Econométrie Méthodes de Moments Christophe Hurlin Documents

Master ESA. Macro-Econometrie. Cours de C. Hurlin 15

2.3.1. Des moments conditionnels aux moments non conditionnels

Supposons que l’on dipsoe d’un modèle avec des conditions d’orthogonalité por-tant sur les moments conditionnels du type :

E [h (θ0, wt)| zt] = 0 (2.34)

où zt est un vecteur de variables pré-determinées. On souhaite transformerces conditions sur les moments conditionnels en conditions sur les moments con-ditionnels.

Résultat Soient deux variables aléatoires z et u, alors :

cov (z, u) = cov [z, E (u| z)] (2.35)

La condition E (u| z) = 0 implique alors que cov (u, z) = 0. Sachantque cov (u, z) = E (zu)−E (z)E (u) et que E (u| z) = 0 implique E (u) =0 (espérances itérées). On en déduit donc que :

E (u| z) = 0 =⇒ cov (z, u) = 0E (u) = 0

=⇒ E (uz) = 0 (2.36)

C’est cette propriété qui va nous permettre d’appliquer les GMM à des moe-ments conditionnels et en particulier aux modèles à AR.

2.3.2. Cas Particulier : Système d’Equations Simultanées non Linéaireset Modèle Dynamique sous AR

Les GMM constituent avec le FIML sans doute la méthode d’estimation la plusutilisér pour les systèmes d’équations simultanées non linéaires. Supposons quel’on cherche à estimer un système de n équations de la forme :

yt(n,1)

= f (θ, zt)(n,1)

+ ut(n,1)

(2.37)

où zt est un vecteur de dimension (k, 1) de variables explicatives et θ un vecteurde paramètres de dimension (a, 1) . On pose

yt(n,1)

=

y1t..ynt

ut(n,1)

=

u1t..unt

f (θ, zt) =

f1t (θ, zt)..fnt (θ, zt)

Soit xit un vecteur d’instruments non corrélés avec le ieme élément uit desrésidus.

E xi,t(ri,1)

ui,t(1,1)

= 0

Page 19: MASTER ECONOMETRIE ET STATISTIQUE …MASTER ECONOMETRIE ET STATISTIQUE APPLIQUEE (ESA) Université d’Orléans Macro-Econométrie Méthodes de Moments Christophe Hurlin Documents

Master ESA. Macro-Econometrie. Cours de C. Hurlin 16

Pour chaque résidu d’équation uit on peut donc avoir plusieurs conditionsd’orthogonalité. Supposons qu’au total on dispose de r = n

i=1 ri conditionsd’orthogonalité :

h (θ, wt) =

[y1t − f1 (θ, zt)] x1t[y2t − f2 (θ, zt)] x2t...[ynt − fn (θ, zt)] xnt

avec wt = (yt xt zt) . L’estimateur GMM est alors obtenu en minimisant la fonc-tion critère :

Q (θ, YT ) =1

T

T

t=1

h (θ, wt) WT1

T

T

t=1

h (θ, wt) (2.38)

où WT est une matrice de poids.

Exemple : le modèle de portefeuille (Hansen et Singleton, 1982).Une application très célébre de ce principe permet d’estimer des Modèle Dy-

namique sous AR. Considérons un modèle intertemporel de consommation dansun univerrs stochastique avec un agent représentatif qui maximise à tout date :

maxU =∞

τ=0

βτEt (ct+τ ) (2.39)

où ct désigne la consommation à la date t, 0 < β < 1 un facteur d’escompte psy-chologique et Et (ct+τ ) l’opérateur espérance conditionnelle à toute l’in-formation disponible à la date t.

Et (ct+τ ) = E (ct+τ |xt) (2.40)

où xt est un vecteur de variables observables contenant toute une partiede l’information disponible pour l’agent à la date t. Supposons que l’agentpuisse épargner et investir dans m titres indicés i = 1, .,m qui pour tout euroinvestit à la date t lui rapportent 1 + ri,t+1 à la période suivante. Ce rendementincertain n’est pas connu à la date t. Sa containte budgéatire est alors de la forme:

ct +m

i=1

pitqit ≤m

i=1

pitqit−1 +Rt (2.41)

où Rt est le revenu du travail à la date t, qit le montant d’actif i détenu par l’agentà la date t et pit le prix de cet actif à la date t. On note ri,t+1 = pi,t+1/pt. On saitque dans ce modèle la condition d’arbitagre inter-temporel de la consommationdevient :

u (ct) = βEt [(1 + ri,t+1)u (ct+1)] i = 1, 2...,m (2.42)

Page 20: MASTER ECONOMETRIE ET STATISTIQUE …MASTER ECONOMETRIE ET STATISTIQUE APPLIQUEE (ESA) Université d’Orléans Macro-Econométrie Méthodes de Moments Christophe Hurlin Documents

Master ESA. Macro-Econometrie. Cours de C. Hurlin 17

dès lors que l’agent détient une part non nul dans tous les actifs.

Supposons que la fonction d’utilité de l’agent soit de type CRRA

u (ct) =c1−γt

1−γlog(ct)

si γ > 0 et γ = 1si γ = 1

où γ désigne le coefficient d’aversion relative pour le risque. Dès lors la conditionsd’arbitrage inter-temporelle se ramène à :

c−γt = βEt (1 + ri,t+1) c−γt+1

ou encore

1 = βEt (1 + ri,t+1)ct+1ct

−γ(2.43)

puisque la variable ct est connue à la date t. Cette expression signifie que chaquevariable aléatoire définie par

1− β (1 + ri,t+1)ct+1ct

−γi = 1, ..m

doit être orthogonale à toute variable contenue dans l’ensemble d’in-formation xt. Soit θ = (β γ) le vecteur de paramètres du modèles. Soit wt =(r1t+1 r2t+1 ...rmt+1 ct+1/ct xt) l’ensemble des variables observées par l’économètreà la date t. Au total si xt a contient n variables, on obtient pour chaque actif nconditions d’orthogonalité, soit un total de

r = n×m

conditions d’orthogonalité.

h (θ, wt)(nm,1)

=

1− β (1 + r1,t+1)ct+1ct

−γxt(n,1)

1− β (1 + r2,t+1)ct+1ct

−γxt(n,1)

...

1− β (1 + rm,t+1)ct+1ct

−γxt(n,1)

(2.44)

ou de façon équivalent :

h (θ, wt)(nm,1)

=h (θ, wt)(m,1)

⊗ xt(n,1)

Page 21: MASTER ECONOMETRIE ET STATISTIQUE …MASTER ECONOMETRIE ET STATISTIQUE APPLIQUEE (ESA) Université d’Orléans Macro-Econométrie Méthodes de Moments Christophe Hurlin Documents

Master ESA. Macro-Econometrie. Cours de C. Hurlin 18

⇐⇒ h (θ, wt)(nm,1)

=

1− β (1 + r1,t+1)ct+1ct

−γ

1− β (1 + r2,t+1)ct+1ct

−γ

...

1− β (1 + rm,t+1)ct+1ct

−γ

⊗ xt

(n,1)

où ⊗ désigne le produit de Kronecker. L’équivalent empriique s’écrit alors définipar :

g (YT , θ) =1

T

T

t=1

h (θ, wt)

L’estimateur GMM est alors obtenu en minimisant le critère :

Q (θ, YT ) =1

T

T

t=1

h (θ, wt) WT1

T

T

t=1

h (θ, wt) (2.45)

3. Matrice de poids optimale

Quelle matrice de poids WT choisir afin d’obtenir un estimateur convergent etefficace du vecteur θ ? Supposons que la le processus h (θ0, wt)∞t=1 soit unprocessus stationnaire dont la matrice d’auto-variance à un l’ordre v soit définipar :

Γv = E h (θ0, wt) h (θ0, wt−v)

Soit S la matrice qui correspond à la somme des autocovariances : cettematrice correspond à la matrice de variance covariance de long terme duprocessus h (θ0, wt)∞t=1 .

Definition 3.1. La matrice de variance covariance de long terme du processush (θ0, wt)∞t=1 est définie par :

S(r,r)=

j=−∞Γv =

j=−∞E h (θ0, wt) h (θ0, wt−v) (3.1)

ce qui peut s’écrire sous la plus forme plus générale

S(r,r)

= limT→∞

1

T

T

t=1

v=−∞E h (θ0, wt)h (θ0, wt−v) (3.2)

Sous l’hypothès de stationnarité stricte la quantité Γv = E h (θ0, wt) h (θ0, wt−v)ne dépend pas de t et la formule (6.1) est valide.

Page 22: MASTER ECONOMETRIE ET STATISTIQUE …MASTER ECONOMETRIE ET STATISTIQUE APPLIQUEE (ESA) Université d’Orléans Macro-Econométrie Méthodes de Moments Christophe Hurlin Documents

Master ESA. Macro-Econometrie. Cours de C. Hurlin 19

Naturellement si le processus h (θ0, wt) est non autocorélé dans le temps, cettematrice se ramène à la matrice de variance covariance. En effet, si h (θ0, wt) eth (θ0, ws) sont indépendants dès lors que s = t, alors S = Γ0. Cette matrice Sdésigne en outre la matrice de variance covariance asymptotique de la moyenneempirique des h (θ0, wt) :

S = limT→∞

T E g (YT , θ) g (YT , θ) (3.3)

Résultat La valeur optimale de la matrice de poidsWT dans la fonctioncritère Q (θ, YT ) est donné par l’inverse de la matrice de variancecovariance asymptotique, S−1

W ∗T = S

−1 (3.4)

La plus petite variance asymptotique (dans la cas univarié) pour l’estimateurGMM θT est obtenue lorsque θT est déini par résolution du programme :

θT =ArgMinθ∈Ra

[g (YT , θ)](1,r)

S−1(r,r)

g (YT , θ)(r,1)

(3.5)

Comment estimer cette matrice de poids optimale W ∗T ? Lorsque les élé-

ments du vecteur h (θ0, wt) sont non corrélés et non autocorrélés, alors S = Γ0 =

E h (θ0, wt) h (θ0, wt) . Dans ce cas, la matrice S peut être estimée par la quan-tité S∗T :

S∗T =1

T

T

t=1

h (θ0, wt)h (θ0, wt) (3.6)

Mais puisque la calcul de cette quantité requiert la connaissance de θ0, onconstruit l’estimateur ST défini de la façon suivante.

Definition 3.2. En l’absence de dépendances temporelles des vecteurs h (θ0, wt)∞t=−∞ ,la matrice de variance covariance asymptotique S peut être estimée par la quantitéST :

ST =1

T

T

t=1

h θT , wt h θT , wt (3.7)

où θT désigne l’estimateur GMM du veceteur θ. On montre que :

STp−→

T→∞S

On aboutiot dès lors à une produre itérative, puisque pour déterminer θT , ilfaut connaitre WT = S

−1T et que pour déterminer ST il faut connaître θT . C’est

pourquoi on distingue trois types de méthodes GMM :

Page 23: MASTER ECONOMETRIE ET STATISTIQUE …MASTER ECONOMETRIE ET STATISTIQUE APPLIQUEE (ESA) Université d’Orléans Macro-Econométrie Méthodes de Moments Christophe Hurlin Documents

Master ESA. Macro-Econometrie. Cours de C. Hurlin 20

1. Méthode de GMM en deux étapes : Hansen (1982)

2. Méthode de GMM itératif : Ferson et Foerster (1994)

3. Méthode de GMM dite ”continuous-updating GMM” développéepar Hansen, Heaton et Yaron (1996) et étudiée dans Stock and Wright(2000), Newey et Smith (2003) et Ma (2002).

3.1. Méthode de GMM en deux étapes

C’est la méthode proposée initiallement par Hansen (1982). Dans ce cas, oncommence par construire un estimateur convergent mais non efficace du vecteurde paramètre θ. Différentes options peuvent être choisies ici. La plus simpleconsiste à accorder le même poids aux différentes conditions d’orthogonalité, c’està dire à considérer une matrice de poids identité, c’est à dire en posant WT = Ir.

On construit alors un premier estimateur convergent non efficace, noté θ1

θ1 =ArgMinθ∈Ra

[g (YT , θ)](1,r)

g (YT , θ)(r,1)

(3.8)

En suite à partir de cet estimateur de θ, on constuit un estimateur W1 de lamatrice de poids optimale W ∗

T = S−1, avec :

W1 = S−11 =

1

T

T

t=1

h θ1, wt h θ1, wt

−1

(3.9)

La deuxième étape consiste à utiliser cet estimateur de la matrice de poidsoptimale pour dériver un estimateur θ convergent et efficicace des paramètres θ :

θ =ArgMinθ∈Ra

[g (YT , θ)](1,r)

S−11 g (YT , θ)(r,1)

(3.10)

θ est alors appelé, estimateur GMM en deux étapes.

3.2. Méthode de GMM itératif

La méthode des GMM itératif repose sur l’algorithme suivant. De la même façonque précédemment, on constuit dans une première étape un premier estimateurθ1 à partir d’une valeur d’amorce de la matrice de poids. Par exemple, on peutpartir d’une matrice identité W0 = Ir attribuant ainsi le même poids à toutes lesconditions d’orthogonalité. On construit alors un premier estimateur GMM telque :

θ1 =ArgMinθ∈Ra

[g (YT , θ)] W0g (YT , θ) (3.11)

Page 24: MASTER ECONOMETRIE ET STATISTIQUE …MASTER ECONOMETRIE ET STATISTIQUE APPLIQUEE (ESA) Université d’Orléans Macro-Econométrie Méthodes de Moments Christophe Hurlin Documents

Master ESA. Macro-Econometrie. Cours de C. Hurlin 21

A partir de ce premier estimateur, on déduit une estimation de la matrice devariance covariance asymptotique :

W1 =1

T

T

t=1

h θ1, wt h θ1, wt

−1

En ré-introduisant cette estimation de la matrice de poids optimale dans lafonction critère GMM, on construit un nouvel estimateur, noté θ2 tel que :

θ2 =ArgMinθ∈Ra

[g (YT , θ)] W1g (YT , θ) (3.12)

et ainsi de suite. Etant donné que tous les estimateurs θj ont exactement la mêmedistribution asympotique, ce processus s’arrête dès lors que :

θj θj−1 (3.13)

La valeur θj est alors estimateur GMM itératif. Dans le logiciels usuels cetteprocédure suppose de définir un critère de convergence. Par exemple, si l’on

note θj = θj,1, .., θj,a un critère du type :

max θj,z − θj−1,za

z=1< C (3.14)

Si cette condition est vérifié, l’algorithme s’arrête. Cette condition se doublegénéralement d’une condition sur le nombre d’itération. Si ce dernier excède uneune certaine valeur, par exemple 100, l’algorithme s’arrête et un message apparaîtsignifiian,t que l’algorithme n’a pas convergé.

3.3. Méthode de continuous-updating GMM

Dans cette approche on va chercher de façon à optimiser la fonction critère entenant compte de la forme générale qui lie l’estimateur de la matrice de poidsoptimale à la valeur des coefficients. C’est la même démarche que dans le casitératif : la différence étant que dans le cas précédent on optimiser le critère pourobtenir θj, puis on constuisez Wj+1, pour obtenir ensuite θj+1. Alors que dans lecas continu, on optimise le critère à chaque étape en tenant compte de la formede Wj qui dépend de θj :

θ =ArgMinθ∈Ra

[g (YT , θ)]1

T

T

t=1

h (θ, wt)h (θ, wt)

−1

g (YT , θ) (3.15)

Cette procédure reste itéraive car on doit utiliser un algorithme d’optimisationnumérique qui partant d’une condition initiale θ0, d’une règle de passage entreθj et θj−1 et d’un critère d’arrêt va déterminer une solution numérique à ceprogramme.

Page 25: MASTER ECONOMETRIE ET STATISTIQUE …MASTER ECONOMETRIE ET STATISTIQUE APPLIQUEE (ESA) Université d’Orléans Macro-Econométrie Méthodes de Moments Christophe Hurlin Documents

Master ESA. Macro-Econometrie. Cours de C. Hurlin 22

3.4. Estimateurs de la matrice de poids en présence de corrélations

Commençons par un certain nombre de rappels :

Lorsque les séquences h (θ0, wt)∞t=1 présentent des autocorrélations, la ma-trice de variance covariance de long terme n’est plus égale à la matrice de variancecovariance. S’il existe des Γj = 0 pour j = 0, alors

S(r,r)=

v=−∞Γv =

v=−∞E h (θ0, wt)h (θ0, wt−v) = Γ0

Dès lors les formules précedentes permettant d’estimer S ne sont plus valables.Considérons l’estimateur Γv de la matrice d’autocovariance d’ordre v, Γv :

Γv =1

T

T

t=v+1

h θ, wt h θ, wt−v (3.16)

Sachant queΓ−v = Γv (3.17)

un estimateur de la matrice S pourrait être donné par la quantité

S =∞

v=−∞Γv = Γ0 +

v=1

Γv + Γv (3.18)

Naturellement, il n’est pas possible de construire un tel estimateur puisqu’il faitintervenir des matrices Γv à des ordres supèrieurs à ce que l’on peut estimerà partir d’un échantillon de T observations. De plus rien ne garantit qu’unematrice construite uniquement à partir d’une somme tronquée soit définie positivecomme doit l’être toute matrice de variance covariance. On a donc recourt àdes méthodes d’estimation non paramétriques de matrice de variancecovariance de long terme.

Le plus connu de ces estimateurs est l’estimateur de Newey-West (1987). Il sefonde sur une troncature et l’utilisation de poids décroissants pour les différentesmatrices Γv.

Definition 3.3. En présence de dépendances temporelles des vecteurs h (θ0, wt)∞t=−∞ ,un estimateur non paramétrique (Newey et West, 1987) de la matrice de variancecovariance asymptotique S est donné par :

SNW = Γ0 +

q

v=1

1− v

q + 1Γv + Γv (3.19)

Page 26: MASTER ECONOMETRIE ET STATISTIQUE …MASTER ECONOMETRIE ET STATISTIQUE APPLIQUEE (ESA) Université d’Orléans Macro-Econométrie Méthodes de Moments Christophe Hurlin Documents

Master ESA. Macro-Econometrie. Cours de C. Hurlin 23

où q désigne un paramètre de troncature et où

Γv =1

T

T

t=v+1

h θ, wt h θ, wt−v (3.20)

Ainsi si par exemple, on a q = 2 :

SNW = Γ0 +2

3Γ1 + Γ1 +

1

3Γ2 + Γ2

L’idée dela démonstration peut se comprendre dans le domaine des fréquences.Dans un cas sacalire, il s’agit d’évaluer la fonction de densité spéctrale au point0, puisque cela correspond à un scalaire près à la variance de long terme duprocessus.

S =∞

v=−∞Γv = 2π SY (0)

avec

SY (ω) =1

v=−∞E (YtYt−v) e−iω

L’estimateur de Newey West est égal à 2π fois l’estimateur kernel(avec kernel de type Bartlett) de la fonction de densité spectrale éval-uée à la fréquence ω = 0. On applique alors les techniques d’estimation nonparamètrique d’une fonction vues dans le cours d’économétrie non paramétrique.

Résultat Newey et West montrent que ST est positive, semi definiepositive par construction et que si q et T tendent vers l’infinialors que la quantité q/T 1/4 tend vers 0, alors :

SNWp−→

T→∞S

Dans les procédures itératives, le choix de θ dans la construction de Γv peutêtre mené parmi l’ensemble des estimateurs convergents de θ.

Andrews (1991) propose d’autres estimateurs de la matrice de variance co-variance de long terme qui peuvent être préférable sous certaines hypothèses. Ilpropose notamment d’utiliser un kernel de type quadratic :

Definition 3.4. En présence de dépendances temporelles des vecteurs h (θ0, wt)∞t=−∞ ,l’estimateur non paramétrique d’Andrews (1991) de la matrice de variance covari-ance asymptotique S est donné par :

SA =T

T − k Γ0 +T−1

v=1

Kv

q + 1Γv + Γv (3.21)

Page 27: MASTER ECONOMETRIE ET STATISTIQUE …MASTER ECONOMETRIE ET STATISTIQUE APPLIQUEE (ESA) Université d’Orléans Macro-Econométrie Méthodes de Moments Christophe Hurlin Documents

Master ESA. Macro-Econometrie. Cours de C. Hurlin 24

où q désigne un paramètre de troncature et K (u) désigne une fonction kernel etype quadratic spectral (QS) telle que

K (u) =3

(6πu/5)2sin (6πu/5)

6πu/5− cos (6πu/5) u = 0 (3.22)

A la différence de Newey et West (1987) et de Gallant (1987), l’estimateurd’Andrews tient compte non pas de q matrice Γv, mais de T − 1 matrices. Parexemple, toujours avec l’hypothèse q = 2, on obtient alors :

Γ0 +T−1

v=1

Kv

q + 1Γv + Γv = Γ0 +

q

v=1

K (v/3) Γv + Γv

= Γ0 + 0.85 Γ1 + Γ1 + 0.5 Γ2 + Γ2 + ..

Andrews recommande en outre de multiplier l’estimateur kernel par un facteurT/ (T − k) lorsqu’il, s’agit d’estimer la variance de long terme des résidus d’unmodèle à k paramètres.

Un estimateur similaire est proposé par Gallant (1987) à partir d’un Kernelde Parzen.

Definition 3.5. En présence de dépendances temporelles des vecteurs h (θ0, wt)∞t=−∞ ,l’estimateur non paramétrique de Gallant (1987)de la matrice de variance covari-ance asymptotique S est donné par :

SG = Γ0 +

q

v=1

Kv

q + 1Γv + Γv (3.23)

où q désigne un paramètre de troncature et K (u) désigne une fonction kernel deParzen telle que

K (u) =

1− 6 |u|2 + 6 |u|32 (1− |u|)30

si 0 ≤ |u| ≤ 1/2si 1/2 ≤ |u| ≤ 1sinon

(3.24)

Ainsi si par exemple, on a q = 2 :

SG = Γ0 +5

9Γ1 + Γ1 +

2

27Γ2 + Γ2

Enfin, en ce qui concerne les formules de détermination des paramètres detroncature (ou des paramètres bandwith quivant les cas) q, on peut se réferrer àAndrews (1991) et à Newey et West (1994). En particulier, dans un cas scalaire

Page 28: MASTER ECONOMETRIE ET STATISTIQUE …MASTER ECONOMETRIE ET STATISTIQUE APPLIQUEE (ESA) Université d’Orléans Macro-Econométrie Méthodes de Moments Christophe Hurlin Documents

Master ESA. Macro-Econometrie. Cours de C. Hurlin 25

la valeur optimale au sens d’Andrews (1991) du paramètre de troncature q pourune fonction kernel de Bartlett correspond à l’entier le plus proche de la quantité:

q = 1. 8171r1

1− r21

23

(T − 2) 13 (3.25)

où r1désigne l’autocorrélation d’ordre un des résidus.

4. Distribution asymptotique des GMM

Nous ne considérons ici que le cas des estimateurs de type GMM en deux étapes.Nous commencerons par présenter la distribution asymptotique générale des GMM,puis nous étudierons quelques illustrations dans des cas particuliers.

4.1. Distribution asymptotique des GMM

Commençons par un certain nombre de rappels.

Rappel 1 Soit y un vecteur (n, 1) fonction d’un vecteur x de dimension (m, 1)tel que : y1

..yn

= f (x) =

f1 (x)..fn (x)

(4.1)

alors la matrice ∂y/∂x est une matrice (n,m) telle que

∂y

∂x=

∂f1 (x) /∂x..∂fn (x) /∂x

=

∂f1(x)∂x1

.. ∂f1(x)∂xm

.. ..∂fn(x)∂x1

.. ∂fn(x)∂xm

Rappel 2 Soit y = Ax om A est une matrice (n,m) alors :

∂y

∂x=

∂ (Ax)

∂x= A (4.2)

Rappel 3 Soit y = z x où z et x sont des vecteurs :

∂ (z x)

∂x= z (4.3)

Rappel 4 Soit x un vecteur (n, 1) , f (x) un vecteur de dimension (m, 1) et Aune matrice symétrique (m,m) , alors :

∂f (x) Af (x)

∂x= 2

∂f (x)

∂xAf (x) (4.4)

Page 29: MASTER ECONOMETRIE ET STATISTIQUE …MASTER ECONOMETRIE ET STATISTIQUE APPLIQUEE (ESA) Université d’Orléans Macro-Econométrie Méthodes de Moments Christophe Hurlin Documents

Master ESA. Macro-Econometrie. Cours de C. Hurlin 26

en cas particulier, si f (x) = x alors ∂f (x) /∂x = I, dès lors :

∂x Ax

∂x= 2Ax (4.5)

Soit θT l’estimateur GMM obtenue en minimisant le critère :

θT =ArgMinθ∈Ra

[g (YT , θ)](1,r)

S−1T(r,r)

g (YT , θ)(r,1)

(4.6)

où ST est considérée comme fixe par rapport à θ et ST est un estimateur conver-gent de S.

STp−→

T→∞S

Cette minimisation de crière est obtenue en annulant la dérivée du critère parrapport au vecteur θ.

Definition 4.1. L’esimateur GMM est donc obtenu par la résolutiondu système d’équations non linéaires suivant :

∂g (YT , θ)

∂θ θ(a,r)

× S−1T(r,r)

× g YT , θ

(r,1)

= 0(a,1)

(4.7)

Il faut bien comprendre ici que la matrice ∂g(YT ,θ)∂θ

θdésigne une matrice

de dimension (r, a) dans laquelle figurent les dérivées de la fonction vectorielleg (YT , θ) par rapport aux a éléments du vecteur θ et que ces dérivées sont évaluéesau point θ = θ, estimateur GMM.

On sait que g (YT , θ) désigne la moyenne empirique d’un processus h (θ0, wt)dont l’espérance est nulle :

g (YT , θ) =1

T

T

t=1

h (θ, wt) (4.8)

avec E [h (θ0, wt)] = 0. Dès lors, on peut appliquer sous certaines conditions(stationnarité des variables wt, continuité de la fonction h (θ0, wt) et restrictionssur les autres moments) un théorème central limite.

Résultat Sous certaines restrictions (stationnarité des variables wt, con-tinuité de la fonction h (θ0, wt) et restrictions sur les autres mo-ments), on a: √

Tg (YT , θ0)L−→

T→∞N (0, S) (4.9)

Page 30: MASTER ECONOMETRIE ET STATISTIQUE …MASTER ECONOMETRIE ET STATISTIQUE APPLIQUEE (ESA) Université d’Orléans Macro-Econométrie Méthodes de Moments Christophe Hurlin Documents

Master ESA. Macro-Econometrie. Cours de C. Hurlin 27

où S = ∞v=−∞ Γv =

∞v=−∞E h (θ0, wt)h (θ0, wt−v) telle que :

S = limT→∞

T E g (YT , θ0) g (YT , θ0) (4.10)

En effet, on rappelle que d’après l’énoncé du TCL√T h−E h

L−→T→∞

N 0, V h , avec ici E h = E (h (θ0, wt)) = 0 et V h = S.

Ces résultats suffisent à montrer que l’estimateur GMM θT est asympto-tiquement distribué et à calculer sa matrice de variance covariance asymptotique(Hansen, 1982) :

Theorem 4.2. On suppose que la fonction g (YT , θ) est differentiable enθ pour tout YT et soit θT l’estimateur GMM statisfaisant le système (4.7)pour r ≥ a. Soit ST

T=1une séquence de matrices définies positives

telles que STp→ S, où S est définie positive. Si

(i) θTp→ θ0

(ii)√Tg (YT , θ0)

L→ N (0, S)

(iii) pour toute séquence θT∞

T=1telle que θT

p→ θ0, on ait

plim∂g (YT , θ)

∂θ θT

= plim∂g (YT , θ)

∂θ θ0

= D(a,r)

(4.11)

où les colonnes de D sont linéairement indépendantes, alors :

√T θT − θ0

L−→T→∞

N (0, V ) (4.12)

avec

V(a,a)

= D(a,r)

S−1(r,r)

D(r,a)

−1(4.13)

La démonstration de ce théorème est donnée dans Hamilton (1994). Bienévidemment la matrice de variance covariance asymptotique V de l’estimateurGMM ne peut être évaluée directement puisqu’elle dépende de θ0. Généralement,on utilise l’approximation suivante.

Résultat Sous les hypothèses du théorème 1, on admet que :

√T θT − θ0

L−→T→∞

N 0, VT (4.14)

Page 31: MASTER ECONOMETRIE ET STATISTIQUE …MASTER ECONOMETRIE ET STATISTIQUE APPLIQUEE (ESA) Université d’Orléans Macro-Econométrie Méthodes de Moments Christophe Hurlin Documents

Master ESA. Macro-Econometrie. Cours de C. Hurlin 28

ce qui peut encore s’écrire sous la forme :

θT ∼= N θ0,VTT

(4.15)

où l’estimateur VT = DS−1D−1de la matrice de variance covariance

asympotique est construit à partir de :

D =∂g (YT , θ)

∂θ θ=θT

(4.16)

avec en l’absence de corrélation des séries h θT , wt

ST =1

T

T

t=1

h θT , wt h θT , wt (4.17)

ou en présence de corrélation :

S = Γ0 +

q

v=1

1− v

q + 1Γv + Γv (4.18)

Γv =1

T

T

t=v+1

h θ, wt h θ, wt−v (4.19)

4.2. Illustrations dans des cas particuliers

Considérons quelques cas particuliers en commençant .par les MCO.

4.2.1. Cas particulier : Moindre Carré Ordinaires

Reprenons le modèle de régression standard :

yt = xt β0 + ut (4.20)

où xt est un vecteur de dimension (k, 1) de variables explicatives. On a vu quela propriété d’orthogonalité des résidus théoriques par rapport aux variablesexplicatives E (xtut) = 0 se traduit par un système de k conditions d’orthog-onalité. Posons dans nos notations wt = (yt xt) et θ = β, on a :

h (θ, wt) = xt (yt − xt β)

E [h (θ0, wt)] = 0

Page 32: MASTER ECONOMETRIE ET STATISTIQUE …MASTER ECONOMETRIE ET STATISTIQUE APPLIQUEE (ESA) Université d’Orléans Macro-Econométrie Méthodes de Moments Christophe Hurlin Documents

Master ESA. Macro-Econometrie. Cours de C. Hurlin 29

Le système étant juste identifié (a = k), l’estimateur GMM se ramène àdéterminer θT tel que

g YT , θT =1

T

T

t=1

xt yt − xt βT = 0 (4.21)

Ce qui nous amène à retrouver l’estimateur MCO :

βT = βMCO =T

t=1

xtxt

−1 T

t=1

xt yt (4.22)

Quelle est maitenant l’expression de la matrice de variance covariance de l’es-timateur βT ? En différentiant h (θ, wt) , il vient

D =∂g (YT , θ)

∂θ θ=θT

=1

T

∂ Tt=1 xt (yt − xt β)

∂ββ=βT

= − 1T

T

t=1

xtxt (4.23)

car on rappelle que ∂Ax/∂x = A et que donc ∂Ax/∂x = A. Parallèment, lamatrice de variance covariance asymptotique des résidus h (θ, wt) s’écrit :

S = limT→∞

1

T

v=−∞

T

t=1

E h (θ0, wt) h (θ0, wt−v) (4.24)

Ici on a donc :

S = limT→∞

1

T

v=−∞

T

t=1

E xt ut (xt−vut−v)

= limT→∞

1

T

v=−∞

T

t=1

E utut−vxtxt−v (4.25)

Supposons tout d’abord que les résidus sont non auto-corrélés, alors :

E utut−vxtxt−v =σ2εE (xtxt)0

pour v = 0sinon

(4.26)

Par conséquent un estimateur de S est donné par :

ST = σ2ε1

T

T

t=1

xtxt (4.27)

Page 33: MASTER ECONOMETRIE ET STATISTIQUE …MASTER ECONOMETRIE ET STATISTIQUE APPLIQUEE (ESA) Université d’Orléans Macro-Econométrie Méthodes de Moments Christophe Hurlin Documents

Master ESA. Macro-Econometrie. Cours de C. Hurlin 30

avec

σ2ε =1

T

T

t=1

u2t (4.28)

où ut = yt − xtβ désigne le résidu estimé. On retrouve ainsi la formule de laproposition dans laquelle on donnait la forme générale de l’estimateur ST enl’absence de dépendance à savoir :

ST =1

T

T

t=1

h θT , wt h θT , wt

=1

T

T

t=1

xt ut (xtut)

=1

T

T

t=1

u2t1

T

T

t=1

xtxt

Déterminons finalement la matrice de variance covariance de l’estimateurGMM : √

T θT − θ0L−→

T→∞N 0, VT

avec VT = DS−1D . Dès lors, il vient :

VT =

− 1T

T

t=1

xtxt σ2ε1

T

T

t=1

xtxt

−1

− 1T

T

t=1

xtxt

−1

= T σ2ε

T

t=1

xtxt

−1

Par conséquent la matrice de variance covariance de l’estimateur GMM s’écritsous la forme :

θT ∼= N θ0,VTT

(4.29)

VTT= σ2ε

T

t=1

xtxt

−1

(4.30)

On retrouve ici la formule de la matrice de variance covariance des MCO (la seuledifférence étant la définition de l’estimateur de la variance des résidus).

Dans le cas où les résidus sont auto-corrélés ou conditionnellement hétéroscé-dastiques,

Page 34: MASTER ECONOMETRIE ET STATISTIQUE …MASTER ECONOMETRIE ET STATISTIQUE APPLIQUEE (ESA) Université d’Orléans Macro-Econométrie Méthodes de Moments Christophe Hurlin Documents

Master ESA. Macro-Econometrie. Cours de C. Hurlin 31

4.2.2. Cas particulier : Variables Instrumentales

Considérons à nouveau un modèle de régression standard :

yt = zt β0 + ut (4.31)

où zt est un vecteur de dimension (k, 1) de variables explicatives. Supposonsqu’un certain nombre de variables explicatives soient endogènes c’est à dire queE (ztut) = 0. Soit xt un vecteur (r, 1) de variables explicatives prédeterminéescorrélées avec les variables zt mais non corrélées avec les résidus ut tel queE (xtut) = 0 . Posons wt = (yt xt zt) et θ = β, a = k, cette contrainte nousdéfinit r conditions d’orthogonalité :

E [h (θ0, wt)] = E [xt (yt − zt β0)] = 0 (4.32)

avec h (θ, wt) = xt (yt − zt β) . Soit g (YT , θ) le vecteur des moments empiriquescorrespondant aux r conditions d’orthogonalité.

g (YT , θ) =1

T

T

t=1

h (θ, wt) =1

T

T

t=1

xt (yt − zt β)

Soit θT = βT l’estimateur GMM obtenu par la résolution du système :

g YT , θT =1

T

T

t=1

xt yt − zt βT = 0⇐⇒ βT =T

t=1

xtzt

−1 T

t=1

xt yt

(4.33)Calculons la matrice de variance civariance asymptotique de βT en utilisant

le résultat général d’Hansen (1982).

θT ∼= N θ0,VTT

(4.34)

où l’estimateur VT = DS−1D−1de la matrice de variance covariance asympo-

tique est construit à partir de :

D =∂g (YT , θ)

∂θ θ=θT

=1

T

T

t=1

∂xt (yt − zt β)∂β β=βT

= − 1T

T

t=1

xtzt

= − 1T

T

t=1

ztxt

Page 35: MASTER ECONOMETRIE ET STATISTIQUE …MASTER ECONOMETRIE ET STATISTIQUE APPLIQUEE (ESA) Université d’Orléans Macro-Econométrie Méthodes de Moments Christophe Hurlin Documents

Master ESA. Macro-Econometrie. Cours de C. Hurlin 32

Le théorème d’Hansen suppose que la plim de cette matrice possède descolonne slinéairement indépendantes (condition usuel de convergence de l’esti-mateur IV). Dès lors la matrice de variance covariance de θT est :

VTT=1

T

1

T

T

t=1

ztxt S−1T1

T

T

t=1

xtzt

−1

(4.35)

où ST est un estimateur de

S = limT→∞

1

T

v=−∞

T

t=1

E utut−vxtxt−v

Si les résidus ut sont homoscédastiques et non auto-corrélés alors un estimateurnaturel de S est donné par :

ST =1

Tσ2T

T

t=1

xtxt (4.36)

avec

σ2T =1

T

T

t=1

yt − zt βT2

.

En utilisant cette expression de ST , on montre que :

E βT − β0 βT − β01

T

1

T

T

t=1

ztxt1

Tσ2T

T

t=1

xtxt

−11

T

T

t=1

xtzt

−1

σ2T

1

T

T

t=1

ztxt

T

t=1

xtxt

−11

T

T

t=1

xtzt

−1

σ2T1

T

T

t=1

ztxt

−1 T

t=1

xtxt1

T

T

t=1

xtzt

−1

On retrouve ainsi la matrice de variance covariance de l’estimateur des vari-ables instrumentales.

5. Résumé des GMM

On dispose d’un modèle théorique implique un ensemble de r conditions d’orthog-onalité s’écrivant sous la forme :

E [h (θ0, wt)] = 0(r,1)

(5.1)

Page 36: MASTER ECONOMETRIE ET STATISTIQUE …MASTER ECONOMETRIE ET STATISTIQUE APPLIQUEE (ESA) Université d’Orléans Macro-Econométrie Méthodes de Moments Christophe Hurlin Documents

Master ESA. Macro-Econometrie. Cours de C. Hurlin 33

où wt désigne un ensemble de variables stationnaires observées à la date t et où θ0est la vraie valeur (inconnue) d’un vecetur de paramètres θ0 de dimension (a, 1) .La fonction h (.) est une fonction de dimension (r, 1) différentiable avec r ≥ a.L’estimateur GMM θT est obtenu en minimisant la fonction critère (ou fonctionde perte) :

Q (θ, YT ) = [g (YT , θ)](1,r)

S−1T(r,r)

g (YT , θ)(r,1)

(5.2)

avec

g (YT , θ) =1

T

T

t=1

h (θ, wt) (5.3)

et où ST est un estimateur de :

S(r,r)

= limT→∞

1

T

T

t=1

v=−∞E h (θ0, wt)h (θ0, wt−v) (5.4)

On peut alors montrer qu’asymptotiquement :

θT ∼ N θ0,VTT

(5.5)

avec :VT = DS−1T D

−1(5.6)

D =∂g (YT , θ)

∂θ θ=θT

(5.7)

6. Application SAS : procédure MODEL

Dans le cas de modèles ARCH nous avons déjà étudié la procédure MODEL quenous ne présenterons que briévement en isnsistant sur les dimensions plus spéci-fiques aux GMM. Cette procédure permet entre autres d’estimer le modèle parles MCO et Double MCO, les méthodes SUR et SUR itératif, les Triple MoindresCarrés, les GMM et le maximum de vraisemblance à information complète ouFIML. La syntaxe générale est de la forme suivante (entres autres) :PROC MODEL options;ENDOGENOUS variable [ initial values ] ... ;ESTIMATE item [ , item ... ] [ ,/ options ] ;EXOGENOUS variable [ initial values ] ... ;OUTVARS variable ... ;INSTRUMENTS [ instruments ] [_EXOG_ ] [EXCLUDE=(parameters) ]

[/ options ] ;

Page 37: MASTER ECONOMETRIE ET STATISTIQUE …MASTER ECONOMETRIE ET STATISTIQUE APPLIQUEE (ESA) Université d’Orléans Macro-Econométrie Méthodes de Moments Christophe Hurlin Documents

Master ESA. Macro-Econometrie. Cours de C. Hurlin 34

PARAMETERS variable [ value ] variable [ value ] ... ;SOLVE variables [SATISFY=(equations) ] [/ options ] ;TEST [ ”name” ] test1 [, test2 ... ] [,/ options ] ;VAR variable [ initial values ] ... ;Nous commenterons successivement deux points de cette procédure :

• la spécification du modèle et des instruments• le contrôle de la procédure d’estimation

6.1. Spécification du modèle et des instruments

De façon générale, cette procédure permet de d’estimer un modèle non linéairede la forme :

εt = q (yt, xt, θ) (6.1)

zt = Z (xt) (6.2)

où q est un vecteur de g fonctions rélles, yt ∈ Rg, xt ∈ Rl et θ ∈ Rp. g désignedonc le nombre d’équations, l le nombre de variables exogènes xt, p le nombre deparamètres. Le vecteur zt ∈ Rk est un vecteur d’instruments et εt est composanted’erreur inobservable telle que :

E (εt) = 0 (6.3)

E (εtεt) = Σ (6.4)

La première étape de la procédure model consiste à spécifier le modèle. Pourcela, considérons le cas d’une équation. On spécifie une équation sous la formed’un résidu. Supposons que l’on veuille spécifier l’équation :

εt = a+ b ln (cy + dx) (6.5)

on utilise alors la notation

EQ.[name]=a+b*log(c*y+d*x);

L’utilisation du préfixe EQ. permet de spécifier à SAS que la variable est unterme d’erreur et qu’il n’existe pas de variable portant ce nom dans le fichier dedonnées.

Lorsqu’il s’agit de spécifier plusiseurs équations dans un système on peututiliser la syntaxe présenté dans l’exemple (6.1). Supposons par exemple que l’onconsidère un modèle offre -demande. On considère l’exemple du fichier citimon

Page 38: MASTER ECONOMETRIE ET STATISTIQUE …MASTER ECONOMETRIE ET STATISTIQUE APPLIQUEE (ESA) Université d’Orléans Macro-Econométrie Méthodes de Moments Christophe Hurlin Documents

Master ESA. Macro-Econometrie. Cours de C. Hurlin 35

de l’aide de SAS dans lequel figurent la consommation d’energie consommée auxEtats Unis (données mensuelles janvier 1980 - janvier 1992) correspondant à lavariable EEC, le price de détail de l’essence (variable EEGP) et le revenu desconsommateur (variabe CCIUTC). On soushaite estimer le système d’équationssimultannées :

qt = α1 + α2 prixt + α3revenut + εt (6.6)

qt = β1 + β2 prixt + µt (6.7)

Ce système admet deux variables endogènes : la quantité qt et les prix. Laprocédure de spécification est alors donnée dans l’exemple (6.1).

Figure 6.1: Procédure MODEL

Dans ce cas, on ne peut pas utiliser les MCO et l’on peut dans ce cas estimer lesystème par la méthode des Triples Moindres Carrés Ordinaires (N3SLS). Cetteméthode requiert de spécifier des instruments : dans ce cas on utilise les variablesprédéterminées prixt−1 et prixt−2, mais aussi les variables exogènes du système :la variable de revenu et une autre varaible non utilisée dans le système, à savoir lavariable la valeur du dollar qui impacte la demande energétique (variable EXVUS,WEIGHTED-AVERAGE EXCHANGE VALUE OF U.S.) On a donc au total 4variables instrumentales : EXVUS, CCITC, lag(EEGP) et lag2(EEGP). Cette

Page 39: MASTER ECONOMETRIE ET STATISTIQUE …MASTER ECONOMETRIE ET STATISTIQUE APPLIQUEE (ESA) Université d’Orléans Macro-Econométrie Méthodes de Moments Christophe Hurlin Documents

Master ESA. Macro-Econometrie. Cours de C. Hurlin 36

liste d’instrument est spécifiée grâce à l’instruction INSTRUMENTS. Il y a deuxfaçons de spécifier les instruments :

• INSTRUMENTS variables [ _EXOG_ ] ;

• INSTRUMENTS [instruments] [ _EXOG_ ] [ EXCLUDE=( pa-rameters ) ] [ / options ] ;

Dans le premier on spécifie une liste globale par défaut d’instrument qui serautilisée dans la procédure d’estimation (FIT). On peut déclarer une liste de vari-able (INSTRUMENTS var1 var2) et/ou utiliser le mot réservé _EXOG_qui permet de spécifier toutes les variables déclarées comme exogènes avec l’op-tion EXOGENEOUS. Cette instruction doit être placée avant la commandeFIT. C’est cette syntaxe qui est utilisée dans l’exemple (6.1). La seconde façoncosnsite à décalrer soit des variables, soit des noms de paramètres ou des motsréservés comme _EXOG_. Si l’on spécifie un paramètre dans la liste, la dérivéepartielle des éuqtaions par rapport à ce paramètre est utiliséee comme instru-ment. Par exemple, dans un modèle à deux équations y1 et y2, où x1 est unevariable exogène, le paramètre b1 intervient uniquement dans l’équation de y1,et b2 et c2 dans l’équationd e y2 si l’on met

INST b1 b2 c2 x1 ;

SAS considère 5 instruments : la constante (par défaut), l’exogène x1, ladérivée de y1 par rapport à b1 ainsi que les deux dérivées de y2 par rapport à b2et c2 ce qui est noté sous la forme suivante (figure 6.2) :

Figure 6.2: Procédure MODEL

L’option EXCLUDE= (parameters) spécifie que tous les paramètres sauf ceuxentre paramètres sont considérés dans la liste des instruments. Différentes optionspeuvent être utilisées. NOINTERCEPT ou NOINT permet de ne pas mettrede constante dans la liste des instruments. Par défaut il y a toujours une constantedans la liste des instruments.

Page 40: MASTER ECONOMETRIE ET STATISTIQUE …MASTER ECONOMETRIE ET STATISTIQUE APPLIQUEE (ESA) Université d’Orléans Macro-Econométrie Méthodes de Moments Christophe Hurlin Documents

Master ESA. Macro-Econometrie. Cours de C. Hurlin 37

6.2. La procédure d’estimation

L’estimation des paramètres déclarés dans la commande PARAMETERS estréalisé avec l’instruction FIT (voir document annexe pour les options). SASpermet d’effectuer soit des GMM en deux étapes (GMM) soit des GMM itératif(ITGMM) mais ne permet pas d’estimer par des techniques du type continuousupdating GMM.

De façon générale, cette procédure permet de d’estimer un modèle non linéairede la forme :

εt = q (yt, xt, θ) (6.8)

zt = Z (xt) (6.9)

où q est un vecteur de g fonctions rélles, yt ∈ Rg, xt ∈ Rl et θ ∈ Rp. g désignedonc le nombre d’équations, l le nombre de variables exogènes xt, p le nombre deparamètres. Le vecteur zt ∈ Rk est un vecteur d’instruments et εt est composanted’erreur inobservable telle que :

E (εt) = 0 (6.10)

E (εtεt) = Σ (6.11)

Résultat Sous SAS, dans le cas des GMMen deux étapes, la matrice devariance covariance asymptotique est estimée suivant la formule

S =T−1

τ=−T+1w

τ

l (T )D cΓτD

c (6.12)

Γv =T

t=v+1

h θ, wt h θ, wt−v

=T

t=v+1

q yt, xt, θ ⊗ zt q yt−v, xt−v, θ ⊗ zt−v (6.13)

où θ désigne un estimateur des Doubles Moindres Carrés (2SLS),où l (T ) est une fonction sacalaire permettant de calculer le band-witdh parameter, w (.) est une fonction kernel et D est une matricede correction diagonale (-Gallant, 1987).

Page 41: MASTER ECONOMETRIE ET STATISTIQUE …MASTER ECONOMETRIE ET STATISTIQUE APPLIQUEE (ESA) Université d’Orléans Macro-Econométrie Méthodes de Moments Christophe Hurlin Documents

Master ESA. Macro-Econometrie. Cours de C. Hurlin 38

On retrouve ainsi les même formules que précedemment à quelques différencesprès. La première tient à la somme dans l’équation (6.12). En effet, nous avionsécrit dans la section précédente pour l’estimateur de Newey West par exemple

SNW = Γ0 +

q

v=1

w (v, q) Γv + Γv avec w (v, q) = 1− v

q + 1(6.14)

où q désigne un paramètre de troncature. Dans le cas d’une fenêtre de Bartlett(Newey et West, 1987) les poids au delà de q sont nulles ce qui permet de réecrireSachant que Γ−v = Γv

S = Γ0 +

q

v=1

w (v, q) Γv + Γv

=

q

v=−qw

v

l (T )Γv

=T−1

v=−(T−1)w

v

l (T )Γv

car sir v > q alors w(v/q) = 0. La seconde différence réside dans la matrice decorrection Dc utilisée pour la correction de l’estimation de la matricede variance covariance dans les petits échantillons (Gallant,1987). La formede cette matrice dépend de l’optionVARDEF. Cette matrice Dc est une matricediagonale dont les élements Di de la diagonale sont définis comme suit :

• Di = 1/√T si VARDEF=N

• Di = 1/√T − dfi si VARDEF=DF, où dfi désigne le nombre de degré de

liberté de l’équation i.

Par défaut SAS utilise la correction VARDEF=N. Ainsi on retrouve le facteur1/T dans la définition usuelle de l’estimateur Γv.

En ce qui concerne le choix de l’estimateur kernel, SAS offre troispossibilités grace à l’option KERNEL. Il s’agit des trois kernels présentésprécédemment à savoir :

• Kernel de type Bartlett (Newey et West, 1987) : KERNEL=BART• Kernel de type Quadratic Spectral (Andrews, 1991) : KERNEL=QS

Page 42: MASTER ECONOMETRIE ET STATISTIQUE …MASTER ECONOMETRIE ET STATISTIQUE APPLIQUEE (ESA) Université d’Orléans Macro-Econométrie Méthodes de Moments Christophe Hurlin Documents

Master ESA. Macro-Econometrie. Cours de C. Hurlin 39

• Kernel de type Parzen (Gallant, 1987) : KERNEL=PARZEN

La syntaxe de cette option est de la forme :

KERNEL=(PARZEN | QS | BART , c , e)

Par défaut SAS utilise un kernel de type Parzen. Les paramètres c et e serventà spécifier le paramètre bandwidth selon la formule :

bandwidth parameter = l (T ) = c T e (6.15)

où T désigne le nombre d’observation. Un message d’alarme est donné si ceparamètre est supérieur à T 1/3. Dans nos notations précédentes, on a l (T ) = q−1.Si rien n’est spécifié, alors SAS propose les règles de calculs suivantes en fonctionde T (Andrews, 1991) :

l (T ) =1

2T 1/3 Kernel Bartlett (6.16)

l (T ) = T 1/5 Kernel Parzen (6.17)

l (T ) =1

2T 1/5 Kernel Quadratic Spectral (6.18)

Si l’on suppose que les moments h (wt, θ0) sont non auto-corrélés, la matrice devariance covariance de long terme correspond à la matrice de variance covarianceusuelle, et son estimateur est :

S = Γ0 =1

T

T

t=v+1

q yt, xt, θ ⊗ zt q yt, xt, θ ⊗ zt (6.19)

Dans ce cas, l’option KERNEL=(kernel,0,) est utilisée.

6.3. Estimation du modèle d’Hansen et Singleton (1982) sous SAS

On considère une application sous SAS d’un modèle de type Hansen- Singleton(1982). On consdière un agent à durée de vie infinie à anticipations rationnellesdont la fonction obejcetif est :

maxU =∞

τ=0

βτEt (ct+τ ) (6.20)

où ct désigne la consommation à la date t, 0 < β < 1 un facteur d’escompte psy-chologique et Et (ct+τ ) l’opérateur espérance conditionnelle à toute l’informationdisponible à la date t résumé par un vecteur xt d’instruments. Supposons que

Page 43: MASTER ECONOMETRIE ET STATISTIQUE …MASTER ECONOMETRIE ET STATISTIQUE APPLIQUEE (ESA) Université d’Orléans Macro-Econométrie Méthodes de Moments Christophe Hurlin Documents

Master ESA. Macro-Econometrie. Cours de C. Hurlin 40

l’agent puisse épargner et investir dans m titres indicés i = 1, .,m qui pour touteuro investit à la date t lui rapportent 1 + ri,t+1 à la période suivante. Pour unefonction d’utilité de type CRRA

u (ct) =c1−γt

1− γsiγ > 0 et γ = 1

où γ désigne le coefficient d’aversion relative pour le risque, les conditions d’ar-bitrage inter-temporelle se ramènent à :

1− βEt (1 + ri,t+1)ct+1ct

−γ= 0 i = 1, ..m (6.21)

Soit θ = (β γ) le vecteur de paramètres du modèles. Soitwt = (r1t+1 r2t+1 ...rmt+1 ct+1/ct xt)l’ensemble des variables observées par l’économètre à la date t. Au total si xt acontient n variables, on obtient pour chaque actif n conditions d’orthogonalité,soit un total de r = n×m, conditions d’orthogonalité.

h (θ, wt)(nm,1)

=h (θ, wt)(m,1)

⊗ xt(n,1)

=

1− β (1 + r1,t+1)ct+1ct

−γ

1− β (1 + r2,t+1)ct+1ct

−γ

...

1− β (1 + rm,t+1)ct+1ct

−γ

⊗ xt

(n,1)

où ⊗ désigne le produit de Kronecker. L’équivalent empirique s’écrit alors définipar :

g (YT , θ) =1

T

T

t=1

h (θ, wt)

L’estimateur GMM est alors obtenu en minimisant le critère :

Q (θ, YT ) =1

T

T

t=1

h (θ, wt) WT1

T

T

t=1

h (θ, wt) (6.22)

On considère dans cette application les données de Ferson et Harvey (1992)reprises dans l’exemple proposé dans la documentation SAS2. Les auteurs consid-èrent des données trimestrielles pour les Etats Unis allant du deuxième trimestre1947 (codé 1947.6) au quatrième trimestre de 1987 (1987.12). Comme mesurede la consommation réelle, les auteurs utilisent la consommation de bien non

2Fichier Macro3_Hansen_Singleton.sas

Page 44: MASTER ECONOMETRIE ET STATISTIQUE …MASTER ECONOMETRIE ET STATISTIQUE APPLIQUEE (ESA) Université d’Orléans Macro-Econométrie Méthodes de Moments Christophe Hurlin Documents

Master ESA. Macro-Econometrie. Cours de C. Hurlin 41

durables corrigée des variations saisonnières rapportée à un déflateur de la con-sommation en données CVS. La croissance de la conosmmation représentée parle ratio (Ct+1 − Ct) /Ct est désigné par la variable CONRAT. Les auteurs consid-èrent en outre m = 4 rendements d’actifs exprimés sous la forme de rendementsc’est à dire sous la forme ri,t+1.

• Rendements réels sur les obligations émises par le gouvernement. Variable: GB

• Rendements réels sur les obligations émises par les entreprises. Variable :CB

• Rendements réels sur les actions, 1er décile. Variable : D1• Rendements réels sur les actions, 10ème décile. Variable : D10

Les rendements réels sont obtenus en dividant les rendements nominaux parl’indice de prix à la consommation correspondant à l’indice de consommationutilisé. En ce qui concerne les instruments xt, les auteurs considèrent au total9 instruments (n = 7). Ils considèrent les rendements réels (variable RINST)et de la croissance de la consommation réelle (variable CINST) retardées de 1à 3 périodes. Toutes ces variables sont donc connues de l’agent à la date t. Leneuvième instrument correspond par défaut à la constante.Danc ce programme (figure 6.3) on estime le modèle par la méthode des GMM

itérés (ITGMM) en utilisant une fonction kernel de type Parzen. Les conditionsinitiales sur β et sur γ sont fixées 0.1. Pour ces quatre équations avec 7 instru-ments, on dipose de 28 conditions d’orthogonalité pour estimer 2 paramètres.Le système est donc largement sur-identifié. Les résultats de la procédure sontreproduits sur les figures (6.4), (6.5) et (6.6).Sur la figure figures (6.4), on vérifie que le model comporte au total 5 vari-

ables dont une endogène (CONRAT) et quatre exogènes (GB, CB, D1 et D10).Ce modèle comporte deux paramètres (β et γ) et quatre équations (nomméesh1, h2, h3 et h4), représentées par le vecteur h (θ, wt) . Un message prévient queces deux paramètres sont présents dans les quatre équations : ce qui impliquenotamment que si l’on spécifie par exemple β dans la litse des instruments, lesdérivées des quatre équations par rapport à β seront considérées comme intru-ments. SAS fournit enfin la liste des 7 variables instruments, la constante etantnommée 1. Un message prévient que l’algorithme d’optimisation a convergé.Sur la figure (6.5) les détails de la procédure d’estimation GMM iétartif sont

donnés. On rappelle le nombre de paramètres a estimer, a = 2, le choix du kernel(Parzen). La valeur du paramètre du bandwitdh parameter est donnée bandwidth

Page 45: MASTER ECONOMETRIE ET STATISTIQUE …MASTER ECONOMETRIE ET STATISTIQUE APPLIQUEE (ESA) Université d’Orléans Macro-Econométrie Méthodes de Moments Christophe Hurlin Documents

Master ESA. Macro-Econometrie. Cours de C. Hurlin 42

Figure 6.3: Procédure MODEL

parameter = l (T ) = 2.75459. Et SAS spécifie la éthode d’optimisation numériqueretenue, à savoir la méthode de Gauss newton. Parmi les différentes indica-tions concernant la convergence de l’algorithme apparait la valeur OBJECTIVEVALUE qui correspond à la valeur optimale du critère Q θ, YT , qui permetnotamment de construire la J statistique du test de sur-identification d’Hansen(1982). Pour les autres critères de convergence, se reporter à la documentationSAS de la procédure MODEL.

Enfin sur la figure (6.6), figurent les résultats d’estimation a proprement parlé.On remarquera qua la valeur estimé de β au point moyen est supérieure à l’unité cequi viole la condition de convergence théorique d’un tel modèle. Une contraintedu type BOUNDS beta<c, où c < 1 permet alors d’éviter ce problème, mais

Page 46: MASTER ECONOMETRIE ET STATISTIQUE …MASTER ECONOMETRIE ET STATISTIQUE APPLIQUEE (ESA) Université d’Orléans Macro-Econométrie Méthodes de Moments Christophe Hurlin Documents

Master ESA. Macro-Econometrie. Cours de C. Hurlin 43

Figure 6.4: Résultats Procédure MODEL : Partie I

l’estimateur obtenu bute alors sur la contrainte. Figure parmi les résultats lavaleur de la J statistique du test de sur-identification d’Hansen (1982) définie parObjective*N.

7. Inférence avec les GMM

Lorsque le nombre de conditions d’orthogonalité est supérieur au nombre deparamètres à estimer (r > a) on dit que le modèle est su-identifié. Dans cecas, il y a r − a conditions sur-identifiantes doivent être nulles si lemodèle est bien spécifié. C’est le principe d’un test de sur-idnetification outest de la J statistique

7.1. Test de sur-identification

Hansen (1982) a proposé un test permettant de déterminer si l’ensemble des

moments empiriques représentés par g YT , θT étaient aussi proches de zéro que

Page 47: MASTER ECONOMETRIE ET STATISTIQUE …MASTER ECONOMETRIE ET STATISTIQUE APPLIQUEE (ESA) Université d’Orléans Macro-Econométrie Méthodes de Moments Christophe Hurlin Documents

Master ESA. Macro-Econometrie. Cours de C. Hurlin 44

Figure 6.5: Résultats de la Procédure MODEL : Partie II

possible dès lors que E [h (θ0, wt)] = 0. En reprenant le résultat de normalité,sous H0, E [h (θ0, wt)] = 0 on peut montrer que :

√Tg (YT , θ0) S−1

√Tg (YT , θ0)

L−→T→∞

χ2 (r) (7.1)

Dans cette expression les moments empiriques g (YT , θ) sont évalués pour lavraie valeur des paramètres θ0. Une première intuition consisterait à sedire que convergence resterait vraie si l’on remplaçait θ0 par son esti-mateur convergent θT . Or ceci n’est pas vrai. En effet, il existe a combi-naisons linéaires des r éléments g YT , θT qui valent précisèment par définition

de l’estimateur θT . Ces a combinaison linéaires sont obtenues en prémultipliantg YT , θT par la matrice :

∂g (YT , θ)

∂θ θ(a,r)

× S−1T(r,r)

(7.2)

Page 48: MASTER ECONOMETRIE ET STATISTIQUE …MASTER ECONOMETRIE ET STATISTIQUE APPLIQUEE (ESA) Université d’Orléans Macro-Econométrie Méthodes de Moments Christophe Hurlin Documents

Master ESA. Macro-Econometrie. Cours de C. Hurlin 45

Figure 6.6: Résultats de la Procédure MODEL : Partie III

puisque par définition

∂g (YT , θ)

∂θ θ(a,r)

× S−1T(r,r)

× g YT , θ

(r,1)

= 0(a,1)

(7.3)

Par exemple, si a = r toute combinaison linéaire des g YT , θ est égale à

0, dès lors la quantité√Tg YT , θ S−1

√Tg YT , θ serait égale à 0 quelle

que soit l’échantillon. Dis autrement, on ne dispose que r− a variables aléatoireslinéairement indépendantes et non dégénérée dans le vecteur g YT , θ . Ce sontces variables qui doivent être étudiées.

Résultat Un test de l’hypothèse nulle E [h (θ0, wt)] = 0 (ou test de sur-idnetification pour le case r>a est donné par la J statistique

J =√Tg YT , θT S−1

√Tg YT , θT

L−→T→∞

χ2 (r − a) (7.4)

Cette statistique correspond au produit de la dimension T par lavaleur de la fontion objectif obtenue pouyr la valeur de l’estima-teur GMM θT

J = T Q θT , YT (7.5)

Page 49: MASTER ECONOMETRIE ET STATISTIQUE …MASTER ECONOMETRIE ET STATISTIQUE APPLIQUEE (ESA) Université d’Orléans Macro-Econométrie Méthodes de Moments Christophe Hurlin Documents

Master ESA. Macro-Econometrie. Cours de C. Hurlin 46

Malheureusement le test de Hansen présente de mauvaise propriété et ne de-tecte que très dificilement un modèle mal spécifié (Newey, 1985). C’est pourquoi,on peut utiliser en outre d’autres tests.

Enfin sous SAS, la réalisation de la J statistique associée au test de sur-identification d’Hansen (1982) est reportée dans le tableau de résultats sous lasyntaxe OBJECTIVE*N, N désignant le nombre d’observations. Admettonsque la réalisation de la J statistique soit égale à 40 pour un nombre de degrés deliberté (r− a dans nos notations) de 70 par exemple. Un programme permettantde récupérer la p-value associée à cette statistique est le suivant :

Figure 7.1: Calcul de la Pvalue Associée à la J statistique

7.2. Test de stabilité structurelle

Supposons que l’on veuille tester le fait que le vecetur de paramètres θ quicartérise les premières T0 observations de l’échantillon soit différent de la valeurqui caratérise les T − T0 observations suivantes. La date de rupture T0 est sup-posé connue. Une approche consiste à estimer θ1,T0 basé uniquement sur les T0premières observations en minismisant :

Q (θ1, w1, ..wT0) = [g (YT0 , θ1)](1,r)

S−1T0(r,r)

g (YT0 , θ1)(r,1)

(7.6)

avec

g (YT , θ1) =1

T0

T

t=1

h (θ1, wt) (7.7)

avec si les résidus sont non auto-corrélés :

S−1T0 =1

T0

T0

t=1

h θ1,T0 , wt h θ1,T0 , wt (7.8)

On sait qu’alors :T0 θ1,T0 − θ1

L−→T→∞

N (0, V1) (7.9)

V1,T0 = D1,T0S−11,T0D1,T0

−1(7.10)

Page 50: MASTER ECONOMETRIE ET STATISTIQUE …MASTER ECONOMETRIE ET STATISTIQUE APPLIQUEE (ESA) Université d’Orléans Macro-Econométrie Méthodes de Moments Christophe Hurlin Documents

Master ESA. Macro-Econometrie. Cours de C. Hurlin 47

D =∂g (YT , θ1)

∂θ1 θ=θ1,T0

(7.11)

On peut de façon similaire construire un estimateur θ2,T−T0 basé sur les T −T0dernières observations :

T − T0 θ2,T−T0 − θ2L−→

T→∞N (0, V2) (7.12)

On note π = T0/T la fraction des obseravtions appartenant à la première période.On a donc finallement :

√T θ1,T0 − θ1

L−→T→∞

N 0,V1π

(7.13)

√T θ2,T−T0 − θ2

L−→T→∞

N 0,V21− π

(7.14)

Andrews et Fair (1988) proposent d’utiliser un test de Wald de l”hypothèsenulle H0 : θ1 = θ2 en exploitant le fait que l’estimateur θ1,T0 est asymptotique-ment indépendant de θ2,T−T0 . On peut donc cosntruire une statistique de Waldasymptotiquement distribuée selon un chi-deux.

Résultat Le test de Wald d’Andrews et Fair (1988) de l’hypothèsenulle H0 : θ1 = θ2 est défini par la statistique :

λt = T θ1,T0 − θ2,T−T0 W−1 θ1,T0 − θ2,T−T0L−→

T→∞χ2 (a) (7.15)

avec

W =1

πV1,T0 +

1

1− πV2,T−T0 (7.16)

On peut aller encore plus loin dans cette optique et tester larupture pour un ensemble de dates T0 allant par exeple de 0.15Tà 0.85T et choisir la plus grande valeur pour la statistique λt (testd’Andrews, 1993)

Un autre test simple consite à assoicer des conditions d’orthogonalité dif-férentes aux deux sous périodes et utilser la J statistique pour tester la validitédes deux ensembles de conditions. Ainsi, on pose :

d1t =10

pour t ≤ T0pour t > T0

(7.17)

Page 51: MASTER ECONOMETRIE ET STATISTIQUE …MASTER ECONOMETRIE ET STATISTIQUE APPLIQUEE (ESA) Université d’Orléans Macro-Econométrie Méthodes de Moments Christophe Hurlin Documents

Master ESA. Macro-Econometrie. Cours de C. Hurlin 48

Supposons queE [h (θ0, wt)] = 0 définissse un vecteur de r conditions d’orthog-onalité et définissons :

h∗ (θ, wt, d1t)(2r,1)

=h (θ, wt) d1th (θ, wt) (1− d1t)

On estime les a éléments de θ à partir de ces 2r conditions d’orthogonalitéE [h∗ (θ, wt, d1t)] = 0. La J statistique obtenue à partir de ce sytème admet pourloi asymptotique un chi deux à 2r − a degrés de liberté. Cette J statistiquepermet alors de tester l’hypothèse de stabilité structurelle H0 : θ1 = θ2.

8. Maximum de Vraisemblance et GMM

9. Méthodes de Moments Simulés

9.1. Présentation de la Méthode des Moments Efficients (EMM)

La méthode des moments simulés a été proposé initiallement par Mac Fadden(Econometrica, 1989) dans le cas des modèles à réponse discrète. La méthodedes Moments Efficients (Efficient Method of Moment) est une méthode de mo-ments simulée particulière proposée par Gallant et Tauchen (1996, 2001). L’idéeconsiste à atteindre l’efficience de l’estimateur du maxiumum de varisemblance(MV) tout en maintenant la souplesse de l’estimateur des GMM. On rappelle quela méthode du MV peut être considérée comme une méthode de moments par-ticulière dans laquelle les conditions d’orthogonalité sont données par le vecteurdu score, c’est à dire le vecteur des dérivées premières de la log-vraisemblancepar rapport aux paramètres. Un des problèmes essentiels des MV est que cettefonction de varisemblance peut e^tre diffcile à construire pour des modèles com-pliqués, et de plus même si l’on connaît sa forme téhorique dans certains cas sonimplementation peut être impossible. C’est en particulier le cas lorsque le modèledépend d’une endogène non observable retardée : dans ce cas la vraisemblancedépend d’une intégrale multiple et la dimension de cette intégrale correspond àla taille de l’échantillon.

Principe Général L’idée des EMM comme de toute méthode de mo-ments simulés consiste à estimer les paramètres θ ∈ Ra d’un mod-èle structurel en rapprochant des moments établis d’un modèleauxiliaire de pseudo paramètres β ∈ Rk, et calculés d’une part surdonnées historiques et d’autres sur données simulées à partir dumodèle structurel. On cherche donc la valeur de θ dans le modèle

Page 52: MASTER ECONOMETRIE ET STATISTIQUE …MASTER ECONOMETRIE ET STATISTIQUE APPLIQUEE (ESA) Université d’Orléans Macro-Econométrie Méthodes de Moments Christophe Hurlin Documents

Master ESA. Macro-Econometrie. Cours de C. Hurlin 49

structurel qui permet de simuler des séries qui en moyenne pos-sèdent les mêmes moments établis à partir du modèle auxiliaireque ceux que l’on peut calculés à partir des séries historiques.

Dans le cas précis des EMM, les moments (ou modèle auxiliaire) correspondentau score de la log-vraisemblance associés aux paramètres β. Naturellement l’iden-tification des paramètres θ implique en particulier que k ≥ a, on supposera icique a = k. Le choix du modèle auxiliaire est laissé libre : il convient de choisirun model permettant de bien approximer la dynamique du DGP touten conservant la faisabilité du maximum de vraisemblance.

On considère un modèle structurel de paramètres θ ∈ Ra inconnus, de vecteurde variables endogènes Yt de dimension (b, 1) . et d’un ensemble de p chocsreprésentés par le vecteur εt, t = 1.., T . Soit ε = (ε1 , .., εT ) (voir synthèsefigure ). On considère un échantillon de T observations y1, ..yT . On consid-ère un pseudo modèle (ou modèle auxiliaire ou générateur de score)paramétrisé par les pseudo paramètres β = (β1..βk) ∈ Rk avec k = a. Soitf (yt| yt−1, β) la fonction de transition associée à ce modèle. L’estimateur β duMV des paramètres β obtenu à partir de l’échantillon historique vérifie :

∂L (β)

∂β β=β

=T

t=1

∂f (yt| yt−1, β)∂β β=β

= 0 (9.1)

Ce qui peut sécrire sous la forme de conditions d’orthogonalité :

1

T

T

t=1

sf Yt,β = 0 (9.2)

où la quantité sf Yt, β désigne le score du modèle auxiliaire :

sf (Yt,β) =∂f (yt| yt−1, β)

∂β(9.3)

De plus, on peut construire un estimateur de la matrice de variance covarianceasymptotique du score du modèle théorique à partir du pseudo score sf Yt, βide la façon suivante (Gaalnt et Long, 1987) :

VT =1

T

T

t=1

sf Yt,β sf Yt,β

L’idée des EMM consiste à trouver la valeur des paramètres θ du modèlestructurel tel que pour un tirage des chocs ε, la série simulée de dimension T,

Page 53: MASTER ECONOMETRIE ET STATISTIQUE …MASTER ECONOMETRIE ET STATISTIQUE APPLIQUEE (ESA) Université d’Orléans Macro-Econométrie Méthodes de Moments Christophe Hurlin Documents

Master ESA. Macro-Econometrie. Cours de C. Hurlin 50

notée Y st (θ)T

t=1, permettent d’annuler le score du pseudo modèle considéré

pour la valeur estimée (sur données historiques) des paramètres β. On cherchedonc θ tel que :

θ =ArgMinθ∈Ra

mS θ, β V −1T mS θ, β (9.4)

où le moment mS θ, β est défini à partir de S simulations de trajectoires

Y st (θ)T

t=1.

mS θ, β =1

S

S

s=1

sf Y st (θ) , β

Il faut comprendre ici que la moyenne obtenue sur les S simulations permetde se ”débarasser” du conditionnement par rapport au tirage du choc ε. Le score

sf Y st (θ) , β est évaluée pour trajectoire Y st (θ)T

t=1particulière condition-

nellement à une certaine valeur de θ et à partir des pseudo paramètres estiméssur données historiques β (et non sur données simulées).

Sous certaines conditions (Gallant et Tauchen, 1996), on montre que

√T θ − θ0

L−→T→∞

N 0, Vθ (9.5)

Vθ = DθV−1T Dθ (9.6)

Dθ =∂mS θ, β

∂θθ=θ

(9.7)

9.2. Application SAS : Modèle de Volatilité Stochastique

On considère un modèle de volatilité stochastique utilisé en finance pour modéliserles rendements yt d’un actif (Gallant and Tauchen 2001) :

yt = σtzt (9.8)

log σ2t = a+ b log σ2t−1 + s ut (9.9)

ut i.i.d. 0, σ2u (9.10)

zt i.i.d. 0,σ2z (9.11)

Page 54: MASTER ECONOMETRIE ET STATISTIQUE …MASTER ECONOMETRIE ET STATISTIQUE APPLIQUEE (ESA) Université d’Orléans Macro-Econométrie Méthodes de Moments Christophe Hurlin Documents

Master ESA. Macro-Econometrie. Cours de C. Hurlin 51

Figure 9.1: Procédure EMM

où les chocs ut et zt sont indépendants et où les paramètres vérifient |b| < 1,

s > 0. Le vecteur des paramètres structurels est donc :

θ = (a b s ) (9.12)

Un exemple de série issue de ce modèle est donnée dans l’exemple de la figure(9.2) pour des valeurs a = −0.736, b = 0.9 et s = 0.363. Le graphique de la sérieque nous conséiderons comme ”historique” d’une dimension T = 1000 est reportésur la figure ().Dans ce cas un modèle auxiliare ”naturel” consiste en l’utilisation d’un modèle

de type ARCH-GARCH. Un cas simple consite à utiliser un modéle de typeGARCH(1,1) :

yt = htzt (9.13)

ht = ω + αy2t−1 + γht−1 (9.14)

Page 55: MASTER ECONOMETRIE ET STATISTIQUE …MASTER ECONOMETRIE ET STATISTIQUE APPLIQUEE (ESA) Université d’Orléans Macro-Econométrie Méthodes de Moments Christophe Hurlin Documents

Master ESA. Macro-Econometrie. Cours de C. Hurlin 52

Figure 9.2: Simulation Modèle à Volatilité Stochastique

où ht = σ2t désigne la variance conditionnelle. Les pseudo paramètres sont donc :

β = (ω α γ) (9.15)

On cherche donc à estimer ce modèle par la méthode du maximum de vraisem-blance. En effet, un des avantages du modèle GARCH(1, 1) c’est que la variabled’intérêt yt est conditionnellement gaussienne dans ce cas, ce qui facilite d’autantl’écriture de la vraisemblance :

logL (β) =

T

t=1

log f (yt| yt−1, β)

= −T2log (2π)− 1

2

T

t=1

log (ht)− 12

T

t=1

y2tht

avec

log f (yt| yt−1,β) = − log (2π)− 12log (ht)− y2t

2ht(9.16)

D’où l’on tire que :

∂ log f (yt| yt−1,β)ω

= − 1

2ht

∂ht∂ω

+y2t2h2t

∂ht∂ω

=1

2ht−1 + y

2t

ht(9.17)

Page 56: MASTER ECONOMETRIE ET STATISTIQUE …MASTER ECONOMETRIE ET STATISTIQUE APPLIQUEE (ESA) Université d’Orléans Macro-Econométrie Méthodes de Moments Christophe Hurlin Documents

Master ESA. Macro-Econometrie. Cours de C. Hurlin 53

Figure 9.3: Série Historique

∂ log f (yt| yt−1, β)α

= − 1

2ht

∂ht∂α

+y2t2h2t

∂ht∂α

=y2t−12ht

−1 + y2t

ht(9.18)

∂ log f (yt| yt−1, β)γ

= − 1

2ht

∂ht∂γ

+y2t2h2t

∂ht∂γ

=ht−12ht

−1 + y2t

ht(9.19)

Si l’on β = (ω α γ) l’estimateur du MV sur données historiques, on a doncpar définition :

1

T

T

t=1

sf Yt, β =1

T

Tt=1

1

2ht−1 + y2t

htTt=1

y2t−12ht

−1 + y2tht

Tt=1

ht−12ht

−1 + y2tht

=

000

(9.20)

avecht = ω + αy2t−1 + γht−1 (9.21)

Page 57: MASTER ECONOMETRIE ET STATISTIQUE …MASTER ECONOMETRIE ET STATISTIQUE APPLIQUEE (ESA) Université d’Orléans Macro-Econométrie Méthodes de Moments Christophe Hurlin Documents

Master ESA. Macro-Econometrie. Cours de C. Hurlin 54

Reste à définir cette matrice VT qui servira de poids dans la procédure GMM.

VT =1

T

T

t=1

sf Yt,β sf Yt,β (9.22)

En effet, l’application de la méthode des EMM suppose de contrôler la matricede poids sous SAS dans l’estimation GMM. Commençons par présenter l’optionVDATA requise dans cette optique (voir la documentation SAS, Proc MODEL,rubrique ”Input Data Set”. ).

9.2.1. Le contrôle de la matrice de poids

Il est possible de contrôler la matrice de poids, plus précisèment la matrice de vari-ance, considérée dans l’estimation GMM en utilisant l’option VDATA=[name].Lorsque l’on spécifie VDATA=V, cette matrice est utilisé dans la défintion ducritère GMM en deux étapes (GMM) ou comme matrice de poids initiale dans lecas de GMM itératif (ITGMM). Cette matrice de poids doit être mise en formede façon spécifique sous SAS. Ne sont spécifiés que les éléménts de la partie tri-nagulaire supérieure (matrice symétrique). Par exemple dans le cas où il existe4 conditions d’orthogonalités (2 équations y1 et y2, et 2 instruments, x1 et uneconstante, par exemple) :

V =

V1,1 V1,2 V1,3 V1,4− V2,2 V2,3 V2,4− − V3,3 V3,4− − − V4,4

(9.23)

Cette matrice V doit être crée de la façon suivante sous SAS. Chaque ligne etchaque colonne de cette matrice est associée à une équation et à un instrument.La position de chaque élément dans la matrice V est donné par lenom de l’équation et le nom de l’instrument (1 pour la constante)de la ligne et le nom de l’équation et le nom de l’instrument de lacolonne. Plutôt que de spécifier ligne=1 et colonne=1 pour identifier l’élémentV1,1, on donne pour identifant de la ligne et de la colonne un nom d’équation etun nom d’instrument. Ainsi pour V1,1 cela correspond à la variance associée à dela condition d’orthogonalité de l’équation 1 pour l’intrument x1 si cette variableapparaît en premier dans la liste des instruments. La colonne de cet élémént estrepérée par le couple (y1, x1) et sa ligne par le même couple (y1, x1). L’élémentV1,1 correspond à la covariance entre les résidus de la condition d’orthogonalitéde l’équation y1 avec l’instrument x1 et la condition d’orthogonalité de l’équationy1 et l’instrument 1 (pour la constante). La ligne de cet élément est repérée par

Page 58: MASTER ECONOMETRIE ET STATISTIQUE …MASTER ECONOMETRIE ET STATISTIQUE APPLIQUEE (ESA) Université d’Orléans Macro-Econométrie Méthodes de Moments Christophe Hurlin Documents

Master ESA. Macro-Econometrie. Cours de C. Hurlin 55

le couple (y1, x1) et sa colonne par le couple (y1, 1) . Ces couples sont stockés dansdes variables :

• EQ_ROW : Nom de l’équation associée à la ligne

• INST_ROW : Nom de l’instrument associée à la ligne

• EQ_COL : Nom de l’équation associée à la colonne

• INST_COL : Nom de l’instrument associée à la colonne

Une variable _TYPE_ doit contenir le terme GMM pour chaque élémént.Enfin la valeur de Vi,j est indiquée dans la variable VALUE.

Figure 9.4: Matrice de Poids GMM

Afin de mieux comprendre la structure de cette matrice de variance covari-ance, considérons un exemple (figure 9.4) dans lequel on récupère grâce à l’optionOUTV dans la procédure MODEL la matrice de poids optimale d’une procédured’estimation GMM (soit W ∗ = S−1T dans nos notations). Dans cet exemple, unmodèle à deux équations est simulé puis estimé par GMM. Pour chaque équation

Page 59: MASTER ECONOMETRIE ET STATISTIQUE …MASTER ECONOMETRIE ET STATISTIQUE APPLIQUEE (ESA) Université d’Orléans Macro-Econométrie Méthodes de Moments Christophe Hurlin Documents

Master ESA. Macro-Econometrie. Cours de C. Hurlin 56

6 instruments sont considérés : la constante (notée 1), la dérivée de l’équation y1par rapport au paramètre b1, la dérivée de l’équation y2 par rapport au paramètreb2, la dérivée de l’équation y2 par rapport au paramètre c2 et les deux variablesexogènes x1 et x2. Les dérivées des équations sont nommées @PRED.Y1/@B1,@PRED.Y2/@B2 et @PRED.Y2/@C2 sous SAS .On a deux équations, ce qui faitun total de 2 ∗ 6 = 12 conditions d’orthogonalité h (wt, θ0) = h (wt, θ0) ⊗ zt. Lamatrice de poids optimal a donc une dimension (12, 12) , ce qui implique que seuls12 ∗ (12+1)/2 = 78 éléménts Vi,j doivent être spécifiés. Les 23 premiers éléméntsVi,j conservé dans la table GMMV sont stockés de la façon suivante (figure 9.5).On retrouve pour chaque valeur les deux indicatrices de colonne et de ligne.

Figure 9.5: Exemple de Matrice de Poids

9.2.2. La procédure EMM sous SAS

A partir des éléments décrits précédement, le programme qui permet de définirla matrice V puis de la mettre en forme sous SAS pour l’incorporer dans uneprocédure de type GMM s’écrit de la manière suivante (figure 9.6). Dans unpremier temps on construit l’estimateur du MV β = (ω α γ) des paramètres du

Page 60: MASTER ECONOMETRIE ET STATISTIQUE …MASTER ECONOMETRIE ET STATISTIQUE APPLIQUEE (ESA) Université d’Orléans Macro-Econométrie Méthodes de Moments Christophe Hurlin Documents

Master ESA. Macro-Econometrie. Cours de C. Hurlin 57

modèle aucilmiaire GARCH(1, 1) sur données historiques:

1

T

T

t=1

sf Yt, β =1

T

Tt=1

1

2ht−1 + y2t

htTt=1

y2t−12ht

−1 + y2tht

Tt=1

ht−12ht

−1 + y2tht

=

000

(9.24)

avecht = ω + αy2t−1 + γht−1 (9.25)

Pour cela on utilise la procéudre AUTOREG3. Reste alors à définir la matricede variance covariance asymptotique à partir des scores VT qui servira de poidsdans la procédure GMM.

VT =1

T

T

t=1

sf Yt,β sf Yt,β (9.26)

Ceci est fait dans la procédure DATA de la figure (9.6). Cette matrice dedimension (3, 3) ne nécissite la spécification que 6 élements :

V =

V1,1 V1,2 V1,3− V2,2 V2,3− − V3,3

(9.27)

On récupère ces éléments dans le dernier éléments des variables v (1) à (6) définiespar accumlation partielle des éléments des matrices v t 1 à v t 6. Plus précisè-ment dans les v t 1 à v t 6 figurent pour chaque date les 6 éléments de la matrice

sf Yt, β sf Yt, β . Reste alors à sommer ces éléments pour les date t = 1 àT = T. Ce qui est fait en utilisant les sommes partielles définies dans les variablesv (1) à (6). Ainsi sur la figure () sont reportées les valeurs de v (1) à (6) . Seulescelles pour la 1000eme ligne nous servent à constituer la matrice de variance VT .A partir de ces éléments, il convient de construire une matrice de poids pour

la procédure MODEL comme exposé précédemment. Cette partie est reportéesur la figure (9.8).Le résultat de cette mise en forme est de la forme suivante (figure 9.9) :A partir de ces différents élements, ne reste plus alors qu’à construire l’esti-

mateur EMM en utilisant la commande SOLVE de la procudre MODEL (figure9.10).

3Voir poly de cours Econométrie pour la Finance.

Page 61: MASTER ECONOMETRIE ET STATISTIQUE …MASTER ECONOMETRIE ET STATISTIQUE APPLIQUEE (ESA) Université d’Orléans Macro-Econométrie Méthodes de Moments Christophe Hurlin Documents

Master ESA. Macro-Econometrie. Cours de C. Hurlin 58

Figure 9.6: Matrice de Poids

10. Bibliographie

Bansal, R., Gallant, A.R., Hussey, R., Tauchen, G.E. (1993), ”ComputationalAspects of Nonparametric Simulation Estimation.” In Belsey, D.A. (Ed.), Com-putational Techniques for Econometrics and Economic Analysis. Boston, MA:Kluwer Academic Publishers, 3-22.Bansal, R., Gallant, A.R., Hussey, R., Tauchen, G.E. (1995), ”Nonparametric

Estimation of Structural Models for High-Frequency Currency Market Data,”Journal of Econometrics, 66, 251-287.Gallant, A.R. and Tauchen, G.E. (1996), ”WhichMoments toMatch?” Econo-

metric Theory, 12, 657-681.Gallant, A.R. and Tauchen, G.E. (2001), ”Efficient Method of Moments,”

Working Paper. [http://www.econ.duke.edu/ get/wpapers/ee.pdf] , accessed 12September 2001.

Page 62: MASTER ECONOMETRIE ET STATISTIQUE …MASTER ECONOMETRIE ET STATISTIQUE APPLIQUEE (ESA) Université d’Orléans Macro-Econométrie Méthodes de Moments Christophe Hurlin Documents

Master ESA. Macro-Econometrie. Cours de C. Hurlin 59

Figure 9.7: Résultat de la Procédure DATA

Figure 9.8: Mise en Forme de la Matrice de Poids GMM

Page 63: MASTER ECONOMETRIE ET STATISTIQUE …MASTER ECONOMETRIE ET STATISTIQUE APPLIQUEE (ESA) Université d’Orléans Macro-Econométrie Méthodes de Moments Christophe Hurlin Documents

Master ESA. Macro-Econometrie. Cours de C. Hurlin 60

Figure 9.9: Matrice de Poids Mise en Forme

Figure 9.10: Estimation GMM