ÉconométriedesDonnéesdePanel...

183
Économétrie des Données de Panel Ch 1. Modèles Linéaires Non Dynamiques Économétrie des Données de Panel Ch 1. Modèles Linéaires Non Dynamiques Pr. Philippe Polomé, Université Lumière Lyon 2 M1 APE Analyse des Politiques Économiques M1 RISE Gouvernance des Risques Environnementaux 2018 – 2019

Transcript of ÉconométriedesDonnéesdePanel...

Page 1: ÉconométriedesDonnéesdePanel Ch1.ModèlesLinéairesNonDynamiquesrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1.pdf · ÉconométriedesDonnéesdePanel Ch1. ModèlesLinéairesNonDynamiques

Économétrie des Données de Panel Ch 1. Modèles Linéaires Non Dynamiques

Économétrie des Données de PanelCh 1. Modèles Linéaires Non Dynamiques

Pr. Philippe Polomé, Université Lumière Lyon 2

M1 APE Analyse des Politiques ÉconomiquesM1 RISE Gouvernance des Risques Environnementaux

2018 – 2019

Page 2: ÉconométriedesDonnéesdePanel Ch1.ModèlesLinéairesNonDynamiquesrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1.pdf · ÉconométriedesDonnéesdePanel Ch1. ModèlesLinéairesNonDynamiques

Économétrie des Données de Panel Ch 1. Modèles Linéaires Non Dynamiques

Plan du Ch 1

Les données de panel

Modèles à Données de PanelEffets Fixes & Effets Aléatoires

Estimateurs pour données de panelEfficience et ErreursEstimateurs appropriés MRLEstimateurs appropriés pour EFEstimateur approprié pour EAInterprétation : EF vs. EAApplication

Inférence avec données de panelMatrice des erreurs en panelInférence robuste : WhiteApplication WhiteInférence robuste : BootstrapApplication Bootstrap

Effets Fixes vs. Effets AléatoiresÉléments du choix hors testsTest de Hausman

Autres testsDonnées de panel non-cylindré

Page 3: ÉconométriedesDonnéesdePanel Ch1.ModèlesLinéairesNonDynamiquesrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1.pdf · ÉconométriedesDonnéesdePanel Ch1. ModèlesLinéairesNonDynamiques

Économétrie des Données de Panel Ch 1. Modèles Linéaires Non Dynamiques

Les données de panel

Sommaire

Les données de panel

Modèles à Données de Panel

Estimateurs pour données de panel

Inférence avec données de panel

Effets Fixes vs. Effets Aléatoires

Autres tests

Données de panel non-cylindré

Page 4: ÉconométriedesDonnéesdePanel Ch1.ModèlesLinéairesNonDynamiquesrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1.pdf · ÉconométriedesDonnéesdePanel Ch1. ModèlesLinéairesNonDynamiques

Économétrie des Données de Panel Ch 1. Modèles Linéaires Non Dynamiques

Les données de panel

Notation

I i = 1, ...,N : agent (individu, firme, pays...)I t = 1, ...,T : temps

I En général Ti : nombre de périodes diffère d’agent à agentI Panel “non-cylindré” (unbalanced)I Attrition, on y reviendra en fin de chapitre

I Pour simplifier la notation, la théorie utilise TI Les logiciels gèrent Ti

I yit une observation de la variable dépendante yI xit une observation du vecteur K × 1 des variables

indépendantesI “régresseurs”I Possiblement endogènes – Ch. 2

Page 5: ÉconométriedesDonnéesdePanel Ch1.ModèlesLinéairesNonDynamiquesrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1.pdf · ÉconométriedesDonnéesdePanel Ch1. ModèlesLinéairesNonDynamiques

Économétrie des Données de Panel Ch 1. Modèles Linéaires Non Dynamiques

Les données de panel

Organisation des données

obs agent i temps t y x1 . . . xK

1 1 1 y11 x111 xK11...

...t 1 t y1t x11t xK1t...

...T 1 T y1T x11T xK1T

T+1 2 1 y21 x121 xK21...

...it i t yit x1it xKit...

...NT N T yNT x1NT xKNT

Page 6: ÉconométriedesDonnéesdePanel Ch1.ModèlesLinéairesNonDynamiquesrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1.pdf · ÉconométriedesDonnéesdePanel Ch1. ModèlesLinéairesNonDynamiques

Économétrie des Données de Panel Ch 1. Modèles Linéaires Non Dynamiques

Modèles à Données de Panel

Sommaire

Les données de panel

Modèles à Données de Panel

Estimateurs pour données de panel

Inférence avec données de panel

Effets Fixes vs. Effets Aléatoires

Autres tests

Données de panel non-cylindré

Page 7: ÉconométriedesDonnéesdePanel Ch1.ModèlesLinéairesNonDynamiquesrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1.pdf · ÉconométriedesDonnéesdePanel Ch1. ModèlesLinéairesNonDynamiques

Économétrie des Données de Panel Ch 1. Modèles Linéaires Non Dynamiques

Modèles à Données de Panel

Modèles & Estimateurs

I Plus grand choix de modèles et d’estimateurs qu’avec lescoupes transversales

I 3 modèles standards dans la présente SectionI 5 estimateurs dans la prochaine Section

I Chaque estimateur “peut” être appliqué à chaque modèleI Avec des résultats divers

I On ne sait jamais quel modèle s’appliqueI Table 5x3 des propriétés des estimateurs dans chaque modèle

Page 8: ÉconométriedesDonnéesdePanel Ch1.ModèlesLinéairesNonDynamiquesrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1.pdf · ÉconométriedesDonnéesdePanel Ch1. ModèlesLinéairesNonDynamiques

Économétrie des Données de Panel Ch 1. Modèles Linéaires Non Dynamiques

Modèles à Données de Panel

Modèle 1. MRL - Modèle de régression linéaire classique

I Le modèle le + restrictifI impose des coefficients constants entre i

yit = α + x′itβ + uit (1)

uit un élément scalaire du vecteur du terme d’erreur uα interceptβ pente

I Si ce modèle est le bonI (correctement spécifié)I et si les régresseurs ne sont pas corrélés à l’erreurI Alors il pourra être estimé, de façon consistante, comme une

coupe transversale

Page 9: ÉconométriedesDonnéesdePanel Ch1.ModèlesLinéairesNonDynamiquesrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1.pdf · ÉconométriedesDonnéesdePanel Ch1. ModèlesLinéairesNonDynamiques

Économétrie des Données de Panel Ch 1. Modèles Linéaires Non Dynamiques

Modèles à Données de Panel

Dichotomiques Individuelles et Temporelles

I Une variante simple du MRL (1)I Intercepts qui changent entre individus et entre période

I Mais pas les deux à la foisI Pentes constantes

yit = αi + γt + x′itβ + εit (2)

ou yit =N∑j=1

αjdj ,it +T∑s=2

γsds,it + x′itβ + εit

où les N dichotomiques individuelles dj ,it = 1 si i = j & = 0 sinon

les T − 1 dichotomiques temporelles ds,it = 1 si t = s & = 0 sinon

Page 10: ÉconométriedesDonnéesdePanel Ch1.ModèlesLinéairesNonDynamiquesrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1.pdf · ÉconométriedesDonnéesdePanel Ch1. ModèlesLinéairesNonDynamiques

Économétrie des Données de Panel Ch 1. Modèles Linéaires Non Dynamiques

Modèles à Données de Panel

Données de panel avec dichotomiques

obs i i = 1 . . . i = N t t = 1 . . . t = T − 1 y x1 . . . xK

1 1 1 0 1 1 0 y11 x111 xK11...

...t 1 1 0 t 0 0 y1t x11t xK1t...

...T 1 1 0 T 0 0 y1T x11T xK1T

T+1 2 0 0 1 1 0 y21 x121 xK21...

...it i 0 0 t 0 0 yit x1it xKit...

...NT N 0 1 T 0 0 yNT x1NT xKNT

Page 11: ÉconométriedesDonnéesdePanel Ch1.ModèlesLinéairesNonDynamiquesrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1.pdf · ÉconométriedesDonnéesdePanel Ch1. ModèlesLinéairesNonDynamiques

Économétrie des Données de Panel Ch 1. Modèles Linéaires Non Dynamiques

Modèles à Données de Panel

Dichotomiques Individuelles et TemporellesI xit n’inclut pas d’intercept

I Si on en met unI alors une des N dichotomiques individuelles doit être retirée

I Beaucoup de logiciels font çaI Focus sur les panels courts où N →∞ mais pas T

I Alors γ (coef. des dich. temp.) peuvent être estimés de façonconsistante

I Au moins au sens où il y a un nombre fini de ces dich. temp.I T − 1 dich. temp. sont simplement incorporées aux

régresseurs xitI Par contre, si on insérait l’ensemble des N dich. individuelles

dj,itI Ça poserait un problème lorsque N →∞I On ne peut estimer de façon consistante un nombre ∞ de

paramètresI L’information ne croît pas sur αi lorsque N croît

I Challenge : estimer les paramètres βI en contrôlant pour les N dich. indiv. αi

Page 12: ÉconométriedesDonnéesdePanel Ch1.ModèlesLinéairesNonDynamiquesrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1.pdf · ÉconométriedesDonnéesdePanel Ch1. ModèlesLinéairesNonDynamiques

Économétrie des Données de Panel Ch 1. Modèles Linéaires Non Dynamiques

Modèles à Données de Panel

Effets Fixes & Effets Aléatoires

Sommaire

Les données de panel

Modèles à Données de PanelEffets Fixes & Effets Aléatoires

Estimateurs pour données de panelEfficience et ErreursEstimateurs appropriés MRLEstimateurs appropriés pour EFEstimateur approprié pour EAInterprétation : EF vs. EAApplication

Inférence avec données de panelMatrice des erreurs en panelInférence robuste : WhiteApplication WhiteInférence robuste : BootstrapApplication Bootstrap

Effets Fixes vs. Effets AléatoiresÉléments du choix hors testsTest de Hausman

Autres testsDonnées de panel non-cylindré

Page 13: ÉconométriedesDonnéesdePanel Ch1.ModèlesLinéairesNonDynamiquesrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1.pdf · ÉconométriedesDonnéesdePanel Ch1. ModèlesLinéairesNonDynamiques

Économétrie des Données de Panel Ch 1. Modèles Linéaires Non Dynamiques

Modèles à Données de Panel

Effets Fixes & Effets Aléatoires

Modèle à Effets IndividuelsI Chaque agent i a son intercept, mais toutes les pentes sont

les mêmes entre agents

yit = αi + x′itβ + εit (3)

où εit est iid sur i et t

I = une façon plus parcimonieuse d’exprimer le précédentmodèle (2)I Les dic. temp. sont incluses dans les régresseurs xitI C’est le modèle linéaire, non-dynamique, à données de panel

“standard”I αi variables aléatoires

I En fait : un modèle à paramètres aléatoiresI Capture hétérogénéité inobservée invariante dans le temps

I = caractéristiques individuelles inobservées

Page 14: ÉconométriedesDonnéesdePanel Ch1.ModèlesLinéairesNonDynamiquesrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1.pdf · ÉconométriedesDonnéesdePanel Ch1. ModèlesLinéairesNonDynamiques

Économétrie des Données de Panel Ch 1. Modèles Linéaires Non Dynamiques

Modèles à Données de Panel

Effets Fixes & Effets Aléatoires

Rappel : l’hétérogénéité inobservée

I Modèle correct : Y = β0 + β1x1 + β2x2 + ε

I Modèle estimé : Y = β0 + β1x1 + ν

I L’effet du régresseur manquant x2 sur Y est implicite dans leterme d’erreur du modèle estimé : ν = β2x2 + εI = hétérogénéité inobservée :

I Des facteurs (individuels) inobservés influent sur YI Si x2 n’est pas corrélé avec x1

I Pas de souciI Si x2 est corrélé avec x1,

I l’erreur ν est corrélée avec x1I MC inconsistant

Page 15: ÉconométriedesDonnéesdePanel Ch1.ModèlesLinéairesNonDynamiquesrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1.pdf · ÉconométriedesDonnéesdePanel Ch1. ModèlesLinéairesNonDynamiques

Économétrie des Données de Panel Ch 1. Modèles Linéaires Non Dynamiques

Modèles à Données de Panel

Effets Fixes & Effets Aléatoires

Rappel : l’hétérogénéité inobservée

Mêmes pentes

Page 16: ÉconométriedesDonnéesdePanel Ch1.ModèlesLinéairesNonDynamiquesrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1.pdf · ÉconométriedesDonnéesdePanel Ch1. ModèlesLinéairesNonDynamiques

Économétrie des Données de Panel Ch 1. Modèles Linéaires Non Dynamiques

Modèles à Données de Panel

Effets Fixes & Effets Aléatoires

Exogénéité

I Dans ce Ch. 1 : on assume l’exogénéité forte/stricte

E [εit |αi , xi1, ..., xiT ] = 0, t = 1, ...,T (4)

I C’est-à-dire : hypothèse que εitI Espérance de zéro conditionnellement aux valeurs passées,

présentes et futures des régresseursI Équivalent à zéro covarianceI Rien n’est supposé entre la variable aléatoire αi et les

régresseurs xiI Exclut des modèles avec une variable dépendante retardée

I Pas de yi(t−s) dans xit = Modèle dynamiqueI Comme yit−1 = αi + x

it−1β + εit−1 : il est diffcile d’affirmerque E (εitεit−1) = 0

I Et aussi avec des régresseurs endogènes (Ch. 2)

Page 17: ÉconométriedesDonnéesdePanel Ch1.ModèlesLinéairesNonDynamiquesrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1.pdf · ÉconométriedesDonnéesdePanel Ch1. ModèlesLinéairesNonDynamiques

Économétrie des Données de Panel Ch 1. Modèles Linéaires Non Dynamiques

Modèles à Données de Panel

Effets Fixes & Effets Aléatoires

Modèle à Effets Fixes

I 2 variantes du modèle (3) yit = αi + x′itβ+ εit selon hyp. sur αi

I Toutes deux ont “2” erreurs αi et εitI Modèles à erreurs composées

I Toutes deux traitent αi comme une v.a. inobservéeI Variante 1 : modèle à effets fixes (EF)

I αi est corrélé avec (la partie invariante au temps) desrégresseurs observés xit

I C’est une forme d’hétérogénéité inobservéeI “fixe” parce que, anciennement, αi était traité comme un

paramètre (non-aléatoire) à estimer

Page 18: ÉconométriedesDonnéesdePanel Ch1.ModèlesLinéairesNonDynamiquesrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1.pdf · ÉconométriedesDonnéesdePanel Ch1. ModèlesLinéairesNonDynamiques

Économétrie des Données de Panel Ch 1. Modèles Linéaires Non Dynamiques

Modèles à Données de Panel

Effets Fixes & Effets Aléatoires

Modèle à Effets Aléatoires

I Variante 2 : modèle à effets aléatoires (EA)I αi distribué indépendamment de xI Habituellement, assume de plus que les effets aléatoires αi et

les termes d’erreurs εit dans (3) sont iid :

αi ∼(α, σ2

α

)εit ∼

(0, σ2

ε

) (5)

I Pas d’hyp. sur la distribution de ces v.a. dans (5)I εit peut présenter de l’autocorrélation

I Souvent, il est supposé que cov (εit , εis) 6= 0I Mais aussi que cov (εit , εjt) = 0 et cov (αi , αj) = 0

I Sauf dans les modèles spatiaux

I Dans le modèle EA, α est vu comme l’intercept

Page 19: ÉconométriedesDonnéesdePanel Ch1.ModèlesLinéairesNonDynamiquesrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1.pdf · ÉconométriedesDonnéesdePanel Ch1. ModèlesLinéairesNonDynamiques

Économétrie des Données de Panel Ch 1. Modèles Linéaires Non Dynamiques

Modèles à Données de Panel

Effets Fixes & Effets Aléatoires

Autres noms des modèles EF/EA (3)

I Modèle à effets individuels une voie (One-way)I Deux voies (Two-way) = inclusion de dich. de temps ou

d’effets aléatoires de tempsI Modèle à intercept aléatoire

I Pour distinguer de modèles plus généraux, p.e. à pentesaléatoires

I Modèles à composants aléatoires

Page 20: ÉconométriedesDonnéesdePanel Ch1.ModèlesLinéairesNonDynamiquesrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1.pdf · ÉconométriedesDonnéesdePanel Ch1. ModèlesLinéairesNonDynamiques

Économétrie des Données de Panel Ch 1. Modèles Linéaires Non Dynamiques

Modèles à Données de Panel

Effets Fixes & Effets Aléatoires

Modèle EA équicorrélé

I Le modèle EA yit = αi + x′itβ + εit

I peut être vu comme la régression de yit sur xitI avec erreur composée uit = αi + εit

I Les hyp. EA usuelles (5) (αi et εit iid) impliquent que

Cov [(αi + εit), (αi + εis)] =

{σv

2α, t 6= s

σv2α

+ σv2ε, t = s

(6)

I Le modèle EA impose donc que l’erreur composée uit soitéquicorreléeI Car Cor [uit , uis ] = σ2

α/[σ2α + σ2

ε ] pour t 6= s ne change pasavec la durée t − s

I Le modèle EA est aussi appelé équicorrélé ou à erreursinterchangeables

Page 21: ÉconométriedesDonnéesdePanel Ch1.ModèlesLinéairesNonDynamiquesrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1.pdf · ÉconométriedesDonnéesdePanel Ch1. ModèlesLinéairesNonDynamiques

Économétrie des Données de Panel Ch 1. Modèles Linéaires Non Dynamiques

Modèles à Données de Panel

Effets Fixes & Effets Aléatoires

Synthèse des 3 modèles à données de panel

MRL (1) yit = α + x′itβ + uit uit ∼

(0, σ2

u

)EF

yit = αi + x′itβ + εit (3)

Cov (αi , xit) 6= 0

EAαi ∼

(α, σ2

α

)εit ∼

(0, σ2

ε

) (5)

I Ces 3 modèles supposent l’hétérogénéité stricte (4)I D’autres modèles panel existent, en particulier dynamiques

Page 22: ÉconométriedesDonnéesdePanel Ch1.ModèlesLinéairesNonDynamiquesrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1.pdf · ÉconométriedesDonnéesdePanel Ch1. ModèlesLinéairesNonDynamiques

Économétrie des Données de Panel Ch 1. Modèles Linéaires Non Dynamiques

Estimateurs pour données de panel

Sommaire

Les données de panel

Modèles à Données de Panel

Estimateurs pour données de panel

Inférence avec données de panel

Effets Fixes vs. Effets Aléatoires

Autres tests

Données de panel non-cylindré

Page 23: ÉconométriedesDonnéesdePanel Ch1.ModèlesLinéairesNonDynamiquesrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1.pdf · ÉconométriedesDonnéesdePanel Ch1. ModèlesLinéairesNonDynamiques

Économétrie des Données de Panel Ch 1. Modèles Linéaires Non Dynamiques

Estimateurs pour données de panel

IntroductionI Il y a 5 estimateurs utilisés couramment pour β en données de

panelI Dans ce contexte non-dynamique, sans endogénéité : variantes

MCI Diffèrent selon leurs utilisations des variations transversales

(entre i) et temporellesI Leurs propriétés dépendent de quel est le modèle approprié

(MRL - EF - EA)I Un régresseur xit peut être soit

I invariant dans le temps, xit = xi pour t = 1, ...,T ,I ou variable dans le tempsI Certains estimateurs ne peuvent identifier que les coefficients

des régresseurs variables dans le tempsI On va voir les estimateurs du plus simple au plus complexe

I On regarde la consistance et l’efficience

Page 24: ÉconométriedesDonnéesdePanel Ch1.ModèlesLinéairesNonDynamiquesrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1.pdf · ÉconométriedesDonnéesdePanel Ch1. ModèlesLinéairesNonDynamiques

Économétrie des Données de Panel Ch 1. Modèles Linéaires Non Dynamiques

Estimateurs pour données de panel

Efficience et Erreurs

Sommaire

Les données de panel

Modèles à Données de PanelEffets Fixes & Effets Aléatoires

Estimateurs pour données de panelEfficience et ErreursEstimateurs appropriés MRLEstimateurs appropriés pour EFEstimateur approprié pour EAInterprétation : EF vs. EAApplication

Inférence avec données de panelMatrice des erreurs en panelInférence robuste : WhiteApplication WhiteInférence robuste : BootstrapApplication Bootstrap

Effets Fixes vs. Effets AléatoiresÉléments du choix hors testsTest de Hausman

Autres testsDonnées de panel non-cylindré

Page 25: ÉconométriedesDonnéesdePanel Ch1.ModèlesLinéairesNonDynamiquesrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1.pdf · ÉconométriedesDonnéesdePanel Ch1. ModèlesLinéairesNonDynamiques

Économétrie des Données de Panel Ch 1. Modèles Linéaires Non Dynamiques

Estimateurs pour données de panel

Efficience et Erreurs

Efficience des Estimateurs

I L’efficience n’est pertinente que pour les estimateursconsistants

I L’efficience est la précision de l’estimateurI Essentiellement l’inverse de sa matrice de var-cov Σβ

I Qui donc dépend de la matrice de var-cov des erreurs Σu

Page 26: ÉconométriedesDonnéesdePanel Ch1.ModèlesLinéairesNonDynamiquesrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1.pdf · ÉconométriedesDonnéesdePanel Ch1. ModèlesLinéairesNonDynamiques

Économétrie des Données de Panel Ch 1. Modèles Linéaires Non Dynamiques

Estimateurs pour données de panel

Efficience et Erreurs

Hypothèses sur les erreursI Les modèles à données de panel ont différents types d’erreur

I uit pour MRLI αi + εit pour EF et EA

I Dans beaucoup d’applications de microéconomieI raisonnable de supposer indépendance entre i

I Sauf en spatialI Pas le cas en macro

I Toutes ces erreurs sont potentiellement1. Autocorrélées (corrélées sur t pour un certain i )

I Corrélation sérielle, temporelle2. Hétéroscédastiques entre les i

I L’inférence (tests) stat. valide requiert de prendre en compteces caractéristiquesI Section suivanteI Dans cette section-ci

I structure de la mat. de var-cov des erreursI Efficience

Page 27: ÉconométriedesDonnéesdePanel Ch1.ModèlesLinéairesNonDynamiquesrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1.pdf · ÉconométriedesDonnéesdePanel Ch1. ModèlesLinéairesNonDynamiques

Économétrie des Données de Panel Ch 1. Modèles Linéaires Non Dynamiques

Estimateurs pour données de panel

Efficience et Erreurs

Matrice Σu de variance-covariance des erreurs en panel

I Sans distinguer entre les trois modèlesI On écrit l’erreur du modèle uit

I Peut être αi + εit ou pasI Entre i on a Cor [uit , ujs ] = 0

I pour i 6= j et t = ou 6= s

I Pour un certain iI Cor [uit , uis ] = σits : corrélation quelconque dans le tempsI t = s, σits = σ2

it : hétérocédasticité quelconque

I Ça donne la matrice var-cov des erreurs Σu suivante

Page 28: ÉconométriedesDonnéesdePanel Ch1.ModèlesLinéairesNonDynamiquesrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1.pdf · ÉconométriedesDonnéesdePanel Ch1. ModèlesLinéairesNonDynamiques

Économétrie des Données de Panel Ch 1. Modèles Linéaires Non Dynamiques

Estimateurs pour données de panel

Efficience et Erreurs

Matrice Σu bloc-diagonale de var-cov des erreurs panel

σv211 σv112 · · · σv11T

σv212

. . ....

.... . .

. . . σv1(T − 1)T

SYM · · · σv21T

0 · · · 0

0. . .

. . ....

.... . .

. . . 0

0 · · · 0

σv2N1 σvN12 · · · σvN1T

σv2N2

. . ....

.... . .

. . . σvN(T − 1)T

SYM · · · σv2NT

Page 29: ÉconométriedesDonnéesdePanel Ch1.ModèlesLinéairesNonDynamiquesrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1.pdf · ÉconométriedesDonnéesdePanel Ch1. ModèlesLinéairesNonDynamiques

Économétrie des Données de Panel Ch 1. Modèles Linéaires Non Dynamiques

Estimateurs pour données de panel

Efficience et Erreurs

Modèle EA

I Le modèle EA met plus de structure dans la matrice Σu

I Modèle EA yit = αi + x′itβ + εit avec

I αi iid (donc non-corrélés à xit)I εit iidI Corrélations comme dans l’hyp. EA (5)

αi ∼(α, σ2

α

)εit ∼

(0, σ2

ε

)I La matrice Σu prend la forme suivante

Page 30: ÉconométriedesDonnéesdePanel Ch1.ModèlesLinéairesNonDynamiquesrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1.pdf · ÉconométriedesDonnéesdePanel Ch1. ModèlesLinéairesNonDynamiques

Matrice Σu Bloc-Diagonale de Var-Cov des Erreurs Panel EA

σv2α

+ σv2ε

σv2α

· · · σv2α

σv2α

σv2α

+ σv2ε

. . ....

.... . .

. . . σv2α

σv2α

· · · σv2ασv2α

+ σv2ε

0 · · · 0

0. . .

. . ....

.... . .

. . . 0

0 · · · 0

σv2α

+ σv2ε

σv2α

· · · σv2α

σv2α

σv2α

+ σv2ε

. . ....

.... . .

. . . σv2α

σv2α

· · · σv2ασv2α

+ σv2ε

Page 31: ÉconométriedesDonnéesdePanel Ch1.ModèlesLinéairesNonDynamiquesrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1.pdf · ÉconométriedesDonnéesdePanel Ch1. ModèlesLinéairesNonDynamiques

Économétrie des Données de Panel Ch 1. Modèles Linéaires Non Dynamiques

Estimateurs pour données de panel

Efficience et Erreurs

En mots

I La matrice s’organise en blocs carrés autour de la diagonaleprincipale

I Chaque carré tient en 2 chiffresI Hors de sa diagonale principale, une corrélation entre périodes

σ2α

I la même pour tous les iI Sur sa diagonale principale, une variance σ2

α + σ2ε

homoscédastiqueI Entre différents i , toutes les corrélations sont nulles

I Hors des blocs diagonaux

Page 32: ÉconométriedesDonnéesdePanel Ch1.ModèlesLinéairesNonDynamiquesrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1.pdf · ÉconométriedesDonnéesdePanel Ch1. ModèlesLinéairesNonDynamiques

Économétrie des Données de Panel Ch 1. Modèles Linéaires Non Dynamiques

Estimateurs pour données de panel

Estimateurs appropriés MRL

Sommaire

Les données de panel

Modèles à Données de PanelEffets Fixes & Effets Aléatoires

Estimateurs pour données de panelEfficience et ErreursEstimateurs appropriés MRLEstimateurs appropriés pour EFEstimateur approprié pour EAInterprétation : EF vs. EAApplication

Inférence avec données de panelMatrice des erreurs en panelInférence robuste : WhiteApplication WhiteInférence robuste : BootstrapApplication Bootstrap

Effets Fixes vs. Effets AléatoiresÉléments du choix hors testsTest de Hausman

Autres testsDonnées de panel non-cylindré

Page 33: ÉconométriedesDonnéesdePanel Ch1.ModèlesLinéairesNonDynamiquesrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1.pdf · ÉconométriedesDonnéesdePanel Ch1. ModèlesLinéairesNonDynamiques

Économétrie des Données de Panel Ch 1. Modèles Linéaires Non Dynamiques

Estimateurs pour données de panel

Estimateurs appropriés MRL

Estimateur MCO

I MCO estime α et β dans yit = α + x ′itβ + uitI MCO est consistant (pour N →∞, t constant) si

I Cov [uit , xit ] = 0 etI MRL (1) est approprié, ou siI EA est approprié

I La mat Σu n’est pas diagonaleI MCO inefficient

I L’estimateur MCO de la matrice Σβ σ2 (X ′X )−1 est biaisé

I MCO est inconsistant si EF est appropriéI Ré-écrire EF yit = αi + x

itβ + εit comme

yit = α+ x´itβ+ (αi−α+ εit)

I Donc l’erreur MCO, uit = αi − α + εit , est corrélé à xit par αi

Page 34: ÉconométriedesDonnéesdePanel Ch1.ModèlesLinéairesNonDynamiquesrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1.pdf · ÉconométriedesDonnéesdePanel Ch1. ModèlesLinéairesNonDynamiques

Économétrie des Données de Panel Ch 1. Modèles Linéaires Non Dynamiques

Estimateurs pour données de panel

Estimateurs appropriés MRL

Estimateur Between

I Étapes1. Prendre les moyennes sur le temps par individu

I yi =1T

T∑t=1

yit , idem pour xi

2. Estimer par MCO yi = α + x ′i β + εiI Régresser yi sur un intercept et le vecteur xi

I Pour estimer β, MCO utilise toutes les donnéesI Donc les variations à la fois sur le temps et en transversal

I Between n’utilise que les variations transversalesI Entre (between) différents individus

I Analogue à une régression en coupe transversaleI Les variations internes (within) à chaque individu sont écartées

Page 35: ÉconométriedesDonnéesdePanel Ch1.ModèlesLinéairesNonDynamiquesrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1.pdf · ÉconométriedesDonnéesdePanel Ch1. ModèlesLinéairesNonDynamiques

Économétrie des Données de Panel Ch 1. Modèles Linéaires Non Dynamiques

Estimateurs pour données de panel

Estimateurs appropriés MRL

Propriétés de l’estimateur Between

I Le modèle implicite derrière l’estimateur between est

yi = α + x′i β + ui i = 1, ...,N (7)

I Between est consistant si les régresseurs xi sont indépendantsde l’erreur uiI C’est le cas pour le MRL (1)I Si par contre le modèle est à erreurs composées (3)

yit = αi + x′

itβ + εitI Alors, ui = (αi − α + εi )

I Dans EA, αi est indépendant de xI Donc Between est consistant pour EA

I Dans EF, αi est corrélé à xit et donc à xiI Between est donc inconsistant

Page 36: ÉconométriedesDonnéesdePanel Ch1.ModèlesLinéairesNonDynamiquesrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1.pdf · ÉconométriedesDonnéesdePanel Ch1. ModèlesLinéairesNonDynamiques

Économétrie des Données de Panel Ch 1. Modèles Linéaires Non Dynamiques

Estimateurs pour données de panel

Estimateurs appropriés MRL

Propriétés de l’estimateur Between

I Between gaspille beaucoup d’informationsI C’est un estimateur didactiqueI Ne pas l’utiliser dans vos applicationsI Sauf si les données ne sont pas stationnaires

I Je ne détaille pas pour l’instantI Sans regarder formellement

I between est très inefficient à cause du gaspillage d’information

Page 37: ÉconométriedesDonnéesdePanel Ch1.ModèlesLinéairesNonDynamiquesrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1.pdf · ÉconométriedesDonnéesdePanel Ch1. ModèlesLinéairesNonDynamiques

Économétrie des Données de Panel Ch 1. Modèles Linéaires Non Dynamiques

Estimateurs pour données de panel

Estimateurs appropriés pour EF

Sommaire

Les données de panel

Modèles à Données de PanelEffets Fixes & Effets Aléatoires

Estimateurs pour données de panelEfficience et ErreursEstimateurs appropriés MRLEstimateurs appropriés pour EFEstimateur approprié pour EAInterprétation : EF vs. EAApplication

Inférence avec données de panelMatrice des erreurs en panelInférence robuste : WhiteApplication WhiteInférence robuste : BootstrapApplication Bootstrap

Effets Fixes vs. Effets AléatoiresÉléments du choix hors testsTest de Hausman

Autres testsDonnées de panel non-cylindré

Page 38: ÉconométriedesDonnéesdePanel Ch1.ModèlesLinéairesNonDynamiquesrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1.pdf · ÉconométriedesDonnéesdePanel Ch1. ModèlesLinéairesNonDynamiques

Économétrie des Données de Panel Ch 1. Modèles Linéaires Non Dynamiques

Estimateurs pour données de panel

Estimateurs appropriés pour EF

Estimateur Within

I Principe : Les déviations individuelles de la variabledépendante de ses moyennes temporellesI sont expliquées parI les déviations individuelles des régresseurs de leurs moyennes

temporellesI Soit le modèle à effets individuels 3 yit = αi + x

′itβ + εit

I Prendre le moyenne sur t : yi = αi + x ′i β + εiI Soustraire : les termes αi s’annulent = la transformation

within

yit − yi = (xit − xi )′β + (εit − εi )

1, ...,N, t = 1, ...,T(8)

Page 39: ÉconométriedesDonnéesdePanel Ch1.ModèlesLinéairesNonDynamiquesrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1.pdf · ÉconométriedesDonnéesdePanel Ch1. ModèlesLinéairesNonDynamiques

Économétrie des Données de Panel Ch 1. Modèles Linéaires Non Dynamiques

Estimateurs pour données de panel

Estimateurs appropriés pour EF

Estimateur Within

I Estimateur Within = MCO sur les données transformées

yit − yi = (xit − xi )′β + (εit − εi )

I Comme αi a disparu par différence, Within est consistant dansEF, EA et MRL

I En tout cas quand l’hyp d’exogénéité forte tient (+ loin)

I Within est aussi appelé estimateur Effets FixesI Chaque i doit être observé au moins deux fois dans

l’échantillonI sinon xit − xi = 0

Page 40: ÉconométriedesDonnéesdePanel Ch1.ModèlesLinéairesNonDynamiquesrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1.pdf · ÉconométriedesDonnéesdePanel Ch1. ModèlesLinéairesNonDynamiques

Économétrie des Données de Panel Ch 1. Modèles Linéaires Non Dynamiques

Estimateurs pour données de panel

Estimateurs appropriés pour EF

Consistance de l’estimateur Within / Effets FixesI Within traite αi comme des paramètres dits nuisance

I que l’on peut ignorer si notre intérêt porte sur les pentes βI qui n’ont pas besoin d’être estimés de façon consistante pour

obtenir une estimation consistante des βI Ce résultats ne se propage généralement pas aux modèles

non-linéairesI La consistance requiert plus précisément

E (εit − εi |xit − xi ) = 0

dans le modèle transformé

yit − yi = (xit − xi )′β + (εit − εi )

I À cause des moyennes, cela exige plus que E (εit |xit) = 0I Il faut l’exogénéité stricte (4)

E [εit |αi , xi1, ..., xiT ] = 0, t = 1, ...,T

Page 41: ÉconométriedesDonnéesdePanel Ch1.ModèlesLinéairesNonDynamiquesrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1.pdf · ÉconométriedesDonnéesdePanel Ch1. ModèlesLinéairesNonDynamiques

Économétrie des Données de Panel Ch 1. Modèles Linéaires Non Dynamiques

Estimateurs pour données de panel

Estimateurs appropriés pour EF

Estimations des effets fixesI Si les effets fixes αi sont d’intérêt , ils peuvent être estimés

par αi = yi − x′i β

I Cet estimateur de αi est non-biaiséI Dans des panels courts (petit T ), il est inconsistant

I Parce que l’information ne s’accumule pas (T ne croît pas)I Par contre, la distribution des αi , par rapport à une variable

clef ou pas, peut être informativeI Si N n’est pas trop grand, une alternative pour estimer Within

est l’estimateur MC à dichotomiquesI On définit N dich. di , une par individu, di = 1 pour iI Ensuite, estimer yit =

∑i

αidi + x′

itβ + εit par MCO

I Régression de yit sur xit et N dich. individuellesI Cela produit l’estimation Within pour β, ainsi que les

estimations des N effets fixesI Dans les limites des capacités de l’ordinateur

Page 42: ÉconométriedesDonnéesdePanel Ch1.ModèlesLinéairesNonDynamiquesrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1.pdf · ÉconométriedesDonnéesdePanel Ch1. ModèlesLinéairesNonDynamiques

Économétrie des Données de Panel Ch 1. Modèles Linéaires Non Dynamiques

Estimateurs pour données de panel

Estimateurs appropriés pour EF

Within et les régresseurs invariants dans le temps

I Une limitation majeure de WithinI les coefficients des régresseurs invariants dans le temps ne sont

pas identifiésI Puisque si xit = xi alors xi = xi et (xit − xi ) = 0

I Beaucoup d’études ont précisément pour objet des régresseursinvariants dans le tempsI P.e. les effets du genre ou de l’origine ethnique sur le salaire

I Pour cette raison, des praticiens évitent d’utiliser withinI MCO et l’estimateur Effets Aléatoires (ci-dessous) permettent

d’estimer ces coefficientsI mais sont inconsitants si EF est le modèle appropriéI On verra un estimateur qui permet parfois de les identifier

Page 43: ÉconométriedesDonnéesdePanel Ch1.ModèlesLinéairesNonDynamiquesrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1.pdf · ÉconométriedesDonnéesdePanel Ch1. ModèlesLinéairesNonDynamiques

Économétrie des Données de Panel Ch 1. Modèles Linéaires Non Dynamiques

Estimateurs pour données de panel

Estimateurs appropriés pour EF

Estimateur différences premières

I Principe : Les changements individuels d’une période àl’autre de la variable dépendanteI sont expliqués parI les changements individuels d’une période à l’autre des

régresseursI Soit le modèle à effets individuels (3) yit = αi + x

′itβ + εit

I retarder d’une période yi,t−1 = αi + x ′i,t−1β + εi,t−1I Soustraire = la transformation différences premières

yit − yi ,t−1 = (xit − xi ,t−1)′β + (εit − εi ,t−1)

i = 1, ...,N, t = 2, ...,T(9)

Page 44: ÉconométriedesDonnéesdePanel Ch1.ModèlesLinéairesNonDynamiquesrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1.pdf · ÉconométriedesDonnéesdePanel Ch1. ModèlesLinéairesNonDynamiques

Économétrie des Données de Panel Ch 1. Modèles Linéaires Non Dynamiques

Estimateurs pour données de panel

Estimateurs appropriés pour EF

Estimateur différences premières

I L’estimateur différences premières (D1) est MCO appliqué à latransformation différences premières (9)

I Cet estimateur est consistant pour β dans tous les modèlesI Pour les mêmes raisons que WithinI Pareillement, les coefficients des régresseurs invariants dans le

temps ne sont pas identifiésI D1 est moins efficient que within

I si εit est iid (pour T > 2)I car une période d’obsevation est écartée

I Cependant, D1 peut préserver contre des variables I(1)I Qui amènerait sinon à des résultats spurieux

Page 45: ÉconométriedesDonnéesdePanel Ch1.ModèlesLinéairesNonDynamiquesrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1.pdf · ÉconométriedesDonnéesdePanel Ch1. ModèlesLinéairesNonDynamiques

Économétrie des Données de Panel Ch 1. Modèles Linéaires Non Dynamiques

Estimateurs pour données de panel

Estimateurs appropriés pour EF

Efficience des estimateurs pour EF

I Ces 2 estimateurs font peu d’hypothèses sur la structure duterme d’erreur

I Leur efficience n’est généralement pas discutéeI Car la priorité est l’estimation consistante

Page 46: ÉconométriedesDonnéesdePanel Ch1.ModèlesLinéairesNonDynamiquesrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1.pdf · ÉconométriedesDonnéesdePanel Ch1. ModèlesLinéairesNonDynamiques

Économétrie des Données de Panel Ch 1. Modèles Linéaires Non Dynamiques

Estimateurs pour données de panel

Estimateur approprié pour EA

Sommaire

Les données de panel

Modèles à Données de PanelEffets Fixes & Effets Aléatoires

Estimateurs pour données de panelEfficience et ErreursEstimateurs appropriés MRLEstimateurs appropriés pour EFEstimateur approprié pour EAInterprétation : EF vs. EAApplication

Inférence avec données de panelMatrice des erreurs en panelInférence robuste : WhiteApplication WhiteInférence robuste : BootstrapApplication Bootstrap

Effets Fixes vs. Effets AléatoiresÉléments du choix hors testsTest de Hausman

Autres testsDonnées de panel non-cylindré

Page 47: ÉconométriedesDonnéesdePanel Ch1.ModèlesLinéairesNonDynamiquesrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1.pdf · ÉconométriedesDonnéesdePanel Ch1. ModèlesLinéairesNonDynamiques

Économétrie des Données de Panel Ch 1. Modèles Linéaires Non Dynamiques

Estimateurs pour données de panel

Estimateur approprié pour EA

Rappel du modèle EA

I Modèle à effets individuels (3) yit = αi + x′itβ + εit avec

I αi iid (donc non-corrélés à xit)I εit iidI Corrélations comme dans l’hyp. EA (5)

αi ∼(α, σ2

α

)εit ∼

(0, σ2

ε

)I Dans ce cas, MCO consistant (car αi non-corrélés à xit)

I Mais Moindres Carrés Généralisés MCG sera plus efficient

Page 48: ÉconométriedesDonnéesdePanel Ch1.ModèlesLinéairesNonDynamiquesrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1.pdf · ÉconométriedesDonnéesdePanel Ch1. ModèlesLinéairesNonDynamiques

Économétrie des Données de Panel Ch 1. Modèles Linéaires Non Dynamiques

Estimateurs pour données de panel

Estimateur approprié pour EA

Rappel : MCG en coupe transversaleI Quand toutes les hyp. du modèle linéaire sont satisfaites

I sauf que la matrice var-cov Σ des erreurs n’est pas l’identité,alors

I MCO consistantI mais pas efficient (Gauss-Markov ne s’applique plus)

I Si on connait Σ, on peut retrouver l’efficienceI Soit le MRL en coupe transversale y = x

′β + ε

I avec E(εε

′)

= Σ 6= σ2I

I On peut montrer qu’il existe toujours P telle que P′P = Σ−1

I Décomposition de Cholesky, non-unique pour les matricesréelles sdp

I Prémultiplier le modèle linéaire par P : Py = Pxβ + PεI y∗ = x∗β + ε∗

I Alors Var (ε∗) = E(Pεε

′P

′)

= PE(εε

′)P

I = PΣP′

= P(P

′P)−1

P′

= PP−1(P

′)−1

P′

= I

Page 49: ÉconométriedesDonnéesdePanel Ch1.ModèlesLinéairesNonDynamiquesrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1.pdf · ÉconométriedesDonnéesdePanel Ch1. ModèlesLinéairesNonDynamiques

Économétrie des Données de Panel Ch 1. Modèles Linéaires Non Dynamiques

Estimateurs pour données de panel

Estimateur approprié pour EA

Rappel : MCG en coupe transversale

I Donc, le modèle transformé a des erreurs dites sphériquesI Donc, MCO sur les données transformées est efficientI C’est MCG

I En pratique, Σ est inconnue, il nous en faut un estimateurconsistantI Tout estimateur consistant de Σ, Σ, définit l’estimateur MCG

faisables (consistant)I En panel, le modèle EA implique une matrice Σ comme dans

la diapo suivanteI Comme détaillé précédemment

Page 50: ÉconométriedesDonnéesdePanel Ch1.ModèlesLinéairesNonDynamiquesrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1.pdf · ÉconométriedesDonnéesdePanel Ch1. ModèlesLinéairesNonDynamiques

Économétrie des Données de Panel Ch 1. Modèles Linéaires Non Dynamiques

Estimateurs pour données de panel

Estimateur approprié pour EA

Matrice Σ bloc-diagonale de var-cov des erreurs panel EA

σv2α + σv2ε σv

2α · · · σv

σv2α σv

2α + σv2ε

. . ....

.... . .

. . . σv2α

σv2α · · · σv

2α σv

2α + σv2ε

0 · · · 0

0. . .

. . ....

.... . .

. . . 0

0 · · · 0

σv2α + σv2ε σv

2α · · · σv

σv2α σv

2α + σv2ε

. . ....

.... . .

. . . σv2α

σv2α · · · σv

2α σv

2α + σv2ε

Page 51: ÉconométriedesDonnéesdePanel Ch1.ModèlesLinéairesNonDynamiquesrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1.pdf · ÉconométriedesDonnéesdePanel Ch1. ModèlesLinéairesNonDynamiques

Économétrie des Données de Panel Ch 1. Modèles Linéaires Non Dynamiques

Estimateurs pour données de panel

Estimateur approprié pour EA

Estimateur EA

I On appelle estimateur EA l’estimateur MCGI dans lequel la matrice Σ des erreurs est celle de la diapo

précédenteI La version faisable de cet estimateur est MCO

I appliqué aux données transformées de la façon suivante :

yit − λyi =(1− λ

)µ+

(xit − λxi

)′β + νit (10)

où νit = (1− λ)αi + (εit − λεi ) est asymptotiquement iid, et

I λ est un estimateur consistant pour

λ = 1− σε√σ2ε + Tσ2

α

(11)

Page 52: ÉconométriedesDonnéesdePanel Ch1.ModèlesLinéairesNonDynamiquesrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1.pdf · ÉconométriedesDonnéesdePanel Ch1. ModèlesLinéairesNonDynamiques

Économétrie des Données de Panel Ch 1. Modèles Linéaires Non Dynamiques

Estimateurs pour données de panel

Estimateur approprié pour EA

Estimateur EA

I On ajoute l’intercept (non-aléatoire) scalaire µ afin denormaliser les effets aléatoires αi à une espérance nulleI et ainsi faire coincider l’estimateur avec l’hypothèse EA (5)I C’est-à-dire µ correspond à α dans (5)

I La dérivation de cet estimateur (10) et des manières d’estimerσ2α et σ2

ε , et donc λ,I sont détaillés dans Cameron & Trivedi

I RemarqueI λ = 0 correspond à l’estimateur MCOI λ = 1 correspond à l’estimateur withinI λ→ 1 lorsque T →∞ (regardez la formule)

I Il s’agit d’un estimateur en deux étapes de β1. estimer λ2. estimer β à partir des données transformées

Page 53: ÉconométriedesDonnéesdePanel Ch1.ModèlesLinéairesNonDynamiquesrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1.pdf · ÉconométriedesDonnéesdePanel Ch1. ModèlesLinéairesNonDynamiques

Économétrie des Données de Panel Ch 1. Modèles Linéaires Non Dynamiques

Estimateurs pour données de panel

Estimateur approprié pour EA

Propriétés de l’estimateur EA

I Consistant et efficient si le modèle EA est le bonI Le gain d’efficience par rapport à l’estimateur MCO n’est pas

nécessairement élevéI Probablement inefficient si l’hypothèse d’équicorrélation

n’est pas vraieI Dans un processus AR (1)I Si le MRL est le bon

I Inconsistant si le modèle EF est le bon car alors αi est corréléavec xit

Page 54: ÉconométriedesDonnéesdePanel Ch1.ModèlesLinéairesNonDynamiquesrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1.pdf · ÉconométriedesDonnéesdePanel Ch1. ModèlesLinéairesNonDynamiques

Économétrie des Données de Panel Ch 1. Modèles Linéaires Non Dynamiques

Estimateurs pour données de panel

Interprétation : EF vs. EA

Sommaire

Les données de panel

Modèles à Données de PanelEffets Fixes & Effets Aléatoires

Estimateurs pour données de panelEfficience et ErreursEstimateurs appropriés MRLEstimateurs appropriés pour EFEstimateur approprié pour EAInterprétation : EF vs. EAApplication

Inférence avec données de panelMatrice des erreurs en panelInférence robuste : WhiteApplication WhiteInférence robuste : BootstrapApplication Bootstrap

Effets Fixes vs. Effets AléatoiresÉléments du choix hors testsTest de Hausman

Autres testsDonnées de panel non-cylindré

Page 55: ÉconométriedesDonnéesdePanel Ch1.ModèlesLinéairesNonDynamiquesrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1.pdf · ÉconométriedesDonnéesdePanel Ch1. ModèlesLinéairesNonDynamiques

Économétrie des Données de Panel Ch 1. Modèles Linéaires Non Dynamiques

Estimateurs pour données de panel

Interprétation : EF vs. EA

Discussion sur EA et EF

I La plupart des disciplines de stat appliquéesI traitent l’hétérogénéité inobservée (individuelle) αi comme

distribuée indépendamment des régresseursI Sauf la micro/macroéconométrie

I Cette hyp d’indépendanceI a l’avantage de permettre une estimation consistante de tous

les paramètresI y-compris ceux invariants dans le tempsI si l’hyp est vraie

I est souvent considérée par les économistes comme nonsupportée par les données

I Les deux modèles ont des intérêts distinctsI EA : Précise la structure temporelle → EfficienceI EF : Endogénéité de l’hétérogénéité inobservée → Consistance

Page 56: ÉconométriedesDonnéesdePanel Ch1.ModèlesLinéairesNonDynamiquesrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1.pdf · ÉconométriedesDonnéesdePanel Ch1. ModèlesLinéairesNonDynamiques

Économétrie des Données de Panel Ch 1. Modèles Linéaires Non Dynamiques

Estimateurs pour données de panel

Interprétation : EF vs. EA

Prédictions et effets individuels

I Le modèle est yit = αi + x′itβ + εit aussi bien pour EA que

pour EFI L’effet individuel αi est une v.a. dans les deux modèles

I On prend l’espérance conditionnelle aux régresseursI E [yit |xit ] = E [αi |xit ] + x ′itβI Que peut-on en dire ? (prochaine dia)

Page 57: ÉconométriedesDonnéesdePanel Ch1.ModèlesLinéairesNonDynamiquesrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1.pdf · ÉconométriedesDonnéesdePanel Ch1. ModèlesLinéairesNonDynamiques

Économétrie des Données de Panel Ch 1. Modèles Linéaires Non Dynamiques

Estimateurs pour données de panel

Interprétation : EF vs. EA

Prédictions et effets individuels

I Dans le modèle EA, il est supposé que E [αi |xit ] = αI Donc E [yit |xit ] = α + x ′itβI Si EA est le bon modèle, α peut être estimé de façon

consistanteI Donc on peut prédire yit par E [yit |xit ]

I Dans EF, E [αi |xit ] varie avec xit et on ne sait pas commentI C’est raisonnable car αi comprend des characteristiques

inobservéesI Donc E [yit |xit ] ne peut être identifié : pas de prédictionI Malgré cela, on peut estimer les β de façon consistante

I Et donc les effets marginaux sont identifiésβ = ∂E [yit |αi , xit ]/∂xit

I Par exemple, l’effet d’un changement de prix sur les ventesI Mais seulement pour les régresseurs variant dans le temps

Page 58: ÉconométriedesDonnéesdePanel Ch1.ModèlesLinéairesNonDynamiquesrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1.pdf · ÉconométriedesDonnéesdePanel Ch1. ModèlesLinéairesNonDynamiques

Économétrie des Données de Panel Ch 1. Modèles Linéaires Non Dynamiques

Estimateurs pour données de panel

Interprétation : EF vs. EA

Résumé estimateurs et modèles linéaires courants pour panel

ModèleEstimateur de β MRL (1) EA (3) & (5) EF (3)MCO (1) Consistant Consistant InconsistantBetween (7) Consistant Consistant InconsistantWithin (EF) (8) Consistant Consistant ConsistantD1 (9) Consistant Consistant ConsistantEA (10) Consistant Consistant Inconsistant

Cette table ne présente que la consistance des estimateurs de βI L’estimation des αi est toujours inconsistante, sauf si αi = α∀iI La consistance ne tient que si les propriétés des modèles

tiennentLe seul estimateur efficient est EA si le bon modèle est EA

Page 59: ÉconométriedesDonnéesdePanel Ch1.ModèlesLinéairesNonDynamiquesrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1.pdf · ÉconométriedesDonnéesdePanel Ch1. ModèlesLinéairesNonDynamiques

Économétrie des Données de Panel Ch 1. Modèles Linéaires Non Dynamiques

Estimateurs pour données de panel

Application

Sommaire

Les données de panel

Modèles à Données de PanelEffets Fixes & Effets Aléatoires

Estimateurs pour données de panelEfficience et ErreursEstimateurs appropriés MRLEstimateurs appropriés pour EFEstimateur approprié pour EAInterprétation : EF vs. EAApplication

Inférence avec données de panelMatrice des erreurs en panelInférence robuste : WhiteApplication WhiteInférence robuste : BootstrapApplication Bootstrap

Effets Fixes vs. Effets AléatoiresÉléments du choix hors testsTest de Hausman

Autres testsDonnées de panel non-cylindré

Page 60: ÉconométriedesDonnéesdePanel Ch1.ModèlesLinéairesNonDynamiquesrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1.pdf · ÉconométriedesDonnéesdePanel Ch1. ModèlesLinéairesNonDynamiques

Économétrie des Données de Panel Ch 1. Modèles Linéaires Non Dynamiques

Estimateurs pour données de panel

Application

Package plm

I Créez un nouveau projet p.e. panelI Installer plm (Croissant & Milo)I fichier de commande 2017Panel.R sur le site du cours

I Structure des données dans plmI Peut être un dataframeI mais il faut un index qui indique i

I Soit on passe un argument index dans les fonctionsd’estimation et de test de plm

I Sinon, plm suppose que la première col. contient l’index i et la2º le temps t

I On peut aussi utiliser pdata.frame(x, index = NULL,...)I sur x un dataframe normalI pour créer un dataframe compris par plm

Page 61: ÉconométriedesDonnéesdePanel Ch1.ModèlesLinéairesNonDynamiquesrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1.pdf · ÉconométriedesDonnéesdePanel Ch1. ModèlesLinéairesNonDynamiques

Économétrie des Données de Panel Ch 1. Modèles Linéaires Non Dynamiques

Estimateurs pour données de panel

Application

Exemple : déforestation amazonienne

I Le fichier de données est en ligne sur le site du coursI À charger dans R-Studio via l’interface

I Bouton fenêtre HDI Données de 1988 à 2015

I États de l’Amazone légaleI 9 états du bassin brézilien de l’Amazone

I Le Brésil est un pays fédéralI Chaque état a une latitude importante sur ses politiques

Page 62: ÉconométriedesDonnéesdePanel Ch1.ModèlesLinéairesNonDynamiquesrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1.pdf · ÉconométriedesDonnéesdePanel Ch1. ModèlesLinéairesNonDynamiques

Amazone légale du Brésil

Page 63: ÉconométriedesDonnéesdePanel Ch1.ModèlesLinéairesNonDynamiquesrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1.pdf · ÉconométriedesDonnéesdePanel Ch1. ModèlesLinéairesNonDynamiques

Déforestation 2001

Page 64: ÉconométriedesDonnéesdePanel Ch1.ModèlesLinéairesNonDynamiquesrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1.pdf · ÉconométriedesDonnéesdePanel Ch1. ModèlesLinéairesNonDynamiques

Déforestation 2002

Page 65: ÉconométriedesDonnéesdePanel Ch1.ModèlesLinéairesNonDynamiquesrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1.pdf · ÉconométriedesDonnéesdePanel Ch1. ModèlesLinéairesNonDynamiques

Déforestation 2003

Page 66: ÉconométriedesDonnéesdePanel Ch1.ModèlesLinéairesNonDynamiquesrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1.pdf · ÉconométriedesDonnéesdePanel Ch1. ModèlesLinéairesNonDynamiques

Déforestation 2004

Page 67: ÉconométriedesDonnéesdePanel Ch1.ModèlesLinéairesNonDynamiquesrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1.pdf · ÉconométriedesDonnéesdePanel Ch1. ModèlesLinéairesNonDynamiques

Déforestation 2005

Page 68: ÉconométriedesDonnéesdePanel Ch1.ModèlesLinéairesNonDynamiquesrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1.pdf · ÉconométriedesDonnéesdePanel Ch1. ModèlesLinéairesNonDynamiques

Déforestation 2006

Page 69: ÉconométriedesDonnéesdePanel Ch1.ModèlesLinéairesNonDynamiquesrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1.pdf · ÉconométriedesDonnéesdePanel Ch1. ModèlesLinéairesNonDynamiques

Déforestation 2007

Page 70: ÉconométriedesDonnéesdePanel Ch1.ModèlesLinéairesNonDynamiquesrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1.pdf · ÉconométriedesDonnéesdePanel Ch1. ModèlesLinéairesNonDynamiques

Déforestation 2008

Page 71: ÉconométriedesDonnéesdePanel Ch1.ModèlesLinéairesNonDynamiquesrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1.pdf · ÉconométriedesDonnéesdePanel Ch1. ModèlesLinéairesNonDynamiques

Déforestation 2009

Page 72: ÉconométriedesDonnéesdePanel Ch1.ModèlesLinéairesNonDynamiquesrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1.pdf · ÉconométriedesDonnéesdePanel Ch1. ModèlesLinéairesNonDynamiques

Déforestation 2010

Page 73: ÉconométriedesDonnéesdePanel Ch1.ModèlesLinéairesNonDynamiquesrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1.pdf · ÉconométriedesDonnéesdePanel Ch1. ModèlesLinéairesNonDynamiques

Déforestation 2011

Page 74: ÉconométriedesDonnéesdePanel Ch1.ModèlesLinéairesNonDynamiquesrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1.pdf · ÉconométriedesDonnéesdePanel Ch1. ModèlesLinéairesNonDynamiques

Déforestation 2012

Page 75: ÉconométriedesDonnéesdePanel Ch1.ModèlesLinéairesNonDynamiquesrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1.pdf · ÉconométriedesDonnéesdePanel Ch1. ModèlesLinéairesNonDynamiques

Déforestation 2013

Page 76: ÉconométriedesDonnéesdePanel Ch1.ModèlesLinéairesNonDynamiquesrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1.pdf · ÉconométriedesDonnéesdePanel Ch1. ModèlesLinéairesNonDynamiques

Déforestation 2014

Page 77: ÉconométriedesDonnéesdePanel Ch1.ModèlesLinéairesNonDynamiquesrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1.pdf · ÉconométriedesDonnéesdePanel Ch1. ModèlesLinéairesNonDynamiques

Déforestation 2015

Page 78: ÉconométriedesDonnéesdePanel Ch1.ModèlesLinéairesNonDynamiquesrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1.pdf · ÉconométriedesDonnéesdePanel Ch1. ModèlesLinéairesNonDynamiques

Économétrie des Données de Panel Ch 1. Modèles Linéaires Non Dynamiques

Estimateurs pour données de panel

Application

Hypothèse : Courbe de Kuznetz Environmentales CKE

I S. Kuznets (1955) suggère une relation “U-inversé” ∩I entre la croissance économique et les inégalités de revenuI Le développement induit d’abord des inégalitésI À mesure que le revenu moyen augment, ces inégalités

deviennet intolérables et disparraissentI p.e. transferts, meilleures opportunités, meilleure éducation,

système de santé, biens publics...

I CKE suggérée par Grossman & Kruger (1991, 1995)I Les dommages environnmentaux augmentent d’abord avec le

développementI Puis se récupèrent lorsque le revenu moyen augmente

I Émissions, déforestation,...

Page 79: ÉconométriedesDonnéesdePanel Ch1.ModèlesLinéairesNonDynamiquesrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1.pdf · ÉconométriedesDonnéesdePanel Ch1. ModèlesLinéairesNonDynamiques

Économétrie des Données de Panel Ch 1. Modèles Linéaires Non Dynamiques

Estimateurs pour données de panel

Application

CKE formelI Les niveaux plus élevés de revenu par habitant PIBh

I sont graduellement associés avec des niveaux plus faibled’émissions y

I Jusqu’à une baisse nette à un “turning point”

yit = β0 + β1PIBhit + β2PIBh2it + γxit + εit

I x : autres régresseurs/contrôles potentiels

Page 80: ÉconométriedesDonnéesdePanel Ch1.ModèlesLinéairesNonDynamiquesrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1.pdf · ÉconométriedesDonnéesdePanel Ch1. ModèlesLinéairesNonDynamiques

Économétrie des Données de Panel Ch 1. Modèles Linéaires Non Dynamiques

Estimateurs pour données de panel

Application

Évidence de CKEI Bien que décrite comme une relation temporelle

I CKE a + souvent été étudiée en coupe-transversale ou en panelI Lorsqu’on la trouve, est-ce causal ou spurieux ?

I Stern 2004 [?]I CKE pour les émissions de CO2 & CO2eq sont spurieusesI L’apparence de CKE est due à un mélange d’effets

1. La pollution ↗ de façon monotone, voire linéaire, avec lerevenu

2. Mais le “temps” fait baisser les émissions, on émet moins3. Dans les pays à croissance rapide, l’effet revenu (↗ émissions)

est plus fort que l’effet temps4. Dans les pays riches, la croissance est faible, donc les efforts

de réduction des émissions peuvent dépasser l’effet revenu

I C’est ce qui cause un CKE apparent en coupe transversale ouen panel

Page 81: ÉconométriedesDonnéesdePanel Ch1.ModèlesLinéairesNonDynamiquesrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1.pdf · ÉconométriedesDonnéesdePanel Ch1. ModèlesLinéairesNonDynamiques

Économétrie des Données de Panel Ch 1. Modèles Linéaires Non Dynamiques

Estimateurs pour données de panel

Application

CKE déforestation

I Objectif : Estimer l’équation KCE par panelI Dans le cas de la déforestation

I Le modèle opérationnel d’intérêt

dit = βi + β1PIBhit + β2PIBh2it + γxit + εit (12)

I d = déforestation annuelleI On pourrait postuler un modèle dynamique en incluant di,t−1

dans xI mais on reste en statique dans ce chapitre

I On pourrait regarder en log

Page 82: ÉconométriedesDonnéesdePanel Ch1.ModèlesLinéairesNonDynamiquesrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1.pdf · ÉconométriedesDonnéesdePanel Ch1. ModèlesLinéairesNonDynamiques

Économétrie des Données de Panel Ch 1. Modèles Linéaires Non Dynamiques

Estimateurs pour données de panel

Application

CKE déforestation

I Il y a un problème d’échelleI Déforestation en niveau, par habitant ou par km² ?I On fait abstraction de cela ici, mais c’est certainement

importantI PIB local ou national ?

I Interprétation, p.e. Kauppi et.al. [?]I avec la hausse du PIB, la déforestation devient moins

intéressante que d’autres alternatives

Page 83: ÉconométriedesDonnéesdePanel Ch1.ModèlesLinéairesNonDynamiquesrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1.pdf · ÉconométriedesDonnéesdePanel Ch1. ModèlesLinéairesNonDynamiques

Économétrie des Données de Panel Ch 1. Modèles Linéaires Non Dynamiques

Estimateurs pour données de panel

Application

CKE déforestation : les x

I PPCDAmI Plano Plurianual (de Ação) para a Prevenção e Controle de

Desmatamento, Queimadas e Exploração Madeireira Ilegal naAmazônia Legal

I Politique de lutte contre la déforestation, instaurée en 2004I Prix agricoles, principalement boeuf, soja dans une moindre

mesureI Prix locaux ou internationaux ?I Ces deux prix sont assez corrélés (65%)

I Pression de populationI Peu probable car les migrations se font surtout vers les villes

I Extraction de boisI Vrai mais peu évoqué comme pression

Page 84: ÉconométriedesDonnéesdePanel Ch1.ModèlesLinéairesNonDynamiquesrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1.pdf · ÉconométriedesDonnéesdePanel Ch1. ModèlesLinéairesNonDynamiques

Examiner les variablesI Etat → noms des étatsI Year → annéeI pop → population en hI surface en km²I PIBh2010R → PIB en Real de 2010

I IPEA-IBGE (statistiques officielles brésiliennes)I Defor_km2 deforestation annuelle en km²

I Prodes http ://www.obt.inpe.br/prodes/taxas_prodes.htmI 1988 : moyenne 1978-1988 (peut-être préférable de l’éliminer) ;

1993-94 : moyenne 2 annéesI PPCDAmCurR → budget du plan d’action contre la

déforestation en Real nominauxI Par État : plano pluriannual (plan pluriannuel) et Lei

Orçamentária Anual (loi du budget annuel) sur les portal dotransparencia de chaque État

I La donnée n’est pas présente pour tous les états ni tous les ansI 0 de 1988 à 2003 inclus pour tous les ÉtatsI 3 phases : 2004-2008, 2009-2011, 2012-2015

I CPI → consumer price index (World Bank)I PPCDAm2010R → budget du plan d’action contre la

déforestation en Real de 2010

Page 85: ÉconométriedesDonnéesdePanel Ch1.ModèlesLinéairesNonDynamiquesrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1.pdf · ÉconométriedesDonnéesdePanel Ch1. ModèlesLinéairesNonDynamiques

Graphique : scatterplot

Page 86: ÉconométriedesDonnéesdePanel Ch1.ModèlesLinéairesNonDynamiquesrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1.pdf · ÉconométriedesDonnéesdePanel Ch1. ModèlesLinéairesNonDynamiques

Graphique : ggplot2+facet (intaller ggplot2)

Page 87: ÉconométriedesDonnéesdePanel Ch1.ModèlesLinéairesNonDynamiquesrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1.pdf · ÉconométriedesDonnéesdePanel Ch1. ModèlesLinéairesNonDynamiques

Graphique : log(Defor)~PIB

Page 88: ÉconométriedesDonnéesdePanel Ch1.ModèlesLinéairesNonDynamiquesrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1.pdf · ÉconométriedesDonnéesdePanel Ch1. ModèlesLinéairesNonDynamiques

Graphique : Defor~Etat (intaller gplots)

Page 89: ÉconométriedesDonnéesdePanel Ch1.ModèlesLinéairesNonDynamiquesrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1.pdf · ÉconométriedesDonnéesdePanel Ch1. ModèlesLinéairesNonDynamiques

Graphique : Defor~Year

Page 90: ÉconométriedesDonnéesdePanel Ch1.ModèlesLinéairesNonDynamiquesrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1.pdf · ÉconométriedesDonnéesdePanel Ch1. ModèlesLinéairesNonDynamiques

Économétrie des Données de Panel Ch 1. Modèles Linéaires Non Dynamiques

Estimateurs pour données de panel

Application

Transformer les données

I Conversion en “pdata.frame” pour plmI Prend en compte la variable temps (Year) correctement

I C’est-à-dire avec une durée entre observationsI 2 arguments logiques

I drop.index laisse tomber les index du data.frameI row.names crée des noms de ligne de type “Acre-1988”

I Il y a AmaLegal dans les donnéesI La somme des autres : il faut laisser tomber cette série

Page 91: ÉconométriedesDonnéesdePanel Ch1.ModèlesLinéairesNonDynamiquesrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1.pdf · ÉconométriedesDonnéesdePanel Ch1. ModèlesLinéairesNonDynamiques

Économétrie des Données de Panel Ch 1. Modèles Linéaires Non Dynamiques

Estimateurs pour données de panel

Application

Qualité des données

I “Cylindrage” du panel - quelle justification ?I Le PIB n’est dispo que jusque 2014 ∀ États (2013

actuellement)I La déforestation n’est dispo qu’à partir de 1988

I Un état n’a pas de donnée de déforestation en 1988I Donc : pas de conséquence

I Importantes différences sur le budget du PPCDAmI Restreint beaucoup l’échantillonI Les états qui tiennent bien les comptes pourraient être ceux

qui font plus d’effort sur la déforestation ?I En tout cas, les plus gros “déforesteurs” (Mato Grosso, Pará,

Rondônia)I présentent peu de donnéesI Biais de sélection ?I Les résultats sont-ils sensibles à la qualité des données ?

Page 92: ÉconométriedesDonnéesdePanel Ch1.ModèlesLinéairesNonDynamiquesrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1.pdf · ÉconométriedesDonnéesdePanel Ch1. ModèlesLinéairesNonDynamiques

Économétrie des Données de Panel Ch 1. Modèles Linéaires Non Dynamiques

Estimateurs pour données de panel

Application

Régression dans R

I On va commencer par la CKE seule (pas de x)I Ça n’est pas correct statistiquementI mais on veut surtout illustrer les régressions panel

I Du général au particulierI Modèle + général : effets fixes

I Estimateur WithinI Estimateur Diff 1ere

I Second modèle : effets aléatoiresI Modèle plus restrictif : MRL

I Estimateur MCOI Estimateur Between

I plm se charge de transformer les données

Page 93: ÉconométriedesDonnéesdePanel Ch1.ModèlesLinéairesNonDynamiquesrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1.pdf · ÉconométriedesDonnéesdePanel Ch1. ModèlesLinéairesNonDynamiques

Économétrie des Données de Panel Ch 1. Modèles Linéaires Non Dynamiques

Estimateurs pour données de panel

Application

Estimateur EF Within

I plm(Defor_km2~PIBh2010R+I(PIBh2010R^2), data=pama,model = "within")

I Unbalanced Panel : n=9, T=25-26, N=233I Un état n’a pas de donnée de déforestation en 1988

I La sortie ne présente pas d’interceptI Suit la théorie, mais + difficile à comparer avec EAI On ne regarde pas les t-stat et les tests pour le moment

I Les autres modèles linéaires fonctionnent de la même manièreI en changeant juste l’option model

I Les αi sont extraits par la commande fixef avec des options decalculI Même non-consistants, on peut corréler ces αi avec des

variables d’intérêtI Juste pour within

Page 94: ÉconométriedesDonnéesdePanel Ch1.ModèlesLinéairesNonDynamiquesrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1.pdf · ÉconométriedesDonnéesdePanel Ch1. ModèlesLinéairesNonDynamiques

Économétrie des Données de Panel Ch 1. Modèles Linéaires Non Dynamiques

Estimateurs pour données de panel

Application

Estimateur EF D1 - fd

I R conserve l’interceptI implicitement, le modèle en niveaux devrait alors inclure un

trenddit = α + τ t + β1PIBit + β2PIB2

it + εit

⇐⇒

∆dit = τ + β1∆PIBit + β2∆PIB2it + ∆εit

I On exclut l’intercept en ajoutant "-1" à la formuleI On perd la significativité [à reporter section ultérieure]

I Illustre la perte d’efficience due aux différences 1º - plutôtintéressant, montre l’importance de la cointégration

Page 95: ÉconométriedesDonnéesdePanel Ch1.ModèlesLinéairesNonDynamiquesrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1.pdf · ÉconométriedesDonnéesdePanel Ch1. ModèlesLinéairesNonDynamiques

Économétrie des Données de Panel Ch 1. Modèles Linéaires Non Dynamiques

Estimateurs pour données de panel

Application

Estimateur EA - random

I Plusieurs versionsI random.method = c("swar", "walhus", "amemiya", "nerlove",

"kinla")I Se différencient essentiellement selon le mode de calcul de

MCGI Je ne détaille pas - on laisse tomberI Défaut : swar : Swamy and Arora

I summary informe sur la variance de chaque composant del’errorI idiosyncratic : σ2

ε ; individual : σ2αi

I Theta est le θ de MCGI L’estimateur EA avec effets temporels (“two way”) n’est pas

implémenté

Page 96: ÉconométriedesDonnéesdePanel Ch1.ModèlesLinéairesNonDynamiquesrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1.pdf · ÉconométriedesDonnéesdePanel Ch1. ModèlesLinéairesNonDynamiques

Économétrie des Données de Panel Ch 1. Modèles Linéaires Non Dynamiques

Estimateurs pour données de panel

Application

Estimateurs MCO, Between

I BetweenI Nombre d’observations réellement utilisées = “Observations

used in estimation” = 9

I Pooling – même chose que MCO

Page 97: ÉconométriedesDonnéesdePanel Ch1.ModèlesLinéairesNonDynamiquesrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1.pdf · ÉconométriedesDonnéesdePanel Ch1. ModèlesLinéairesNonDynamiques

Économétrie des Données de Panel Ch 1. Modèles Linéaires Non Dynamiques

Estimateurs pour données de panel

Application

Comparaison des résultats

EF - Within EF - D1 EA - MCG Pooling Between

β0 – -99.5 -1045 1057 6942β1DIP 630 437 624 121 -1290β2DIP2 -31.4 -11.5 -31.1 -4.96 68.294# obs. 233 224 233 233 9

Sans dich. de temps

I Au vu des graphiques, pooling & between ne sont pasappropriés

I Within et EA ont des résultats semblablesI Forte différence (EF D1) vs. (EA MCO Between)

I Révèle endogénéitéI D1 est qualitativement semblables

I On en rediscute lors de l’inférence

Page 98: ÉconométriedesDonnéesdePanel Ch1.ModèlesLinéairesNonDynamiquesrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1.pdf · ÉconométriedesDonnéesdePanel Ch1. ModèlesLinéairesNonDynamiques

Économétrie des Données de Panel Ch 1. Modèles Linéaires Non Dynamiques

Estimateurs pour données de panel

Application

Dichotomiques de temps – twoways

I Permettent de “filtrer” un choc idiosyncratiqueI qui affecte tous les états de façon semblableI Mais beaucoup de régresseurs (1988 → 2014 = 27)

I introduit potentiellement du bruitI plm option effect = "twoways"

I On les extrait avec fixef(modèle estimé,effect="time")I Si on donne l’option effect = "time" à plm : supprime les αi

I pas défini pour D1 : pq ?I ni pour be bien sûr

I pour EA, ne fonctionne que pour les panel “balanced”I Lorsque toutes les dich de temps sont introduites

I Peu de différence

Page 99: ÉconométriedesDonnéesdePanel Ch1.ModèlesLinéairesNonDynamiquesrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1.pdf · ÉconométriedesDonnéesdePanel Ch1. ModèlesLinéairesNonDynamiques

Économétrie des Données de Panel Ch 1. Modèles Linéaires Non Dynamiques

Inférence avec données de panel

Sommaire

Les données de panel

Modèles à Données de Panel

Estimateurs pour données de panel

Inférence avec données de panel

Effets Fixes vs. Effets Aléatoires

Autres tests

Données de panel non-cylindré

Page 100: ÉconométriedesDonnéesdePanel Ch1.ModèlesLinéairesNonDynamiquesrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1.pdf · ÉconométriedesDonnéesdePanel Ch1. ModèlesLinéairesNonDynamiques

Économétrie des Données de Panel Ch 1. Modèles Linéaires Non Dynamiques

Inférence avec données de panel

Matrice des erreurs en panel

Sommaire

Les données de panel

Modèles à Données de PanelEffets Fixes & Effets Aléatoires

Estimateurs pour données de panelEfficience et ErreursEstimateurs appropriés MRLEstimateurs appropriés pour EFEstimateur approprié pour EAInterprétation : EF vs. EAApplication

Inférence avec données de panelMatrice des erreurs en panelInférence robuste : WhiteApplication WhiteInférence robuste : BootstrapApplication Bootstrap

Effets Fixes vs. Effets AléatoiresÉléments du choix hors testsTest de Hausman

Autres testsDonnées de panel non-cylindré

Page 101: ÉconométriedesDonnéesdePanel Ch1.ModèlesLinéairesNonDynamiquesrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1.pdf · ÉconométriedesDonnéesdePanel Ch1. ModèlesLinéairesNonDynamiques

Économétrie des Données de Panel Ch 1. Modèles Linéaires Non Dynamiques

Inférence avec données de panel

Matrice des erreurs en panel

Inférence

I L’inférence consiste enI la prédictionI les tests d’hypothèses

I L’inférence classique fait des tests d’hyp.I dont la significativité des coefficientsI à partir de la matrice Σβ de variance-covariance des β

I Donc : essentiel de disposer d’une estimationI au minimum consistanteI de cette matrice Σβ

I Celle-ci s’appuie sur la matrice Σu

I Var-Cov des erreurs uit = αi + εitI Prochaine dia

Page 102: ÉconométriedesDonnéesdePanel Ch1.ModèlesLinéairesNonDynamiquesrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1.pdf · ÉconométriedesDonnéesdePanel Ch1. ModèlesLinéairesNonDynamiques

Économétrie des Données de Panel Ch 1. Modèles Linéaires Non Dynamiques

Inférence avec données de panel

Matrice des erreurs en panel

Rappel sur la matrice var-cov des erreurs panel en général

σv211 σv112 · · · σv11T

σv212

. . ....

.... . .

. . . σv1(T − 1)T

SYM · · · σv21T

0 · · · 0

0. . .

. . ....

.... . .

. . . 0

0 · · · 0

σv2N1 σvN12 · · · σvN1T

σv2N2

. . ....

.... . .

. . . σvN(T − 1)T

SYM · · · σv2NT

Page 103: ÉconométriedesDonnéesdePanel Ch1.ModèlesLinéairesNonDynamiquesrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1.pdf · ÉconométriedesDonnéesdePanel Ch1. ModèlesLinéairesNonDynamiques

Rappel 2 : Matrice Σu dans le modèle EA avechétéroscédasticité

σv2α

+ σv2ε1 σv

· · · σv2α

σv2α

σv2α

+ σv2ε1

. . ....

.... . .

. . . σv2α

σv2α

· · · σv2ασv2α

+ σv2ε1

0 · · · 0

0. . .

. . ....

.... . .

. . . 0

0 · · · 0

σv2α

+ σv2εN

σv2α

· · · σv2α

σv2α

σv2α

+ σv2εN

. . ....

.... . .

. . . σv2α

σv2α

· · · σv2ασv2α

+ σv2εN

Page 104: ÉconométriedesDonnéesdePanel Ch1.ModèlesLinéairesNonDynamiquesrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1.pdf · ÉconométriedesDonnéesdePanel Ch1. ModèlesLinéairesNonDynamiques

Économétrie des Données de Panel Ch 1. Modèles Linéaires Non Dynamiques

Inférence avec données de panel

Matrice des erreurs en panel

Estimateur MCI Tous les estimateurs panel sont MC sur données transforméesI MC traite chacune des T années comme de l’information

indépendante, maisI Le contenu informationnel est moindre

I puisque les erreurs (et donc les obs.) sont corréléesI Ceci tend à surestimer la précision

I Le modèle qui fait le plus d’hypothèses sur Σu est EAI Si ce modèle est exact, on peut procéder à l’inférence

habituelleI à partir des données transformées MCG

I Dans les autres cas,I On utilise des corrections panel des écarts-types (et) quand on

applique MCOI Beaucoup de corrections sont possibles, selon les hyp. sur la

corrélation et l’hétéroscédasticitéI Et aussi selon la longueur du panel – mais on ne verra pas

Page 105: ÉconométriedesDonnéesdePanel Ch1.ModèlesLinéairesNonDynamiquesrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1.pdf · ÉconométriedesDonnéesdePanel Ch1. ModèlesLinéairesNonDynamiques

Économétrie des Données de Panel Ch 1. Modèles Linéaires Non Dynamiques

Inférence avec données de panel

Matrice des erreurs en panel

Inférence statistique Panel-robuste

I Des écarts-types Panel-robustes peuvent être estimésI sans supposer de forme fonctionnelle spécifique pour la

corrélation ou l’hétéroscédasticité des erreurs individuellesI au moyen de 2 techniques

I l’estimateur robuste de WhiteI le bootstrap

I Dans beaucoup de packages économétriques, les et calculéspar défautI assument des erreurs iidI Donc une matrice Σu diagonale

I incohérente avec PanelI Cette inférence est erronée

I En général, elle sous-estime les et, donc sur-estime les t-stat

Page 106: ÉconométriedesDonnéesdePanel Ch1.ModèlesLinéairesNonDynamiquesrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1.pdf · ÉconométriedesDonnéesdePanel Ch1. ModèlesLinéairesNonDynamiques

Économétrie des Données de Panel Ch 1. Modèles Linéaires Non Dynamiques

Inférence avec données de panel

Matrice des erreurs en panel

Efficience en panel

I En panel, donc, on utilise des estimateurs inefficientsI mais on estime leur matrice de var-cov Σβ de façon

consistanteI Lorsque l’estimateur de β est consistant

I Seul l’estimateur EA est efficient dans le modèle EAI Tous les autres estimateurs consistants sont inefficients dans

tous les modèlesI Estimateurs plus efficients

I Moindres Carrés Généralisés (faisables) : pgglsI Méthode Généralisée des Moments GMM : Ch. 2

I Les estimateurs EF, EA et D1 tendent à réduire la corrélationsérielleI mais pas à l’éliminer

Page 107: ÉconométriedesDonnéesdePanel Ch1.ModèlesLinéairesNonDynamiquesrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1.pdf · ÉconométriedesDonnéesdePanel Ch1. ModèlesLinéairesNonDynamiques

Économétrie des Données de Panel Ch 1. Modèles Linéaires Non Dynamiques

Inférence avec données de panel

Inférence robuste : White

Sommaire

Les données de panel

Modèles à Données de PanelEffets Fixes & Effets Aléatoires

Estimateurs pour données de panelEfficience et ErreursEstimateurs appropriés MRLEstimateurs appropriés pour EFEstimateur approprié pour EAInterprétation : EF vs. EAApplication

Inférence avec données de panelMatrice des erreurs en panelInférence robuste : WhiteApplication WhiteInférence robuste : BootstrapApplication Bootstrap

Effets Fixes vs. Effets AléatoiresÉléments du choix hors testsTest de Hausman

Autres testsDonnées de panel non-cylindré

Page 108: ÉconométriedesDonnéesdePanel Ch1.ModèlesLinéairesNonDynamiquesrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1.pdf · ÉconométriedesDonnéesdePanel Ch1. ModèlesLinéairesNonDynamiques

Économétrie des Données de Panel Ch 1. Modèles Linéaires Non Dynamiques

Inférence avec données de panel

Inférence robuste : White

Rappel : l’estimateur de Σβ hétéroscédastique-consistant deWhite

I MRL classique en coupe transversaleI y = x

′β + ε avec E

(εε

′)

= Σε 6= σ2I

I MCO est non-biaisé et consistantI Var

(βOLS

)= ΣβMCO

=(X

′X)−1

X′ΣεX

(X

′X)−16=

σ2(X

′X)−1

I En cas d’hétéroscédasticité pure, White (1980) montre que

S =1N

N∑i=1

ε2i XiX′i

I est un estimateur consistant de 1NX

′ΣεX sous des conditions

généralesI εi est le résidu MCO ε = y − x

′βMCO

Page 109: ÉconométriedesDonnéesdePanel Ch1.ModèlesLinéairesNonDynamiquesrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1.pdf · ÉconométriedesDonnéesdePanel Ch1. ModèlesLinéairesNonDynamiques

Économétrie des Données de Panel Ch 1. Modèles Linéaires Non Dynamiques

Inférence avec données de panel

Inférence robuste : White

L’estimateur de Σβ hétéroscédastique-consistant de Whiteen panel

I L’estimateur de White peut être étendu pour l’autocorrélationI mais souvent on ne le fait pas

I car on cherche à étudier les propriétés temporelles dans plusde détails

I Sauf en panel courtI où la série est trop courte pour la tester en détailI On va voir brièvement comment White est appliqué au Panel

Page 110: ÉconométriedesDonnéesdePanel Ch1.ModèlesLinéairesNonDynamiquesrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1.pdf · ÉconométriedesDonnéesdePanel Ch1. ModèlesLinéairesNonDynamiques

Économétrie des Données de Panel Ch 1. Modèles Linéaires Non Dynamiques

Inférence avec données de panel

Inférence robuste : White

L’estimateur de Σβ hétéroscédastique-consistant de Whiteen panel

I Réécrire tout estimateur panel comme un estimateur MC de θdans

yit = w′itθ + uit (13)

I yit est une fonction connue de seulement yi1, ..., yiTI Pareil pour w

it et w′it =

[1 x

it

]; uit et uit

I p.e. MCO : pas de transformation, θ =[α β

′ ]′I Within : yit = yit − yi , wit = xit−xi uniquement pour les

régresseurs variant dans le tempsI θ : coefficients des régresseurs variant dans le temps

I ...I / Ces transformations induiront de la corrélation sérielle

I même si les erreurs originelles n’en ont pas

Page 111: ÉconométriedesDonnéesdePanel Ch1.ModèlesLinéairesNonDynamiquesrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1.pdf · ÉconométriedesDonnéesdePanel Ch1. ModèlesLinéairesNonDynamiques

Économétrie des Données de Panel Ch 1. Modèles Linéaires Non Dynamiques

Inférence avec données de panel

Inférence robuste : White

Notation

I Empiler les observations selon les périodes pour un individu i :I ~yi = ~W

i θ +~ui oùI ~yi : T × 1

I Pour D1, (T − 1)× 1I ~Wi : T × q

I MCO θMCO =

[N∑i=1

~W′i~Wi

]−1∑i

~W′i~yi

I pour tous les estimateurs panel

Page 112: ÉconométriedesDonnéesdePanel Ch1.ModèlesLinéairesNonDynamiquesrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1.pdf · ÉconométriedesDonnéesdePanel Ch1. ModèlesLinéairesNonDynamiques

Économétrie des Données de Panel Ch 1. Modèles Linéaires Non Dynamiques

Inférence avec données de panel

Inférence robuste : White

Variance estimateur MCO

I Variance de θMCO dans le modèle avec un ~ :

ΣθMCO=

[N∑i=1

~W′i~Wi

]−1∑i

~W′iE[~ui~u

′i |~Wi

]~Wi

[N∑i=1

~W′i~Wi

]−1

I Même formule sandwich que dans le rappelI Sauf qu’on a un vecteur ui plutôt qu’un scalaire ui

I White :I On a pas besoin d’un estimateur consistant de la matrice

var-cov des erreurs Σu pour l’inférenceI Il suffit d’un estimateur de

∑i

~W′

iE[~ui~u

i |~Wi

]~Wi

I La partie du milieu de ΣθMCOI Qui est de dimension plus réduite que Σu

Page 113: ÉconométriedesDonnéesdePanel Ch1.ModèlesLinéairesNonDynamiquesrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1.pdf · ÉconométriedesDonnéesdePanel Ch1. ModèlesLinéairesNonDynamiques

Économétrie des Données de Panel Ch 1. Modèles Linéaires Non Dynamiques

Inférence avec données de panel

Inférence robuste : White

Estimateur “Panel-robuste” de la matrice de var-cov ΣθMCO

I L’estimateur de White faisable de Σβ

I étendu pour le panelI permet à la fois hétérodasticité et autocorrélation

ΣθMCO=

[N∑i=1

~W′

i~Wi

]−1∑i

~W′

i ~ui~u′

i~Wi

[N∑i=1

~W′

i~Wi

]−1

(14)

où ~ui = ~yi − ~W′i θ

I L’information accumule lorsque N →∞I car la mat. Σu de var-cov des erreurs est de dimensions finies

T × T alors qu’on prend∑i

I C’est la base de la consistance

Page 114: ÉconométriedesDonnéesdePanel Ch1.ModèlesLinéairesNonDynamiquesrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1.pdf · ÉconométriedesDonnéesdePanel Ch1. ModèlesLinéairesNonDynamiques

Économétrie des Données de Panel Ch 1. Modèles Linéaires Non Dynamiques

Inférence avec données de panel

Inférence robuste : White

DétailI On cherche

∑i

~W′iE[~ui~u

′i |~Wi

]~Wi

I On prend∑i

~W′

i ~ui~u′

i~Wi

I simplification de notation

I Wi = Zi =

zi11 · · · zik1...

. . ....

zi1T · · · zikT

, ˆui = ei =

ei1...eiT

∑i

Z′i eie

′iZi =

∑i

zi11 · · · zik1...

. . ....

zi1T · · · zikT

′ ei1

...eiT

ei1

...eiT

′ zi11 · · · zik1

.... . .

...zi1T · · · zikT

(k × T )× (T × 1)× (1× T )× (T × k) = (k × k)

Page 115: ÉconométriedesDonnéesdePanel Ch1.ModèlesLinéairesNonDynamiquesrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1.pdf · ÉconométriedesDonnéesdePanel Ch1. ModèlesLinéairesNonDynamiques

Économétrie des Données de Panel Ch 1. Modèles Linéaires Non Dynamiques

Inférence avec données de panel

Inférence robuste : White

Détail∑i

Z′i eie

′iZi =

∑i

zi11 · · · zi1T...

. . ....

zik1 · · · zikT

e2

i1 · · · ei1eiT...

...sym · · · e2

iT

zi11 · · · zik1

.... . .

...zi1T · · · zikT

=∑i

ei1∑

t zi1teit · · · eiT∑

t zi1teit...

. . ....

ei1∑

t zikteit · · · eiT∑

t zikteit

zi11 · · · zik1

.... . .

...zi1T · · · zikT

=∑i

t zi1teit∑

t zi1teit · · ·∑

t zikteit∑

t zi1teit...

. . ....

sym · · ·∑

t zikteit∑

t zikteit

On voit comment on se rapproche d’une matrice de var-cov

Page 116: ÉconométriedesDonnéesdePanel Ch1.ModèlesLinéairesNonDynamiquesrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1.pdf · ÉconométriedesDonnéesdePanel Ch1. ModèlesLinéairesNonDynamiques

Économétrie des Données de Panel Ch 1. Modèles Linéaires Non Dynamiques

Inférence avec données de panel

Inférence robuste : White

Estimateur Panel-robuste de la matrice de var-cov ΣθMCO

I Cet estimateur (14) assume l’indépendance entre i et N →∞I mais permet que V [uit ] et Cov [uit , uis ] change avec i , t, et sI ce qui est le cas pour des panels courts

I Des et Panel-robustes basés sur cet estimateur (14)I peuvent être calculés en utilisant une commande MCO

habituelleI avec une procédure parfois appelée “cluster-robust” pour le

calcul des etI cluster sur i

I Erreur fréquente :I utiliser une procédure “standard robust” des et dans MCO de

yit = w′

itθ + uitI Ajuste uniquement pour hétéroscédasticité

I En Panel, en pratique, plus important de corriger pour lacorrélation sérielle

Page 117: ÉconométriedesDonnéesdePanel Ch1.ModèlesLinéairesNonDynamiquesrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1.pdf · ÉconométriedesDonnéesdePanel Ch1. ModèlesLinéairesNonDynamiques

Économétrie des Données de Panel Ch 1. Modèles Linéaires Non Dynamiques

Inférence avec données de panel

Application White

Sommaire

Les données de panel

Modèles à Données de PanelEffets Fixes & Effets Aléatoires

Estimateurs pour données de panelEfficience et ErreursEstimateurs appropriés MRLEstimateurs appropriés pour EFEstimateur approprié pour EAInterprétation : EF vs. EAApplication

Inférence avec données de panelMatrice des erreurs en panelInférence robuste : WhiteApplication WhiteInférence robuste : BootstrapApplication Bootstrap

Effets Fixes vs. Effets AléatoiresÉléments du choix hors testsTest de Hausman

Autres testsDonnées de panel non-cylindré

Page 118: ÉconométriedesDonnéesdePanel Ch1.ModèlesLinéairesNonDynamiquesrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1.pdf · ÉconométriedesDonnéesdePanel Ch1. ModèlesLinéairesNonDynamiques

Économétrie des Données de Panel Ch 1. Modèles Linéaires Non Dynamiques

Inférence avec données de panel

Application White

Application : déforestation amazonienne

RappelI Le fichier de données est en ligne sur le site du coursI Données de 1988 à 2015

I États de l’Amazone légale (un état n’a pas 1988)I 9 états du bassin brézilien de l’Amazone

I Modèle CKE

yit = αi + β1PIBhit + β2PIBh2it + γxit + εit

I On ne regarde pas x pour le moment

Page 119: ÉconométriedesDonnéesdePanel Ch1.ModèlesLinéairesNonDynamiquesrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1.pdf · ÉconométriedesDonnéesdePanel Ch1. ModèlesLinéairesNonDynamiques

Économétrie des Données de Panel Ch 1. Modèles Linéaires Non Dynamiques

Inférence avec données de panel

Application White

vcovXX : fonctions du package plm

L’autocorrélation sérielle et/ou l’hétéroscédasticitéI ne modifie les coefficients estimés

I mais la matrice de v-cov des β doit être estimée correctementI plm ne fait pas les tests lui-même

I mais calcule une estimation robuste de cette matriceI qui est ensuite passée au package lmtest pour les tests

vcovHC correspond à l’estimation de White telle qu’on la vue pourpanelI plusieurs alternatives existent sur le même principe

I Elles ont généralement + modernes et mieux adaptées àcertains cas

I voir help plm, dans la liste descendre à vcovI On va juste regarder le classique vcovHC

Page 120: ÉconométriedesDonnéesdePanel Ch1.ModèlesLinéairesNonDynamiquesrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1.pdf · ÉconométriedesDonnéesdePanel Ch1. ModèlesLinéairesNonDynamiques

Économétrie des Données de Panel Ch 1. Modèles Linéaires Non Dynamiques

Inférence avec données de panel

Application White

vcovHCvcovHC(x,I x : objet de class "plm" (résultat d’une estimation EA ou

within), ou class "pgmm" ou class "pcce"method = c("arellano", "white1", "white2"),I white1 : hétérocédasticité de tout type, pas d’autocorrélationI white2 : même variance au sein d’un groupe iI arellano : structure générale hétérocédasticité comme white 1

et autocorrélation à l’intérieur d’un groupeI Entre groupes, pas de corrélation

type = c("HC0", "sss", "HC1", "HC2", "HC3", "HC4"),I diverses corrections pour la taille d’échantillon entre autres

cluster = c("group", "time"), ...)I normalement le cluster est sur “group”

I Si on prend “time”, on groupe par t au lieu que par i

Page 121: ÉconométriedesDonnéesdePanel Ch1.ModèlesLinéairesNonDynamiquesrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1.pdf · ÉconométriedesDonnéesdePanel Ch1. ModèlesLinéairesNonDynamiques

Économétrie des Données de Panel Ch 1. Modèles Linéaires Non Dynamiques

Inférence avec données de panel

Application White

vcovHC estimée

I Dans le cas de la déforestationI On s’attend à Hétéroscédasticité et AutocorrélationI Donc : arellano

I vcovHC.w <- vcovHC(defor.w, method="ar")I et similaire pour ea & fd

Page 122: ÉconométriedesDonnéesdePanel Ch1.ModèlesLinéairesNonDynamiquesrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1.pdf · ÉconométriedesDonnéesdePanel Ch1. ModèlesLinéairesNonDynamiques

Économétrie des Données de Panel Ch 1. Modèles Linéaires Non Dynamiques

Inférence avec données de panel

Application White

Package lmtest – Zeileis & Hothorn

I Possiblement il faut l’installer & le chargerI lmtest peut exécuter plusieurs tests classiques

I associés aux modèles linéairesI coeftest est le t-stat

I mais aussi z-stat dans les conditions appropriéesI coeftest(x, vcov., ...)

I x est un objet stocké résultat d’une estimationI vcov. est soit une matrice stockée, soit une méthode pour

calculer cette matrice à partir de xI coefci(x, vcov., parm, level ...)

I idem, mais donne l’intervalle de confianceI pour le paramètre dans parm (optionel)I et le niveau de confiance dans level (.95 par défaut)

Page 123: ÉconométriedesDonnéesdePanel Ch1.ModèlesLinéairesNonDynamiquesrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1.pdf · ÉconométriedesDonnéesdePanel Ch1. ModèlesLinéairesNonDynamiques

Économétrie des Données de Panel Ch 1. Modèles Linéaires Non Dynamiques

Inférence avec données de panel

Application White

Résultats – en reprenant les estimations oneway

EF - Within EF - D1 EA - MCG Pooling Betweencoef. p-val coef. p-val coef. p-val coef. p-val coef. p-val

β0 – -99.5 .14 .03 -1045 .35 .61 1057 .37 .61 6942 .40β1DIP 630 2e-05 .09 437 .27 .04 624 2e-05 .09 121 .55 .75 -1290 .41β2DIP2 -31.4 3e-08 .02 -11.5 .43 .025 -31.1 3e-08 .025 -4.96 .55 .70 68.294 .33# obs. 233 defaut White 224 defaut White 233 defaut White 233 defaut White 9 defaut

I Le changement important de significativité en passant à WhiteI de pls ordres de grandeurs sur les p-valeurs

I Faible significativité de D1 due à la perte d’efficience enpassant aux diff. 1ºI Surpenante récupération en passant à White

Page 124: ÉconométriedesDonnéesdePanel Ch1.ModèlesLinéairesNonDynamiquesrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1.pdf · ÉconométriedesDonnéesdePanel Ch1. ModèlesLinéairesNonDynamiques

Économétrie des Données de Panel Ch 1. Modèles Linéaires Non Dynamiques

Inférence avec données de panel

Application White

Autres tests sur les coefficients

I Test de Wald : comparer des modèles anidésI waldtest du package lmtest

I Tester des restrictions linéairesI linearHypothesis( ) du package car

I Voir plm vignette p 40.

Page 125: ÉconométriedesDonnéesdePanel Ch1.ModèlesLinéairesNonDynamiquesrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1.pdf · ÉconométriedesDonnéesdePanel Ch1. ModèlesLinéairesNonDynamiques

Économétrie des Données de Panel Ch 1. Modèles Linéaires Non Dynamiques

Inférence avec données de panel

Application White

Note. Décomposition de la varianceI Pour l’estimateur EA, la sortie indique “Effects :

I Idiosyncratic – εitI Individual – αi ”I Si le modèle est twoway (et le panel balanced), il y a aussi un

terme timeI Cela reflète la variance estimée de l’erreur

I La variance totale s2 d’une série panel xit peut êtredécomposée en

1NT

N∑i=1

T∑t=1

(xit − x)2 = 1NT

N∑i=1

T∑t=1

[(xit − xi ) + (xi − x)]2

= 1NT−N

N∑i=1

T∑t=1

(xit − xi )2 + 1

N−1

N∑i=1

T∑t=1

(xi − x)2

car les produits croisés somment à zéro.

Page 126: ÉconométriedesDonnéesdePanel Ch1.ModèlesLinéairesNonDynamiquesrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1.pdf · ÉconométriedesDonnéesdePanel Ch1. ModèlesLinéairesNonDynamiques

Économétrie des Données de Panel Ch 1. Modèles Linéaires Non Dynamiques

Inférence avec données de panel

Application White

Décomposition de la variance des résidus

I Variance totale s2 =I s2

w variance within “individual”I [moyenne sur les i des déviations individuelles autour des

moyennes individuelles]I = variance due aux évolutions temporelles individuelles (en

moyenne sur les i)I + s2

b variance between “idiosyncratic”I [déviations des moyennes individuelles autour de la moyenne

générale]I = variance due aux écarts entre individus

I Ici on a que de la variance totale inexpliquéeI 20% est idiosyncratiqueI 80% est due aux différences intra individus

I C’est bien l’intuition des graphiques panel

Page 127: ÉconométriedesDonnéesdePanel Ch1.ModèlesLinéairesNonDynamiquesrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1.pdf · ÉconométriedesDonnéesdePanel Ch1. ModèlesLinéairesNonDynamiques

Économétrie des Données de Panel Ch 1. Modèles Linéaires Non Dynamiques

Inférence avec données de panel

Inférence robuste : Bootstrap

Sommaire

Les données de panel

Modèles à Données de PanelEffets Fixes & Effets Aléatoires

Estimateurs pour données de panelEfficience et ErreursEstimateurs appropriés MRLEstimateurs appropriés pour EFEstimateur approprié pour EAInterprétation : EF vs. EAApplication

Inférence avec données de panelMatrice des erreurs en panelInférence robuste : WhiteApplication WhiteInférence robuste : BootstrapApplication Bootstrap

Effets Fixes vs. Effets AléatoiresÉléments du choix hors testsTest de Hausman

Autres testsDonnées de panel non-cylindré

Page 128: ÉconométriedesDonnéesdePanel Ch1.ModèlesLinéairesNonDynamiquesrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1.pdf · ÉconométriedesDonnéesdePanel Ch1. ModèlesLinéairesNonDynamiques

Rappel : le Bootstrap

I Hyp. Bootstrap :I Si on pouvait ré-échantillonner la pop. dans les mêmes

conditions, on obtiendrait un échantillon semblable à celuiqu’on a déjà

I “Principe de médiocrité”I Pas la même chose que représentativité

I Principe (et 2nde hyp.)I Échantillonner l’échantillon de taille n avec remplacement

I soit n tirages, chaque i a une probabilité 1/n de sortirI S’appelle “Bootstrap par paire” car y et X sont tirésI On obtient un échantillon Bootstrap (de taille n)I Hyp. : semblable à ce qu’on aurait obtenu en

ré-échantillonnant la pop.

I Répliquer ce processus B foisI B pseudo-échantillons différents

I Pour chaque pseudo-échantillon < Yb,Xb >I un vecteur θb

Page 129: ÉconométriedesDonnéesdePanel Ch1.ModèlesLinéairesNonDynamiquesrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1.pdf · ÉconométriedesDonnéesdePanel Ch1. ModèlesLinéairesNonDynamiques

Économétrie des Données de Panel Ch 1. Modèles Linéaires Non Dynamiques

Inférence avec données de panel

Inférence robuste : Bootstrap

Rappel : le BootstrapI Pour construire un intervale de confiance pour un élément θk

de θI On a B estimations θkb p.e. B = 10 000I Ordonner ces estimations de la plus petite à la plus grandeI Alors l’intervale de confiance à 95% est délimité par

I l’estimation numéro 250, borne inférieureI l’estimation numéro 9750, borne supérieure

Pourquoi est-ce intéressant ?1. Pas d’hypothèse sur la distribution des erreurs

1.1 Mais il ne peut y avoir de corrélation entre observations1.2 Dès lors, en panels, on ré-échantillonne seulement sur i , en

utilisant toutes les T périodes de chaque i sélectionné2. On peut calculer des intervales de confiance

2.1 pour toute fonction des paramètres estimés, y-comprisnon-linéaire

2.2 pour des paramètres estimés de modèles sans propriétésd’échantillons finis connues

Page 130: ÉconométriedesDonnéesdePanel Ch1.ModèlesLinéairesNonDynamiquesrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1.pdf · ÉconométriedesDonnéesdePanel Ch1. ModèlesLinéairesNonDynamiques

Économétrie des Données de Panel Ch 1. Modèles Linéaires Non Dynamiques

Inférence avec données de panel

Inférence robuste : Bootstrap

Estimateur Bootstrap (Panel-robuste) de la matrice devar-cov ΣθMCO

en panel

I Pour chaque pseudo-échantillon BI MCO de yit sur wit

I yit = w′itθ + uit

I B estimations θb, b = 1, ...,B

I Estimateur Bootstrap “empirique” de la matrice de var-cov Σθ :

Σbootθ

=1

B − 1

B∑b=1

(θb − ¯

θ)(

θb − ¯θ)′

(15)

où ¯θ = B−1∑b θb

Page 131: ÉconométriedesDonnéesdePanel Ch1.ModèlesLinéairesNonDynamiquesrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1.pdf · ÉconométriedesDonnéesdePanel Ch1. ModèlesLinéairesNonDynamiques

Économétrie des Données de Panel Ch 1. Modèles Linéaires Non Dynamiques

Inférence avec données de panel

Inférence robuste : Bootstrap

Estimateur Bootstrap (Panel-robuste) de la matrice devar-cov ΣθMCO

en panel

I Bootstrap s’applique à toutes les techniques économétriquesI Peut être lent

I Pour autant que les i soient indépendants :I Consistant quand N →∞I Asymptotiquement équivalent au “Sandwich” Panel-robuste de

WhiteI Pour autant que les hyp. de chauqe approche soient correctes

I ∀ forme d’hétéroscédasticité ou d’autocorrélation (intra-i)I Pas accessible comme White dans R

I Il faut une programmation + lourde

Page 132: ÉconométriedesDonnéesdePanel Ch1.ModèlesLinéairesNonDynamiquesrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1.pdf · ÉconométriedesDonnéesdePanel Ch1. ModèlesLinéairesNonDynamiques

Économétrie des Données de Panel Ch 1. Modèles Linéaires Non Dynamiques

Inférence avec données de panel

Application Bootstrap

Sommaire

Les données de panel

Modèles à Données de PanelEffets Fixes & Effets Aléatoires

Estimateurs pour données de panelEfficience et ErreursEstimateurs appropriés MRLEstimateurs appropriés pour EFEstimateur approprié pour EAInterprétation : EF vs. EAApplication

Inférence avec données de panelMatrice des erreurs en panelInférence robuste : WhiteApplication WhiteInférence robuste : BootstrapApplication Bootstrap

Effets Fixes vs. Effets AléatoiresÉléments du choix hors testsTest de Hausman

Autres testsDonnées de panel non-cylindré

Page 133: ÉconométriedesDonnéesdePanel Ch1.ModèlesLinéairesNonDynamiquesrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1.pdf · ÉconométriedesDonnéesdePanel Ch1. ModèlesLinéairesNonDynamiques

Économétrie des Données de Panel Ch 1. Modèles Linéaires Non Dynamiques

Inférence avec données de panel

Application Bootstrap

Application : déforestation amazonienne

RappelI Le fichier de données est en ligne sur le site du coursI Données de 1988 à 2015

I États de l’Amazone légale (un état n’a pas 1988)I 9 états du bassin brézilien de l’Amazone

I Modèle CKE

yit = αi + β1PIBhit + β2PIBh2it + γxit + εit

I On ne regarde pas x pour le moment

Page 134: ÉconométriedesDonnéesdePanel Ch1.ModèlesLinéairesNonDynamiquesrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1.pdf · ÉconométriedesDonnéesdePanel Ch1. ModèlesLinéairesNonDynamiques

Économétrie des Données de Panel Ch 1. Modèles Linéaires Non Dynamiques

Inférence avec données de panel

Application Bootstrap

Bootstrap

I N’est pas implémenté dans le package plmI Il existe le package boot

I Mais il n’est pas implémenté pour les données de PanelI Rappel : en panel, bootstrap sur les i, pas sur toutes les

donnéesI Actuellement, je ne sais pas faire avec un panel non-cylindré

I Sous-échantillon cylindré :I PIBh manque en 1988 pour Tocantins

I ama3 <- ama2[-which(ama2$Year=="1988"),]I On enlève 1988I 27 observations pour chacun des 9 états

Page 135: ÉconométriedesDonnéesdePanel Ch1.ModèlesLinéairesNonDynamiquesrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1.pdf · ÉconométriedesDonnéesdePanel Ch1. ModèlesLinéairesNonDynamiques

Générer un échantillon bootstrapI myfunc <- function(n,df) {

I #definit function (n et df sont dans l’appel de la fonction +bas)

I # n est ama3$Etat lors de l’appel de myfunc, df est ledataframe, ama3

I unique_Etat <- unique(n)I # Etat unique

I (help : unique renvoie un vecteur ou data frame comme sonarg x mais en enlevant les lignes doublons, dans ce cas définissur Etat

I sample_Etat <- sample(unique_Etat,size=length(unique_Etat), replace=T )

I # choisit sur Etat unique, au hasard avec remplacement, de lataille de "size" (help sample)

I new_df <- do.call(rbind, lapply(sample_Etat, function(x)df[df$Etat==x,] ))

I # va chercher toutes les années de chaque Etat choisialéatoirement et rbind c’est-à-dire empile par ligne

I }

Page 136: ÉconométriedesDonnéesdePanel Ch1.ModèlesLinéairesNonDynamiquesrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1.pdf · ÉconométriedesDonnéesdePanel Ch1. ModèlesLinéairesNonDynamiques

Économétrie des Données de Panel Ch 1. Modèles Linéaires Non Dynamiques

Inférence avec données de panel

Application Bootstrap

Générer un échantillon bootstrap

I Notes do.call & lapplyI # do.call : construit & exécute une functionI # do.call(what, args, quote = FALSE, envir = parent.frame())I # what : soit une (nouvelle) function soit 1 string avec le nom

de la commande à appelerI # lapply {base} : Apply une Function sur un Vector ; lapply(X,

FUN, ...) renvoie une liste de même longueur que X, chaqueélément duquel est le résultat d’appliquer FUN à l’élémentcorrespondant de X

I # Note : création d’une 2eme function à l’intérieur de lapplyI a <- myfunc(ama3$Etat, ama3)

I # exécute la function, on voit que le résultat a la même tailleque ama3

I c’est un bien un "panel bootstrap" de ama3

Page 137: ÉconométriedesDonnéesdePanel Ch1.ModèlesLinéairesNonDynamiquesrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1.pdf · ÉconométriedesDonnéesdePanel Ch1. ModèlesLinéairesNonDynamiques

Économétrie des Données de Panel Ch 1. Modèles Linéaires Non Dynamiques

Inférence avec données de panel

Application Bootstrap

Boucle for de 1 à R

I À ce stade, on a donc 1 échantillon bootstrapI On l’utilise pour estimer le panelI On met ca dans une boucle R fois

I R=99I c <- coef(plm(Defor_km2~PIBh2010R+I(PIBh2010R^2),

data=ama3, index = c("Etat","Year"), model = "within"))I # Estimation initiale (peut être une part du bootstrap), coef

est un vector

Page 138: ÉconométriedesDonnéesdePanel Ch1.ModèlesLinéairesNonDynamiquesrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1.pdf · ÉconométriedesDonnéesdePanel Ch1. ModèlesLinéairesNonDynamiques

Économétrie des Données de Panel Ch 1. Modèles Linéaires Non Dynamiques

Inférence avec données de panel

Application Bootstrap

Boucle for de 1 à R

I for(i in 1 :R) {I a <- myfunc(ama3$Etat, ama3)

I # A chaque i on relance le bootstrap & les estimationsI a$E <- rep(1 :9, each = 27)

I On ne peut pas utiliser directement “Etat” dans un call plmcar il y a des doublons par construction

I c <-cbind(c,coef(plm(Defor_km2~PIBh2010R+I(PIBh2010R^2),data=a, index = c("E","Year"), model = "within")))

I # crée une matrice avec tous les 1º coefs sur la 1º ligne, tousles 2º sur la seconde et ainsi de suite pour l’ensemble des coefdu modele (ici 2)

I }

Page 139: ÉconométriedesDonnéesdePanel Ch1.ModèlesLinéairesNonDynamiquesrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1.pdf · ÉconométriedesDonnéesdePanel Ch1. ModèlesLinéairesNonDynamiques

Économétrie des Données de Panel Ch 1. Modèles Linéaires Non Dynamiques

Inférence avec données de panel

Application Bootstrap

Sortir les résultats

I colMeans(t(c))I # moyenne sur chaque coef

I sqrt(apply(t(c), MARGIN = 2, var))I # écarts-types par coefI apply : appliquer la fonction “var” sur la matrice t(c) par

colonne (MARGIN=2)I apply(t(c), MARGIN = 2, quantile, probs=c(.025, .975))

I # 95% CI over coef valueI Conclusion

I le bootstrap ne conclut pas à autant de significativité que laprocédure robuste White (option )

Page 140: ÉconométriedesDonnéesdePanel Ch1.ModèlesLinéairesNonDynamiquesrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1.pdf · ÉconométriedesDonnéesdePanel Ch1. ModèlesLinéairesNonDynamiques

Économétrie des Données de Panel Ch 1. Modèles Linéaires Non Dynamiques

Inférence avec données de panel

Application Bootstrap

Résultats – à partir des estimations oneway, R =999

EF - Within EF - D1 EA - MCG Poolingcoef. IC 95% coef. IC 95% coef. IC 95% coef. IC 95%

β0,.025 – – – -99.5-222 -189

-1045-4733 -5128

1057-4544 -3052

β0,.975 -17 -10 5009 3039 12164 5166β1,.025DIP 630

-404 -103437

-194 16624

-450 -106121

-1516 -616β1,.975DIP 1260 1364 1006 858 1217 1353 1233 858β2,.025DIP2

-31.4-53 -58

-11.5-24 -21

-31.1-49 -57

-4.96-59 -31

β2,.975DIP2 12 -5 7 -1 14 -5 49 21# obs. 233 boot White 224 boot White 233 boot White 233 boot White

Décimales arrondies ; les résultats varient un peu d’un bootstrap à un autre ;EA : un message d’erreur dans au moins une itération

Page 141: ÉconométriedesDonnéesdePanel Ch1.ModèlesLinéairesNonDynamiquesrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1.pdf · ÉconométriedesDonnéesdePanel Ch1. ModèlesLinéairesNonDynamiques

Économétrie des Données de Panel Ch 1. Modèles Linéaires Non Dynamiques

Inférence avec données de panel

Application Bootstrap

En résumé

I Dans la plupart des cas, les estimateurs Panel sont inefficientsI On ne tache pas de récupérer l’efficienceI Mais seulement d’estimer correctement var

(β)

I pour l’inférenceI 2 techniques

I WhiteI

var(β)= sandwich

I Bootstrap

I var(β)= variance sur pseudo-échantillons

Page 142: ÉconométriedesDonnéesdePanel Ch1.ModèlesLinéairesNonDynamiquesrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1.pdf · ÉconométriedesDonnéesdePanel Ch1. ModèlesLinéairesNonDynamiques

Économétrie des Données de Panel Ch 1. Modèles Linéaires Non Dynamiques

Effets Fixes vs. Effets Aléatoires

Sommaire

Les données de panel

Modèles à Données de Panel

Estimateurs pour données de panel

Inférence avec données de panel

Effets Fixes vs. Effets Aléatoires

Autres tests

Données de panel non-cylindré

Page 143: ÉconométriedesDonnéesdePanel Ch1.ModèlesLinéairesNonDynamiquesrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1.pdf · ÉconométriedesDonnéesdePanel Ch1. ModèlesLinéairesNonDynamiques

Économétrie des Données de Panel Ch 1. Modèles Linéaires Non Dynamiques

Effets Fixes vs. Effets Aléatoires

Éléments du choix hors tests

Sommaire

Les données de panel

Modèles à Données de PanelEffets Fixes & Effets Aléatoires

Estimateurs pour données de panelEfficience et ErreursEstimateurs appropriés MRLEstimateurs appropriés pour EFEstimateur approprié pour EAInterprétation : EF vs. EAApplication

Inférence avec données de panelMatrice des erreurs en panelInférence robuste : WhiteApplication WhiteInférence robuste : BootstrapApplication Bootstrap

Effets Fixes vs. Effets AléatoiresÉléments du choix hors testsTest de Hausman

Autres testsDonnées de panel non-cylindré

Page 144: ÉconométriedesDonnéesdePanel Ch1.ModèlesLinéairesNonDynamiquesrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1.pdf · ÉconométriedesDonnéesdePanel Ch1. ModèlesLinéairesNonDynamiques

Économétrie des Données de Panel Ch 1. Modèles Linéaires Non Dynamiques

Effets Fixes vs. Effets Aléatoires

Éléments du choix hors tests

CausalitéI Le modèle EF peut établir la causalité avec moins d’hyp.

que pourI des données de coupe transversaleI le MRL ou les EA

I Dans quelques cas, la causalité est claire, donc EA estappropriéI p.e. dans une expérience contrôlée, la causalité est claire, il

s’agit plus de mesurer sa forceI des rendements de culture causés par 6= quantités d’engrais,

en laboI dans ce cas, le traitement xit est alloué aléatoirement, donc

non-corrélé à αi

I Parfois, on ne veut mesurer que la corrélation, pas la“causation”

I p.e. pour de la prédiction (data mining)I EA est alors suffisant

Page 145: ÉconométriedesDonnéesdePanel Ch1.ModèlesLinéairesNonDynamiquesrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1.pdf · ÉconométriedesDonnéesdePanel Ch1. ModèlesLinéairesNonDynamiques

Économétrie des Données de Panel Ch 1. Modèles Linéaires Non Dynamiques

Effets Fixes vs. Effets Aléatoires

Éléments du choix hors tests

Causalité

I Les économistes sont inhabituelsI ils préfèrent une approche EF car ils veulent mesurer la

causalitéI avec des données observationnellesI plutôt qu’expérimentales

I Dans ce cas, utiliser EA ou MCO n’aboutit qu’à une corrélationspurieuse souvent due à une hétérogénéité inobservée

I “facteurs confondants” : variables non-incluses corrélées avecrégresseurs

I EF élimine l’hétérogénéité inobservéeI due aux variables inobservées qui sont invariantes dans le

tempsI L’effet causal de x sur y est mesuré par la corrélation entre des

changements individuels dans y et dans x

Page 146: ÉconométriedesDonnéesdePanel Ch1.ModèlesLinéairesNonDynamiquesrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1.pdf · ÉconométriedesDonnéesdePanel Ch1. ModèlesLinéairesNonDynamiques

Économétrie des Données de Panel Ch 1. Modèles Linéaires Non Dynamiques

Effets Fixes vs. Effets Aléatoires

Éléments du choix hors tests

Échantillon

I Souvent en économie, l’échantillon porte surI des agents complexes : personnes ou paysI des phénomènes expliqués complexes

I travail (chômage, salaire, participation....)I revenu, croissance, vote, espérance de vie...

I En conséquenceI il est difficle d’argumenter qu’il ne manque pas une

caractérisqueI histoire, géographie, droit... pour les paysI psychologie, culture... pour les personnes

I Donc, EF par défautI EA doit être justifié

Page 147: ÉconométriedesDonnéesdePanel Ch1.ModèlesLinéairesNonDynamiquesrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1.pdf · ÉconométriedesDonnéesdePanel Ch1. ModèlesLinéairesNonDynamiques

Économétrie des Données de Panel Ch 1. Modèles Linéaires Non Dynamiques

Effets Fixes vs. Effets Aléatoires

Éléments du choix hors tests

Faiblesse des EF en pratiqueI L’estimation des coef. des régresseurs invariants dans le

temps n’est pas possible avec EFI Les coef. des régresseurs peu variables dans le temps sera

impréciseI sb (variation entre unités) forte par rapport à sW (variation

dans le temps)I La prédiction de la moyenne conditionnelle n’est pas

consistanteI car les effets individuels αi ne sont pas estimés de façon

consistanteI Seuls les changements de cette moyenne conditionnelle, causés

par des changement de régresseurs variants dans le temps,peuvent être prédits

I EF fait moins d’hyp que EA sur l’hétérogénéité inobservéeI mais il faut que celle-ci soit invariante au temps

I αi , pas αit

Page 148: ÉconométriedesDonnéesdePanel Ch1.ModèlesLinéairesNonDynamiquesrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1.pdf · ÉconométriedesDonnéesdePanel Ch1. ModèlesLinéairesNonDynamiques

Économétrie des Données de Panel Ch 1. Modèles Linéaires Non Dynamiques

Effets Fixes vs. Effets Aléatoires

Test de Hausman

Sommaire

Les données de panel

Modèles à Données de PanelEffets Fixes & Effets Aléatoires

Estimateurs pour données de panelEfficience et ErreursEstimateurs appropriés MRLEstimateurs appropriés pour EFEstimateur approprié pour EAInterprétation : EF vs. EAApplication

Inférence avec données de panelMatrice des erreurs en panelInférence robuste : WhiteApplication WhiteInférence robuste : BootstrapApplication Bootstrap

Effets Fixes vs. Effets AléatoiresÉléments du choix hors testsTest de Hausman

Autres testsDonnées de panel non-cylindré

Page 149: ÉconométriedesDonnéesdePanel Ch1.ModèlesLinéairesNonDynamiquesrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1.pdf · ÉconométriedesDonnéesdePanel Ch1. ModèlesLinéairesNonDynamiques

Économétrie des Données de Panel Ch 1. Modèles Linéaires Non Dynamiques

Effets Fixes vs. Effets Aléatoires

Test de Hausman

Rappel : le test de Hausman

I PrincipeI Soit 2 estimateurs θ et θ

I dans le même modèle yit = w′itθ + uit

I S’ils sont tous 2 consistantsI alors leur différence

(θ − θ

)ne devrait pas être

statistiquement 6= 0, asymptotiquement

I On teste H0 : plim(θ − θ

)= 0 , Ha : plim

(θ − θ

)6= 0

I Sous H0, la différence entre ces 2 estimateurs converge à unenormale d’espérance zéro

I√N(θ − θ

)→ N [0,VH ]

I VH est la matrice de var-cov de la distribution limite

Page 150: ÉconométriedesDonnéesdePanel Ch1.ModèlesLinéairesNonDynamiquesrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1.pdf · ÉconométriedesDonnéesdePanel Ch1. ModèlesLinéairesNonDynamiques

Économétrie des Données de Panel Ch 1. Modèles Linéaires Non Dynamiques

Effets Fixes vs. Effets Aléatoires

Test de Hausman

Rappel : le test de Hausman

I Statistique du test de Hausman

H =(θ − θ

)′ ( 1NVH

)−1 (θ − θ

)I Principe

I H est une valeur normalisée du carré de la différence(θ − θ

)I Donc, des valeurs élevées de H amènent à rejeter l’hyp. nulle

I On peut montrer que H asymptotiquement χ2 (q) sous H0I donc rejeter H0 au niveau α si H > χ2α (q)I avec q le nombre d’éléments de θI et donc : un des 2 estimateurs θ, θ au moins est inconsistant

I Difficulté pratique : trouver un estimateur VH de VH

I On va voir comment on fait en panel

Page 151: ÉconométriedesDonnéesdePanel Ch1.ModèlesLinéairesNonDynamiquesrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1.pdf · ÉconométriedesDonnéesdePanel Ch1. ModèlesLinéairesNonDynamiques

Économétrie des Données de Panel Ch 1. Modèles Linéaires Non Dynamiques

Effets Fixes vs. Effets Aléatoires

Test de Hausman

Test de Hausman sur la présence d’effets fixes en donnéesde panel

I Si les effets individuels αi sont fixesI L’estimateur within βW est consistantI L’estimateur EA βEA est inconsistant

I Avec β le vecteur des coefficients des régresseurs variant dansle temps

I puique seuls ces coefficients sont estimables avec WithinI Tandis que si les effets sont aléatoires

I Les 2 sont consistantsI H0 : pas de différence systématique entre les 2 estimations

I Si H0 vraie : on préfère EA car plus efficientI en principe, pas si clair si les erreurs sont I(1)

I Hausman fonctionne sur toutes paires d’estimateurs avec despropriétés semblablesI p.e. D1 vs. MCO

Page 152: ÉconométriedesDonnéesdePanel Ch1.ModèlesLinéairesNonDynamiquesrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1.pdf · ÉconométriedesDonnéesdePanel Ch1. ModèlesLinéairesNonDynamiques

Économétrie des Données de Panel Ch 1. Modèles Linéaires Non Dynamiques

Effets Fixes vs. Effets Aléatoires

Test de Hausman

Test de Hausman sur la présence d’effets fixes en donnéesde panel

I Si le test amène à rejeter l’égalité des 2 vecteurs βW et βEAI On infère que puisque βW est consistant,

I si βEA est différent, il doit être inconsistantI Et donc que les effets individuels αi sont corrélés avec les

régresseurs xitI Remarque : On peut encore éviter d’utiliser un estimateur EF

I Si les régresseurs sont corrélés aux αi à cause de variablesomises

I il peut être possible de rajouter des régresseursI Il peut être possible d’utiliser un estimateur EA avec variables

instrumentales (Ch. 2)

I À présent on regarde la mat. de var-cov de(βEA − βW

)I pour calculer la stat de Hausman en panelI 2 cas

Page 153: ÉconométriedesDonnéesdePanel Ch1.ModèlesLinéairesNonDynamiquesrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1.pdf · ÉconométriedesDonnéesdePanel Ch1. ModèlesLinéairesNonDynamiques

Économétrie des Données de Panel Ch 1. Modèles Linéaires Non Dynamiques

Effets Fixes vs. Effets Aléatoires

Test de Hausman

Calcul du test de Hausman quand βEA EST pleinementefficient

I Si le modèle vrai est EA avec Equicorrélation, doncI αi iid

[0, σ2

α

]non-corrélé aux régresseurs

I l’erreur εit iid[0, σ2

ε

]I Alors βEA pleinement efficient,

I la stat de Hausman se simplifie

H =(βEA − βW

)′ [ V[βW

]−

V[βEA

]]−1 (βEA−βW

)I Avec β le vecteur des coefficients des régresseurs variant dans

le temps comme d’habitudeI Cette stat de test est asymptotiquement χ2 (dim [β]) sous H0

I Très facile à calculerI puisque les matrices

V[βW

],

V[βEA

]sont fournies lors de

l’estimation

Page 154: ÉconométriedesDonnéesdePanel Ch1.ModèlesLinéairesNonDynamiquesrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1.pdf · ÉconométriedesDonnéesdePanel Ch1. ModèlesLinéairesNonDynamiques

Économétrie des Données de Panel Ch 1. Modèles Linéaires Non Dynamiques

Effets Fixes vs. Effets Aléatoires

Test de Hausman

Calcul du test de Hausman quand βEA N’EST PASpleinement efficient

I La forme simplifiée de la stat de Hausman n’est pas valable siαi ou εit ne sont pas iidI p.e. lorsqu’il y a hétéroscédasticitéI Car dans ce cas l’estimateur EA βEA n’est pas pleinement

efficient sous H0

I L’expression

V[βW

]−

V[βEA

]dans la formule de H doit être

remplacée par

I V[βEA − βW

]qui est + générale

I Estimation de la matrice de var-cov de(βEA − βW

)I Ceci N’EST PAS implémenté dans plmI Mais peut être estimé de façon consistante par bootstrap sur

i (pas t)

Page 155: ÉconométriedesDonnéesdePanel Ch1.ModèlesLinéairesNonDynamiquesrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1.pdf · ÉconométriedesDonnéesdePanel Ch1. ModèlesLinéairesNonDynamiques

Économétrie des Données de Panel Ch 1. Modèles Linéaires Non Dynamiques

Effets Fixes vs. Effets Aléatoires

Test de Hausman

Calcul du test de Hausman quand βEA N’EST PASpleinement efficient

I Une version panel-robuste de la stat de Hausman est

HRobuste =(βEA−βW

)´[

Vboot

[βEA − βW

]]−1 (βEA−βW

)

I avec

Vboot

[βEA − βW

]= 1

B−1

B∑b=1

(δb − ¯δ

)(δb − ¯δ

)′

I b est la beme de B replications bootstrap et δ = βEA − βWI Cette stat de test peut

I être appliquée à des sous-vecteurs de βI utiliser d’autres estimateurs tels que βMCO à la place de βEA et

βD1 à la place de βW

Page 156: ÉconométriedesDonnéesdePanel Ch1.ModèlesLinéairesNonDynamiquesrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1.pdf · ÉconométriedesDonnéesdePanel Ch1. ModèlesLinéairesNonDynamiques

Économétrie des Données de Panel Ch 1. Modèles Linéaires Non Dynamiques

Effets Fixes vs. Effets Aléatoires

Test de Hausman

Application du test de Hausman

Rappel. Déforestation amazonienneI Le fichier de données est en ligne sur le site du coursI Données de 1988 à 2015

I États de l’Amazone légale (un état n’a pas 1988)I 9 états du bassin brézilien de l’Amazone

I Modèle CKE

yit = αi + β1PIBhit + β2PIBh2it + γxit + εit

I On ne regarde pas x pour le moment

Page 157: ÉconométriedesDonnéesdePanel Ch1.ModèlesLinéairesNonDynamiquesrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1.pdf · ÉconométriedesDonnéesdePanel Ch1. ModèlesLinéairesNonDynamiques

Économétrie des Données de Panel Ch 1. Modèles Linéaires Non Dynamiques

Effets Fixes vs. Effets Aléatoires

Test de Hausman

Illustration du calcul habituel du test de Hausman dans R

I ama3$PIBSQR <- PIBh2010R^2I Pourquoi ? Comme ca, PIBh^2 est dans ama3

I phtest(defor.w3, defor.re3)I p-valeur légèrement inf. à 5% : on R H0 (within=re)

I Mais pas solidementI phtest(modèle 1, modèle 2)I La version de base, qui utilise la vcov par défaut de chaque

modèleI Donc, certainement fausse si on R H0 car alors re ne peut pas

être efficient

Page 158: ÉconométriedesDonnéesdePanel Ch1.ModèlesLinéairesNonDynamiquesrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1.pdf · ÉconométriedesDonnéesdePanel Ch1. ModèlesLinéairesNonDynamiques

Économétrie des Données de Panel Ch 1. Modèles Linéaires Non Dynamiques

Effets Fixes vs. Effets Aléatoires

Test de Hausman

Illustration du calcul habituel du test de Hausman dans R

I plm fournit une version basée sur une méthode plus modernede calculer HI form <- Defor_km2~PIBh2010R+PIBSQRI phtest(form, data=ama3)

I exactement le même que la version de baseI phtest(form, data=ama3, method = "aux")

I method = "aux" est la méthode + moderneI p-val passe à presque 19%

I phtest(form, data = ama3, method = "aux", vcov = vcovHC)

I idem que la précédente, mais matrice de vcov des coef estrobuste

I on tombe a p-val 8%

Page 159: ÉconométriedesDonnéesdePanel Ch1.ModèlesLinéairesNonDynamiquesrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1.pdf · ÉconométriedesDonnéesdePanel Ch1. ModèlesLinéairesNonDynamiques

Économétrie des Données de Panel Ch 1. Modèles Linéaires Non Dynamiques

Effets Fixes vs. Effets Aléatoires

Test de Hausman

Hausman par bootstrapI Pour autant que je comprenne

I La version précédente ne résoud toujours pas le problème quela diff. des matrices vcov n’est pas la matrice vcov du vec. desdiff.

I On applique le bootstrap qu’on a développé précédemmentI On stocke les résutlats des 1000 estimations within dans cw

I 1000 estimations re dans creI cre2 <- cre[2 :3,] pour enlever l’intercept

I Calcul de la stat de HausmanI Hdiff <- cw-cre2I betadiff <- coef(defor.w)-(coef(defor.re)[2 :3])I H <- crossprod(betadiff,solve(var(t(Hdiff))))%*%betadiff

I Sous H0, est une chisq(q)I pchisq(H,df=2, lower.tail = F)

I ' 0 : prob qu’une chi2 > H (si lower.tail = TRUE, prob que<)

Page 160: ÉconométriedesDonnéesdePanel Ch1.ModèlesLinéairesNonDynamiquesrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1.pdf · ÉconométriedesDonnéesdePanel Ch1. ModèlesLinéairesNonDynamiques

Économétrie des Données de Panel Ch 1. Modèles Linéaires Non Dynamiques

Effets Fixes vs. Effets Aléatoires

Test de Hausman

Hausman : Conclusion

I On rejette facilement re avec un test inadéquat,I mais avec bootstrap

I la vcov de la diff de coefficients est (bien) plus grandeI et donc on ne rejette plus du tout

I Ça fait sensI la différence des β1 est de l’ordre de 6.6

I alors que les β1 sont 100 fois + grandsI la différence des β2 est de l’ordre de -0.34

I idem les β2 sont 100 fois + grandsI Comme les estimations sont peu significatives, il serait

étonnant de conclure à une différence significative

Page 161: ÉconométriedesDonnéesdePanel Ch1.ModèlesLinéairesNonDynamiquesrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1.pdf · ÉconométriedesDonnéesdePanel Ch1. ModèlesLinéairesNonDynamiques

Économétrie des Données de Panel Ch 1. Modèles Linéaires Non Dynamiques

Autres tests

Sommaire

Les données de panel

Modèles à Données de Panel

Estimateurs pour données de panel

Inférence avec données de panel

Effets Fixes vs. Effets Aléatoires

Autres tests

Données de panel non-cylindré

Page 162: ÉconométriedesDonnéesdePanel Ch1.ModèlesLinéairesNonDynamiquesrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1.pdf · ÉconométriedesDonnéesdePanel Ch1. ModèlesLinéairesNonDynamiques

Économétrie des Données de Panel Ch 1. Modèles Linéaires Non Dynamiques

Autres tests

Test de “poolability”

I Est-ce que les i de l’échantillon ont des coefficients égaux ? –sauf interceptsI Peut-on dire que les pentes des différents i sont toutes les

mêmes ?I On estime d’abord un modèle dit à coefficients variables pvcm

I Version “within” : un modèle est estimé (par MC) par iI Version “random” : est le modèle de Swamy

I Essentiellement une moyenne des estimations withinprécédentes

I pondérées par une fonction de leurs variances

Page 163: ÉconométriedesDonnéesdePanel Ch1.ModèlesLinéairesNonDynamiquesrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1.pdf · ÉconométriedesDonnéesdePanel Ch1. ModèlesLinéairesNonDynamiques

Économétrie des Données de Panel Ch 1. Modèles Linéaires Non Dynamiques

Autres tests

pooltest

I permet de tester si les résultats pvcm sont significativementdifférents des résultats plmI 1º argument est un objet plmI 2º argument est un objet pvcm avec model=withinI Si le 1º argument est un model pooling

I Le test s’applique à tous les coefficients y-compris lesintercepts,

I Si c’est un modèle within, il ne s’applique qu’aux pentes,différents intercepts sont assumés

I est essentiellement un test zI On rejette fortement l’égalité des coefficients

I Pourquoi ? diapo suivante

Page 164: ÉconométriedesDonnéesdePanel Ch1.ModèlesLinéairesNonDynamiquesrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1.pdf · ÉconométriedesDonnéesdePanel Ch1. ModèlesLinéairesNonDynamiques

pooltest : pourquoi des coef. différents ?I Voir les graphiques ggplot par Etat

I Déforestation en fonction du temps et du PIBhI Alors que la décroissance est observée partout, le PIBh évolue

différemment dans 3 étatsI Mato Grosso, Rondônia, Amazonas

I Acre, Amapá, Tocantins, Roraima, Pará ont une évolution bienplus limitée du revenuI la baisse de déforestation observée y est peut-être due à autre

chose qu’un CKEI Maranhão est le plus pauvre

I Par contre, voir le scatterplot, la déforestation estprincipalement le fait de 3 états :I Mato Grosso, Rondônia, Pará. Ceci explique l’effet CKE au

globalI Mais, il semble qu’il y ait autre chose en jeuI On peut aussi se demander si le revenu par état est pertinent

dans une fédération sans frontière interneI C’est le revenu national (“fédéral”) qui importe en terme

d’opportunité

Page 165: ÉconométriedesDonnéesdePanel Ch1.ModèlesLinéairesNonDynamiquesrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1.pdf · ÉconométriedesDonnéesdePanel Ch1. ModèlesLinéairesNonDynamiques

Économétrie des Données de Panel Ch 1. Modèles Linéaires Non Dynamiques

Autres tests

Tests d’effets individuels et temporelsI Est-ce que αi = α ∀i ?

I Le pooling est-il supérieur aux effets alétoires / fixes ?I Si αi = α ∀i , alors on préfère MCO aux estimateurs panel pour

l’efficienceI plmtest est un test des multiplicateurs de Lagrange

I À partir d’un objet plm poolingI N’utilise que les résidus du modèle poolingI Modèle qui est donc inconsistent si le bon modèle est within

I 4 variantes, arg typeI bp : Breusch and Pagan (1980), traditionnelI honda : Honda (1985), le défautI kw : King and Wu (1997)I ghm : Gourieroux, Holly, and Monfort (1982)

I Prend l’argument effectI "individual" (défaut), "time" ou les deux ("twoways")

I pFtest compare le modèle pooling et le withinI pour tester si αi = α ∀i .

Page 166: ÉconométriedesDonnéesdePanel Ch1.ModèlesLinéairesNonDynamiquesrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1.pdf · ÉconométriedesDonnéesdePanel Ch1. ModèlesLinéairesNonDynamiques

Économétrie des Données de Panel Ch 1. Modèles Linéaires Non Dynamiques

Autres tests

Tests d’autocorrélation

I Plusieurs tests d’autocorrélation (corrélation sérielle) sontimplémentés dans plmI Voir la vignetteI Les tests de racines unitaires sont importants

I Mais nous embarqueraient dans des développementsthéoriques trop importants

I On ne les verra pas dans ce cadre-ciI Car on s’appuie essentiellement sur une inférence robuste

I Mais deux tests ont un impact pratique importantI Choisir entre D1 et EFI Corrélation entre i

Page 167: ÉconométriedesDonnéesdePanel Ch1.ModèlesLinéairesNonDynamiquesrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1.pdf · ÉconométriedesDonnéesdePanel Ch1. ModèlesLinéairesNonDynamiques

D1 vs. EFI D1 et EF sont consistants dans les 3 modèles panel

yit = αi + x′itβ + εit

I Sauf si corrélation entre εit et un régresseurI Mais toutes les transfo yit = w

itθ + uit sauf pooling (identité)créent de la corrélation sérielle

I Si T = 2, D1 et EF identiquesI Si le terme idiosyncratique εit n’a pas de corrélation sérielle

I alors l’erreur du modèle D1 uit = εit − εi,t−1 a une corrélationsérielle de –0.5

I cor (uit , ui,t−1) = cor ((εit − εi,t−1) , (εi,t−1 − εi,t−2)) = −0.5I puisque les αi sont éliminés

I Dans ce cas, EF est plus efficient que D1I car EF n’élimine pas de données

I Si l’erreur du modèle D1 uit = εit − εi ,t−1 a une corrélationsérielle nulleI Alors εit = εi,t−1 + uit est une marche aléatoire par définition

I Un processus AR(1) avec corrélation parfaiteI Dans ce cas, D1 est plus efficient que EF

I car la transformation D1 ramène la série à un ordre 0

Page 168: ÉconométriedesDonnéesdePanel Ch1.ModèlesLinéairesNonDynamiquesrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1.pdf · ÉconométriedesDonnéesdePanel Ch1. ModèlesLinéairesNonDynamiques

Économétrie des Données de Panel Ch 1. Modèles Linéaires Non Dynamiques

Autres tests

D1 vs. EF : commande pwfdtest

I Appliquer sur un objet “fd”I Résultat d’une estimation D1

I Teste par défaut si les résidus D1 (h0=“fd”) n’ont pas decorrélation sérielleI Si on ne rejette pas, D1 est recommandé

I L’option h0= “fe” teste pour la corrélation sérielle dans lesrésidus non transformésI Si on ne rejette pas, EF est recommandé

I Si on rejette les deux, l’estimateur choisi aura de la corrélationsérielle

I Conclusion pour la déforestationI Indication de corrélation sérielle dans les εitI mais pas dans les résidus D1I Donc D1 recommandé

Page 169: ÉconométriedesDonnéesdePanel Ch1.ModèlesLinéairesNonDynamiquesrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1.pdf · ÉconométriedesDonnéesdePanel Ch1. ModèlesLinéairesNonDynamiques

Économétrie des Données de Panel Ch 1. Modèles Linéaires Non Dynamiques

Autres tests

Tests de dépendance entre coupes transversalesI Abrégée en XSD pour “cross-sectional dependence”I Peut arriver

I Si les i répondent à des chocs communsI S’il y a des phénomènes de diffusion spatiale

I Les i sont alors reliés en fonction de la distance qui lesséparent

I S’il y a XSDI Aucun des estimateurs présentés n’est efficientI Au pire, si XSD est due à un régresseur manquant, les

estimateurs sont inconsistantsI Actuellement, plm ne comprend que des tests de spécification

I Détecter une corrélation résiduelle entre iI La seule solution est de trouver le(s) régresseur(s)

manquant(s)I Pour l’inférence comme pour la consistance

Page 170: ÉconométriedesDonnéesdePanel Ch1.ModèlesLinéairesNonDynamiquesrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1.pdf · ÉconométriedesDonnéesdePanel Ch1. ModèlesLinéairesNonDynamiques

Commande pcdtestI Essentiellement, on regarde les corrélations résiduelles entre

chaque paire de iI Les résidus sont par défaut calculés sur des régressions sur

chaque iI Mais si la série est trop courte, le test utilise les résidus within

I Il faut que cette régression soit consistante pour que le testaie du sens

I La version Breusch-Pagan test= “lm” s’applique à des panelslongsI T →∞ et n fixeI la version test= “pclm” est semblable, avec une correction

I La version Pesaran test= “cd” s’applique à toutes taillesd’échantillon suffisamment grandI Mais est peu puissante lorsque la corrélation est due à des

chocs qui ont un effet négatif sur certains i et positif surd’autres

I Est le défaut

I Il est possible de fournir une matrice de proximité au test

Page 171: ÉconométriedesDonnéesdePanel Ch1.ModèlesLinéairesNonDynamiquesrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1.pdf · ÉconométriedesDonnéesdePanel Ch1. ModèlesLinéairesNonDynamiques

Économétrie des Données de Panel Ch 1. Modèles Linéaires Non Dynamiques

Autres tests

Protocole pratique1. Estimateurs pour EF

1.1 Within1.2 Différences premières

I S’il y a des différences notables entre ces deux estimateurs, ily a probablement des racines unitaires

I Section sur dynamique, différences premières est plusprobablement correct

2. Estimateur EAI HausmanI En principe, ça s’arrête là et on interprêteI En économie, si on préfère un modèle sans EF, il faut le

justifier en passant un test de Hausman3. (optionel) Estimateurs pour MRL

I Si Hausman & la théorie rejette EFI Si on a de bonnes raisons de soupçonner qu’il pourrait ne pas

y avoir d’EAI Alors, test d’effets individuels / poolability

Page 172: ÉconométriedesDonnéesdePanel Ch1.ModèlesLinéairesNonDynamiquesrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1.pdf · ÉconométriedesDonnéesdePanel Ch1. ModèlesLinéairesNonDynamiques

Économétrie des Données de Panel Ch 1. Modèles Linéaires Non Dynamiques

Autres tests

Protocole pratique

I Souvent les étudiants procèdent à partir du plus simple :1. Estimer MCO2. Estimer EA3. Tester (effets individuels ou autre) EA contre MCO4. Si ¬R EA, alors estimer EF5. Test de Hausman EF contre EA

I Problème avec cette approcheI Si le modèle correct est EF, alors les estimateurs MCO et EA

sont inconsistantsI Les tests à l’étape 3 ne peuvent être utilisés

Page 173: ÉconométriedesDonnéesdePanel Ch1.ModèlesLinéairesNonDynamiquesrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1.pdf · ÉconométriedesDonnéesdePanel Ch1. ModèlesLinéairesNonDynamiques

Économétrie des Données de Panel Ch 1. Modèles Linéaires Non Dynamiques

Données de panel non-cylindré

Sommaire

Les données de panel

Modèles à Données de Panel

Estimateurs pour données de panel

Inférence avec données de panel

Effets Fixes vs. Effets Aléatoires

Autres tests

Données de panel non-cylindré

Page 174: ÉconométriedesDonnéesdePanel Ch1.ModèlesLinéairesNonDynamiquesrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1.pdf · ÉconométriedesDonnéesdePanel Ch1. ModèlesLinéairesNonDynamiques

Économétrie des Données de Panel Ch 1. Modèles Linéaires Non Dynamiques

Données de panel non-cylindré

Attrition

I Panel cylindré (balanced)I Les données existent pour chaque i chaque t

I Lorsque les données de certains i n’existent pas pour certains tI On dit qu’il y a attrition

I p.e. avec des individus qui abandonnent le panelI Généralement définitivement

I Le panel est alors non-cylindréI (unbalanced)I ou incomplet

I Panel rotatifI un sous-échantillon d’individus est remplacé chaque année

Page 175: ÉconométriedesDonnéesdePanel Ch1.ModèlesLinéairesNonDynamiquesrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1.pdf · ÉconométriedesDonnéesdePanel Ch1. ModèlesLinéairesNonDynamiques

Économétrie des Données de Panel Ch 1. Modèles Linéaires Non Dynamiques

Données de panel non-cylindré

Consistance

I yit = αi + x′itβ + εit

I Soit dit = 1 si i observé au temps t, = 0 sinonI alors T devient Ti

I Within est consistant si l’hyp d’exogénéité forte devient

E [εit |αi , xi1, . . . , xiTi, di1, . . . , diTi

] = 0

I C’est-à-dire : présence ou absence (dit) dans l’échantillon nepeut être corrélée aux erreurs εit

Page 176: ÉconométriedesDonnéesdePanel Ch1.ModèlesLinéairesNonDynamiquesrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1.pdf · ÉconométriedesDonnéesdePanel Ch1. ModèlesLinéairesNonDynamiques

Économétrie des Données de Panel Ch 1. Modèles Linéaires Non Dynamiques

Données de panel non-cylindré

Consistance

I Lorsque ça n’est pas le cas, on aI un exemple classique de sélection de l’échantillon

I Les estimateurs vus sont généralement inconsistantsI On parle de biais d’attrition

I Des caractéristiques inobservées gouvernent l’attritionI p.e. dans une enquête sur le salaire, il est plus probable que les

personnes à bas salaires quittent l’échantillonI Dans des applications macro, les pays les plus pauvres ne

disposent pas d’un système stat et auront plus de donnésmanquantes

I EA est consistant si de plusI l’effet individuel αi est indépendant des régresseurs xit

Page 177: ÉconométriedesDonnéesdePanel Ch1.ModèlesLinéairesNonDynamiquesrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1.pdf · ÉconométriedesDonnéesdePanel Ch1. ModèlesLinéairesNonDynamiques

Économétrie des Données de Panel Ch 1. Modèles Linéaires Non Dynamiques

Données de panel non-cylindré

Cylindrage (Balancing)

I Opération consistant à convertir un panel non-cylindré encylindréI En excluant de l’échantillon tous les individus dont les données

ne sont pas disponibles tous les ansI Ou en rejetant les années pour lesquelles tous les individus ne

sont pas observésI En général, cela réduit beaucoup l’efficience

I D’un autre côté, dans la pratique,I Il arrive que seules certaines variables ne sont pas observées

tous les ansI p.e. les questions sur le revenu

I Plutôt que de cylindrer le panel à cause de ça, des méthodesd’imputation de données sont souvent préférables

I Package mice (on verra en M2 CEE)

Page 178: ÉconométriedesDonnéesdePanel Ch1.ModèlesLinéairesNonDynamiquesrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1.pdf · ÉconométriedesDonnéesdePanel Ch1. ModèlesLinéairesNonDynamiques

Économétrie des Données de Panel Ch 1. Modèles Linéaires Non Dynamiques

Données de panel non-cylindré

Conclusions

I Un panel permet deI traiter l’hétérogénéité inobservée constante dans le temps

I et donc établir la causation plus facilementI Il existe plusieurs modèles linéaires non-dynamiques en panel

I selon les hyp. sur les αiI Et plusieurs estimateurs

I Tous basés sur MCI On souligne EF, EA et D1

Page 179: ÉconométriedesDonnéesdePanel Ch1.ModèlesLinéairesNonDynamiquesrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1.pdf · ÉconométriedesDonnéesdePanel Ch1. ModèlesLinéairesNonDynamiques

Économétrie des Données de Panel Ch 1. Modèles Linéaires Non Dynamiques

Données de panel non-cylindré

ConclusionsI Hétéroscédasticité & autocorrélation sont normalement

présentes ensembleI Souvent on ne va pas traiterI Mais utiliser une version robuste du calcul des et

I White ou bootstrapI Les estimateurs EF et D1 sont toujours consistants dans ce

contexteI Mais ne peuvent prédire ou estimer les coef. des régresseurs

constants dans le tempsI Ce que peut EA

I qui de + est + efficientI Mais repose sur une absence de corrélation en αi et xi

I Le choix entre EF et EA peut être justifié par un test deHausmanI Dont le calcul a fréquemment recours à bootstrap

Page 180: ÉconométriedesDonnéesdePanel Ch1.ModèlesLinéairesNonDynamiquesrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1.pdf · ÉconométriedesDonnéesdePanel Ch1. ModèlesLinéairesNonDynamiques

Économétrie des Données de Panel Ch 1. Modèles Linéaires Non Dynamiques

Données de panel non-cylindré

Annexe 1. Sur la consistance de MCO dans les modèles àdonnées de Panel

Page 181: ÉconométriedesDonnéesdePanel Ch1.ModèlesLinéairesNonDynamiquesrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1.pdf · ÉconométriedesDonnéesdePanel Ch1. ModèlesLinéairesNonDynamiques

Économétrie des Données de Panel Ch 1. Modèles Linéaires Non Dynamiques

Données de panel non-cylindré

Compacter la notation

I Empiler les observations sur le temps pour un i donné :I ~yi = ~W

i θ +~ui oùI ~yi : T × 1

I pour le modèle en diff. 1ères, (T − 1)× 1

I ~Wi : T × q

I Estimateur MCO θMCO =

[N∑i=1

~W′i~Wi

]−1∑i

~W′i~yi

Page 182: ÉconométriedesDonnéesdePanel Ch1.ModèlesLinéairesNonDynamiquesrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1.pdf · ÉconométriedesDonnéesdePanel Ch1. ModèlesLinéairesNonDynamiques

Consistance de MCO dans un modèle ~I Si le modèle est correctement spécifié :

θMCO = θ +

[N∑i=1

~W′i~Wi

]−1∑i

~W′i~ui

I Comme l’indépendance entre i n’est pas remise en cause,I la condition essentielle pour la consistance de MCO est

E[~W

i~ui]

= 0I c’est-à-dire pas de corrélation des erreurs avec les régresseurs

“à l’intérieur (within)” de chanque individu

I E[~W′

i~ui]

= 0 est + forte que is E [uit |wit ] = 0 (exogénéitécontemporaine)I parce que la transformation ~ implique plus d’une période p.e.

wit = xit−xi

I Exogénéité forte (4) E [uit |wi1, ..., wiT ] = 0 est suffisanteI Ch. 2 : hyp. + faibles – donc matrice de var-cov + compliquée

Page 183: ÉconométriedesDonnéesdePanel Ch1.ModèlesLinéairesNonDynamiquesrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1.pdf · ÉconométriedesDonnéesdePanel Ch1. ModèlesLinéairesNonDynamiques

Économétrie des Données de Panel Ch 1. Modèles Linéaires Non Dynamiques

Données de panel non-cylindré

Annex 2. Abréviations courantesI D1 estimateur différences premièresI ddl degré de liberté (dof)I dich. DichotomiqueI v.a. Variable aléatoire (random variable)I EF Effets fixes (fixed effects)I EA Effets aléatoire (random effects)I ES état stationnaireI et Écart-type (se standard errors)I iid Indépendamment et identiquement distribuéI MC Moindres carrés

I MCO Moindres Carrés OrdinairesI MCG Moindres Carrés Généralisés

I MRL Modèle de Régression LinéaireI p.e. par exemple