Guide d’´econom´etrie appliqu´ee pour...

51
Guide d’´ econom´ etrie appliqu´ ee pour Stata Simon Leblond 1 Universit´ e de Montr´ eal [email protected] 26 d´ ecembre 2003 1 Merci ` a William McCausland, Fran¸ cois Vaillancourt et Benoit Perron pour leurs commentaires utiles dans l’´ elaboration de ce document. Je demeure seul responsable de toutes les erreurs.

Transcript of Guide d’´econom´etrie appliqu´ee pour...

Page 1: Guide d’´econom´etrie appliqu´ee pour Statamapageweb.umontreal.ca/goncals/Ecn2160/GuideEconometrieStata.pdf · Guide d’´econom´etrie appliqu´ee pour Stata Simon Leblond1

Guide d’econometrie appliquee pour Stata

Simon Leblond1

Universite de [email protected]

26 decembre 2003

1Merci a William McCausland, Francois Vaillancourt et Benoit Perron pour leurs commentairesutiles dans l’elaboration de ce document. Je demeure seul responsable de toutes les erreurs.

Page 2: Guide d’´econom´etrie appliqu´ee pour Statamapageweb.umontreal.ca/goncals/Ecn2160/GuideEconometrieStata.pdf · Guide d’´econom´etrie appliqu´ee pour Stata Simon Leblond1

Table des Matieres

1 Introduction a Stata 6

2 Commandes generales importantes 72.1 Importation des donnees . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72.2 Manipulation des donnees . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8

2.2.1 Operateurs mathematiques . . . . . . . . . . . . . . . . . . . . . . . . 82.2.2 Operateurs logiques et de comparaison . . . . . . . . . . . . . . . . . 92.2.3 Manipulations des matrices . . . . . . . . . . . . . . . . . . . . . . . 9

2.3 Autres transformations des variables . . . . . . . . . . . . . . . . . . . . . . 112.4 Divers . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 112.5 Exemples et resultats pour le Chapitre 2 . . . . . . . . . . . . . . . . . . . . 12

3 Visualisation des donnees 133.1 Impression/Exportation des donnees . . . . . . . . . . . . . . . . . . . . . . 13

3.1.1 Impression a l’ecran . . . . . . . . . . . . . . . . . . . . . . . . . . . . 133.1.2 Exportation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 133.1.3 Impression . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13

3.2 Exemples et resultats pour le Chapitre 3 . . . . . . . . . . . . . . . . . . . . 14

4 Graphiques 154.1 Exemples et resultats pour le Chapitre 4 . . . . . . . . . . . . . . . . . . . . 16

5 Regressions Simples 175.1 Tests d’heteroscedasticite . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 185.2 Test de Changement structurel (Test de Chow) . . . . . . . . . . . . . . . . 19

6 Variables instrumentales et Doubles Moindres Carres 216.1 Estimateur Variables Instrumentales . . . . . . . . . . . . . . . . . . . . . . 216.2 DMCO . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 226.3 Tests d’endogeneite . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23

7 Estimateur du Maximum de Vraissemblance (EMV) 24

1

Page 3: Guide d’´econom´etrie appliqu´ee pour Statamapageweb.umontreal.ca/goncals/Ecn2160/GuideEconometrieStata.pdf · Guide d’´econom´etrie appliqu´ee pour Stata Simon Leblond1

8 Moindres Carres Generalises 26

9 Variables dependantes qualitatives 279.1 Probit/Logit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 279.2 Probit/Logit ordonne . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 289.3 Tobit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 289.4 Biais de selection: Heckit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28

10 Modeles de duree 29

11 Series Chronologiques 3011.1 Operation sur les variables dans le cadre de series chronologiques . . . . . . . 3011.2 Operateurs de series temporelles . . . . . . . . . . . . . . . . . . . . . . . . . 3011.3 Tests d’autocorrelation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3111.4 Methode de Box-Jenkins . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32

11.4.1 Stationnarite des donnees . . . . . . . . . . . . . . . . . . . . . . . . 3211.4.2 Modelisation des cycles: Modeles AR, MA, ARMA, ARIMA . . . . . 3311.4.3 Selection de Modele . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34

12 Donnees longitudinales (Panel) 3612.1 Effets Fixes et Effets Aleatoires . . . . . . . . . . . . . . . . . . . . . . . . . 36

12.1.1 Variables binaires . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3612.1.2 Fonctions pour donnees longitudinales . . . . . . . . . . . . . . . . . 37

13 Interaction avec les tableurs et les traitements de texte 3913.1 Remarques . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3913.2 Tableur . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3913.3 Traitement de texte . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40

14 Ou trouver ses donnees et comment les extraires 4114.1 Liens utiles . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41

14.1.1 A l’Universite . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4114.1.2 A l’Exterieur . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41

14.2 Acces au Donnees . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4214.2.1 Statcan . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4214.2.2 OCDE . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4314.2.3 Sherlock . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43

A Tableaux Recapitulatifs 45A.1 Fonctions de Stata . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46A.2 Operateurs . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49A.3 Symboles Mathematiques . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49

2

Page 4: Guide d’´econom´etrie appliqu´ee pour Statamapageweb.umontreal.ca/goncals/Ecn2160/GuideEconometrieStata.pdf · Guide d’´econom´etrie appliqu´ee pour Stata Simon Leblond1

A.4 Alphabet Grec . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50

3

Page 5: Guide d’´econom´etrie appliqu´ee pour Statamapageweb.umontreal.ca/goncals/Ecn2160/GuideEconometrieStata.pdf · Guide d’´econom´etrie appliqu´ee pour Stata Simon Leblond1

Introduction

Ce manuel ne vient pas se substituer a vos notes de cours, mais plutot les completer en vousdonnant un guide pour l’utilisation de Stata. A ce titre, bien que vous trouverez quelques foisdes explications plus importantes sur la nature d’un probleme econometrique, la majoritedu temps on supposera que vous possedez deja les connaissances liees a la section consultee.

Chaque section presente rapidement le but de l’operation qui y est traite. Les commandesappropriees sont ensuite presentees, d’abord individuellement, puis dans le cadre d’exemplesconcrets. Il existe deux versions de ce guide, celle-ci pour Stata et une autre pour Matlab.Notez que ce manuel couvre la version 7 de Stata, la version 8 sera integree peu a peu pendantl’annee qui vient. Comme il s’agit d’un manuel encore en developpement, des changementslui seront constamment apportes en cours de session et la version distribuee sera toujours laplus recente. Tout commentaire, suggestion ou correction sera bienvenu et apprecie.

Prenez note que ce texte decrit seulement certaines fonctions ainsi que leurs optionsles plus souvent utilisees pour le genre de recherches effectuees au bac et a la maıtrise eneconomie, il n’est donc pas du tout exhaustif. Un conseil: apprenez a utiliser l’aide de Stata.Il s’agit la d’un outil fort utile pour decouvrir de nouvelles fonctions ou pour connaıtrel’ensemble des options disponibles pour les fonctions decrites dans ce guide.

Les fonctions sont presentees dans le format suivant:

1. Le nom de la fonction et, entre parantheses, le nom abrgege de la fonction;

2. Sa description;

3. Le format d’entree;

4. Ses options (s’il y en a);

5. Un exemple court.

La majorite des chapitres se terminent par une section donnant un exemple plus long et plusconcret d’applications des informations presentes dans le chapitre.

La nomenclature suivante est suivie dans ce guide:

• Le texte en machine a ecrire designe les fonctions dans leur forme generique.

4

Page 6: Guide d’´econom´etrie appliqu´ee pour Statamapageweb.umontreal.ca/goncals/Ecn2160/GuideEconometrieStata.pdf · Guide d’´econom´etrie appliqu´ee pour Stata Simon Leblond1

• Le texte en italique designe les variables et autres chaınes de caracteres qui doiventetre remplacees.

• Le texte en sans serif designe le texte tel qu’il serait entre a l’ordinateur.

Les chapitres 1 a 4 font le tour des commandes de base, ainsi que leur format de saisie. Ala suite de ces chapitres vous devriez etre en mesure d’importer, de manipuler, puis d’exportervos donnees et de tracer des graphiques.

Les chapitres 5 a 12 abordent quant a eux chacun un sujet specifique de l’econometrie. Ilsprennent donc une approche quelque peu differente puisqu’ils introduisent peu de nouvellesfonctions, se concentrant plutot sur la demarche a adopter pour effectuer l’operation enquestion.

Finalement, les deux derniers chapitres (13 et 14) sortent quelque peu du cadre de ceguide en abordant respectivement la manipulation des donnees par Word et Excel et larecherche de donnees. Ces chapitres ont pour but de vous aider dans le cadre plus generalde la production d’un travail de recherche.

5

Page 7: Guide d’´econom´etrie appliqu´ee pour Statamapageweb.umontreal.ca/goncals/Ecn2160/GuideEconometrieStata.pdf · Guide d’´econom´etrie appliqu´ee pour Stata Simon Leblond1

Chapitre 1

Introduction a Stata

Ce guide s’appuie sur la construction d’un do-file (.do), plutot que sur l’entree directe decommandes. Les avantages du do-file sont nombreux. Entre autres, il vous d’entrer lescommandes a nouveau si le travail s’etend sur plusieurs seances, il permet de garder une tracedu travail effectuer et il permet de garder une vue d’ensemble des etapes du programme.Pour creer un do-file, il faut entrer dans le do-file editor. Vous pouvez egalement construireun fichier texte (.txt) avec un traitement de texte quelconque auquel vous donnerez uneextension ‘.do’. Notez que vous n’etes pas du tout obliges d’avoir recours a un do-file, vouspouvez entrez directement dans la boıte de commande toutes les fonctions mentionnees dansce guide.

La version 8 de Stata permet d’utiliser les fonctions en les selectionnant directement desmenus. Ce guide n’abordera pas du tout cette approche et ce concentrera sur l’utilisation“manuelle” (entree directe) des fonctions.

6

Page 8: Guide d’´econom´etrie appliqu´ee pour Statamapageweb.umontreal.ca/goncals/Ecn2160/GuideEconometrieStata.pdf · Guide d’´econom´etrie appliqu´ee pour Stata Simon Leblond1

Chapitre 2

Commandes generales importantes

2.1 Importation des donnees

Note importante sur l’importation de donnees:

Lorsque vous faites le transfert des donnees, vous devez vous assurer que le format de celles-ciest compatible avec Stata. Outre les separateurs de donnees qui doivent correspondre a lacommande choisie, il faut aussi s’assurer que le separateur de decimales soit un point (.) etque les milliers ne soient pas separes par un espace. Consultez la section 13 pour plus dedetails a ce sujet.

insheet

Rapide et efficace, insheet permet d’importer les donnees d’un fichier texte possedant uneobservation par ligne et dont les donnees sont separees par des tabulations ou des vir-gules.si le nom des donnees sont sur la premiere ligne:

insheet using nomdefichier1

si le fichier ne contient pas le nom des donnees:

insheet [nom des variables]2 using nom de fichier

options3: clear, specifie que les donnees en memoires peuvent etre remplacees par les nou-velles donnees importees.

1A moins de precisions contraires, nomdefichier indique le nom complet, donc avec le chemin d’acces etl’extension (a : \test.txt par exemple).

2La nomenclature de l’aide de Stata est conservee tout au long de ce guide, ainsi les arguments entre “[]” designent des arguments facultatifs.

3Les options dans stata sont separes du reste de la commande par une virgule. Par exemple, dans le caspresent: insheet using ”c:\ test.txt”, clear

7

Page 9: Guide d’´econom´etrie appliqu´ee pour Statamapageweb.umontreal.ca/goncals/Ecn2160/GuideEconometrieStata.pdf · Guide d’´econom´etrie appliqu´ee pour Stata Simon Leblond1

infile (inf)4

Permet plus de flexibilite que insheet en permettant que les observations soient sur plusieurslignes ou que les donnees soient separees par des espaces.une observation par ligne: infile nom des variables using nom de fichierobservations sur plusieurs lignes:infile nom des variables [ skip(#) nom des variables] using ‘‘nom de fichier’’;ou # designe le nombre de ligne a sauter pour continuer la lecture de l’observation.options: clear, voir insheet

ex: observation sur la premiere, la deuxieme et la quatrieme ligne. . .infile var1 var2 skip var3 var4 skip(1) var5 var6 using “a:\ test.raw”

2.2 Manipulation des donnees

Stata

generate (g)Probablement la commande la plus utile (et utilisee) dans Stata, elle permet de creer desnouvelles variables.generate nouvelle variable = expression

ex: g x2 = x^2

replace

Meme idee que generate, mais pour une variable existante.replace variable existante = expression

ex: replace x2 = x/2

2.2.1 Operateurs mathematiques

Addition: +

Soustraction: -

Multiplication: *

Division: /

Puissance: ^

4Le nom entre parantheses qui suit le nom de la fonction designe l’abreviation que l’on peut utiliser dansle code.

8

Page 10: Guide d’´econom´etrie appliqu´ee pour Statamapageweb.umontreal.ca/goncals/Ecn2160/GuideEconometrieStata.pdf · Guide d’´econom´etrie appliqu´ee pour Stata Simon Leblond1

2.2.2 Operateurs logiques et de comparaison

ET: &

OU: |Non (¬): ~

Egal: ==

Different: ~=

Plus grand: >

Plus petit: <

Plus grand ou egal: >=

Plus petit ou egal: <=

2.2.3 Manipulations des matrices

matrix (mat)L’equivalent de generate pour les matrices, permet de creer des nouvelles matrices ou demodifier des matrices existantes.matrix nom de la matrice = expression

ex:Creation d’une matrice: mat A = B*CModification d’une matrice existante: mat A = A*2Construction d’une matrice: mat D = (1,0,0\0,1,0); ou les virgules separent lescolonnes et les \ separent les rangees (matrice 2× 3).Extraction d’une sous-matrice: mat A = B(1..4,2...); se lit rangees 1 a 4, colonne2 a N.Remplacement d’un element: mat A(1,1) = 3; remplace l’element a11 par 3.

mkmat

Permet de transformer des variables existantes en vecteurs du meme nom ou en une nouvellematrice.Transformation en vecteurs: mkmat nom(s) de variable(s)Transformation en matrice: mkmat nom(s) de variable(s), matrix [(nom de la nouvelle matrice)]

ex: mkmat x1 x2 x3 x4, mat(X)

svmat

Inverse de mkmat, transforme les colonnes d’une matrice en vecteurs.svmat matrice, [names(nom col1, nom col2, . . . )]; names peut aussi s’ecrire n

9

Page 11: Guide d’´econom´etrie appliqu´ee pour Statamapageweb.umontreal.ca/goncals/Ecn2160/GuideEconometrieStata.pdf · Guide d’´econom´etrie appliqu´ee pour Stata Simon Leblond1

ex: svmat X, n(x1,x2,x3,x4)

matrix get

Sert a obtenir une copie d’une matrice systeme5

Quelques matrices systemes:

• b: coefficients apres une estimation

• VCE: matrice de variance-covariance apres une estimation

matrix variable = get(matrice systeme)

ex: matrix beta = get( b)

Fonctions matricielles

det(A): determinant de Arowsof(A): nombre de rangees de Acolsof(A): nombre de colonnes de Ael(A,i,j): element aij de AI(n): matrice identite n× ninv(A): inverse de la matrice carree Adiag(V ): matrice diagonale n × n, avec pour diagonale les elements de V , ou V est unvecteur n× 1 ou 1× nvecdiag(A): extrait la diagonale d’une matrice carree A sous forme de vecteur

Operateurs matriciel

Soit A et B, deux matrices carrees definies positives n×n et C, une matrice definie positivet× n:Transposee: A′ (n× n)Somme: A + B (n× n)Difference: A - B (n× n)Produit vectoriel: B*C ′ (n× n)Division par un scalaire: A/k (n× n)Empiler les rangees horizontalement: A ((n+ t)× n)Empiler les colonnes verticalement: A,B (n× 2n)

5Les variables et les matrices systemes sont stockes par Stata dans des noms predefinis apres une operationdonnee.

10

Page 12: Guide d’´econom´etrie appliqu´ee pour Statamapageweb.umontreal.ca/goncals/Ecn2160/GuideEconometrieStata.pdf · Guide d’´econom´etrie appliqu´ee pour Stata Simon Leblond1

2.3 Autres transformations des variables

log(x): logarithme naturel de x, equivalent a ln(x)exp(x): exponentiel de x, i.e. ex

mod(x,y): partie entiere de x par rapport a y, par exemple: mod(5,26) = 5abs(x): valeur absolue de xsqrt(x): racine carree de x, equivalent a x^1/2

max(x1, ..., xn): renvoie l’argument possedant la valeur la plus eleveemin(x1, ..., xn): renvoie l’argument possedant la valeur la moins eleveesum(x): somme de tous les elements de xuniform(): donne une valeur aleatoire entre 0 et 1 (ditribution uniforme sur [0,1))

2.4 Divers

CommentairesIl est possible d’inserer des commentaires dans son programme en prenant soin de debuterla ligne de commentaire par le symbole ‘*’.

ex: * Ceci est un commentaire.

more

Avez-vous deja rencontre le message --more-- qui fait une pause dans l’affichage de vosdonnees? Si ca vous enerve, vous pouvez enlever ce message en specifiant set more off audebut de votre programme.

set matsize (set mat)La taille maximale des matrices est fixee par defaut a 40× 40 dans Stata. Pour utiliser desmatrices plus grandes vous devez utiliser la fonction set matsize.set matsize #; ou # est un nombre entre 10 et 800 qui indique la taille maximale desmatrices.

if

La majorite des fonctions peuvent etre suivies de la commande if qui permet de specifierune condition pour que l’expression soit executee. if est place apres la fonction, mais avantles optionsCette option ne sera pas mentionnee pour chaque fonction puisqu’elle est presente tres sou-vent.commande if expression

ex: replace x = y if x < y

11

Page 13: Guide d’´econom´etrie appliqu´ee pour Statamapageweb.umontreal.ca/goncals/Ecn2160/GuideEconometrieStata.pdf · Guide d’´econom´etrie appliqu´ee pour Stata Simon Leblond1

in

La majorite des fonctions peuvent etre suivies de la commande in qui permet de specifierl’etendue des donnees affectees par la fonction. in est place apres la fonction, mais avant lesoptions.Cette option ne sera pas mentionnee pour chaque fonction puisqu’elle est presente tres sou-vent.commande in etendue; ou etendue peut prendre la forme # ou #/#, et # peut-etre unnombre positif, l (derniere observation), f (premiere observation) ou un nombre negatif (dis-tance par rapport a la derniere observation).

ex:regress y x1 x2 in f/60; equivalent a regress y x1 x2 in 1/60: les 60 premieresobservations.list y in -10/l: les 10 dernieres observations.

2.5 Exemples et resultats pour le Chapitre 2

Lecture des donnees a partir du fichier Donnees.dat et manipulation des variables dans lebut de faire une regression. Le fichier Donnees.dat contient 5 variables, comptant chacune100 observations.

set more offinfile px qt var3 var4 var5 ”c:\mes documents\Donnees.dat”, clear* Construction d’une variable binaire: le rapport de la 3e sur la 4e variable doit* etre inclu dans l’ensemble [0,25;0,5] et la 5e variable doit etre egale* a 1 pour que la variable binaire egale 1.g bin = (0.25 = var3/var4 = 0.5 var5==1)* Creation d’une variable indice.g no = n

12

Page 14: Guide d’´econom´etrie appliqu´ee pour Statamapageweb.umontreal.ca/goncals/Ecn2160/GuideEconometrieStata.pdf · Guide d’´econom´etrie appliqu´ee pour Stata Simon Leblond1

Chapitre 3

Visualisation des donnees

3.1 Impression/Exportation des donnees

3.1.1 Impression a l’ecran

list

Affiche a l’ecran la valeur des variables specifees.list [nom(s) de variable(s)]; si aucun nom de variable est specifie, Stata affiche toutes lesvariables.

ex:list y in -10/l: affiche les 10 dernieres observations de y.

3.1.2 Exportation

log using

Permet de sauvegarder une copie de sa session dans le fichier specifie. Doit etre suivi de log

off a la fin du programme.log using nom de fichierprogrammelog off

Options: replace, indique a Stata de remplacer le fichier existant.

3.1.3 Impression

La facon la plus pratique d’imprimer ses resultats est d’utiliser la fonction log, puis de traiterle fichier “.log” avec son traitement de texte prefere.

13

Page 15: Guide d’´econom´etrie appliqu´ee pour Statamapageweb.umontreal.ca/goncals/Ecn2160/GuideEconometrieStata.pdf · Guide d’´econom´etrie appliqu´ee pour Stata Simon Leblond1

3.2 Exemples et resultats pour le Chapitre 3

Reprenons l’exemple du chapitre 1, en incluant cette fois les fonctions du chapitre 2.

log using ”c:\mes documents\ExChap2.log”, replaceset more offinfile px qt var3 var4 var5 ”c:documents.dat”, clear* Construction d’une variable binaire: le rapport de la 3e sur la 4e variable doit* etre inclu dans l’ensemble [0,25;0,5] et la 5e variable doit etre egale* a 1 pour que la variable binaire egale 1.g bin = (0.25 = var3/var4 = 0.5 & var5 ==1)list px qt bin* Creation d’une variable indice.g no = nlog close

14

Page 16: Guide d’´econom´etrie appliqu´ee pour Statamapageweb.umontreal.ca/goncals/Ecn2160/GuideEconometrieStata.pdf · Guide d’´econom´etrie appliqu´ee pour Stata Simon Leblond1

Chapitre 4

Graphiques

graph (gr)Trace des graphiques.graph nom des variables, [type de graphique, autres options]Ou type de graphique peut prendre les valeurs suivantes:

• histogram (h): histogramme

• twoway (t): nuage de points a deux axes; valeur par defaut si plusieurs variables sontaffiches. La premiere variable specifiee est toujours la variable dependante.

• bar (b): graphique a barres

• pie (p): graphique en pointe de tartes

Voici certaines des options supplementaires les plus utiles:

• xlog, ylog: specifie que l’axe des x ou des y respectivement doit etre en echellelogarithmique.

• xline, yline: specifie qu’une grille en x ou en y respectivement devrait etre affichee.

• connect(option) (c(option)): specifie si les points devraient etre connectes/. optionpeut prendre les valeurs suivantes:

– .: non-connectes; valeur par defaut

– l: lignes droites entre les points

– s: traces des lignes courbes entre les points

• symbol(option) (s(options)): specifie le symbole que doivent prendre les points.option peut prendre les valeurs suivantes:

– O: grand cercles; valeur par defaut

15

Page 17: Guide d’´econom´etrie appliqu´ee pour Statamapageweb.umontreal.ca/goncals/Ecn2160/GuideEconometrieStata.pdf · Guide d’´econom´etrie appliqu´ee pour Stata Simon Leblond1

– o: petits cercles

– .: points

– i: invisibles

• saving(nomdefichier), [replace]: sauvegarde le graphique dans le fichier specifie,si aucune extension n’est specifiee, Stata ajoute par defaut “.gph”.replace indique que le fichier existant peut etre remplace.

4.1 Exemples et resultats pour le Chapitre 4

log using ”e:\ExChap3.log”, replaceset more off* Fixer le nombre d’observations a 100.set obs 100* creation d’un indice de temps commencant a 4.g t = n+3* creation du log de cet indice.g lnt = log(t)graph lnt t, saving(”e:1”, replace)graph lnt t, yline saving(”e:2”, replace)graph lnt t, yline c(s) saving(”e:3”, replace)graph lnt t, yline s(.) saving(”e:4”, replace)graph lcrd t, xlog yline c(s) s(i) saving(”e:5”, replace)log off

16

Page 18: Guide d’´econom´etrie appliqu´ee pour Statamapageweb.umontreal.ca/goncals/Ecn2160/GuideEconometrieStata.pdf · Guide d’´econom´etrie appliqu´ee pour Stata Simon Leblond1

Chapitre 5

Regressions Simples

Dans ce chapitre nous considererons le modele suivant:

y = β0 + β1x1 + β2x2 + · · ·+ βkxk + u

y = Xβ + u

regress (reg)Incontournable si on desire faire des regressions par MCO. Effectue la regression de la variabledependante sur la ou les variables independantes specifiees.regress variable dependante [variables independantes]Options:

• level(#) (l(#)): permet de specifier le niveau de confiance pour les intervalles et lep-value (# doit etre un entier); si level() n’est pas specifie, # prend la valeur 95, i.e.le niveau de confiance est fixe a 95%.

• robust (r): calcule des variances robustes par la methode de Eicker-White.

ex: reg y x1 x2 x3 if x1==1, r

predict

Permet de calculer les valeurs predites, les residus, etc. pour toutes les observations.predict nom de nouvelle variable; sans aucune option calcule les valeurs predites (y).Options:

• xb: calcule X ′β, la valeur lineaire predite

• residuals (r): calcule les residus

• stdp: calcule les ecarts-types des valeurs predites

17

Page 19: Guide d’´econom´etrie appliqu´ee pour Statamapageweb.umontreal.ca/goncals/Ecn2160/GuideEconometrieStata.pdf · Guide d’´econom´etrie appliqu´ee pour Stata Simon Leblond1

ex: calcule les y hors-echantillonreg y x1 x2 x3 in 1/100predict y hat if ~e(sample)

test (t)test permet d’effectuer des tests d’hypotheses apres une estimation. Il prend principalementdeux formes:test [expression1 = expression2]: test que l’expression1 n’est pas statistiquement differentede l’expression2test liste de coefficients: test que les coefficients ne sont pas conjointements statistique-ment differents de zero.

ex:reg y x1 x2 x3test x1 = x2test x2 x3

5.1 Tests d’heteroscedasticite

La presence d’heteroscedasticite ne vient pas biaiser vos resultats, elle biaise plutot les ecarts-types obtenus par MCO. Il existe plusieurs methodes similaires de tester pour la presenced’heteroscedasticite. La plus simple est le test de Breusch-Pagen:

1. recuperer les residus de la regression qu’on desire tester;

2. generer le carre des residus;

3. regresser la carre des residus sur les variables dependantes de la regression originale;

4. tester si les coefficients sont conjointement significatifs (test F ou test LM).

reg y x1 x2predict u, rg u2 = u2reg u2 x1 x2Il suffit alors de regarder la statistique F donnee par Stata.

La faiblesse du test de Breusch-Pagan est qu’il suppose les erreurs normalement dis-tribuees. Afin de laisser tomber cette hypothese, il suffit d’ajouter le carre des variablesdependantes et leurs produits croises dans la regression de l’etape 3, il s’agıt la du test

18

Page 20: Guide d’´econom´etrie appliqu´ee pour Statamapageweb.umontreal.ca/goncals/Ecn2160/GuideEconometrieStata.pdf · Guide d’´econom´etrie appliqu´ee pour Stata Simon Leblond1

de White. Afin de limiter le nombre de regresseurs, on peut utiliser un test de Whitelegerement modifie:

u2 = β0 + β1y + β2y2 + e

On procede pour le reste exactement de la meme facon que pour le test de Breusch-Pagan.

Que faire lorsque vous trouvez la presence d’heteroscedasticite? Deux options s’offrent avous:

• Calculer des variances robustes par la methode de White1

• Estimer le modele par MCG, i.e. modeliser la forme d’heteroscedasticite (voir lechapitre 8).

5.2 Test de Changement structurel (Test de Chow)

Considerez le modele suivant:

y = β0 + β1x1 + β2x2 + u

Le test de Chow sert a verifier s’il existe une difference dans l’influence d’une variabledependante entre deux groupes de donnees, i.e. si le coefficient est statistiquement different.Les deux groupes de donnees pourraient etre deux series d’observations ou deux periodes detemps par exemple.La facon “classique” d’effectuer le test de Chow est d’effectuer la regression du modele pourles deux groupes de facon independante et pour les deux groupes ensemble:

y1 = β10 + β11x11 + β12x12

y2 = β20 + β21x21 + β22x22

y = β0 + β1x1 + β2x2

puis de tester si les coefficient sont statistiquement differents par un test F :

F =( ˆSSRy − ˆSSRy1 − ˆSSRy2)/q

( ˆSSRy1 − ˆSSRy2)/n1 + n2 − 2k)

Rappel: q est le nombre de contraintes et k le nombre de coefficients, ici q = k = 3Une autre facon plus rapide d’effectuer ce test est de construire une variable binaire egale a

1Il peut-etre bien tentant de proceder systematiquement avec les variances robustes Eicker-White poureviter de faire le test d’heteroscedasticite, mais cette facon de faire reduit la precision de vos resultats (i.e.gonfle les ecarts-types et reduit la puissance des tests) lorsque les donnees sont homoscedastiques.

19

Page 21: Guide d’´econom´etrie appliqu´ee pour Statamapageweb.umontreal.ca/goncals/Ecn2160/GuideEconometrieStata.pdf · Guide d’´econom´etrie appliqu´ee pour Stata Simon Leblond1

un pour les observations du deuxieme groupe et de faire une seule regression sur les variablesoriginales et sur les termes d’interaction avec la variable binaire2:

Soit δ la variable binaire:

y = β0 + β1x1 + β2x2 + β3δ + β4x1δ + β5x2δ

On desire maintenant tester si β0 = (β0 + β3), si β1 = (β1 + β4) et si β2 = (β2 + β5). Ce quirevient a tester si β3, β4 et β5 sont conjointement different de 0. Ceci peut etre facilementeffectue par un test de F .

ex:

g g2 = (groupe == 2)g g2x1 = g2*x1g g2x2 = g2*x2reg y x1 x2 g2 g2x1 g2x2test g2 g2x1 g2x2

2Cette section et l’exemple qui la suit sont inspires de la rubrique de l’aide de Stata: How can I computethe Chow test statistic? par Bill Gould.

20

Page 22: Guide d’´econom´etrie appliqu´ee pour Statamapageweb.umontreal.ca/goncals/Ecn2160/GuideEconometrieStata.pdf · Guide d’´econom´etrie appliqu´ee pour Stata Simon Leblond1

Chapitre 6

Variables instrumentales et DoublesMoindres Carres

Lorsqu’une variable “independante” est correlee avec le terme d’erreur, les hypotheses clas-siques du modele lineaire sont violees et on se retrouve face a un probleme d’endogeneite.Dans ces cas, on peut faire appel a l’estimateur de variables instrumentales (VI) ouaux doubles moindres carres ordinaires (DMCO).

6.1 Estimateur Variables Instrumentales

Soit Z, une matrice de VI et X, la matrice originale. L’estimateur VI est donne par:

β(V I) = (Z ′X)−1Z ′y

et l’estimateur VI de la covariance par:

σ2(Z ′X)−1(Z ′Z)(X ′Z)−1

ou

σ2 =1

T(y −Xβ(IV ))

′(y −Xβ(IV )).

ou, lorsque J > K (J etant le nombre de VI et K le nombre de variables independantes),par:

β(IV ) = [X ′Z(Z ′Z)−1Z ′X]−1X ′Z(Z ′Z)−1Z ′y.

σ2[X ′Z(Z ′Z)−1Z ′X]−1.

ivreg

ivreg permet de faire directement une regression par DMCO.

21

Page 23: Guide d’´econom´etrie appliqu´ee pour Statamapageweb.umontreal.ca/goncals/Ecn2160/GuideEconometrieStata.pdf · Guide d’´econom´etrie appliqu´ee pour Stata Simon Leblond1

ivreg variable dependante variables independantes (variable dependante = variable(s) intrumentale(s)),options

ou options peut prendre les memes valeurs que pour regress, ainsi que first qui afficheles resultats de la premiere regression.

ex:ivreg y1 z1 z2 (y2=x1), r first

predict peut etre utilise apres ivreg

6.2 DMCO

Le principe des doubles moindres carres ordinaires est d’utiliser une estimation de la variableendogene qui ne soit pas correlee avec le terme d’erreur pour effectuer la regression.Soit le modele suivant:

y1 = β0 + β1x1 + β2x2 + β3y2 + u

et soit z une VI de y2.

Comme leur nom l’indique, les DMCO se font en deux etapes.

1. Estimation de la variable endogene:Regression de y2 sur toutes les variables independantes (x1 et x2 ici) et la/les VIpour y2 (z ici).On recupere y2, l’estimation lineaire de y2.

2. Regression du modele avec y2:Regression de y1 sur une constante, x1, x2 et y2.

Cette derniere regression ne souffrant plus d’endogeneite, les β ainsi obtenus sontnon-biaises.

Vous pouvez effectuer les deux regressions par vous meme ou utiliser la fonction ivreg a lasection precedente.

22

Page 24: Guide d’´econom´etrie appliqu´ee pour Statamapageweb.umontreal.ca/goncals/Ecn2160/GuideEconometrieStata.pdf · Guide d’´econom´etrie appliqu´ee pour Stata Simon Leblond1

6.3 Tests d’endogeneite

Le test de Hausman permet de verifier s’il existe bel et bien une difference entre l’estimateurVI et l’estimateur MCO, verifiant ainsi s’il y a bel et bien endogeneite des variables (si lesdeux estimateurs sont consistants, ils seront asymptotiquement egaux). Sous H0, la statis-tique de Hausman est:

H = [β(V I) − b]′[σ2[(X ′Z(Z ′Z)−1Z ′X]−1 − σ2(X ′X)−1]−1[β(V I) − b] ∼ χ2(J)

hausman

Effectue le test de specification d’Hausman.Estimation du modele moins efficient, mais convergent (VI ici)hausman, save

Estimation du modele efficient, mais peut-etre pas convergent (MCO ici)hausman

Options: constant (c), indique que la constante doit etre inclue dans la comparaison desdeux modeles.

ex:ivreg y1 z1 z2 (y2=x1)hausman, savereg y1 z1 z2 y2hausman, c

23

Page 25: Guide d’´econom´etrie appliqu´ee pour Statamapageweb.umontreal.ca/goncals/Ecn2160/GuideEconometrieStata.pdf · Guide d’´econom´etrie appliqu´ee pour Stata Simon Leblond1

Chapitre 7

Estimateur du Maximum deVraissemblance (EMV)

La fonction de vraisemblance est la probabilite jointe des observations etant donne lesparametres d’interets, i.e.:

L(θ|y) = f(y1, . . . , yn|θ) =n∏

i=1

f(yi|θ)

L’estimateur du maximum de vraisemblance (EMV) a pour but de choisir le vecteurde parametres θ qui maximise la fonction de vraisemblance, i.e. pour lequel les donneesobservees sont les plus probables. Pour simplifier les choses, la fonction de log-vraisemblance,L(θ|y), est generalement utilisee1.Prenons l’exemple d’un echantillon normalement distribue, de moyenne 0 et de variance σ2:

f(y|X, β, σ2) =T∏

t=1

(2πσ2)−1/2 exp[(yt − x′tβ)2]

= (2πσ2)−T/2 exp

[−(y −Xβ)′(y −Xβ)

2σ2

].

La log-vraisemblance est

L(β, σ2) = −T2

log(2π)− T

2log σ2 − (y −Xβ)′(y −Xβ)

2σ2.

Les CPO sont:δlnL

δβ=

(y −Xβ)(y −Xβ)

2σ2

1Le logarithme etant une fonction montone, la valeur qui maximise L(θ|y) est la meme que celle quimaximise L(θ|y).

24

Page 26: Guide d’´econom´etrie appliqu´ee pour Statamapageweb.umontreal.ca/goncals/Ecn2160/GuideEconometrieStata.pdf · Guide d’´econom´etrie appliqu´ee pour Stata Simon Leblond1

δlnL

δσ2= − T

2σ2+

(y −Xβ)′(y −Xβ)

2σ4

Ce qui nous permet de trouverβ = (X ′X)X ′y

σ2 =(y −Xβ)′(y −Xβ)

T=e′e

T

ml

Permet de faire une estimation par maximum de vraisemblance pour une equation donnee.Cette fonction etant fort complexe et tres peu utilisee dans le cadre des problemes abordesdans ce guide, il est laisse a la discretion du lecteur le soin de consulter l’aide de Stata a sonsujet.

Stata estime automatiquement par maximum de vraisemblance les regressions qui doiventetre traitees par EMV. Les modeles a variable dependante qualitative, les modeles de dureeet les ARIMA sont des exemples de tels cas.

25

Page 27: Guide d’´econom´etrie appliqu´ee pour Statamapageweb.umontreal.ca/goncals/Ecn2160/GuideEconometrieStata.pdf · Guide d’´econom´etrie appliqu´ee pour Stata Simon Leblond1

Chapitre 8

Moindres Carres Generalises

La methode des moindres carres generalises (MCG) cherche a modeliser la fonction dela variance. Nous obtenons alors l’estimateur MCG

βMCG = (X ′V −1X)−1X ′V −1y

ou encoreβMCG = (X ′W−1X)−1W ′V −1y

et sa variance estvar[β] = σ2(X ′V −1X)−1.

ou V et W sont egaux a

W = σ2

x1 0 · · · 00 x2 · · · 0...

.... . .

...0 0 · · · xn

≡ σ2V

vwls

permet de faire une regression lineaire ponderee par la variance.vwls variable dependante variables independantes [poids], options

Options: sd(nom variable) fournit une estimation de l’ecart-type de la variable dependante.

ex:vwls y x1 x2, sd(sigma2ch)ou sigma2ch est une estimation de l’ecart-type de y.

predict peut etre utilise apres vwls

26

Page 28: Guide d’´econom´etrie appliqu´ee pour Statamapageweb.umontreal.ca/goncals/Ecn2160/GuideEconometrieStata.pdf · Guide d’´econom´etrie appliqu´ee pour Stata Simon Leblond1

Chapitre 9

Variables dependantes qualitatives

9.1 Probit/Logit

Un probit et un logit s’appuient en fait sur le meme principe, ils ne different que dans laforme de la fonction de repartition qu’ils utilisent pour calculer l’effet sur la probabilited’une variation de la variable latente. En effet, lorsque la variable dependante ne prend quedes valeurs qualitatives (oui ou non par exemple), l’effet d’une variable independante sur laprobabilite de dire oui doit etre “traduit” par une fonction de repartition. Cette dernierenous donne la probabilite associee a une valeur donnee de la valeur latente exprimee par lacombinaison lineaire des variables independantes.

probit (prob)Estime un modele probit.probit variable dependante variable independanteOptions: probit possede en grande partie les memes options que regress.Note: Ici predict donne par defaut la probabilite. Pour avoir l’estimation lineaire, il fautpreciser xt dans les options de predict.

logit

Permet d’estimer un modele logit.logit variable dependante variable independanteOptions: logit possede en grande partie les memes options que regress.

27

Page 29: Guide d’´econom´etrie appliqu´ee pour Statamapageweb.umontreal.ca/goncals/Ecn2160/GuideEconometrieStata.pdf · Guide d’´econom´etrie appliqu´ee pour Stata Simon Leblond1

9.2 Probit/Logit ordonne

9.3 Tobit

Un tobit est essentiellement un modele dont les donnees sont censurees. Comme le probit,le tobit suit une loi normale.

tobit

Permet d’estimer un modele tobit.logit variable dependante variable independanteOptions: ll(#), ul(#): indiquent respectivement que les donnees sont tronquees a gaucheou a droite. Une ou les deux de ces options doivent etre specifiees. # indique le point detroncation. Si # n’est pas precise, Stata suppose qu’il s’agit respectivement de la valeurminimum et de la valeur maximum.Les autres options de tobit sont en grande partie commune avec regress.

ex:tobit y x1 x2 x3 x4, ll(0)

9.4 Biais de selection: Heckit

28

Page 30: Guide d’´econom´etrie appliqu´ee pour Statamapageweb.umontreal.ca/goncals/Ecn2160/GuideEconometrieStata.pdf · Guide d’´econom´etrie appliqu´ee pour Stata Simon Leblond1

Chapitre 10

Modeles de duree

29

Page 31: Guide d’´econom´etrie appliqu´ee pour Statamapageweb.umontreal.ca/goncals/Ecn2160/GuideEconometrieStata.pdf · Guide d’´econom´etrie appliqu´ee pour Stata Simon Leblond1

Chapitre 11

Series Chronologiques

11.1 Operation sur les variables dans le cadre de series

chronologiques

tsset

Lorsqu’on travaille avec des series chronologiques dans Stata, il est necessaire de l’en informerpar la commande tsset.tsset variable de temps

ex:generate t = ntsset = t

11.2 Operateurs de series temporelles

Voici comment reproduire l’equivalent des operateurs Avance et Retard dans Stata pourtravailler sur les series chronologiques.

l

L’operateur l est l’operateur Retard de stata. Il peut etre utilise avec toutes les fonctionsqui acceptent les series temporelles une fois que la declaration de series temporelles a etefaite.l#.variableou variable est la variable sur laquelle l’operateur doit agir et # est le nombre de retards aappliquer. Si # est omis, un seul retard est applique (equivalent a l1.variable).

tsset t* un modele AR2

30

Page 32: Guide d’´econom´etrie appliqu´ee pour Statamapageweb.umontreal.ca/goncals/Ecn2160/GuideEconometrieStata.pdf · Guide d’´econom´etrie appliqu´ee pour Stata Simon Leblond1

regress y l.y l2.y

f

L’operateur f est l’operateur Avance de stata. Il peut etre utilise avec toutes les fonctionsqui acceptent les series temporelles une fois que la declaration de series temporelles a etefaite.f#.variableou variable est la variable sur laquelle l’operateur doit agir et # est le nombre d’avance aappliquer. Si # est omis, une seule avance est appliquee (equivalent a f1.variable).

tsset t* une autre formulation pour un modele AR2regress f.y y l.y

11.3 Tests d’autocorrelation

Inutile de mentionner que l’autocorrelation est un probleme qui n’est pertinent que dans lecas des series temporelles. . .Le test ρ est le test le plus simple a effectuer pour tester la presence d’autocorrelation:

1. recuperer les residus de la regression qu’on desire tester;

2. regresser ut sur ut−1 a ut−n et X

3. Tester la signification conjointe des coefficients de cette regression par un test F.

Choisissons n egal a 3.

reg y x1 x2predict u, rreg u l.u l2.u l3.uIl suffit alors de regarder la statistique F donnee par Stata.

Le test de Durbin-Watson est aussi utilise pour tester la presence d’autocorrelation, maiscomme il est moins precis et ne considere qu’une seule periode, nous ne le couvrirons pas ici.

31

Page 33: Guide d’´econom´etrie appliqu´ee pour Statamapageweb.umontreal.ca/goncals/Ecn2160/GuideEconometrieStata.pdf · Guide d’´econom´etrie appliqu´ee pour Stata Simon Leblond1

11.4 Methode de Box-Jenkins

Ce qu’il est important de comprendre, a mon avis, dans la methode de Box-Jenkins, c’est quel’objectif de toutes les operations que nous effectuons est de se retrouver avec un residu quiest un bruit-blanc. Le but ultime etant de modeliser la serie afin de faire des predictions,nous pouvons seulement etre certain d’avoir tout extrait lorsqu’il nous reste seulement unbruit-blanc: un processus qui est par definission impossible a predire.

11.4.1 Stationnarite des donnees

La premiere etape de la methode de Box-Jenkins consiste a effectuer les transformationsnecessaires afin de s’assurer que notre serie est stationnaire, si elle ne l’est pas, il nous seraimpossible de travailler dessus.Premiere question a se poser: doit-on travailler en log ou pas? Si la variable croıt a untaux constant, elle sera lineaire en log. De plus, les proprietes du logarithme font en sortequ’il “ecrase” une variance croissante. Outre la transformation logarithmique, il existe troiscas possibles de non-stationnarite qui impliqueront des changements dans la serie (ou samodelisation):

• Changement structurel

• Tendance deterministe

• Racine unitaire

Changement structurel

Les changement structurels peuvent etre detectes a l’aide du Test de Chow (voir section 5.2).Malheureusement, rien ne peut generalement etre fait pour stationnariser une serie dans lecas d’un changement structurel.

Tendance deterministe

Afin de regler le probleme de la presence d’une tendance temporelle, il suffit de la modeliser.Il faut faire attention de bien choisir la tendance la mieux adaptee a nos donnees: lineaire,quadratique, logarithmique, etc.

ex: tendance quadratiquet = nt2 = t^2tsset tregress y t t2

32

Page 34: Guide d’´econom´etrie appliqu´ee pour Statamapageweb.umontreal.ca/goncals/Ecn2160/GuideEconometrieStata.pdf · Guide d’´econom´etrie appliqu´ee pour Stata Simon Leblond1

Racines Unitaires

On fait face a un probleme de racine unitaire lorsque ρ = 1 dans le modele suivant:

yt = α+ ρyt−1 + et

Afin de regler le probleme de racine unitaire, il faut differencier la serie, i.e. travailler sur∆yt = yt − yt−1 plutot que yt. Le modele devient donc:

∆yt = α+ θyt−1 + εt

La differenciation d’une serie est effectuee automatiquement dans Stata lors de l’utilisationde la fonction arima.

Tester pour la presence d’une racine unitaire se fait par un test t ou H0 est θ = 0.Malheureusement, sous l’hypothese nulle, la statistique t ne suit pas la loi asymptotiquehabituelle. Il faut plutot utiliser la loi de Dickey-Fuller. S’il y a correlation des termesd’erreur, il faut plutot utiliser une loi de Dickey-Fuller augmentee.

dfuller

Effectue un test de Dickey-Fuller augmente sur la variable specifiee.dfuller nom de variable, optionsOptions:

• lags(#): specifie le nombre de retards a utiliser pour le calcul de la variance estimeeNewey-West.

• trend: incluera une variable de tendance dans la regression.

pperron

Possede exactement la meme structure et les memes options que dfuller, mais effectue untest de Phillips-Perron plutot qu’un test de Dickey-Fuller augmente.

11.4.2 Modelisation des cycles: Modeles AR, MA, ARMA, ARIMA

arima

Permet d’estimer un modele AR, MA, ARMA ou ARIMA par maximum de vraisemblance.arima variable dependante variable independante, arima(p,d,q)ou p est le nombre de AR, d le nombre de differenciation et q le nombre de MA.Il n’est pas necessaire de preciser de variables independates.

33

Page 35: Guide d’´econom´etrie appliqu´ee pour Statamapageweb.umontreal.ca/goncals/Ecn2160/GuideEconometrieStata.pdf · Guide d’´econom´etrie appliqu´ee pour Stata Simon Leblond1

ex: AR(1)arima t, arima(1,0,0)ex: MA(1)arima t, arima(0,0,1)ex: ARIMA(1,1,2)arima t, arima(1,1,2)

Pour choisir p et q, il est bon de regarder l’autocorrelogramme partiel (nombre de AR) etl’autocorrelogramme (nombre de MA) de la variable qui nous interesse.

corrgram

Construit une table des autocorrelations et des autocorrelations partielles. Permet de tracerl’autocorrelogramme et l’autocorrelogramme partiel.corrgram nom de variable, optionOptions: lags(#): specifie le nombre de retards a calculer.

corrgran peut etre suivi de deux autres fonctions:

ac

Produit un autocorrelogramme.ac nom de variable, optionsOptions:

• lags(#): specifie le nombre de retards a calculer.

• level(#): specifie le niveau de confiance a utiliser dans le calcul des bandesde confiances.

• Toutes les options standards d’un graphique sont egalement admissible.

pac

Produit un autocorrelogramme partiel. Meme structure et memes options que ac.

11.4.3 Selection de Modele

A chaque etape de la modelisation de notre serie chronologique, il est important de choisirle meilleur des choix qui s’offre a nous: tendance quadratique ou logarithmique? AR(2) ouAR(3)?Plusieurs criteres existent pour nous aider dans nos choix, nous en explorerons trois qui sebasent tous sur le principe de penalite pour le nombre de variables.

34

Page 36: Guide d’´econom´etrie appliqu´ee pour Statamapageweb.umontreal.ca/goncals/Ecn2160/GuideEconometrieStata.pdf · Guide d’´econom´etrie appliqu´ee pour Stata Simon Leblond1

R-carre ajuste

Le R-carre ajuste (R2) est donne par la formule suivante:

R2 = 1− n− 1

n−K(1−R2)

Akaike information criterion (AIC)

Voici la formule habituelle du critere d’Akaike:

AIC(K) = log(e′e

n) +

2K

n

Bayesian information criterion (BIC)

Voici la formule habituelle du critere de Schwartz ou Bayesien:

BIC(K) = log(e′e

n) +

Klogn

n

Ces criteres doivent etre construits manuellement.

35

Page 37: Guide d’´econom´etrie appliqu´ee pour Statamapageweb.umontreal.ca/goncals/Ecn2160/GuideEconometrieStata.pdf · Guide d’´econom´etrie appliqu´ee pour Stata Simon Leblond1

Chapitre 12

Donnees longitudinales (Panel)

Il existe bon nombre de methodes pour traiter les donnees en Panel et la litterature sur lesujet est tres exhaustive, nous ne traiterons donc dans ce chapitre que des methodes de base.

12.1 Effets Fixes et Effets Aleatoires

Lorsqu’on a des donnees longitudinales, on voudra souvent isoler l’effet associe a chaqueannee, a chaque individu ou aux deux. Il existe deux facons de modeliser ces effets, soitcomme des effets fixes, soit comme des effets aleatoires.Effets fixes (αi, µt):

yit = αi + µt +Xitβ + eit

Effets aleatoires (αi, µt):

yit = Xitβ + eit

eit = αi + µt + εit

Les effets fixes ont l’avantage de permettre une correlation avec les variables explicatives,mais imposent une structure aux effets. A l’inverse, les effets aleatoires seront biaises s’il y acorrelation avec certaines varibles explicatives, mais permettent beaucoup plus de flexibilite.

12.1.1 Variables binaires

Dans le cas d’un effet fixe, la methode la plus simple de capter cet effet est de supposerqu’il existe pour chacun de nos groupes et, ainsi, d’ajouter une variable binaire par groupe(sans oublier, comme d’habitude, d’en laisser tomber une). Donc si nous avons cinq groupeset quatre periodes de temps, nous aurons un total de sept variables binaires. Il peut etre

36

Page 38: Guide d’´econom´etrie appliqu´ee pour Statamapageweb.umontreal.ca/goncals/Ecn2160/GuideEconometrieStata.pdf · Guide d’´econom´etrie appliqu´ee pour Stata Simon Leblond1

preferable dans certains cas de ne pas inclure de constante pour comparer tous les groupesentre eux. Dans le dernier exemple, on pourrait ainsi laisser tomber la constante et inclurecinq variables binaires pour les groupes et trois variables binaires pour les annes.

Ajout manuellement de variables binaires pour chaque groupe et chaque annee.

ex: Regression sur cinq echantillons tires de 1980,81,82 et 83.* creation des variables binairesa81 = (annee == 1981)a82 = (annee == 1982)a83 = (annee == 1983)g2 = (groupe == 2)g3 = (groupe == 3)g4 = (groupe == 4)g5 = (groupe == 5)* regressionregress y x1 x2 a81 a82 a83 g2 g3 g4 g5

12.1.2 Fonctions pour donnees longitudinales

Il est aussi possible d’indiquer a Stata que l’on travaille avec des donnees en Panel afind’automatiser le processus de calcul des effets fixes ou aleatoires:

tsset

Cette fonction deja vue dans le chapitre 11 permet egalement de declarer nos donnees commeun panel de series temporelles. Il suffit pour ca d’ajouter la variable de panel (de groupe)avant la variable de temps.tsset variable de panel variable de temps

ex:g t = ntsset groupe t

Une fois tsset declare pour des donnees panel, il est possible de travailler avec la famillede fonctions xt de Stata. Il existe une telle fonction pour chacun des types de regression:xtreg, xtlogit, xprobit, xttobit, xtgls, etc. Nous ne couvrirons ici que sommaire-ment xtreg et nous vous referons a l’aide de Stata pour plus de details sur cette famille defonctions.

xtreg

37

Page 39: Guide d’´econom´etrie appliqu´ee pour Statamapageweb.umontreal.ca/goncals/Ecn2160/GuideEconometrieStata.pdf · Guide d’´econom´etrie appliqu´ee pour Stata Simon Leblond1

Permet de faire des regressions sur des donnees en Panel.Effet fixe: xtreg variable dependante variable independante, fe

Effet aleatoire estime par MCG: xtreg variable dependante variable independante, re

Effet aleatoire estime par EMV: xtreg variable dependante variable independante, mle

ex:tsset groupe anneextreg y x1 x2, fe

38

Page 40: Guide d’´econom´etrie appliqu´ee pour Statamapageweb.umontreal.ca/goncals/Ecn2160/GuideEconometrieStata.pdf · Guide d’´econom´etrie appliqu´ee pour Stata Simon Leblond1

Chapitre 13

Interaction avec les tableurs et lestraitements de texte

13.1 Remarques

Quelques remarques importantes lorsque vous travaillez avec des donnees numeriques:

• Pour etre utilisables, les donnees numeriques doivent etre separees par variable et parobservation, chaque valeur etant separee de la suivante par un ‘separateur’.

• Generalement, il est plus facile de travailler si les variables constituent les colonnes etles observations les rangees.

• Comme les logiciels sont (tous?) americains, le separateur de decimales doit etre unpoint (‘.’) et non pas une virgule (‘,’). Si ce n’est pas le cas, ceci peut facilement etrechange par la commande replace du menu Edit de Excel.

• Assurez-vous que le separateur de valeurs est compatible avec la methode utilisee pourimporter les donnees dans le logiciel econometrique.

• Assurez-vous egalement que si vous avez du texte dans vos observations, cela est permispar votre methode d’importation.

• Evitez les lignes de commentaire ou de texte avant vos donnees ou le nom de vosvariables. Bien qu’il soit possible de contourner cette difficulte, ca evite souvent desproblemes.

13.2 Tableur

Cette section est surtout orientee vers Excel puisque c’est le tableur le plus utilise sur lemarche.

39

Page 41: Guide d’´econom´etrie appliqu´ee pour Statamapageweb.umontreal.ca/goncals/Ecn2160/GuideEconometrieStata.pdf · Guide d’´econom´etrie appliqu´ee pour Stata Simon Leblond1

• Exportation des donnees: Dans le menu Fichier, Sauvegarder sous, selectionnez unformat text avec separateur: soit des tabulations (.txt ou .tab), soit des virgules (.txtou .csv).

• Importation de donnees: En ouvrant un fichier ASCII (sans formatage), l’assistantimportation-donnees de Excel devrait s’ouvir automatiquement. Vous devrez alorsseulement selectionner le type de separateur (etape 2) et le type de donnees (etape 3:optionnel) pour pouvoir acceder a votre fichier.

13.3 Traitement de texte

Cette section est surtout orientee vers Word puisque c’est le traitement de texte le plusutilise sur le marche.

• Creation de Tableau: Le copier-coller est la solution de choix ici. L’ideal est de passerpar Excel apres avoir importer le fichier de donnees (selectionnez les cases desirees,copier, coller...). Sinon, vous pouvez egalement copier directement les resultats a partirdu gestionnaire de donnees.

• Insertion de Graphique: Menu insertion, objet, du fichier.... Trouvez l’image qui voussert de graphique et appuyez sur OK.

• Transcription de resultats: Malheureusement, il n’existe pas de moyen rapide de tran-scrire vos resultats s’ils ne peuvent pas etre mis en tableau. Copier-coller ou latranscription manuelle demeurent les seuls moyens d’effectuer ce travail... faites destableaux!

40

Page 42: Guide d’´econom´etrie appliqu´ee pour Statamapageweb.umontreal.ca/goncals/Ecn2160/GuideEconometrieStata.pdf · Guide d’´econom´etrie appliqu´ee pour Stata Simon Leblond1

Chapitre 14

Ou trouver ses donnees et commentles extraires

14.1 Liens utiles

14.1.1 A l’Universite

Votre premier arret pour trouver des donnees se doit d’etre sur le site web de la bib-liotheque des sciences humaines au:http://www.bib.umontreal.ca/SB/num/Cette page vous donne acces aux plus importantes sources officielles de donnees numeriques,notamment, Statistiques Canada (E-STAT et CHASS), l’institut de la statistique duQuebec et l’OCDE. La majorite de ces donnees sont des series chronologiques ou desdonnees en panel.

Pour obtenir des donnees d’enquetse, il faut se tourner vers Sherlock (aussi accessiblepar cette page) ou vers des organismes prives. Certaines donnees d’enquetes sontegalement accessible par l’institut de la statistique du Quebec.

14.1.2 A l’Exterieur

Google www.google.caMoteur de recherche tres puissant qui devrait vous aider pour toutes vos requetes.

Gouvernement du Quebec www.gouv.qc.caPlusieurs ministeres ont des donnees telchargeables qui sont accessibles par leursite web.

41

Page 43: Guide d’´econom´etrie appliqu´ee pour Statamapageweb.umontreal.ca/goncals/Ecn2160/GuideEconometrieStata.pdf · Guide d’´econom´etrie appliqu´ee pour Stata Simon Leblond1

Gouvernement du Canada www.gc.caPlusieurs ministeres ont des donnees telchargeables qui sont accessibles par leursite web.

Eurostat http://europa.eu.int/comm/eurostat/Plusieurs indicateurs economiques et sociaux de l’Union Europeenne.

US Census Bureau http://www.census.gov/Donnees des recensement americains.

Agences Nationales de Statistiques http://www.census.gov/main/www/stat int.htmlLiens vers toutes les agences nationales de statistiques.

Fedstat http://www.fedstats.gov/Liens vers la majorite des organismes federaux americains produisant des donneesqui son accessibles.

Donnees Spatiales http://data.geocomm.com/catalog/Plusieurs liens vers des donnees codees geographiquement.

DataLinks http://www.econ-datalinks.org/Une foule de liens vers des donnees economiques et financieres.

Cette liste est tres tres loin d’etre exhaustive, donc n’hesitez pas a pousser vosrecherches sur internet plus loin. Si vous trouver des liens interessant, envoyez-les moiet je me ferrai un plaisir de les ajouter aux versions futures de ce guide.

Un conseil: Les sites gouvernementaux et ministeriels au niveau national et sous-national sont souvent des mines d’or de donnees!

14.2 Acces au Donnees

Cette section decrit seulement comment acceder et telecharger les donnees de quelquessources particulierement importantes.

14.2.1 Statcan

http://www.bib.umontreal.ca/SB/num/statcan.htm

Vous avez deux choix pour acceder aux series chronologiques de Statistiques Canada:

E-Stat Acces a la grande majorite des donnees de Statistiques Canada, environnementtres convivial.

42

Page 44: Guide d’´econom´etrie appliqu´ee pour Statamapageweb.umontreal.ca/goncals/Ecn2160/GuideEconometrieStata.pdf · Guide d’´econom´etrie appliqu´ee pour Stata Simon Leblond1

CHASS Acces a envrions 600 000 series de plus qu’avec E-Stat, mais environnementde navigation moins convivial.

Nous decrirons seulement l’usage de E-Stat ici.

1. Trouvez le tableau qui vous interesse en effectuant une recherche par sujet ou parmot-cle.

2. Une fois dans le tableau de votre choix, vous aurez generalement a selectionner desseries specifiques en choisissant parmis une liste deroulante et ce, pour plusieurscategories (ex: geographie, frequence, sexe, dates, etc.).Choisissez les series desires (tenez la touche ctrl enfoncee pour selectionnerplusieurs items dans une meme liste) et appuyez sur serie chronologiques.

3. Choisissez votre format de sortie parmis les choix offerts (suggestion: CSV ouPRN, periodes = lignes).

4. Appuyez sur extraire et sauvegarder le fichier qui apparaitra sous le nom desire.

14.2.2 OCDE

http://www.sourceoecd.org/ (doit etre accede par l’UdeM)

Generalement, les donnees les plus interessantes se trouvent dans statistiques de l’OCDE/ Perspectives Economiques.

1. Une fois dans Perspectives Economiques, appuyez sur Bases de donnees statis-tiques puis, a la page suivante, sur tableaux, puis sur donnees et, enfin, sur accesaux donnees.

2. Vous devrez ensuite selectionner dans l’ordre vos Pays, vos Variables et votrePeriode de couverture.

3. La derniere etape consiste a sauvegarder vos donnees dans le format desire.

14.2.3 Sherlock

1. Une fois votre enquete selectionnee, cliquez dessus.

2. Choisissez le format d’extraction. A moins que vous connaissiez SAS ou SPSS, ilvous est suggere de choisir Extraction par variables et un fichier .tab.

3. Vous devrez ensuite selectionner les variables desirees en cochant les cases corre-spondantes.

43

Page 45: Guide d’´econom´etrie appliqu´ee pour Statamapageweb.umontreal.ca/goncals/Ecn2160/GuideEconometrieStata.pdf · Guide d’´econom´etrie appliqu´ee pour Stata Simon Leblond1

4. Finalement, vous devez choisir les valeurs des variables que vous desirees.

5. Pour extraire les donnees, entrez votre adresse courriel et appuyez sur Extraire.Les donnees vous seront envoyees en differe a l’adresse specifiee.

44

Page 46: Guide d’´econom´etrie appliqu´ee pour Statamapageweb.umontreal.ca/goncals/Ecn2160/GuideEconometrieStata.pdf · Guide d’´econom´etrie appliqu´ee pour Stata Simon Leblond1

45

Page 47: Guide d’´econom´etrie appliqu´ee pour Statamapageweb.umontreal.ca/goncals/Ecn2160/GuideEconometrieStata.pdf · Guide d’´econom´etrie appliqu´ee pour Stata Simon Leblond1

Annexe A

Tableaux Recapitulatifs

A.1 Fonctions de Stata

Fonction Abreviation Description Forme

Importation de Donneesinfile inf Importe les donnees d’un

fichier.infile nom des variablesusing nomdefichier

insheet Importe les donnees d’unfichier (separateurs: tabula-tions ou virgules).

insheet using

nom de fichier

Transformation de Variablesgenerate g Cree une nouvelle variable. generate

nouvelle variable =

expressionreplace Remplace une variable exis-

tante.replace variable existante= expression

abs Valeur absolue. abs(x)exp Exponentiel. exp(x)log Logarithme naturel. log(x)max Renvoie l’argument

possedant la valeur laplus elevee.

max(x1, ..., xn)

min Renvoie l’argumentpossedant la valeur lamoins elevee.

min(x1, ..., xn)

mod Modulo de x par rapport ay.

mod(x,y)

sqrt Racine carree. sqrt(x)sum Somme de tous les elements

de x.sum(x)

46

Page 48: Guide d’´econom´etrie appliqu´ee pour Statamapageweb.umontreal.ca/goncals/Ecn2160/GuideEconometrieStata.pdf · Guide d’´econom´etrie appliqu´ee pour Stata Simon Leblond1

Fonctions Matriciellesmatrix mat Cree ou modifie une ma-

trice.matrix nom de la matrice= expression

matrix get Permet d’obtenir copied’une matrice systeme.

matrix variable =

get(matrice systeme)mkmat Transforme des variables en

vecteurs/matrice.mkmat

nom(s) de variable(s),matrix

[(nomdelanouvellematrice)]svmat Transforme les colonnes

d’une matrice en variables.svmat matrice,[names(nom col1, nom col2, . . . )]

colsof nombre de colonnes d’unematrice.

colsof(A)

det Determinant d’une matrice. det(A)diag Matrice diagonale n × n,

avec pour diagonale leselements de V .

diag(V )

el Element aij d’une matrice. el(A,i,j)I Matrice identite n× n. I(n):inv Inverse d’une matrice

carree.inv(A)

rowsof Nombre de rangees d’unematrice.

rowsof(A)

vecdiag Extrait la diagonale d’unematrice carree sous forme devecteur.

vecdiag(A)

Fonctions Diversesgraph gr Trace un graphique. graph nomdesvariables,

[typedegraphique,autresoptions]

list Affiche a l’ecran les vari-ables specifiees.

list

[nom(s) de variable(s)]log Enregistre la session. log using nom de fichiermore Active ou desactive

l’affichage de --more--.more on/off

set matsize set mat Fixe la taille maximale desmatrices.

set matsize #

47

Page 49: Guide d’´econom´etrie appliqu´ee pour Statamapageweb.umontreal.ca/goncals/Ecn2160/GuideEconometrieStata.pdf · Guide d’´econom´etrie appliqu´ee pour Stata Simon Leblond1

Fonctions Diverses (suite)uniform Donne une valeur aleatoire

entre 0 et 1 (ditribution uni-forme sur [0,1)).

uniform()

tsset Declaration de series tem-porelles/Donnees pannel.

tsset variable de temps

l Operateur retard. l#.variablef Operateur avance. f#.variable

Fonctions Econometriquesregress reg Effectue une regression

lineaire par MCO.regress vardep [vars inds]

predict Calcule les valeurs predites,les residus, etc.

predict nouvelle variable,options

test t Effectue des testsd’hypothese.

test [expression1 =

expression2]ivreg Effectue une regression par

DMCO.ivreg var dep vars inds(var dep = V I), options

hausman Effectue le test despecification d’Hausman.

hausman / hausman, save

vwls Effectue une regressionponderee par la variance(FGLS).

vwls vardep vars inds[poids], options

probit prob Estime un modele probit. probit var dep vars indslogit Estime un modele logit. logit var dep vars indstobit Estime un modele tobit. tobit var dep vars inds,

[ll(#)] [ul(#)]

dfuller Effectue le test de Dickey-Fuller augmente.

dfuller nom de variable,options

pperron Effectue le test de Phillips-Perron.

pperron nom de variable,options

corrgram Produit une table des au-tocorrelations et des auto-correlations partielles.

corrgram

nom de variable, option

xtreg Effectue une regression surdes donnees panel.

xtreg var dep vars inds,[fe] [re] [mle]

48

Page 50: Guide d’´econom´etrie appliqu´ee pour Statamapageweb.umontreal.ca/goncals/Ecn2160/GuideEconometrieStata.pdf · Guide d’´econom´etrie appliqu´ee pour Stata Simon Leblond1

A.2 Operateurs

Description Forme

Operateurs MathematiquesAddition +

Soustraction -

Multiplication *

Division /

Puissance ^

Operateurs LogiquesET &

OU |Non (¬) ~

Operateurs de Comparaison

Egal ==

Different ~=

Plus grand >

Plus petit <

Plus grand ou egal >=

Plus petit ou egal <=

A.3 Symboles Mathematiques

Symbole Description Symbole Description Symbole Description∑somme ! factoriel ⊥ perpendiculaire∏produit | x | valeur absolue ‖ parallele∫integrale ‖ x ‖ norme de x bcp plus petit

∂ derivee partielle ≺ precede, prefere bcp plus grand

6= different ∅ ensemble vide ∀ pour tout≡ equivalent ⊂ sous-ensemble

de (inclus dans)∃ il existe

≈ approximative-ment egal a

∈ element de ¬ non (negation)

∼= congruent, iso-morphique

⋂intersection ⇒ implique

∝ proportionel⋃

union ⇔ equivalent∼ similaires (geometrie), asymptotiquement, suit (une loi)

49

Page 51: Guide d’´econom´etrie appliqu´ee pour Statamapageweb.umontreal.ca/goncals/Ecn2160/GuideEconometrieStata.pdf · Guide d’´econom´etrie appliqu´ee pour Stata Simon Leblond1

A.4 Alphabet Grec

minuscule majuscule nom minuscule majuscule nom

α alpha ν nuβ beta ξ Ξ xiγ Γ gamma o oδ ∆ delta π,$ Π piε, ε epsilon ρ, % rhoζ zeta σ, ς Σ sigmaη eta τ tauθ, ϑ Θ theta υ Υ upsilonι iota φ, ϕ Φ phiκ kappa χ chiλ Λ lambda ψ Ψ psiµ mu ω Ω omega

50