MASTER ECONOMETRIE ET STATISTIQUE … · MASTER ECONOMETRIE ET STATISTIQUE APPLIQUEE (ESA)...

32
MASTER ECONOMETRIE ET STATISTIQUE APPLIQUEE (ESA) Université d’Orléans Econométrie des Variables Qualitatives Chapitre 2 Modèles Multinomiaux Modèles Logit Multinomiaux Ordonnées et non Ordonnés Christophe Hurlin Polycopié de Cours Master Econométrie et Statistique Appliquée (ESA) Université d’Orléans Faculté de Droit, d’Economie et de Gestion Bureau A 224 Rue de Blois – BP 6739 45067 Orléans Cedex 2 www.univ-orleans.fr/deg/masters/ESA/

Transcript of MASTER ECONOMETRIE ET STATISTIQUE … · MASTER ECONOMETRIE ET STATISTIQUE APPLIQUEE (ESA)...

Page 1: MASTER ECONOMETRIE ET STATISTIQUE … · MASTER ECONOMETRIE ET STATISTIQUE APPLIQUEE (ESA) Université d’Orléans Econométrie des Variables Qualitatives Chapitre 2 Modèles Multinomiaux

MASTER ECONOMETRIE ET STATISTIQUE APPLIQUEE (ESA)

Université d’Orléans

Econométrie des Variables Qualitatives

Chapitre 2

Modèles Multinomiaux

Modèles Logit Multinomiaux Ordonnées et non Ordonnés

Christophe Hurlin

Polycopié de Cours

Master Econométrie et Statistique Appliquée (ESA) Université d’Orléans Faculté de Droit, d’Economie et de Gestion Bureau A 224 Rue de Blois – BP 6739 45067 Orléans Cedex 2 www.univ-orleans.fr/deg/masters/ESA/

Page 2: MASTER ECONOMETRIE ET STATISTIQUE … · MASTER ECONOMETRIE ET STATISTIQUE APPLIQUEE (ESA) Université d’Orléans Econométrie des Variables Qualitatives Chapitre 2 Modèles Multinomiaux

January 21, 2003

Contents

1 Modèles Multinomiaux Ordonnés . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41.1 Exemples de Modèles Multinomiaux Ordonnés . . . . . . . . . . . . . . . . . . . 5

1.1.1 Dosage d’insecticide : Gurland, Lee et Dahm (1960) . . . . . . . . . . . . 61.1.2 Acquisition d’un bien immobilier : David et Legg (1975) . . . . . . . . . . 7

1.2 Application . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 82 Modèles Multinomiaux Séquentiels . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 122.1 Application . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13

3 Modèles Multinomiaux Non Ordonnés . . . . . . . . . . . . . . . . . . . . . . . . . . . 143.1 Des modèles de choix probabilistes . . . . . . . . . . . . . . . . . . . . . . . . . . 143.2 Logit multinomial indépendant . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17

3.2.1 Spécification du Logit Multinomial . . . . . . . . . . . . . . . . . . . . . . 183.2.2 Estimation des paramètres du logit multinomial . . . . . . . . . . . . . . 213.2.3 Exemples de modèles logit multinomial . . . . . . . . . . . . . . . . . . . 24

3.3 Application . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 253.4 Logit Conditionnel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25

3.4.1 Spécification du logit conditionnel . . . . . . . . . . . . . . . . . . . . . . 263.4.2 Estimations des paramètres du logit conditionnel . . . . . . . . . . . . . . 273.4.3 Exemples de modèles logit conditionnel . . . . . . . . . . . . . . . . . . . 283.4.4 Applications . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29

3.5 Logit Universel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 294 L’hypothèse d’indépendance des alternatives non pertinentes . . . . . . . . . . . . . . . 304.1 Test de l’hypothèse IIA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 304.2 Modèle Alternatifs . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30

4.2.1 Probit multinomial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 304.2.2 Logit Hierarchisé . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30

Page 3: MASTER ECONOMETRIE ET STATISTIQUE … · MASTER ECONOMETRIE ET STATISTIQUE APPLIQUEE (ESA) Université d’Orléans Econométrie des Variables Qualitatives Chapitre 2 Modèles Multinomiaux

Econométrie des Variables Qualitatives. Cours C. Hurlin 2

Introduction

Nous allons à présent envisager le cas des modèle multinomiaux, ou plus précisément desmodèles à variable expliquée qualitative multinomiale (ou polytomique). Ce sont des modèlesdans lesquels la variable expliquée peut prendre plus de deux modalités1 . Nous allons voir qu’ilexiste trois catégories de modèles multinomiaux :

1. Modèles multinomiaux ordonnés

2. Modèles multinomiaux séquentiels

3. Modèles multinomiaux non ordonnés

Dans la pratique, les modèles non ordonnés sont les plus fréquents, c’est pourquoi nousleur accorderons une attention toute particulière. Dans cette catégorie, on trouve notammentle modèle logit multinomial et le modèle logit conditionnel de McFadden qui sontles modèles les plus utilisés et qui constituent une extension du logit binaire étudié dans lechapitre précédent. Nous verrons toutefois, que si ces modèles sont simples à utiliser, ils posenttoutefois un problème de cohérence en raison d’un propriété peu réaliste d’indépendance desétats non pertinents. C’est pourquoi, des modèles alternatifs ont été développés comme lemodèle logit hierarchisé ou le modèle probit multinomial. Ces derniers requièrent toutefoisdes techniques d’estimation relativement complexes.

Commençons par décrire le cadre général de ces modèles multinomiaux.

Definition 0.1. On considère un modèle multinomial dans le lequel la variable dépen-dante qualitative observée pour le ieme individu ∀i = 1, .., N , notée yi, peut prendremi + 1 modalités indicées j = 0, 1, 2, ..,mi, supposées mutuellement exclusives pourchaque individu i :

mi+1

j=0

Prob (yi = j) = 1 ∀i = 1, .., N (0.1)

La probabilité associée à chaque réponse est définie par :

Prob (yi = j) = Fij (x,β) ∀i = 1.., N ∀j = 0, 1, ..,mi (0.2)

Partant de cette définition, on peut faire quatre remarques.

1. On remarque tout d’abord que le nombre de modalitésmi prises par la variable dépendanteyi peut dépendre de l’individu : on peut avoir mz = mk.

2. La fonction de répartition Fij (x,β) correspond à la probabilité que l’individu i choisissela modalité j en fonction des variables explicatives x et du vecteur de paramètres β. Cettefonction peut ainsi différer suivant les individus (indice i) mais aussi suivant les modalités(indice j).

1Voir l”introduction du premier chapitre pour la définition générale des modèles à variable qualitative.

Page 4: MASTER ECONOMETRIE ET STATISTIQUE … · MASTER ECONOMETRIE ET STATISTIQUE APPLIQUEE (ESA) Université d’Orléans Econométrie des Variables Qualitatives Chapitre 2 Modèles Multinomiaux

Econométrie des Variables Qualitatives. Cours C. Hurlin 3

3. Dans un modèle multinomial, la probabilité associée à lami+1eme modalité (généralement

l’événement codé en 0) n’a pas besoin d’être spécifiée puisqu’elle peut être calculée à partirdes mi probabilité comme suit :

Prob (yi = 0) = 1−mi

j=1

Fij (x,β) ∀i = 1.., N

Si l’on définit Ni=1 (mi + 1) variables binaires yij telles que :

yij =10

si yi = jsinon

∀i = 1.., N ∀j = 0, 1, ..,mi (0.3)

alors on peut écrire la vraisemblance associé à l’échantillon y = (y10, ...., y1m1, ..., yN0, ...., yNmN

)

comme le produit des probabilités associées aux différentes modalités, et ceci pour tous lesindividus :

L (y,β) =N

i=1

mi

j=0

Fij (x,β)yij (0.4)

Les résultats généraux concernant les estimateurs du MV et les propriétés asymptotiquesdes estimateurs étudiées dans le chapitre 1 concernant les modèles binaires restent valables ici.Il n’y a donc pas de difficulté technique concernant l’estimation des paramètres de ces mod-èles. Mais les modèles polytomiques peuvent avoir des formes mathématiques très différentessuivant les hypothèses retenues. C’est pourquoi la recherche d’une forme adaptée au problèmeéconomique posé constitue dans la plupart des cas, la plus grande difficulté bien avant les méth-odes d’estimation et d’inférence. Si ces modèles posent des problèmes, ce sont avant tout desproblèmes de choix de modélisation. Pour mieux comprendre ces difficultés, nous allonsà présent distinguer les modèles multinomiaux ordonnés, les modèles multinomiaux séquentielset les modèles multinomiaux non ordonnés.

Page 5: MASTER ECONOMETRIE ET STATISTIQUE … · MASTER ECONOMETRIE ET STATISTIQUE APPLIQUEE (ESA) Université d’Orléans Econométrie des Variables Qualitatives Chapitre 2 Modèles Multinomiaux

Econométrie des Variables Qualitatives. Cours C. Hurlin 4

1. Modèles Multinomiaux Ordonnés

Avant de définir précisément ce que sont les modèles multinomiaux ordonnés, commençons pardéfinir leur champ d’application. Les modèles ordonnés sont utilisés lorsque les valeursprises par la variable multinomiale correspondent à des intervalles dans lesquelsva se trouver une seule variable latente inobservable continue. Ainsi, un modèlepolytomique univarié ordonné est un modèle dans lequel on a une variable, plusieurs modalités,et un ordre naturel sur ces modalités. On suppose que les modalités sont identiques pour tousles individus :

mi = m ∀i = 1.., NDefinition 1.1. Un modèle polytomique univarié ordonné peut s’écrire sous laforme :

yi =

01...m

si y∗i < c1si c1 ≤ y∗i < c2...si y∗i > cm

∀i = 1.., N (1.1)

avec cj+1 ≥ cj et où la variable latente y∗i est défini pary∗i = xiβ + εi (1.2)

avec xi = x1i ..xKi , ∀i = 1, .., N , β = (β1...βK) ∈ RK, εi i.i.d. 0,σ2ε et où εi/σε suit une

loi de fonction de répartition F (.) .

Naturellement, si la fonction F (.) correspond à la loi logistique, F (.) = Λ (.) , le modèleest un modèle logit multinomial ordonné, tandis que si la fonction F (.) correspond à la loinormale centrée réduite, F (.) = Φ (.) , le modèle est un modèle probit multinomial ordonné.Du point de vue pratique, naturellement un tel découpage en classe sur y∗i n’a de sens que si lenombre de classes est relativement faible.

Naturellement, à partir de la définition précédente on peut déduire la loi de la variablequalitative observée yi qui nous servira par la suite à construire la fonction de vraisemblance.En effet, on a :

Prob (yi = 0) = Prob (y∗i < c1) = F

c1σε− xiβ

σε

Prob (yi = 1) = Prob (c1 ≤ y∗i < c2) = Fc2σε− xiβ

σε− F c1

σε− xiβ

σε...

Prob (yi = m) = Prob (y∗i > cm) = 1− F

cmσε− xiβ

σε

De façon générale, on obtient le résultat suivant :

Proposition 1.2. Dans un modèle polytomique univarié ordonné satisfaisant la déf-inition 1.1, la probabilité associée à l’événement yi = j, ∀j = 0, 1, ..,m est définie par:

Prob (yi = j) = Fcj+1σε− xiβ

σε− F cj

σε− xiβ

σε∀i = 1.., N

avec par convention c0 = −∞ et cm+1 =∞.

Page 6: MASTER ECONOMETRIE ET STATISTIQUE … · MASTER ECONOMETRIE ET STATISTIQUE APPLIQUEE (ESA) Université d’Orléans Econométrie des Variables Qualitatives Chapitre 2 Modèles Multinomiaux

Econométrie des Variables Qualitatives. Cours C. Hurlin 5

Il ne reste plus alors qu’à construire la vraisemblance associée à l’échantillon y comme suit :

L (y,β, c1, .., cm,σε) =N

i=1

mi

j=0

Prob (yi = j)yij

=N

i=1

mi

j=0

Fcj+1σε− xiβ

σε− F cj

σε− xiβ

σε

yij

(1.3)

où la variable dichotomique yij est définie par :

yij =10

si yi = jsinon

∀i = 1.., N ∀j = 0, 1, ..,m

Généralement seuls les paramètres β = β/σε et cj = cj/σε sont identifiables. La vraisemblances’écrit alors en fonction de ces paramètres comme suit :

L y,β, c1, .., cm =N

i=1

mi

j=0

F cj+1 − xiβ − F cj − xiβyij

(1.4)

On vérifie en outre que le vecteur xi ne peut contenir de constante pour les mêmes raisond’identification qui avaient été évoquées dans le cas du modèle dichotomique en ce qui concernela normalisation du seuil γ. On ne peut identifier à la fois le paramètre associé à la constanteet les seuils cj .

Il n’y a alors aucune difficulté technique à maximiser la fonction de log-vraisemblance enβ, c1, ..et cm pour obtenir les estimateurs du maximum de vraisemblance dont les propriétés sontidentiques à celles étudiées dans le modèle dichotomique univarié, si ce n’est que l’on estime enoutre les paramètres de seuil cj :

β =argmax{β}

logL y,β, c1, .., cm (1.5)

cj =argmax{cj}

logL y,β, c1, .., cm (1.6)

avec

logL y,β, c1, .., cm =N

i=1

m

j=0

yij log F cj+1 − xiβ − F cj − xiβ (1.7)

où F (.) est une fonction de répartition donnée.

Nous allons à présent étudier plusieurs exemples de modèles qualitatifs multinomiaux ordon-nées afin de mieux appréhender le type de problèmes économiques auxquels cette modélisations’adapte. Ces exemples sont repris de Amemiya (1981).

1.1. Exemples de Modèles Multinomiaux Ordonnés

Considérons plusieurs exemples de modèles multinomiaux ordonnés.

Page 7: MASTER ECONOMETRIE ET STATISTIQUE … · MASTER ECONOMETRIE ET STATISTIQUE APPLIQUEE (ESA) Université d’Orléans Econométrie des Variables Qualitatives Chapitre 2 Modèles Multinomiaux

Econométrie des Variables Qualitatives. Cours C. Hurlin 6

1.1.1. Dosage d’insecticide : Gurland, Lee et Dahm (1960)

Le premier exemple relève de la bio-économétrie, domaine privilégié des premières applicationsdes modèles qualitatifs.. Il s’agit de l’étude de Gurland, Lee et Dahm (1960) parue dansBiometrics qui constitue une extension en multinomial de l’exemple de l’insecticide étudié dansle modèle dichotomique. On considère un dosage d’insecticide xi vaporisé sur le ieme individu etl’on note y∗i la tolérance de cet individu au produit. Naturellement, on suppose que la toléranceest inobservable et continue. On suppose pour simplifier que la tolérance y∗i est distribué selonune loi N µ,σ2 de paramètre inconnus. On suppose en outre que la variable observée yi quitraduit l’état de l’insecte peut prendre à présent trois valeurs, m = 3 et ∀i = 1.., N :

yi =

012

si l’individu i est vivantsi l’individu i est moribondsi l’individu i est mort

On suppose que l’individu meurt si et seulement si le dosage de l’insecticide dépasse latolérance xi > y∗i , et qu’il reste vivant si au contraire sa tolérance dépasse d’un montant γle dosage d’insecticide, c’est à dire si et seulement si y∗i > xi + γ, où γ est un paramètreinconnu. Entre les deux, l’insecte est mal en point. Un tel problème correspond bien à lastructure d’un modèle polytomique ordonné, puisque les valeurs prises par la variablemultinomiale (yi = 0, 1, 2) correspondent à des intervalles dans lesquels va se trouverune seule variable latente inobservable continue, à savoir la tolérance y∗i . En effet,un tel problème peut se modéliser sous la forme :

yi =

012

si y∗i > xi + γsi xi < y∗i ≤ xi + γsi y∗i ≤ xi

(1.8)

Les probabilités associées au trois modalités sont donc égales à :

Prob (yi = 0) = Prob (y∗i > xi + γ) = 1− Φ xi + γ − µ

σ= Φ

µ− γ − xiσ

Prob (yi = 1) = Prob (xi < y∗i ≤ xi + γ) = Φ

xi − µ+ γ

σ− Φ xi − µ

σ

Prob (yi = 2) = Prob (y∗i < xi) = Φ

xi − µσ

où Φ (x) désigne la fonction de répartition de la loi normale centrée réduite. Naturellement,puisque la somme de ces trois probabilité est égale à l’unité, seules deux probabilités seronteffectivement estimées. Considérons seulement Prob (yi = 0) et Prob (yi = 2) , c’est à dire lesprobabilités de rester vivant et de décès. L’estimation de la probabilité Prob (yi = 2) , sous laforme Prob (yi = 2) = Φ (β0 + β1x) , fournit un estimateur β0 du coefficient associé à la con-stante et un estimateur β1 du coefficient associé à xi. On peut alors identifier les paramètresstructurels σ et µ en résolvant le système trivial β0 = 1/σ et β1 = −µ/σ et proposer deux esti-mateurs σ = 1/β0 et µ = β1β0. De la même façon, l’estimation de la probabilité Prob (yi = 0) ,sous la forme Prob (yi = 0) = Φ (α0 + α1x) , fournit un estimateur α0 du coefficient associé à laconstante et un estimateur α1 du coefficient associé à xi. On peut alors identifier le paramètrestructurel manquant à savoir le seuil γ. En effet, on sait que α0 = (µ− γ) /σ, connaissant unevaleur de µ et de σ on peut en déduire un estimateur pour γ, tel que γ = µ− σα0. Naturelle-ment, l’estimateur du paramètre α1 = −1/σ est obtenu sous la contrainte α1 = −β0. Donc

Page 8: MASTER ECONOMETRIE ET STATISTIQUE … · MASTER ECONOMETRIE ET STATISTIQUE APPLIQUEE (ESA) Université d’Orléans Econométrie des Variables Qualitatives Chapitre 2 Modèles Multinomiaux

Econométrie des Variables Qualitatives. Cours C. Hurlin 7

dans ce modèle, l’estimation des probabilités Prob (yi = 0) et Prob (yi = 2) permet d’identifierles trois paramètres structurels µ,σ et γ. Notre bio-économètre connaît alors la distribution dela tolérance y∗i des insectes et le seuil γ d’insecticide.

1.1.2. Acquisition d’un bien immobilier : David et Legg (1975)

L’étude de David et Legg (1975) parue dans le Journal of Business and Economic Statistics,est une tentative de modélisation du prix des biens immobiliers en fonction d’un certain nom-bre de caractéristiques comme la taille du bien immobilier, l’âge de l’acquéreur, le revenu del’acquéreur, le nombre d’années d’études de l’acquéreur etc.. Les données de David et Leggsont présentées de la façon suivante. On observe si l’acquisition d’un bien immobilier a eulieu, les biens étant regroupés en trois catégories suivant leur prix. Etant donné la nature desdonnées utilisées, le prix de chaque bien est inobservable et seul son appartenance à l’une destrois catégories est observée :

yi =

012

si le prix du bien i acquis est inférieur à $28,999si le prix du bien i acquis est compris entre $29,000 et $54,999si le prix du bien i acquis est supérieur à $55,000

(1.9)

David et Legg (1975) proposent de modéliser la variable polytomique yi = 0, 1, 2 selonl’appartenance d’une variable inobservable y∗i à trois classes distinctes :

yi =

012

si y∗i < c1si c1 ≤ y∗i < c2si y∗i > c2

∀i = 1.., N (1.10)

où la variable latente y∗i est distribuée selon une loi normale N xiβ,σ2 , où le vecteur xi

comporte l’ensemble des caractéristiques du bien citées précédemment.. On suppose que levecteur xi ne comporte pas de constante. Le problème consiste donc à estimer les paramètresstructurels c1, c2, σ et les K paramètres du vecteur β. On a donc K +3 paramètres structurelsà estimer. Les probabilités associées aux trois modalités sont définies de la façon suivante :

Prob (yi = 0) = Prob (y∗i < c1) = Φ

c1σ− xiβ

σ

Prob (yi = 1) = Prob (c1 ≤ y∗i < c2) = Φc2σ− xiβ

σ− Φ c1

σ− xi β

σ

Prob (yi = 2) = Prob (y∗i > c2) = 1− Φ

c2

σ− xiβ

σ= Φ −c2

σ+ xi

β

σ

Dès lors, la log-vraisemblance de l’échantillon est définie par la fonction :

logL (y,β, c1, c2,σ) =N

i=1

yi0 log Φc1σ− xiβ

σ+ yi1 log Φ

c2σ− xiβ

σ− Φ c1

σ− xiβ

σ

+yi2 log Φ −c2σ+ xi

β

σ

Ce qui peut s’écrire sous une forme log-linéaire dans les paramètres :

logL y,β, c1, c2 =N

i=1

yi0 log Φ c1 − xiβ + yi1 log Φ c2 − xiβ − Φ c1 − xiβ

+yi2 log Φ −c2 + xiβ (1.11)

Page 9: MASTER ECONOMETRIE ET STATISTIQUE … · MASTER ECONOMETRIE ET STATISTIQUE APPLIQUEE (ESA) Université d’Orléans Econométrie des Variables Qualitatives Chapitre 2 Modèles Multinomiaux

Econométrie des Variables Qualitatives. Cours C. Hurlin 8

avec x = x/σ. La procédure du maximum de vraisemblance fournit alors une estimation pourles K + 2 paramètres β, c1 et c2. Dès lors, on ne peut pas dans ce cas identifier la variance σdu fait de la normalisation imposée par le choix de la distribution normale. Par conséquentl’estimation de ce modèle ne permet pas d’identifier les paramètres de seuil c1 et c2 et lesparamètres β, mais seulement les transformées β, c1 et c2. Ceci n’a pas d’importance dès lorsque l’on s’intéresse uniquement aux effets marginaux des variables xi sur la probabilité d’acheterdes biens immobiliers appartenant aux trois catégories. On peut par exemple calculer l’impactde la taille du logement sur la probabilité d’acheter un logement dont le prix est inférieur à$28,999 et comparer celle-ci avec l’impact de la taille du logement sur la probabilité d’acheterun logement dont le prix est supérieur à $55,000. En effet, on peut calculer 3 ∗N ∗K dérivéessuivantes :

∂Prob (yi = j)

∂x[k]i

∀i = 1.., N, ∀j = 0, 1, 2 ∀k = 1..,K

Dans cette étude, tout comme dans les modèles multinomiaux en général, il y a finalementplusieurs façons d’interpréter la variable latente y∗i .

Remarque Dans un modèle multinomial, il n’y a généralement aucune nécessité dedonner un nom et d’expliquer réellement ce qu’est la variable latente y∗i . Peuimporte ce qu’elle représente, il suffit juste de supposer que c’est une variablecontinue qui affecte la variable polytomique observée yi. Le fait de nommery∗i permet simplement de faciliter la justification économique du choix desvariables explicatives xi.

Dans le cas présent de l’étude David et Legg (1975), on peut dire que la variable latente y∗icorrespond au prix du bien immobilier. Dans ce cas, si cette variable est par ailleurs observable,il aurait été préférable au lieu d’estimer les probabilités, d’estimer directement la relation entrele prix du bien et les caractéristiques xi observées. Mais rien ne nous contraint dans le faitd’assimiler y∗i au prix des biens : cette variable inobservable y

∗i peut représenter n’importe

quelle grandeur économique susceptible d’affecter l’achat de biens des trois catégories de prix etqui elle même dépend des variables xi (taille du logement, revenu et âge de l’acquéreur etc..).Ce peut être par exemple, la disponibilité à payer le bien immobilier.

1.2. Application

On considère une application tirée d’une étude de J. Gunther de la Federal Reserve Bank deDallas, intitulée ”Between a Rock and a Hard Place : The CRA-Safety and Soundness Pinch”.Le fichier de données disponible sur le sitye web (??) est intitulé Gunther.xls. Cette étude portesur le Community Reinvestment Act (CRA), loi promulgué aux Etats Unis en 1977 et visantà encourager les institutions de dépôts (banques et autres institutions financières) à répondreaux besoins en crédit des communautés dans lesquelles elles opèrent2. Toutes les banques sontainsi évaluées par des instances de contrôle qui sont les suivantes : Office of the Comptrollerof the Currency (OCC), Board of Governors of the Federal Reserve System (FRB), Office ofThrift Supervision (OTS), and Federal Deposit Insurance Corporation (FDIC). En effet, la loirecquiert que les agences de contrôle mentionnées, évaluent régulièrement les performance desinstitutions au regard des objectifs du CRA.

2Pour un historique et une présentation plus global du CRA, consulter le sitehttp://www.ffiec.gov/cra/history.htm.

Page 10: MASTER ECONOMETRIE ET STATISTIQUE … · MASTER ECONOMETRIE ET STATISTIQUE APPLIQUEE (ESA) Université d’Orléans Econométrie des Variables Qualitatives Chapitre 2 Modèles Multinomiaux

Econométrie des Variables Qualitatives. Cours C. Hurlin 9

La performance des institutions en ce qui concerne le fait de favoriser les besoins en créditde la communauté est évalué dans le contexte des informations disponibles sur cette institution(capacités, contraintes diverses, stratégie..), des informations sur la communauté (démographie,données économiques, prêts, investissements..) et des informations sur ses concurrents et surl’état du marché. Une notation (ou rating) est alors attribué selon quatre modalité : yi = 1 pourperformance remarquable, yi = 2 pour performance satisfaisante,; yi = 3 pour performance àaméliorer, yi = 4 pour performance déplorable.

L’étude de Gunther porte sur 350 observations de ces rating et propose de modéliser cesratings en fonction de plusieurs variables explicatives intitulées respectivement loa, prl, equ,roa, sec, ass, metro et growth. La variable loa désigne le ratio prêts sur actif total de labanque, la variable prl désigne le ratio actifs douteux sur actif total, la variable equ désigne leratio capitaux propres sur actif, la variable roa désigne le ratio dividende sur actifs, la variablesec désigne le ratio investissements de valeurs sur actifs, la variable ass le logarithme de l’actifde la banque, la variable metro prend une valeur 1 si la banque à son siège dans une MSA (∩)et 0 sinon, et enfin la variable growth désigne le taux de croissance du Pib de l’état dans lequella banque opère. Dans le tableau ci dessous sont reproduit les valeurs ces différentes variablespour les 10 premiers individus de l’échantillon.

Figure 1.1:

Nous allons à présent modéliser le rating sous la forme d’un probit ordonné. En effet, dans cecas précis, les valeurs prises par la variable multinomiale peuvent correspondre à des intervallesdans lesquels va se trouver une variable latente inobservable. On a ici un ordre naturel surles modalités allant de la satisfaction la plus complète au regard des objectifs du CRA à laperformance déplorable. Pour modéliser ce probit ordonné sous Eviews, on choisit EstimateEquation dans le menu Quick, et l’on retient la méthode ORDERED - Ordered Choice avecune Error Distribution de type Normal. On indique ensuite la variable polytomique ainsi queles variables explicatives, la constante ne pouvant être introduite pour une raison de colinéarité.Les coefficients des variables roa et sec sont alors non significativement différents de zéro. Onretire donc ces variables et les résultats obtenus pour le probit ordonnés sont alors les suivants:On observe cette fois que toutes les variables sont significatives de même que les trois seuils

Page 11: MASTER ECONOMETRIE ET STATISTIQUE … · MASTER ECONOMETRIE ET STATISTIQUE APPLIQUEE (ESA) Université d’Orléans Econométrie des Variables Qualitatives Chapitre 2 Modèles Multinomiaux

Econométrie des Variables Qualitatives. Cours C. Hurlin 10

Figure 1.2: Estimation d’un Probit Ordonné

c1, c2 et c3 tels que :

yi =

1234

si y∗i < c1si c1 ≤ y∗i < c2si c2 ≤ y∗i < c3si y∗i > c3

∀i = 1.., N y∗i = xiβ + εi (1.12)

On obtient ainsi des réalisations c1 = −3.645, c2 = −2.725 et c3 = −1.61. On peut alorscalculer pour chaque banque la probabilité d’obtenir un rating très satisfaisant (yi = 1) de lafaçon suivante :

Prob (yi = 1) = Prob (y∗i < c1) = Φ c1 − xiβ

où c1 = c1/σε, β = β/σε. On peut donc estimer cette probabilité de la façon suivante :

Prob (yi = 1) = Φ c1 − xiβ (1.13)

où c1 est un estimateur convergent de c1 et où β est un estimateur convergent de β. Ainsi dansle cas de notre modèle pour l’individu 1, on montre que la réalisation de l’estimation de lavariable latente est :

x1β = 0.068 ∗ 5.24− 6.138 ∗ 0.0559− 11.273 ∗ 0.250−1.7245 ∗ 0.3982 + 0.7685 ∗ 0 + 10.748 ∗ 0.0120

= −3.359

Page 12: MASTER ECONOMETRIE ET STATISTIQUE … · MASTER ECONOMETRIE ET STATISTIQUE APPLIQUEE (ESA) Université d’Orléans Econométrie des Variables Qualitatives Chapitre 2 Modèles Multinomiaux

Econométrie des Variables Qualitatives. Cours C. Hurlin 11

Dès lors, on a :

Prob (y1 = 1) = Φ c1 − x1βΦ (−3.645 + 3.359)Φ (−0. 286)0.387

De la même façon, on peut calculer pour cette banque la probabilité que yi = 2 :

Prob (y1 = 2) = Φ c2 − x1β − Φ c1 − x1βΦ (−2.725 + 3.359)− Φ (−0. 286)Φ (0. 634)− 0.3870.736− 0.3870. 349

Ainsi pour tous les individus on peut calculer les probabilités associées aux quatre modalités.On obtient les résultats suivants pour les dix premiers individus :

Figure 1.3: Probabilités Estimées du Probit Ordonné

Page 13: MASTER ECONOMETRIE ET STATISTIQUE … · MASTER ECONOMETRIE ET STATISTIQUE APPLIQUEE (ESA) Université d’Orléans Econométrie des Variables Qualitatives Chapitre 2 Modèles Multinomiaux

Econométrie des Variables Qualitatives. Cours C. Hurlin 12

2. Modèles Multinomiaux Séquentiels

Avant de définir précisément ce que sont les modèles multinomiaux séquentiels, commençonspar définir leur champ d’application. Les modèles séquentiels sont utilisés pour ren-dre compte de choix effectués ou d’événements selon une séquence bien précise, leplus souvent dans le temps, et dont les réalisations successives conditionnent na-turellement l’ensemble des modalités futures. Ces modèles possèdent la particularité deconstruire la séquence des événements comme le produit des probabilités élémentaires associéesà la réalisation d’un seul évenement à chaque étape.

Definition 2.1. Soit T le nombre d’étapes et yi = 1, .., N une variable polytomiquedont les modalités sont 1, 2, .., T. On écrit alors la probabilité de s’arrêter à l’étapet comme une fonction Ft (xiβ) , t = 1, 2, .., T :

Prob (yi = j) =

j−1

s=1

[1− Fs (xiβ)]× Fj (xiβ) (2.1)

L’exemple typique est celui de la réussite aux examens, qui est bien entendu conditionnéepar la réussite aux examens antérieurs dans le cursus. Considérons l’exemple de la réussite aumaster. On cherche à modéliser la probabilité qu’un étudiant obtienne son Master en fonctionde caractéristiques individuelles, comme le revenu moyen des parents, la moyenne des notesau baccalauréat, la série du baccalauréat etc.. On note yi = 1 si le ieme étudiant a obtenu lebaccalauréat mais pas la licence, yi = 2 si l’étudiant a obtenu la licence mais pas le master etyi = 3 si l’étudiant a obtenu le master. Naturellement, la probabilité associée à l’obtention dumaster s’écrit :

Prob (yi = 3) =2

s=1

[1− Fs (xiβ)]× F3 (xiβ)

= [1− F1 (xiβ)]× [1− F2 (xiβ)]× F3 (xiβ)

De la même façon, la probabilité associée à l’obtention de la licence s’écrit :

Prob (yi = 2) =1

s=1

[1− Fs (xiβ)]× F2 (xiβ) = [1− F1 (xiβ)]× F2 (xiβ)

La probabilité que les individus n’obtiennent pas leur baccalauréat, c’est à dire que yi = 1,est calculée en utilisant tout l’échantillon constitué des deux sous groupes : les étudiants ayantobtenu le baccalauréat et ceux qui ont échoué (yi = 0 non modélisée). On utilise ensuite le souséchantillon des étudiants ayant obtenu le baccalauréat pour déterminer les caractéristiques dela probabilité d’obtenir la licence yi = 2. Et enfin, on utilise le sous échantillon des étudiantsayant obtenu la licence pour déterminer les caractéristiques de la probabilité d’obtenir le masteryi = 3.

Page 14: MASTER ECONOMETRIE ET STATISTIQUE … · MASTER ECONOMETRIE ET STATISTIQUE APPLIQUEE (ESA) Université d’Orléans Econométrie des Variables Qualitatives Chapitre 2 Modèles Multinomiaux

Econométrie des Variables Qualitatives. Cours C. Hurlin 13

2.1. Application

******************************* Application Eviews ******************************cf. Ordered Models- Chandek, Meghan Stroshine (1999). Race, expectations and evaluations of police perfor-

mance: An empirical assessment. Policing 22(4):675- http://faculty.smu.edu/tfomby/eco6352/data/

Page 15: MASTER ECONOMETRIE ET STATISTIQUE … · MASTER ECONOMETRIE ET STATISTIQUE APPLIQUEE (ESA) Université d’Orléans Econométrie des Variables Qualitatives Chapitre 2 Modèles Multinomiaux

Econométrie des Variables Qualitatives. Cours C. Hurlin 14

3. Modèles Multinomiaux Non Ordonnés

Nous allons à présent envisager la classe des modèles multinomiaux les plus fréquents enéconomie : les modèles multinomiaux non ordonnés. Il existe deux grandes classes demodèles multinomiaux non ordonnés suivant que ces modèles satisfont ou ne satisfont pas unehypothèse particulière qui est l’hypothèse d’Indépendence des Alternatives Non Perti-nentes (IANP ou IIA en anglais pour Independance of Irrelevant Alternative). Cette hy-pothèse traduit le fait que le rapport de deux probabilités associés à deux évenements partic-uliers est indépendant des autres événements. Ainsi, la première grande classe de modèle estconstitué par les modèles logit multinomiaux non ordonnés qui comprend notamment :

1. Les modèles logit multinomiaux indépendants ou modèles logit multinomiaux.

2. Les modèles logit multinomiaux conditionnels ou modèles logit conditionnels.

3. Les modèles logit multinomiaux universels ou modèles logit universels.

Tous ces modèles satisfont l’hypothèse IIA, or nous verrons qu’une telle hypothèse pose desproblèmes de cohérence dans certaines modélisations économiques. C’est pourquoi des modèlesalternatifs ont été développés de sorte à ne pas satisfaire cette hypothèse contestable : cetteseconde classe de modèles comprend notamment le modèle logit hierarchisé, le modèle probitmultinomial.

Toutefois, dans la pratique les modèles multinomiaux les plus fréquemment utilisés restentles modèles logit satisfaisant l’hypothèse IIA. C’est pourquoi dans cette section, nous nouslimiterons à l’étude de cette classe de modèles multinomiaux non ordonnés. Nousétudierons les modèles alternatifs dans la prochaine section. Mais avant de présenter la classedes logit multinomiaux non ordonnés, nous allons introduire ces modèles en décrivant leurutilisation essentielle, à savoir celle de rendre compte de choix probabilistes. Lesmodèles multinomiaux non ordonnés sont en effet avant tout des modèles permettant de décriredes choix individuels en présence d’utilité stochastique.

3.1. Des modèles de choix probabilistes

Supposons qu’un individu ait a effectuer un choix rationnel entre m + 1 modalités procurantm + 1 niveaux de satisfaction différents pour l’individu. On postule que les choix rationnelspeuvent être représentés par une fonction d’utilité. Rappelons qu’une fonction d’utilité U (ω)est définie à une transformée croissante près : si la fonction h (.) est une fonction croissanteet continue, h (U (ω)) est une autre fonction d’utilité associée au même préordre que celui deU (ω). On considère le cas où le niveau d’utilité est stochastique et décrit par une fonctionU (.) dépendant d’un terme aléatoire. Ce choix peut se justifier par ne mauvaise perceptionde la qualité des différentes modalités ou en raison d’une grande difficulté à évaluer de façoncertaine les niveaux d’utilité. On pose que pour chaque modalité j = 0, 1, ..,m, l’utilité del’individu s’exprime sous la forme suivante :

Uj = U (xj , εj) = v (xj) + εj ∀j = 0, 1, ..,m (3.1)

Page 16: MASTER ECONOMETRIE ET STATISTIQUE … · MASTER ECONOMETRIE ET STATISTIQUE APPLIQUEE (ESA) Université d’Orléans Econométrie des Variables Qualitatives Chapitre 2 Modèles Multinomiaux

Econométrie des Variables Qualitatives. Cours C. Hurlin 15

où v (.) est une fonction continue déterministe et où εj est une variable aléatoire i.i.d. dont la loiest décrite par la fonction de densité f (.) et la fonction de répartition F (.) . On suppose queles perturbations εj ,∀j = 0, 1, ..,m sont indépendantes. Ainsi l’utilité aléatoire associéeà la jememodalité dépend des caractéristiques propres à cette modalité

On définit une variable polytomique y qui prend m + 1 modalités suivant les choix del’individu :

y = j si l’individu choisit la jememodalité ∀j = 0, 1, ..,mDès lors, la probabilité que notre individu choisisse la modalité j correspond à la probabilité

que cette modalité lui confère un niveau d’utilité supérieure à toutes les autres modalités quis’offrent à lui. En effet, la probabilité que l’individu choisisse la modalité j est définie par :

Prob (y = j) = Prob {U (xj , εj) > U (x0, ε0) , U (xj , εj) > U (x1, ε1) ,....., U (xj , εj) > U (xk, εk) , ....., U (xj , εj) > U (xm, εm)} (3.2)

Prenons par exemple la probabilité que l’agent choisisse la modalité 0 :

Prob (y = 0) = Prob {U (x0, ε0) > U (x1, ε1) , U (x0, ε0) > U (x2, ε2) ,....., U (x0, ε0) > U (xk, εk) , ....., U (x0, ε0) > U (xm, εm)}

ce qui peut se réécrire sous la forme suivante :

Prob (y = 0) = Prob [U (x0, ε0) > U (xk, εk) ,∀k = 1, ..,m]= Prob [v (x0) + ε0 > v (xk) + εk,∀k = 1, ..,m]= Prob [εk < v (x0)− v (xk) + ε0,∀k = 1, ..,m]

Pour calculer cette probabilité à partir des fonctions de densité f (.) , rappelons la définitionde la densité jointe.

Definition 3.1. La densité jointe de deux v.a.r. continues X et Y , notée fX,Y (x, y) ≥0, satisfait les propriétés suivantes :

∀ (a, b, c, d) ∈ R4 P (a ≤ X ≤ b, c ≤ Y ≤ d) =b

a

d

c

fX,Y (x, y) dy dx (3.3)

−∞

−∞fX,Y (x, y) dy dx = 1 (3.4)

La fonction de distribution cumulative jointe, notée FX,Y (x, y) est alors définie par,∀ (a, b) ∈ R2 :

FX,Y (a, b) = P (X ≤ a, Y ≤ b) =a

−∞

b

−∞fX,Y (x, y) dy dx (3.5)

On sait en outre que si les variables X et Y sont dites indépendantes si et seulementsi fX,Y (x, y) = fX (x) fY (y) . L’indépendance implique par conséquent que FX,Y (x, y) =FX (x) FY (y) . Ainsi, si l’on suppose que les perturbations εj sont indépendantes et distribuées

Page 17: MASTER ECONOMETRIE ET STATISTIQUE … · MASTER ECONOMETRIE ET STATISTIQUE APPLIQUEE (ESA) Université d’Orléans Econométrie des Variables Qualitatives Chapitre 2 Modèles Multinomiaux

Econométrie des Variables Qualitatives. Cours C. Hurlin 16

selon une loi de distribution f (.) , et si l’on note vj = v (xj) , la probabilité Prob (y = 0) peuts’écrire sous la forme :

Prob (y = 0) =∞

−∞

m

k=1

Prob [εk < v0 − vk + ε0] f (ε0) dε0

=∞

−∞

v0−v1+ε0

−∞f (ε1) dε1 ×

v0−v2+ε0

−∞f (ε2) dε2 × ..

..×v0−vm+ε0

−∞f (εm) dεm f (ε0) dε0

En d’autres termes, si l’on note F (.) la fonction de répartition associée à la loi des pertur-bations εj , on a:

Prob (y = 0) =∞

−∞

m

k=1

F [v (x0)− v (xk) + ε0] f (ε0) dε0

De façon générale, quelque soit la modalité j = 0, 1, ..,m on montre ainsi que :

Prob (y = j) =∞

−∞

m

k=0k=j

F [v (xj)− v (xk) + εj ]

f (εj) dεj (3.6)

Supposons à présent que la loi des perturbations soit une loi de Gompertz3 :

F (z) = exp [− exp (−z)] (3.7)

f (z) = exp [−z − exp (−z)] (3.8)

Alors, il est possible de donner une expression analytique à la probabilité que l’agent choisissela modalité 0.

Prob (y = 0) =∞

−∞

m

k=1

exp [− exp (−v0 + vk − ε0)] exp [−ε0 − exp (−ε0)] dε0

=∞

−∞exp −

m

k=1

exp (−v0 + vk − ε0) exp [−ε0 − exp (−ε0)] dε0

********************************* FINIR DEMONSTRATION *********************************Finalement, on montre que :

Prob (y = 0) =exp [v (x0)]m

k=0

exp [v (xk)]=

1

1 +m

k=1

exp [v (xk)− v (x0)]

avec par convention v (x0) = 0. De façon générale, la probabilité que l’individu choisisse lamodalité j est définie par :

Prob (y = j) =exp [v (xj)]m

k=0

exp [v (xk)](3.9)

3Dite aussi loi des valeurs extrêmes.

Page 18: MASTER ECONOMETRIE ET STATISTIQUE … · MASTER ECONOMETRIE ET STATISTIQUE APPLIQUEE (ESA) Université d’Orléans Econométrie des Variables Qualitatives Chapitre 2 Modèles Multinomiaux

Econométrie des Variables Qualitatives. Cours C. Hurlin 17

Or, si l’on se restreint à une classe des fonctions v (.) affines, avec v (xj) = βjxj ,

cette formulation de la probabilité associée à la jeme modalité est précisément lamodélisation de la probabilité que l’on retiendra dans les modèles logit multinomi-aux non ordonnés.

Considérons à présent le cas où l’on dispose d’un ensemble de N individus indicés i = 1, .., Nayant les mêmes préférences que l’individu de référence de l’exemple précédent. De la mêmefaçon sous les hypothèse d’indépendance des perturbations εj et sous une hypothèse particulièresur la distribution des ces perturbations, on montre que la probabilité que l’individu i choisissela modalité j, ∀j = 0, ..,m, est définie par :

Prob (yi = j) =exp [v (xi,j)]mk=0 exp [v (xi,k)]

(3.10)

où xi,j désigne la valeur du vecteur de variable explicative pour l’individu i conditionnant lechoix de la jeme modalité.

Suivant la forme de la fonction v (xi,j) plusieurs modèles peuvent être envisagés.

1. Le modèle logit multinomial indépendant (ou logit multinomial) est obtenulorsque la fonction v (.) est une fonction linéaire dont les paramètres βj dif-fèrent selon les modalités et pour laquelle les variables explicatives varientuniquement en fonction des individus :

v (xi,j) = xiβj (3.11)

2. Le modèle logit multinomial conditionnel (ou logit conditionnel) est obtenulorsque la fonction v (.) est linéaire, les paramètres β sont indépendants desmodalités et que les variables explicatives diffèrent selon les modalités et lesindividus :

v (xi,j) = xi,jβ (3.12)

3. Le modèle logit multinomial universel (ou logit universel) est obtenu pourtoute fonction v (.) continue dépendant de paramètres βj conditionnels auxmodalités et de l’ensemble des variables explicatives du modèle :

v (xi,j) = v βj , xij (3.13)

3.2. Logit multinomial indépendant

Comme nous l’avons dit précédemment, le modèle logit multinomial indépendant4 (ou logitmultinomial) est obtenu lorsque la fonction v (.) est linéaire, les paramètres βj diffèrent selon lesmodalités et que les variables explicatives varient uniquement en fonction des individus, c’està dire lorsque v (xi,j) = xiβj . Dès lors, on peut définir la forme générale de la probabilité quel’individu i choisisse la modalité j de la façon suivante :

4 Il convient de faire attention ici sur la terminologie employée. Amemiya (1981) qualifie le modèle logit con-ditionnel de modèle indépendant puisque construit sur l’indépendance des perturbations. Donc pour Amemiya,le modèle indépendant ici étudié n’est qu’un cas particulier sans nom du logit universel..

Page 19: MASTER ECONOMETRIE ET STATISTIQUE … · MASTER ECONOMETRIE ET STATISTIQUE APPLIQUEE (ESA) Université d’Orléans Econométrie des Variables Qualitatives Chapitre 2 Modèles Multinomiaux

Econométrie des Variables Qualitatives. Cours C. Hurlin 18

Definition 3.2. Dans un modèle logit multinomial, la probabilité que l’individu ichoisisse la modalité j, ∀j = 0, ..,m, est définie par :

Prob (yi = j) =exp xiβjm

k=0

exp (xiβk)=

exp xiβj

1 +m

k=1

exp (xiβk)(3.14)

où le vecteur β0 est normalisé à zéro : β0 = 0.

Sous l’hypothèse de normalisation β0 = 0, la probabilité associée à la modalité de référence0 est définie par :

Prob (yi = 0) =1

m

k=0

exp (xiβk)=

1

1 +m

k=1

exp (xiβk)(3.15)

Exemple : Considérons à présent un exemple de modèle logit multinomial. On cherche àmodéliser la probabilité de défaillance d’abonnés en fonction de leur revenu, noté ri, et d’uneconstante. Supposons que la variable observable yi puisse prendre trois modalités : défaillancetotale (modalité 0), défaillance partielle (modalité 1) et remboursement intégral de la créance(modalité 2). L’hypothèse selon laquelle les paramètres βj diffèrent selon les modalités revienten fait à poser que :

Prob (yi = 1) =exp β

[1]1 + β

[2]1 ri

1 + exp β[1]1 + β

[2]1 ri + exp β

[1]2 + β

[2]2 ri

Prob (yi = 2) =exp β

[1]2 + β

[2]2 ri

1 + exp β[1]1 + β

[2]1 ri + exp β

[1]2 + β

[2]2 ri

où β[2]1 désigne le coefficient associé au revenu (2eme variable explicative) dans la modélisation

de la probabilité de la défaillance partielle (1ere modalité), tandis que β[2]2 désigne le coefficientassocié au revenu (2eme variable explicative) dans la modélisation de la probabilité de l’absencede défaillance (2eme modalité). On suppose ici que le revenu n’affecte pas de façon identiquela probabilité de défaillance partielle et la probabilité d’absence de défaillance. Par contre lerevenu du couple ne diffère suivant que ce dernier rembourse totalement ou de façon partielleson prêt. Essayons à présent de recenser les implications de la spécification d’un modèle logitmultinomial indépendant.

3.2.1. Spécification du Logit Multinomial

On considère un modèle multinomial pour lequel la probabilité que l’individu i choisisse lamodalité j = 0, ..,m s’écrit sous la forme :

Prob (yi = j) =exp xiβjm

k=0

exp (xiβk)

où les vecteurs de paramètres βj ∈ RK peuvent différer selon les modalités j. La premièreremarque sur cette spécification concerne la normalisation β0 = 0. En effet, supposons que

Page 20: MASTER ECONOMETRIE ET STATISTIQUE … · MASTER ECONOMETRIE ET STATISTIQUE APPLIQUEE (ESA) Université d’Orléans Econométrie des Variables Qualitatives Chapitre 2 Modèles Multinomiaux

Econométrie des Variables Qualitatives. Cours C. Hurlin 19

cette normalisation ne soit pas imposée a priori. On obtient alors une expression équivalente àla probabilité (3.14) en divisant les deux membres de la probabilité par exp (β0xi) :

Prob (yi = j) =exp xiβj / exp (xiβ0)m

k=0

exp (xiβk) / exp (xiβ0)

=exp xi βj − β0m

k=0

exp [xi (βk − β0)]

En posant β∗j = βj − β0, ∀j, et donc β∗0 = 0, on obtient alors une expression de la probabilitéProb (yi = j) similaire à celle de la définition, sans imposer la normalisation β0 = 0.

Prob (yi = j) =exp xiβ

∗j

m

k=0

exp (xiβ∗k)=

exp xiβ∗j

1 +m

k=1

exp (xiβ∗k)

(3.16)

Ainsi écrire la probabilité sous la forme exp β∗jxi / [1 +mk=1 exp (xiβ

∗k)] revient en fait

à normaliser les paramètres du modèle qui correspondent en fait aux différences entre lesparamètres originaux β et le vecteur de paramètres de la modalité de référence, ici en l’oc-currence β0. Ainsi, les paramètres s’interprètent comme des écarts au référentiel(c’est à dire aux paramètres de la modalité 0). On peut exprimer cette propriété de lafaçon suivante.

Proposition 3.3. Dans un modèle logit multinomial à m+1 modalités, la probabilitéassociée à la jeme modalité dépend des écarts βk − βj avec k = j et k = 0, 1, ..m :

Prob (yi = j) =exp xiβjm

k=0

exp (xiβk)=

1

1 +m

k=0k=j

exp xi βk − βj

(3.17)

Les m probabilité indépendantes dépendent alors de (m+ 1)m/2 différences deparamètres βk − βj . Les paramètres ne sont pas identifiables à moins d’imposerune contrainte de normalisation : par exemple β0 = 0.

Exemple : considérons un modèle avec 3 modalités (m = 2), j = 0, 1, 2. On a alors :

Prob (yi = 0) =1

1 + exp [xi (β1 − β0)] + exp [xi (β2 − β0)]

Prob (yi = 1) =1

1 + exp [xi (β0 − β1)] + exp [xi (β2 − β1)]

Prob (yi = 2) =1

1 + exp [xi (β0 − β2)] + exp [xi (β1 − β2)]

Par construction 2j=0 pj = 1. On dispose ainsi de deux probabilités indépendantes pour

déterminer trois différences de paramètres (β1 − β0) , (β2 − β0) et (β2 − β1) .Naturellement, cesdifférences de paramètres ne sont identifiables que si l’on impose une contrainte de normalisationdu type β0 = 0. Dès lors, on a deux probabilités indépendantes qui nous permettent d’identifierdeux paramètres β1 et β2. Ces paramètres s’interprètent comme des écarts au vecteur β0.

Corollary 3.4. Dans un modèle logit mutinomial à m+ 1 modalités :

• Les paramètres associés à la modalité de référence, généralement 0, sont nor-malisés à zéro : seuls les paramètres associées à m modalités peuvent êtreestimés.

Page 21: MASTER ECONOMETRIE ET STATISTIQUE … · MASTER ECONOMETRIE ET STATISTIQUE APPLIQUEE (ESA) Université d’Orléans Econométrie des Variables Qualitatives Chapitre 2 Modèles Multinomiaux

Econométrie des Variables Qualitatives. Cours C. Hurlin 20

• Les paramètres du modèle s’interprètent comme des écarts au référentiel (c’està dire aux paramètres β0 de la modalité 0)

• La log vraisemblance s’écrit uniquement en fonction des vecteurs β1, ...,βm

La seconde propriété centrale dans l’analyse des modèles logit multinomiaux concerne lesratio de probabilités pj/pk où j et k sont deux modalités distinctes. En effet, on montre lapropriété suivante :

Proposition 3.5. Dans le cas d’un modèle logit multinomial, le rapport des proba-bilités associés à deux modalités j et k distinctes, ∀j = 0, ..,m et ∀k = 0, ..,m, s’écritsous la forme :

pjpk=Prob (yi = j)

Prob (yi = k)=exp xiβjexp (xiβk)

= exp xi βj − βk (3.18)

Ce rapport de probabilités est indépendant des alternatives autres que j et k.

Ainsi, on illustre une hypothèse très particulière de ces modèles logit multinomiaux indépen-dants : à savoir l’hypothèse d’Indépendence des Alternatives Non Pertinentes (IANPou IIA en anglais pour Independance of Irrelevant Alternative). Cette hypothèse traduit le faitque le rapport de deux probabilités associés à deux évenements particuliers est indépendantdes autres événements. La question que se pose est alors de savoir si une telle hypothèse estsatisfaite en pratique.

Pour montrer à quel point cette hypothèse peut s’avérer inadéquate, reprenons l’exemple duchoix de transport proposé par Mac Fadden et connu sous le nom de ”bus bleu, bus rouge”. Onconsidère qu’un individu pour se rendre à son travail à le choix entre deux modes de transports.

yi =01

si l’individu prend le métrosi l’individu prend un bus bleu

On note pb = p0 la probabilité que l’individu prenne le bus bleu et pm = p1 la probabilitéque l’individu prenne le métro dans cette configuration de choix. Supposons maintenant quel’on offre à l’individu la possibilité soit de prendre un bus bleu, soit de prendre un bus rouge.

yi =

012

si l’individu prend le métrosi l’individu prend un bus bleusi l’individu prend un bus rouge

La probabilité que l’agent prenne le bus s’écrit donc sous la forme :

pb = Prob (yi = 1) + Prob (yi = 2) (3.19)

La probabilité que l’agent prenne le métro demeure pm = p0 et reste à un niveau inchangé parrapport au cas précédent étant donné les nouvelles alternatives proposées. Si l’on admet quela couleur du bus a vraisemblablement peu de chance d’affecter le choix du mode de transport,on doit avoir que les probabilités de sélection p1 et p2 doivent être égales :

Prob (yi = 1) = Prob (yi = 2) (3.20)

Page 22: MASTER ECONOMETRIE ET STATISTIQUE … · MASTER ECONOMETRIE ET STATISTIQUE APPLIQUEE (ESA) Université d’Orléans Econométrie des Variables Qualitatives Chapitre 2 Modèles Multinomiaux

Econométrie des Variables Qualitatives. Cours C. Hurlin 21

Maintenant, si l’hypothèse IIA est satisfaite le rapport entre la probabilité de prendre lemétro et la probabilité de prendre le bus devrait être la même dans les deux modèles : en effet,ce ratio doit être indépendant des alternatives. Or, ici ce ratio vaut p0/p1 dans la premièremodélisation et vaut :

pmpb=

p0p1 + p2

=1

2

p0p1

Ce ratio diffère de celui que l’on avait obtenu en l’absence de l’alternative ”bus rouge” : l’hy-pothèse IIA n’est donc pas satisfaite.

En conclusion, l’hypothèse IIA n’est que rarement satisfaite, ce qui pose le problème dela cohérence d’une modélisation de type logit multinomial pour rendre compte de choix prob-abilistes. Nous reviendrons dans la prochaine section sur cette hypothèse IIA et les modèlesalternatifs qui en rendement compte. Toutefois, le modèle logit multinomial indépendant esttrès souvent utilisé compte tenu de la simplicité de sa mise en oeuvre pratique. C’est ce quenous allons voir à présent en ce qui concerne l’estimation des paramètres de ce type de modèles..

3.2.2. Estimation des paramètres du logit multinomial

Tout comme dans le cas du modèle logit dichotomique, l’estimation des paramètres des modèleslogit multinomiaux peut se faire de différentes façons :

1. Méthodes du maximum de vraisemblance

2. Méthodes de moments : GMM, moments simulés etc..

3. Méthodes non paramétriques et semi-paramétriques

Nous n’étudierons ici que la méthode du maximum de vraisemblance à information complète.

Comme nous l’avons vu précédemment la vraisemblance associée à un modèle logit multino-mial indépendant àm+1modalités s’écrit en fonction dem vecteur de paramètres βj , j = 1, ..,mdu fait de la normalisation β0 = 0. Ainsi l’estimation des paramètres du modèle logit multino-mial s’effectue alors en maximisant la log-vraisemblance par rapport aux vecteurs de paramètres(β1,β2, ...,βm) :

logL (y,β1,β2, ...,βm) =N

i=1

m

j=0

yi,j log [Prob (yi = j)]

avec yi,j = 1 si yi = j et 0 sinon, et où les probabilités Prob (yi = j) sont définies par :

Prob (yi = j) =exp xiβjmk=0 exp (xiβk)

=exp xiβj

1 + mk=1 exp (xiβk)

Prob (yi = 0) =1

1 + mk=1 exp (xiβk)

avec β0 par convention.

Page 23: MASTER ECONOMETRIE ET STATISTIQUE … · MASTER ECONOMETRIE ET STATISTIQUE APPLIQUEE (ESA) Université d’Orléans Econométrie des Variables Qualitatives Chapitre 2 Modèles Multinomiaux

Econométrie des Variables Qualitatives. Cours C. Hurlin 22

Proposition 3.6. La log vraisemblance associée à un modèle logit multinomial àm+ 1 modalités j = 0, 1, ..,m s’écrit :

logL (y,β1,β2, ...,βm) =N

i=1

m

j=1

yi,jxiβj −N

i=1

log 1 +m

k=1

exp (xiβk) (3.21)

avec β0 = 0 par convention.

En effet, on sait que la log-vraisemblance est définie par la relation suivante :

logL (y,β1,β2, ...,βm) =N

i=1

m

j=0

yi,j log (pi,j)

=N

i=1

m

j=0

yi,j logexp xiβj

1 + mk=1 exp (xiβk)

Si l’on pose Hi = log [1 +mk=1 exp (xiβk)] , cette expression devient :

logL (y,β1,β2, ...,βm) =N

i=1

m

j=0

yi,jxiβj −N

i=1

Hi

m

j=0

yi,j

Sachant que par conventionβ0 = 0 on a donc :

N

i=1

m

j=0

yi,jxiβj =N

i=1

m

j=1

yi,jxiβj

Etant donnée la définition de la variable yi,j qui prend la valeur 1 si yi = j et 0 sinon, on aimmédiatement que :

m

j=0

yi,j = yi,0 + yi,1 + ..+ yi,m−1 + yi,m = 1

En effet, on sait que la variable yi ne peut prendre qu’une seule et même valeur parmi les m+1modalités, dès lors m

j=0 yi,j = 1. Ainsi, on obtient que :

N

i=1

Hi

m

j=0

yi,j

=N

i=1

Hi =N

i=1

log 1 +m

k=1

exp (xiβk)

Puisque en effet Ni=1 yi,0 = 1. On en déduit alors finalement que :

logL (y,β1,β2, ...,βm) =N

i=1

m

j=1

yi,jxiβj −N

i=1

log 1 +m

k=1

exp (xiβk)

On retrouve alors l’expression (3.21) de la log-vraisemblance. Notons au passage que la fonc-tion de log-vraisemblance d’un modèle logit multinomial indépendant est globale-ment concave5 et que par conséquent on peut utiliser différents algorithmes d’optimisationnumérique propres à ce type de problème (Newton Raphson par exemple) et que les résultatsne sont pas sensibles au choix des conditions initiales de ces algorithmes.

5La démonstration de ce résultat est laissée au lecteur à titre d’exercice.

Page 24: MASTER ECONOMETRIE ET STATISTIQUE … · MASTER ECONOMETRIE ET STATISTIQUE APPLIQUEE (ESA) Université d’Orléans Econométrie des Variables Qualitatives Chapitre 2 Modèles Multinomiaux

Econométrie des Variables Qualitatives. Cours C. Hurlin 23

Definition 3.7. Le gradient associé à la log-vraisemblance d’un modèle logit multino-mial est défini ∀z = 1, ..,m :

∂ logL (y,β1,β2, ...,βm)

∂βz=

N

i=1

(yi,z − pi,z)xi (3.22)

avec pi,z = Prob (yi = z) .

En effet, on a :

∂ logL (y,β1,β2, ...,βm)

∂βz=

∂βz

N

i=1

m

j=1

yi,jxiβj

− ∂

∂βz

N

i=1

log 1 +m

k=1

exp (xiβk)

=N

i=1

yi,zxi −N

i=1

exp (xiβz)

1 +mk=1 exp (xiβk)

xi

Connaissant la définition de pi,z = Prob (yi = z) , on a donc :

∂ logL (y,β1,β2, ...,βm)

∂βz=

N

i=1

yi,zxi −N

i=1

pi,zxi =N

i=1

(yi,z − pi,z)xi

On retrouve naturellement la même expression que dans le cas du modèle logit bivarié. Dela même façon, la matrice hessienne est définie par :

∂2 logL (y,β1,β2, ...,βm)

∂βj∂βk= −

N

i=1

pi,j (Ij,k − pi,k)xixi (3.23)

où la fonction indicatrice Ij,k est telle que Ij,k = 1 si k = j et 0 sinon.

Enfin, on peut naturellement étudier les effets marginaux dans un modèle logitmultinomial indépendant de la façon suivante.

Definition 3.8. Les effets marginaux d’une variation de la variable exogène x[k]i ,∀k = 1, ..,K sur la probabilité que l’individu i choisisse la jeme modalité, ∀j = 0, 1, ..,m,sont définis par :

∂pi,j

∂x[k]i

= pi,j β[k]j −

m

z=0

pi,zβ[k]z (3.24)

où β[k]j est la kemecomposante de βj associé à la variable explicative x

[k]i et où pi,j =

Prob (yi = j) désigne la probabilité que l’individu i choisisse la jeme modalité :

pi,j =exp xiβjm

z=0exp (xiβz)

(3.25)

Pour démontrer ce résultat, on pose H (xi) =mz=0 exp (xiβz) En effet, on sait que

∂pi,j

∂x[k]i

=∂

∂x[k]i

exp xiβjH

=1

H (xi)2

∂ exp xiβj

∂x[k]i

×H (xi)− exp xiβj∂H (xi)

∂x[k]i

=1

H (xi)2 β

[k]j exp xiβj ×H (xi)− exp xiβj

m

z=0

β[k]z exp (xiβz)

Page 25: MASTER ECONOMETRIE ET STATISTIQUE … · MASTER ECONOMETRIE ET STATISTIQUE APPLIQUEE (ESA) Université d’Orléans Econométrie des Variables Qualitatives Chapitre 2 Modèles Multinomiaux

Econométrie des Variables Qualitatives. Cours C. Hurlin 24

En simplifiant cette expression, on fait apparaître les probabilités pi,j = exp xiβj /H, eton trouve :

∂pi,j

∂x[k]i

= β[k]j

exp xiβjH (xi)

− exp xiβjH

m

z=0

β[k]zexp (xiβz)

H

= β[k]j pi,j − pi,j

m

z=0

β[k]z pi,z

On retrouve ainsi l’expression (3.24) des effets marginaux. Il convient de remarquer que,pour chaque individu, pour une variable explicative quelconque x[k]i , on doit calculer m + 1

effets marginaux associés aux probabilités pi,j pour j = 0, 1, ..,m.

Dans le cas d’un modèle dichotomique à deux modalités (m = 1), on retrouve évidemmentla formule proposée dans le premier chapitre. En effet, nous avions vu que pour un modèle logitunivarié :

∂pi

∂x[k]i

=exiβ

(1 + exiβ)2βk (3.26)

Selon la formule (3.24), dans un modèle à 2 modalités on doit avoir

∂pi,1

∂x[k]i

= pi,1 β[k]1 − pi,0β[k]0 − pi,1β[k]1

avec pi,1 = Prob (yi = 1) et pi,0 = Prob (yi = 0) = 1 − pi,1 et pi,1 = exiβ/ 1 + exiβ . Par

normalisation, on pose β[k]0 = 0, ∀k, dès lors, il vient ∂pi,1/∂x[k]i = pi,1β[k]1 − p2i,1β[k]1 ou encore :

∂pi,1

∂x[k]i

= β[k]1

exiβ

1 + exiβ− exiβ

1 + exiβ

2

= β[k]1

exiβ

(1 + exiβ)2

On retrouve naturellement la formule proposée dans le cadre du premier chapitre pour le modèlelogit dichotomique.

3.2.3. Exemples de modèles logit multinomial

Le exemple de modèle logit multinomial est tiré de Perloff et Watcher (1979). Aux Etats-Unis en 1977-1978 est mis en place un programme de subventions destiné à lutter contre lechômage endémique lié à la crise économique du début des années 70. Ce programme viseà proposer des réductions de taxes aux entreprises qui embauchent de nouveaux salariés etplus particulièrement des salariés non qualifiés. Perloff et Watcher (1979) proposent d’évaluerl’utilité de ce programme en régressant la variation en pourcentage de l’emploi dans la ieme

firme, notée y∗i , sur différentes variables explicatives incluant notamment une variable dummyindiquant si l’entreprise participe au programme. Etant donnés que les premiers résultats deces régressions n’étaient pas satisfaisant, les auteurs ont alors regroupées les entreprises en cinqclasses : celles pour lesquels y∗i était compris dans les intervalles S0 = ]−∞,−1] , S1 = ]−1, 2] ,S2 = ]2, 30] , S3 = ]30, 45] et S4 = [45,+∞[ . Ils ont alors estimé un modèle non ordonné detype logit multinomial en essayant de modéliser la probabilité

pi,j = Prob (y∗i ∈ Sj) (3.27)

Page 26: MASTER ECONOMETRIE ET STATISTIQUE … · MASTER ECONOMETRIE ET STATISTIQUE APPLIQUEE (ESA) Université d’Orléans Econométrie des Variables Qualitatives Chapitre 2 Modèles Multinomiaux

Econométrie des Variables Qualitatives. Cours C. Hurlin 25

en utilisant les mêmes variables explicatives que dans leurs premières estimations. Dans leurmodèle les variables xi,j sont indépendantes des modalités (xi,j = xi) et les coefficients βjvarient avec les modalités. On a vu que généralement lorsque la variable latente y∗iest continue, distribuée selon une loi normale et observable, il est préférable derégresser directement y∗i sur un ensemble de variables explicatives plutôt que devouloir modéliser les probabilités que y∗i tombe dans certains intervalles. Pourtant,si y∗i est distribuée selon une loi inconnue et non normale qui dépend de xi d’une façon pluscompliquée qu’un simple problème de localisation dans un intervalle, la procédure de Perloff etWatcher peut donner de meilleurs résultats que les MCO de y∗i sur xi.

******************************************* Chercher d’autres applications sur EconLit ******************************************

3.3. Application

*********************************************** Application Eviews ou Limdep à programmer ***********************************************

3.4. Logit Conditionnel

Comme nous l’avons vu, le modèle logit multinomial indépendant permet d’envisager une mod-élisation où les paramètres diffèrent selon les modalités, mais où les variables explicatives sontles mêmes quelles que soient les modalités. Ces dernières ne varient qu’avec les individus. Sil’on reprend la notation de l’utilité stochastique utilisée précédemment, on a un modèle où laprobabilité que l’individu i choisisse la modalité j s’écrit sous la forme :

Prob (yi = j) =exp [v (xi,j)]m

k=0

exp [v (xi,k)](3.28)

où la fonction v (.) est linéaire, les paramètres βj diffèrent selon les modalités et que les variablesexplicatives varient uniquement en fonction des individus :

v (xi,j) = xiβj (3.29)

Une alternative à ce modèle logit multinomial consiste à supposer qu’au contraire lesparamètres β sont indépendants des modalités et que ce sont les variables explica-tives qui diffèrent selon les modalités et les individus :

v (xi,j) = xi,jβ (3.30)

On obtient alors, un modèle logit multinomial conditionnel (ou logit condition-nel) introduit par McFadden (1973). La définition d’un modèle logit conditionnel est ainsila suivante :

Definition 3.9. Dans un modèle logit conditionnel, la probabilité que l’individu ichoisisse la modalité j, ∀j = 0, ..,m, est définie par :

Prob (yi = j) =exp (xi,jβ )m

k=0

exp (xi,kβ)=

exp x∗i,jβ

1 +m

k=1

exp x∗i,kβ(3.31)

Page 27: MASTER ECONOMETRIE ET STATISTIQUE … · MASTER ECONOMETRIE ET STATISTIQUE APPLIQUEE (ESA) Université d’Orléans Econométrie des Variables Qualitatives Chapitre 2 Modèles Multinomiaux

Econométrie des Variables Qualitatives. Cours C. Hurlin 26

où par convention x∗i,j = xi,j − xi,0.

Nous allons à présent étudier quels sont les avantages et limites de cette spécification avantde proposer différentes applications.

3.4.1. Spécification du logit conditionnel

Commençons par étudier le rapport de probabilités dans un modèle logit conditionnel. Onconstate immédiatement que ce modèle vérifie l’hypothèse IIA tout comme le modèle logitmultinomial.

Proposition 3.10. Dans le cas d’un modèle logit conditionnel, le rapport des prob-abilités associés à deux modalités j et k distinctes, ∀j = 0, ..,m et ∀k = 0, ..,m, s’écritsous la forme :

pjpk=Prob (yi = j)

Prob (yi = k)=exp (xi,jβ)

exp (xi,kβ)= exp [(xi,j − xi,k)β] (3.32)

Ce rapport de probabilités est indépendant des alternatives autres que j et k.

Ainsi, le modèle logit conditionnel de McFadden vérifie l’hypothèse d’Indépendence desAlternatives Non Pertinentes (IANP ou IIA en anglais pour Independance of IrrelevantAlternative). Donc l’avantage de ce modèle ne se situe pas dans ses propriétés vis à vis del’hypothèse d’IIA.

L’avantage de ce modèle se situe d’avantage dans la possibilité qui est offerte de prédire laprobabilité d’une nouvelle modalité (virtuelle) en fonction de variables explicatives simulées.

Proposition 3.11. Le modèle logit conditionnel permet d’estimer la probabilité as-sociée à une modalité virtuelle de la façon suivante :

Pm+1 =exp x∗i,m+1β

1 +m

k=1

exp x∗i,kβ + exp x∗i,m+1β(3.33)

où β désigne un estimateur convergent de β obtenu sur la base des modalitésj = 0, ..,m existantes et où x∗i,m+1 est une estimation des caractéristiques exogènesassociées à la m+ 1eme modalité virtuelle.

C’est l’exemple typique du modèle hypothétique de choix de transport cité dans Amemiya(1981) et Alban (2000). Prenons l’exemple d’une collectivité territoriale envisageant la miseen place d’un nouveau mode de transport public, le tramway, en plus des modes de transportscollectifs existant (le bus pour simplifier). Pour évaluer la probabilité que les administréschoisissent le tramway, on conduit tout d’abord une enquête sur les choix des modes de transportexistant : le but est de calculer la probabilité que l’individu choisisse le bus (modalité 1), lavoiture (modalité 2), ou le vélo (modalité 3). On a ici m + 1 = 4 modalités, la modalitéde référence (codée 0) étant les autres modes de transports (marche à pieds, roller, auto-stopetc..). Les variables explicatives sont exprimées en différences par rapport à leur valeur prisesdans la modalité 0. Il s’agit par exemple du temps de transport moyen du domicile au lieu detravail pour le mode j, noté ti,j = x

[1]i,j et le coût au kilomètre de ce mode, noté ci,j = x

[2]i,j ,

Page 28: MASTER ECONOMETRIE ET STATISTIQUE … · MASTER ECONOMETRIE ET STATISTIQUE APPLIQUEE (ESA) Université d’Orléans Econométrie des Variables Qualitatives Chapitre 2 Modèles Multinomiaux

Econométrie des Variables Qualitatives. Cours C. Hurlin 27

pour l’individu i. Le modèle donne alors la probabilité qu’un individu caractérisé par des tempsrelatifs (ti,1, ti,2, ti3) et des coûts (ci,1, ci,2, ci3) choisisse le mode de transport j = 1, 2, 3. Laprobabilité que l’individu i choisisse le bus est par exemple égale à :

Prob (yi = 1) =exp (β0 + β1 ti,1 + β2 ci,1)

1 +3

k=1

exp (β0 + β1 ti,j + β2 ci,j)

=exp x∗i,1β

1 +3

k=1

exp x∗i,kβ

avec β = (β0 β1 β2) et x∗i,j = (1 ti,j ci,j) .

Comme le mode de transport métro (modalité 4) n’existe pas encore, les variables de tempsde trajet ti,4 et de coût ci,4 ne sont pas disponibles. Mais elles peuvent être simulées à partird’une évaluation du temps de trajet du métro et du coût au kilomètre de ce mode de transportdans d’autres villes. Soient ti,4 et ci,4 les évaluations correspondantes. Si l’on dispose en outred’un estimateur convergent β du vecteur de paramètres β, on peut alors calculer la probabilitéqu’un individu i prenne le métro lorsque celui-ci sera effectivement mis en place :

Prob (yi = 4) =exp β0 + β1 ti,4 + β2 ci,4

1 +3

k=1

exp β0 + β1 ti,j + β2 ci,j + exp β0 + β1 ti,4 + β2 ci,4

Cela donne la probabilité que l’individu i choisisse le métro plutôt que les autres modes detransport.

3.4.2. Estimations des paramètres du logit conditionnel

Tout comme dans le cas du modèle logit multinomial, plusieurs méthodes peuvent être util-isées pour estimer les paramètres d’un modèle logit conditionnel : méthodes du maximumde vraisemblance, méthodes de moments, méthodes non paramétriques et semi-paramétriques.Nous n’étudierons ici que la méthode du maximum de vraisemblance à information complète.

La vraisemblance associée à un modèle logit conditionnel àm+1modalités s’écrit en fonctiond’un vecteur β ∈ RK de K paramètres.

logL (y,β) =N

i=1

m

j=0

yi,j log [Prob (yi = j)]

avec yi,j = 1 si yi = j et 0 sinon, et où les probabilités Prob (yi = j) sont définies par :

Prob (yi = j) =exp (xi,jβ )m

k=0

exp (xi,kβ)=

exp x∗i,jβ

1 +m

k=1

exp x∗i,kβ

avec par convention x∗i,j = xi,j − xi,0.Proposition 3.12. La log vraisemblance associée à un modèle logit conditionnels’écrit alors :

logL (y,β) =N

i=1

m

j=0

yi,jxi,jβ −N

i=1

logm

k=0

exp (xi,jβ) (3.34)

=N

i=1

m

j=1

yi,jx∗i,jβ −

N

i=1

log 1 +m

k=1

exp x∗i,jβ

Page 29: MASTER ECONOMETRIE ET STATISTIQUE … · MASTER ECONOMETRIE ET STATISTIQUE APPLIQUEE (ESA) Université d’Orléans Econométrie des Variables Qualitatives Chapitre 2 Modèles Multinomiaux

Econométrie des Variables Qualitatives. Cours C. Hurlin 28

avec x∗i,j = xi,j − xi,0 par convention.

En effet, on sait que la log-vraisemblance est définie par la relation suivante :

logL (y,β) =N

i=1

m

j=0

yi,j log (pi,j)

=N

i=1

m

j=0

yi,j logexp x∗i,jβ

1 + mk=1 exp x∗i,jβ

On en déduit la relation suivante :

logL (y,β) =N

i=1

m

j=0

yi,jx∗i,jβ −

N

i=1

m

j=0

yi,j

log 1 +m

k=1

exp x∗i,jβ

=N

i=1

m

j=1

yi,jx∗i,jβ −

N

i=1

log 1 +m

k=1

exp x∗i,jβ

puisque par construction mj=0 yi,j = 1 et que x∗i,0 = 0. On retrouve alors l’expression (3.34)

de la log-vraisemblance. De la même façon que pour un modèle logit multinomial, la fonctionde log-vraisemblance d’un modèle logit conditionnel est globalement concave.

3.4.3. Exemples de modèles logit conditionnel

Un premier exemple de modèle logit conditionnel est donné dans l’étude de 1976 de McFadden(prix Nobel 2000). Dans cette étude, préalablement réalisée en 1968, McFadden utilise un logitconditionnel pour analyser la sélection des projets autoroutiers faite par la division californiennedes autoroutes (California Division of Highways) pour les districts de San Fransisco et de LosAngles durant les années 1958-1966. L’échantillon porte sur N = 65 projets. Le iemeprojetpeut être choisi parmi mi routes possibles et la probabilité de sélection est donnée par :

Prob (yi = j) =exp (xi,jβ )

mi

k=0

exp (xi,kβ)∀j = 0, 1, ..,mi (3.35)

où xi,j est un ensemble de caractéristiques attribuées à la route j dans le projet i (duréede trajet, nombre de kilomètre, difficulté de construction etc..). Naturellement pour chaqueprojet, le nombre de routes possibles diffère : d’où la présence d’un terme mi pour le nombre demodalités. Naturellement, l’ensemble des caractéristiques xi,j diffère avec la nature du projetmais aussi selon les routes envisagées pour ce projet.

McFadden considère deux ensembles de variables explicatives xi,j : un premier ensemble necomportant que des variables de coûts et de bénéfices, le second ensemble regroupe les variablesdu premier ainsi que des variables qui expriment les sentiments de la population sur le projet etle degré selon lequel la population sera affectée par le projet. A chaque ensemble de variablesexplicatives, McFadden associe un modèle logit conditionnel différent et le choix du modèle estfait selon le critère de la log-vraisemblance et le critère du nombre de prédictions fausses. Ce quemontre ainsi McFadden c’est que pour chaque projet le classement entre les différentes routes(selon la probabilité de sélection pi,j) diffère selon le modèle utilisé. Suivi que l’on ne considère

Page 30: MASTER ECONOMETRIE ET STATISTIQUE … · MASTER ECONOMETRIE ET STATISTIQUE APPLIQUEE (ESA) Université d’Orléans Econométrie des Variables Qualitatives Chapitre 2 Modèles Multinomiaux

Econométrie des Variables Qualitatives. Cours C. Hurlin 29

que des variables de coûts - bénéfices ou des variables liées aux souhaits de la population, lesprobabilités affectés pour un même projet aux différentes routes varient.

3.4.4. Applications

*********************************************** Application Eviews ou Limdep à programmer ***********************************************

3.5. Logit Universel

La dernière catégorie des modèles logit multinomiaux est celle du logit universel, qui commeson nom l’indique englobe le logit multinomial indépendant et le logit multinomial conditionnelde McFadden. Si l’on reprend la notation de l’utilité stochastique utilisée précédemment, on aun modèle où la probabilité que l’individu i choisisse la modalité j s’écrit sous la forme :

Prob (yi = j) =exp [v (xi,j)]m

k=0

exp [v (xi,k)](3.36)

où la fonction v (.) est linéaire, les paramètres βj diffèrent selon les modalités et que les variablesexplicatives varient uniquement en fonction des individus :

Definition 3.13. Le modèle logit multinomial universel (ou logit universel) est obtenupour toute fonction v (.) continue dépendant de paramètres βj conditionnels auxmodalités et de l’ensemble des variables explicatives du modèle :

v (xi,j) = v βj , xij (3.37)

La probabilité que l’individu i choisisse la modalité j, ∀j = 0, ..,m, est alors définiepar :

Prob (yi = j) =exp v βj , xijm

k=0

exp v βj , xij

(3.38)

On peut montrer que si les fonctions v βj , xij dépendent de l’ensemble des caractéris-tiques, le modèle logit universel ne satisfait pas l’hypothèse d’indépendance des alternativesnon pertinentes (IIA). Lorsque v (.) est linéaire dans les paramètres βj , on retrouve alors lemodèle logit indépendant.

Page 31: MASTER ECONOMETRIE ET STATISTIQUE … · MASTER ECONOMETRIE ET STATISTIQUE APPLIQUEE (ESA) Université d’Orléans Econométrie des Variables Qualitatives Chapitre 2 Modèles Multinomiaux

Econométrie des Variables Qualitatives. Cours C. Hurlin 30

4. L’hypothèse d’indépendance des alternatives non pertinentes

Tests + modèles alternatifs.

4.1. Test de l’hypothèse IIA

4.2. Modèle Alternatifs

4.2.1. Probit multinomial

4.2.2. Logit Hierarchisé

cf amemiya

Page 32: MASTER ECONOMETRIE ET STATISTIQUE … · MASTER ECONOMETRIE ET STATISTIQUE APPLIQUEE (ESA) Université d’Orléans Econométrie des Variables Qualitatives Chapitre 2 Modèles Multinomiaux

Econométrie des Variables Qualitatives. Cours C. Hurlin 31

Bibliographie

Amemiya T. (1981), ”Qualitative Response Models : A Survey”, Journal of Economic Littera-ture, 19(4), 481-536

Alban T. (2000), ”Econométrie des Variables Qualitatives”, Dunod.

David J.M. et LeggW.E. (1975), ”An application of Multivariate Probit Analysis to the Demandfor Housing”, Journal of Business and Economic Statistics, August 1975, 295-300

Gourieroux C. (1989), ”Econométrie des Variables Qualitatives”, Economica.

Gurland J., Lee I.et Dahm P. (1960), ”Polytchotomous Quantal Response in Biological Assay”,Biometrics, Sept. 1960, 382-388.

Greene W.H. (1997), ”Econometric Analysis”, Londres, Prentice Hall.

Judge G.G., Miller D.J. et Mittelhammer R.C. (2000), ”Econometric Foundations”, CambridgeUniversity Press.

Maddala. G.S. (1983), ”Limited-dependent and Qualitative Variables in Econometrics”, Econo-metric Society Monographs, 3, Cambrige University Press.

McFadden D. (1976), ”The Revealed Prefrences of a Government Bureaucracy: Empirical Ev-idence”, Bell Journal of Economic Mangament, Spring 1976, 55-72

Spector L.C. et MazzeoMcFadden M. (1980), ”Probit Analysis and Economic Education”, Jour-nal of Economic Education, 11(2), 37-44

Tobin J. (1958), ”Estimation of Relationships for Limited Dependent Variables”, Econometrica,26, 24-36.