Chapitre 2
Les indices
Chapitre 2 : Les indices
1. Définition et propriétés
En sciences sociales, les grandeurs varient dans l’espace et dans le temps :
- Dans le temps, puisqu’elles prennent des valeurs différentes à différentes dates.
- Dans l’espace, puisqu’elles prennent des valeurs différentes d’une région à l’autre.
Ce n’est pas toujours facile de pouvoir comparer des grandeurs. EX :
X Y
2000 53 492 1282005 64190 154
1,20 1,20
Chapitre 2
Pour faciliter la comparaison, on a recours à la notion d’indice.Définition : Un indice, c’est un rapport positif ou nul
Il existe des indices synthétiques, qui sont des rapports obtenus avec des grandeurs complexes (composés de plusieurs indices simples).
Ex: l’indice des prix est un indice qui résume l’évolution des prix de grandeurs hétérogènes (prix du chocolat et prix d’un vidéoprojecteur). La difficulté est l’agrégation de ces grandeurs si différentes.
Chapitre 2
2. Les indices simples
Notons la date t=0 : date de base (situation de base) et la date t : date ou période courante. Soit deux valeurs V0 (valeur de départ) et Vt (valeur d’arrivée), on appelle
- indice simple ou élémentaire
- indice simple base 100 :0
0/ V
VI t
t
1000
0/ V
VI t
t
Chapitre 2
Exemple : Evolution d’un prix entre 2000 et 2005 (base 100 en 2000)
100Pr
Pr
2000
20052000/2005
ix
ixI
Chapitre 2
100Pr
Pr/
FR
RPFRRP ix
ixI
Exemple : Rapport d’un prix entre la Région parisienne (RP) et la France entière(FR) (base 100 pour l’ensemble de la France)
Chapitre 2
3. Décomposition d’indices
1000/1
0/21/2
I
II
1001
21/2
V
VI
1002000/2002
2000/20052002/2005
I
II
Chapitre 2
3.1 Propriétés des indices élémentaires
- La circularité entre t=1 et t=2
En généralisant :100
10/''/0/ tttt III
100
10/11/20/2 III
Chapitre 2
On se ramène à l’expression précédente :
Pour comparer deux grandeurs simples, il suffit de faire le rapport de leurs indices.
Généralisation :
1000/'
0/'/
t
ttt I
II
100...
100100100100 1/2/31/20/1
0/tt
t
IIIII
Chapitre 2
- La réversibilité
Quand on inverse le rôle de la base et de la période courante, l’indice élémentaire s’inverse à près.410
4/00/ 10 tt II
Chapitre 2
Propriété secondaire : Produits d’indices
Si a=bxc
EX : RT=PxQ (indice des prix et indice des quantités=indice de la recette totale)
100
10/0/0/ cIbIaI ttt
Chapitre 2
4. Les indices synthétiques
Un indice synthétique résume une série d’indices élémentaires
Les indices synthétiques les plus utilisés
Valeur=prix x quantité
L’indice de la valeur s’écrit :
10000
0/
i
iii
it
it
t qp
qppqI
Chapitre 2
Le problème de cet indice, c’est qu’on ne peut attribuer la cause de l’évolution : ce peut être toute combinaison des prix ou des quantités. Il faut ainsi éliminer l’influence des prix pour calculer un indice des quantités et éliminer l’influence des quantités pour calculer un indice des prix.
Par exemple pour un indice simple des prix d’un bien :
10000
00/
ii
iit
t qp
qppqI
Chapitre 2
Indice synthétique des prix
Indice synthétique des quantités
10000
0
0/
i
iii
iit
t qp
qppI
10000
0
0/
i
iii
it
i
t qp
qpqI
Chapitre 2
Exemple de calculs d’indices synthétiques (de prix et de quantités) avec trois biens
prix B1 B2 B3dates
0 0,07 10 352 0,14 20 50
quantités B1 B2 B3dates
0 30 0,5 0,152 20 0,4 0,11
Chapitre 2
1. Calculer l’indice d’évolution de la valeur de B1
2. Calculer l’indice synthétique des prix
3. Calculer l’indice synthétique des quantités
Chapitre 2
Exemple de la propriété de circularité : trouver IND2007/2006
ou100
10/''/0/ tttt III
Prix de X dates indices150 € 2005 100210 € 2006 140230 € 2007 153,3
1000/'
0/'/
t
ttt I
II
Chapitre 3
Le modèle Linéaire Simple (La méthode des moindres
carrés ordinaires)
1. PRESENTATION DU MODELE Définition
La régression est l’outil le plus utilisé pour estimer une équation linéaire.
La régression permet de décrire et d’évaluer la relation entre une variable dépendante et une (ou plusieurs) variable(s) indépendante(s).
La variable dépendante est définie par y et la variables indépendantes par x.– Dans le modèle de régression simple, k=1.
– Dans le modèle de régression multiple, k>1.
I. PRESENTATION DU MODELE Définition
Quelques noms pour les variables y et x.y x
variable dépendante variable indépendante variable de contrôle
variable à expliquer variable explicative (régresseur)
Dans une régression, la variable y et la ou les variables x sont traitées de manière asymétrique.– La variable y est supposée être aléatoire ou ‘stochastique’. Elle
possède une distribution de probabilité.
– La ou les variables x sont supposée(s) avoir des valeurs fixes d’un échantillon à l’autre (elles ne sont pas aléatoires).
I. PRESENTATION DU MODELE Définition
Dans le modèle de régression simple, il n’y a qu’une une seule variable x (k=1).
Le modèle de régression linéaire simple peut être spécifié de la manière suivante:– Pour des données temporelles (t=1,…,n)
– yt = a0 + a1xt + εt
– Pour des données en coupe transversale (i=1,…,N)
– yi = a0 + a1xi + εi
I. PRESENTATION DU MODELE Le Rôle de
La relation spécifiée entre y et x ne peut pas être déterministe.– Il nous est impossible de connaître le modèle ‘vrai’ de
régression pour y: E(y|x) = a0 + a1x : Il est (souvent) impossible (ou trop coûteux) d’observer la totalité de la population de Y et X.
Comme le modèle spécifié ne sera jamais rigoureusement exact, un terme aléatoire (aussi appelé ‘terme d’erreur’) est ajouté.– Ce terme est et restera inconnu. On ne pourra en
obtenir qu’une estimation (e).
I. PRESENTATION DU MODELE Le Rôle de
Le terme aléatoire synthétise:1.Une erreur de spécification
• La variable explicative peut ne pas être suffisante pour rendre compte de la totalité du phénomène expliqué.
(Le terme aléatoire synthétise l’ensemble des informations non explicitées dans le modèle)
2.Une erreur de mesure• Les données ne représentent pas exactement le
phénomène.• Il y a des données manquantes.
3.Une erreur de fluctuation d’échantillonnage Les observations comprises dans l’échantillon, et donc
les estimations, peuvent être différentes.
I. PRESENTATION DU MODELE Conséquence du terme aléatoire
Comme les valeurs vraies de a0 et a1 ne sont pas connues, elles doivent être estimées.– On dérive les formules des estimateurs de a0 et a1,
notés respectivement â0 et â1.• L’estimation de a est la valeur particulière que prend
l’estimateur â pour un échantillon donné.• Le modèle de régression linéaire estimé peut
s’écrire:– y = â0 + â1x + eâ0 et â1 possèdent une distribution de probabilité : ( a0
et a1 sont des constantes).â0 et â1 suivent les mêmes lois de distribution que y et
e.
II. ESTIMATION DES PARAMETRESLa méthode des MCO (moindres
carrés ordinaires)• La méthode la plus souvent
utilisée pour estimer les paramètres a0 et a1 est la méthode des Moindres Carrés Ordinaires (MCO/OLS).– Elle consiste à ajuster un
nuage de points à l’aide d’une droite en minimisant la distance au carré entre chaque valeur observée et la droite.
– Cette distance mesure le résidu (l’erreur/la partie non expliquée)pour chaque observation:
•
y x
0ˆ888 yye
0ˆ555 yye
De manière analytique, il s’agit de minimiser la Somme des Carrés des Résidus (SCR/RSS), c.à.d. :
• Minimisons la fonction L, évaluée en â1 et â2, en dérivant par rapport à chacun des deux paramètres:
n
ttt
ttt
n
tt
aa
xaayL
xaay
Min
1
210
210
2
1
2
,
)( Posons
)( or,
10
(2) 0)ˆˆ(2),(
(1) 0)ˆˆ(2),(
101
10
100
10
tttt
ttt
xaayxa
ââL
xaaya
ââL
II. ESTIMATION DES PARAMETRESLa méthode des MCO
On obtient l’estimateur de a0 à partir de la première équation comme suit :
ˆˆ
0ˆˆ
0ˆˆ
0ˆˆ
0ˆˆ
0)ˆˆ(
10
10
10
10
10
10
xaya
xaay
xnaanynn
xnaan
n
yn
xaany
xaay
tt
tt
t ttt
ttt
Calcul des estimateurs
L’estimateur de a1 est obtenu à partir de la seconde comme suit:
B
xxx
A
yyxa
xxxayyx
xaxayyxa
xaayx
tt
tt
ttttt
tttt
tttt
)(
)(ˆ
0)(ˆ)(
0)ˆˆ(:aon ,ˆutilisant En
0)ˆˆ(
1
1
110
10
Calcul des estimateurs
• On formule l’estimateur de a1 en terme de variance-covariance :
222
2222222
)()2(
22
))((
)(
xxxxxx
xnn
xxnxxnxnxxnxB
yyxx
yxyxyxyxyxn
yxnyxyx
yxnyxnyxyxA
ttt
tttt
tt
ttttt
ttt
ttt
Calcul des estimateurs
• En remplaçant A et B par leur valeur, on obtient:
Car en divisant chaque terme par (n-1), on a
)(
),(
)(
))((ˆ
21 XV
YXCov
xx
yyxxa
tt
ttt
2
,
21 ˆ
ˆ
)1(
)()1(
))((
ˆx
xy
tt
ttt
n
xxn
yyxx
a
Calcul des estimateurs
• Le coefficient de régression mesure l’impact d’une variation (c.à.d. l’effet propre/partiel) de la variable indépendante sur la variable dépendante.
• â1=Y/X (coefficient de régression de Y sur X)
Régression ≠ corrélation
1. En matière de corrélation, les variables sont traitées de manière SYMETRIQUE (elles sont aléatoires).
– Le coefficient de corrélation, ne dépend pas de la manière dont sont traitées X et Y.
• Si y = a0 + a1x + e, Y,X =
• Si x = a’0 + a’1y + e, X,Y =
2. â1, le coefficient de régression de y sur x, n’est pas égal à , le coefficient de corrélation entre y et x.
)ˆˆ/(ˆ , yxyx )ˆˆ/(ˆ , yxyx
x
y
x
yxxy
x
yxyx
xy
t
xy
xVa
ˆ
ˆ
ˆ
ˆˆ
ˆ
ˆˆˆˆ
ˆ
)(ˆˆ
ˆ2
,
2
,
,1
Régression ≠ corrélation
N
ii
N
iii
N
ii
N
iii
x
xy
N
ii
N
ii
N
iii
N
ii
N
ii
N
iii
yx
xyyx
xx
yyxx
n
xx
n
yyxx
a
yyxx
yyxx
n
yy
n
xx
n
yyxx
1
2
1
1
2
1
21
1
2
1
2
1
1
2
1
2
1
,
)(
))((
1
)(
1
))((
ˆ
ˆˆ
)()(
))((
1
)(
1
)(
1
))((
ˆˆ
ˆ
ANALYSE DE LA VARIANCE
L’équation fondamentale de l’analyse de la variance est:
• SCT = Somme des Carrés Totaux = variabilité totale(SST = Total Sum of Squares).
• SCR = Somme des Carrés des Résidus = variabilité non expliquée (SSR = Residual Sum of Squares).
• SCE = Somme des Carrés Expliqués = variabilité expliquée (SSE = Explained Sum of Squares).
SCE
tt
eSCR
ttt
SCT
tt yyyyyy
tt
222ˆˆ
2
ANALYSE DE LA VARIANCE
Plus la variabilité expliquée (SCE) est proche de la variabilité totale (SCT), meilleur est l’ajustement du nuage de points par la droite des MCO.=> La variabilité de y autour de sa moyenne est bien
expliquée par la variable explicative .
Une mesure de la qualité d’ajustement est le coefficient de détermination, R2 (avec R=ρ, le coefficient de corrélation linéaire).• R2=SCE/SCT• R2=1-(SCR/SCT)
ANALYSE DE LA VARIANCE
• Les cas limites où R2=0 et R2=1
ty
y
tx
ty
tx
Exercice 1
Calcul d’un « trend » par les MCO.
Estimer l’équation yt = a0 + a1xt + εt
avec les données suivantes.Années trimestres y x
2005 1 2 12 0,5 23 3,5 34 1 4
2006 1 5 52 2 63 5 74 3,5 8
2007 1 6,5 92 4 103 7,5 114 5 12
Exercice 2
La relation prix/demande.
0
20
40
60
80
100
120
0 50 100 150 200 250 300 350
Série1
Prix de ventes en euros X 95 130 148 210 250 330Quantités demandées Y 104 58 37 22 12 9
Exercice 2
1. Passer en Log. On pose u=log(x) et v=log(y)
2. Calculer le coefficient de corrélation linéaire
3. Calculer les estimateurs de a et b en estimant V=aU+b+ε
4. Calculer la quantité demandé pour un prix égal à 75 €
Exercice 3
Corrélation et équation d’analyse de la variance
y x6 1,55 2,52 3,51 4,54 5,55 6,55 7,5
Exercice 3
1. Calculer le coefficient de corrélation linéaire
2. Calculer les estimateurs de a et b en estimant Y=aX+b+ε
3. Calculer les variance expliquées et résiduelles
Exercice 3
0
1
2
3
4
5
6
7
0 1 2 3 4 5 6 7 8
Top Related