Download - Chapitre 2

Chapitre 2

Les indices

Chapitre 2 : Les indices

1. Définition et propriétés

En sciences sociales, les grandeurs varient dans l’espace et dans le temps :

- Dans le temps, puisqu’elles prennent des valeurs différentes à différentes dates.

- Dans l’espace, puisqu’elles prennent des valeurs différentes d’une région à l’autre.

Ce n’est pas toujours facile de pouvoir comparer des grandeurs. EX :

X Y

2000 53 492 1282005 64190 154

1,20 1,20

Chapitre 2

Pour faciliter la comparaison, on a recours à la notion d’indice.Définition : Un indice, c’est un rapport positif ou nul

Il existe des indices synthétiques, qui sont des rapports obtenus avec des grandeurs complexes (composés de plusieurs indices simples).

Ex: l’indice des prix est un indice qui résume l’évolution des prix de grandeurs hétérogènes (prix du chocolat et prix d’un vidéoprojecteur). La difficulté est l’agrégation de ces grandeurs si différentes.

Chapitre 2

2. Les indices simples

Notons la date t=0 : date de base (situation de base) et la date t : date ou période courante. Soit deux valeurs V0 (valeur de départ) et Vt (valeur d’arrivée), on appelle

- indice simple ou élémentaire

- indice simple base 100 :0

0/ V

VI t

t

1000

0/ V

VI t

t

Chapitre 2

Exemple : Evolution d’un prix entre 2000 et 2005 (base 100 en 2000)

100Pr

Pr

2000

20052000/2005

ix

ixI

Chapitre 2

100Pr

Pr/

FR

RPFRRP ix

ixI

Exemple : Rapport d’un prix entre la Région parisienne (RP) et la France entière(FR) (base 100 pour l’ensemble de la France)

Chapitre 2

3. Décomposition d’indices

1000/1

0/21/2

I

II

1001

21/2

V

VI

1002000/2002

2000/20052002/2005

I

II

Chapitre 2

3.1 Propriétés des indices élémentaires

- La circularité entre t=1 et t=2

En généralisant :100

10/''/0/ tttt III

100

10/11/20/2 III

Chapitre 2

On se ramène à l’expression précédente :

Pour comparer deux grandeurs simples, il suffit de faire le rapport de leurs indices.

Généralisation :

1000/'

0/'/

t

ttt I

II

100...

100100100100 1/2/31/20/1

0/tt

t

IIIII

Chapitre 2

- La réversibilité

Quand on inverse le rôle de la base et de la période courante, l’indice élémentaire s’inverse à près.410

4/00/ 10 tt II

Chapitre 2

Propriété secondaire : Produits d’indices

Si a=bxc

EX : RT=PxQ (indice des prix et indice des quantités=indice de la recette totale)

100

10/0/0/ cIbIaI ttt

Chapitre 2

4. Les indices synthétiques

Un indice synthétique résume une série d’indices élémentaires

Les indices synthétiques les plus utilisés

Valeur=prix x quantité

L’indice de la valeur s’écrit :

10000

0/

i

iii

it

it

t qp

qppqI

Chapitre 2

Le problème de cet indice, c’est qu’on ne peut attribuer la cause de l’évolution : ce peut être toute combinaison des prix ou des quantités. Il faut ainsi éliminer l’influence des prix pour calculer un indice des quantités et éliminer l’influence des quantités pour calculer un indice des prix.

Par exemple pour un indice simple des prix d’un bien :

10000

00/

ii

iit

t qp

qppqI

Chapitre 2

Indice synthétique des prix

Indice synthétique des quantités

10000

0

0/

i

iii

iit

t qp

qppI

10000

0

0/

i

iii

it

i

t qp

qpqI

Chapitre 2

Exemple de calculs d’indices synthétiques (de prix et de quantités) avec trois biens

prix B1 B2 B3dates

0 0,07 10 352 0,14 20 50

quantités B1 B2 B3dates

0 30 0,5 0,152 20 0,4 0,11

Chapitre 2

1. Calculer l’indice d’évolution de la valeur de B1

2. Calculer l’indice synthétique des prix

3. Calculer l’indice synthétique des quantités

Chapitre 2

Exemple de la propriété de circularité : trouver IND2007/2006

ou100

10/''/0/ tttt III

Prix de X dates indices150 € 2005 100210 € 2006 140230 € 2007 153,3

1000/'

0/'/

t

ttt I

II

Chapitre 3

Le modèle Linéaire Simple (La méthode des moindres

carrés ordinaires)

1. PRESENTATION DU MODELE Définition

La régression est l’outil le plus utilisé pour estimer une équation linéaire.

La régression permet de décrire et d’évaluer la relation entre une variable dépendante et une (ou plusieurs) variable(s) indépendante(s).

La variable dépendante est définie par y et la variables indépendantes par x.– Dans le modèle de régression simple, k=1.

– Dans le modèle de régression multiple, k>1.

I. PRESENTATION DU MODELE Définition

Quelques noms pour les variables y et x.y x

variable dépendante variable indépendante variable de contrôle

variable à expliquer variable explicative (régresseur)

Dans une régression, la variable y et la ou les variables x sont traitées de manière asymétrique.– La variable y est supposée être aléatoire ou ‘stochastique’. Elle

possède une distribution de probabilité.

– La ou les variables x sont supposée(s) avoir des valeurs fixes d’un échantillon à l’autre (elles ne sont pas aléatoires).

I. PRESENTATION DU MODELE Définition

Dans le modèle de régression simple, il n’y a qu’une une seule variable x (k=1).

Le modèle de régression linéaire simple peut être spécifié de la manière suivante:– Pour des données temporelles (t=1,…,n)

– yt = a0 + a1xt + εt

– Pour des données en coupe transversale (i=1,…,N)

– yi = a0 + a1xi + εi

I. PRESENTATION DU MODELE Le Rôle de

La relation spécifiée entre y et x ne peut pas être déterministe.– Il nous est impossible de connaître le modèle ‘vrai’ de

régression pour y: E(y|x) = a0 + a1x : Il est (souvent) impossible (ou trop coûteux) d’observer la totalité de la population de Y et X.

Comme le modèle spécifié ne sera jamais rigoureusement exact, un terme aléatoire (aussi appelé ‘terme d’erreur’) est ajouté.– Ce terme est et restera inconnu. On ne pourra en

obtenir qu’une estimation (e).

I. PRESENTATION DU MODELE Le Rôle de

Le terme aléatoire synthétise:1.Une erreur de spécification

• La variable explicative peut ne pas être suffisante pour rendre compte de la totalité du phénomène expliqué.

(Le terme aléatoire synthétise l’ensemble des informations non explicitées dans le modèle)

2.Une erreur de mesure• Les données ne représentent pas exactement le

phénomène.• Il y a des données manquantes.

3.Une erreur de fluctuation d’échantillonnage Les observations comprises dans l’échantillon, et donc

les estimations, peuvent être différentes.

I. PRESENTATION DU MODELE Conséquence du terme aléatoire

Comme les valeurs vraies de a0 et a1 ne sont pas connues, elles doivent être estimées.– On dérive les formules des estimateurs de a0 et a1,

notés respectivement â0 et â1.• L’estimation de a est la valeur particulière que prend

l’estimateur â pour un échantillon donné.• Le modèle de régression linéaire estimé peut

s’écrire:– y = â0 + â1x + eâ0 et â1 possèdent une distribution de probabilité : ( a0

et a1 sont des constantes).â0 et â1 suivent les mêmes lois de distribution que y et

e.

II. ESTIMATION DES PARAMETRESLa méthode des MCO (moindres

carrés ordinaires)• La méthode la plus souvent

utilisée pour estimer les paramètres a0 et a1 est la méthode des Moindres Carrés Ordinaires (MCO/OLS).– Elle consiste à ajuster un

nuage de points à l’aide d’une droite en minimisant la distance au carré entre chaque valeur observée et la droite.

– Cette distance mesure le résidu (l’erreur/la partie non expliquée)pour chaque observation:

•

y x

0ˆ888 yye

0ˆ555 yye

De manière analytique, il s’agit de minimiser la Somme des Carrés des Résidus (SCR/RSS), c.à.d. :

• Minimisons la fonction L, évaluée en â1 et â2, en dérivant par rapport à chacun des deux paramètres:

n

ttt

ttt

n

tt

aa

xaayL

xaay

Min

1

210

210

2

1

2

,

)( Posons

)( or,

10

(2) 0)ˆˆ(2),(

(1) 0)ˆˆ(2),(

101

10

100

10

tttt

ttt

xaayxa

ââL

xaaya

ââL

II. ESTIMATION DES PARAMETRESLa méthode des MCO

On obtient l’estimateur de a0 à partir de la première équation comme suit :

ˆˆ

0ˆˆ

0ˆˆ

0ˆˆ

0ˆˆ

0)ˆˆ(

10

10

10

10

10

10

xaya

xaay

xnaanynn

xnaan

n

yn

xaany

xaay

tt

tt

t ttt

ttt

Calcul des estimateurs

L’estimateur de a1 est obtenu à partir de la seconde comme suit:

B

xxx

A

yyxa

xxxayyx

xaxayyxa

xaayx

tt

tt

ttttt

tttt

tttt

)(

)(ˆ

0)(ˆ)(

0)ˆˆ(:aon ,ˆutilisant En

0)ˆˆ(

1

1

110

10


• On formule l’estimateur de a1 en terme de variance-covariance :

222

2222222

)()2(

22

))((

)(

xxxxxx

xnn

xxnxxnxnxxnxB

yyxx

yxyxyxyxyxn

yxnyxyx

yxnyxnyxyxA

ttt

tttt

tt

ttttt

ttt

ttt


• En remplaçant A et B par leur valeur, on obtient:

Car en divisant chaque terme par (n-1), on a

)(

),(

)(

))((ˆ

21 XV

YXCov

xx

yyxxa

tt

ttt

2

,

21 ˆ

ˆ

)1(

)()1(

))((

ˆx

xy

tt

ttt

n

xxn

yyxx

a


• Le coefficient de régression mesure l’impact d’une variation (c.à.d. l’effet propre/partiel) de la variable indépendante sur la variable dépendante.

• â1=Y/X (coefficient de régression de Y sur X)

Régression ≠ corrélation

1. En matière de corrélation, les variables sont traitées de manière SYMETRIQUE (elles sont aléatoires).

– Le coefficient de corrélation, ne dépend pas de la manière dont sont traitées X et Y.

• Si y = a0 + a1x + e, Y,X =

• Si x = a’0 + a’1y + e, X,Y =

2. â1, le coefficient de régression de y sur x, n’est pas égal à , le coefficient de corrélation entre y et x.

)ˆˆ/(ˆ , yxyx )ˆˆ/(ˆ , yxyx

x

y

x

yxxy

x

yxyx

xy

t

xy

xVa

ˆ

ˆ

ˆ

ˆˆ

ˆ

ˆˆˆˆ

ˆ

)(ˆˆ

ˆ2

,

2

,

,1

Régression ≠ corrélation

N

ii

N

iii

N

ii

N

iii

x

xy

N

ii

N

ii

N

iii

N

ii

N

ii

N

iii

yx

xyyx

xx

yyxx

n

xx

n

yyxx

a

yyxx

yyxx

n

yy

n

xx

n

yyxx

1

2

1

1

2

1

21

1

2

1

2

1

1

2

1

2

1

,

)(

))((

1

)(

1

))((

ˆ

ˆˆ

)()(

))((

1

)(

1

)(

1

))((

ˆˆ

ˆ

ANALYSE DE LA VARIANCE

L’équation fondamentale de l’analyse de la variance est:

• SCT = Somme des Carrés Totaux = variabilité totale(SST = Total Sum of Squares).

• SCR = Somme des Carrés des Résidus = variabilité non expliquée (SSR = Residual Sum of Squares).

• SCE = Somme des Carrés Expliqués = variabilité expliquée (SSE = Explained Sum of Squares).

SCE

tt

eSCR

ttt

SCT

tt yyyyyy

tt

222ˆˆ

2


Plus la variabilité expliquée (SCE) est proche de la variabilité totale (SCT), meilleur est l’ajustement du nuage de points par la droite des MCO.=> La variabilité de y autour de sa moyenne est bien

expliquée par la variable explicative .

Une mesure de la qualité d’ajustement est le coefficient de détermination, R2 (avec R=ρ, le coefficient de corrélation linéaire).• R2=SCE/SCT• R2=1-(SCR/SCT)


• Les cas limites où R2=0 et R2=1

ty

y

tx

ty

tx

Exercice 1

Calcul d’un « trend » par les MCO.

Estimer l’équation yt = a0 + a1xt + εt

avec les données suivantes.Années trimestres y x

2005 1 2 12 0,5 23 3,5 34 1 4

2006 1 5 52 2 63 5 74 3,5 8

2007 1 6,5 92 4 103 7,5 114 5 12

Exercice 2

La relation prix/demande.

0

20

40

60

80

100

120

0 50 100 150 200 250 300 350

Série1

Prix de ventes en euros X 95 130 148 210 250 330Quantités demandées Y 104 58 37 22 12 9

Exercice 2

1. Passer en Log. On pose u=log(x) et v=log(y)

2. Calculer le coefficient de corrélation linéaire

3. Calculer les estimateurs de a et b en estimant V=aU+b+ε

4. Calculer la quantité demandé pour un prix égal à 75 €

Exercice 3

Corrélation et équation d’analyse de la variance

y x6 1,55 2,52 3,51 4,54 5,55 6,55 7,5

Exercice 3

1. Calculer le coefficient de corrélation linéaire

2. Calculer les estimateurs de a et b en estimant Y=aX+b+ε

3. Calculer les variance expliquées et résiduelles

Exercice 3

0

1

2

3

4

5

6

7

0 1 2 3 4 5 6 7 8