Chapitre 2 : Etude d’une série chronologique - Le GEAN

33
Chapitre 2 : Etude d’une série chronologique

Transcript of Chapitre 2 : Etude d’une série chronologique - Le GEAN

Page 1: Chapitre 2 : Etude d’une série chronologique - Le GEAN

Chapitre 2 : Etude d’une série

chronologique

Page 2: Chapitre 2 : Etude d’une série chronologique - Le GEAN

Mesurer l’évolution des

données

Page 3: Chapitre 2 : Etude d’une série chronologique - Le GEAN

Variation absolue, variation relative

• Soit et les valeurs prises par une variable

V, aux dates d (départ) et a (arrivée), sur le

même individu.

• La variation absolue de la variable V entre les

dates d et a est : .

• La variation relative de la variable V entre les

dates d et a est :

• Le terme de variation relative est synonyme de

taux de variation et de taux de croissance.

dvav

a dV v v

1a d a

d d

v v vVt

V v v

Page 4: Chapitre 2 : Etude d’une série chronologique - Le GEAN

Années 2000 2001 2002

Nombre de cinémas en France 2180 2192 2153

Exemples de calculs :

2000/ 2001 2192 2180 12Variation absolue

2001/ 2002

2153 21920.0178

2192Variation relative

Remarques : * Les variations absolues ont l’unité de grandeur considérée (sur

l’exemple ci-dessus on note qu’on dénombrait 12 cinémas de plus en 2001 par

rapport à 2000).

* Les variations relatives sont sans unités et donc souvent exprimées en

pourcentage (sur l’exemple ci-dessus on dénombrait 1,78% de moins de cinémas

en 2002 par rapport à 2001).

*Les variations relatives ne sont pas additives :

2000 / 2001 2001/ 2002 2000 / 2002

0.01228

0.005505 ( 0.01779) 0.01238

t t t

Page 5: Chapitre 2 : Etude d’une série chronologique - Le GEAN

Calcul des contributions à la croissance • On donne l’évolution du chiffre d’affaire détaillé d’une société

spécialisée dans le multimédia :

• Le taux de variation du CA global est alors de :

• Pour déterminer ensuite lequel des secteurs d’activité a le plus

contribué à cette croissance, on peut calculer en première approche

les taux de variation pour chaque secteur comme par exemple pour

les lecteurs de DVD :

Lecteur DVD LCD Plasma Total

CA 2004 18 097 13 229 7 930 39 256

CA 2005 18 448 16 179 10 475 45 102

45102 3925614,9%

39256

CA

CA

2004

18448 180971,9%

18097

DVD

DVD

CA

CA

Page 6: Chapitre 2 : Etude d’une série chronologique - Le GEAN

•On obtient alors les taux de variation suivant :

•Cependant, il n’est pas aisé d’interpréter ces taux comme des contributions à la croissance globale car ni leur moyenne ni leur somme ne permet de réobtenir le taux de variation global. En effet, pour cela il faut prendre en compte l’importance de chaque secteur par rapport à l’activité globale du groupe. On calcule ainsi des coefficients, représentant ce qu’on appelle l’effet masse, qui donnent la part représentée par chaque secteur sur l’année de départ :

Lecteur DVD LCD Plasma CA Global

Taux de variation +1,9% +22,3% +32,1% +14,9%

Secteur Lecteur DVD LCD Plasma Total

Effet masse 0,461 0,337 0,202 1

2004

2004

DVDDVD

global

CAEffet masse

CA

Page 7: Chapitre 2 : Etude d’une série chronologique - Le GEAN

• Ces coefficients permettent de pondérer les taux de variations de chaque secteur pour en faire leur moyenne et réobtenir ainsi le taux de variation du CA global :

• Le taux de variation du CA global se décomposent donc en une somme de contributions de chacun des secteurs à cette croissance. Chaque contribution s’exprimant de manière analogue à celle présentée ci-dessous :

• On obtient alors le tableau des contributions suivant :

• En conclusion, même si les écrans LCD n’ont pas la plus forte croissance, ce sont eux qui ont le plus contribué à la croissance du chiffre d’affaire global.

2004

2004 2004

" "

DVD DVDDVD

DVD

effet masse croissance DVD

CA CAContribution

CA CA

14,9 0,461 1,9 0,337 22,3 0,202 32,1

DVD LCD plasma

Secteur Lecteur DVD LCD Plasma Total

Contribution 0,9 7,5 6,5 14,9

Page 8: Chapitre 2 : Etude d’une série chronologique - Le GEAN

Bilan sur le calcul des contributions

• Soit une variable V se décomposant comme la somme de

différentes composantes :

• On peut alors calculer les taux de variation de chaque

composante et en faisant la moyenne pondérée de ces taux

selon l’importance de chacune des composantes on retrouve le

taux de variation de V. Ce taux se lit aussi alors comme somme

des contributions de chaque composante.

• La contribution de chaque composante i se décompose ainsi :

1 2 nV = composante +composante +....+composante

,

,

i d i

d i d

composante composanteeffet masse taux de variation

V composante

Page 9: Chapitre 2 : Etude d’une série chronologique - Le GEAN

Indices élémentaires

•L’indice élémentaire de la variable V, à la date a de base 1 à la date d est :

•L’indice élémentaire de la variable V, à la date a de base 100 à la date d est :

•L’indice en base 1 peut aussi être défini à partir du taux de variation t par :

En multipliant une valeur par i, on lui fait subir une variation de ( )% (on appelle également i le coefficient

multiplicateur)

/a

a dd

vi

v

/ /100 100 aa d a d

d

vI i

v

1 i t

100 t

Page 10: Chapitre 2 : Etude d’une série chronologique - Le GEAN

Base glissante/Base fixe

• Exemple traité : Evolution de la dette publique

• Indices en base glissante (date t, base 100 en t-1)

• Indices en base fixe (date t, base 100 en 1998)

• Dans la suite du cours, sauf indication contraire, nous

considèrerons des indices en base glissante.

Année 1998 1999 2000 2001 2002 2003 2004

Dette

publique

777,9 796 817 840,8 901,4 995,6 1067

Année 1998 1999 2000 2001 2002 2003 2004

indice 102,3 102,6 102,9 107,2 110,4 107,2

Année 1998 1999 2000 2001 2002 2003 2004

indice 100 102,3 105,0 108,1 115,9 128,0 137,2

Page 11: Chapitre 2 : Etude d’une série chronologique - Le GEAN

Propriété de circularité des indices

élémentaires en base 1

• Ainsi, contrairement au cas des variations relatives on

peut, à partir des évolutions entre chaque année

déterminer l’évolution entre la première et la dernière

année.

• En appliquant cette propriété au cas précédent avec

les indices en base glissante, on obtient :

/ 1 1/ 2 1/ 0 / 0...n n n n ni i i i

2004/ 2003 2003/ 2002 1999/1998 2004/1998... 1,072 1,104 ... 1,023 1,370i i i i

Page 12: Chapitre 2 : Etude d’une série chronologique - Le GEAN

Taux de variation moyen • On peut remarquer dans les tableaux précédents que la dette publique a

augmenté de 37,2% entre 1998 et 2004. On va maintenant chercher le taux de variation moyen c’est-à-dire celui qu’il faudrait appliquer entre chaque année pour aboutir à la même variation globale.

• Selon la même idée, on calcule d’abord l’indice annuel moyen :

D’où

• Le taux de croissance annuel moyen sur la période 1998-2004 est donc de 5,4% ( ).

• Ce taux ne dépendant que des valeurs prises aux deux extrémités de la période étudiée. Il peut donc ne pas représenter très justement ce qui s’est passé pendant cette période notamment si les dates extrêmes correspondent à des années particulièrement fastes (ou à l’inverse mauvaises) ce qui peut influencer fortement ce taux.

62004/1998 1,372m m m m m m mi i i i i i i i

6 1,372 1,054mi

mi

1m mt i

Page 13: Chapitre 2 : Etude d’une série chronologique - Le GEAN

Indices synthétiques

• Les indices synthétiques ont pour but de résumer par un

seul indicateur une série d’indices de prix (ou de quantités)

correspondant à une série de produits.

• Imaginons le cas d’une société spécialisée dans la

distribution de courrier amenée à renouveler fréquemment

son parc de véhicules à 2 et 4 roues. On donne ci-dessous

l’évolution des prix et des quantités des produits concernés

entre 2 années :

Page 14: Chapitre 2 : Etude d’une série chronologique - Le GEAN

•Entre ces deux dates, les indices simples des prix des deux produits sont :

et

Autrement dit le prix des voitures augmentait de 3,8% pendant que celui d’un

vélo diminuait de 16,7%

•Pour synthétiser ces deux indicateurs en un seul, l’idée la plus simple est de

mesurer l’évolution de la dépense totale entre les deux années, on obtient

ainsi l’indice de la dépense :

soit une diminution de 19,7%

• Résumer une augmentation de 3,8% et une diminution de 16,7% par une

diminution de 19,7% pose problème. Cela vient du fait que les deux premiers

indices sont des indices de prix tandis que le troisième est un indice de la

dépense qui mesure à la fois l’évolution des prix et des quantités

consommées. D’où l’idée, pour calculer un indice synthétique des prix de fixer

les quantités consommées à la date initiale ce qui conduit à l’indice de

Laspeyres des prix.

13500( ) 100 103,85

13000Ip voiture

100( ) 100 83,33

120Ip bicyclette

/

13500 1000 100 4500100 80,26

13000 1300 120 4000a d

dépense totale date arrivéeV

dépense totale date départ

Page 15: Chapitre 2 : Etude d’une série chronologique - Le GEAN

Indice de Laspeyres

•On synthétise donc bien deux indices des prix par un indice se situant entre eux deux.

Cependant cet indice synthétique se trouve beaucoup plus proche de l’indice des prix

des voitures ce qui s’explique par sa définition sous forme de moyenne des deux indices

pondérée par les coefficients budgétaires et représentant les parts de

dépense associées à chaque type de véhicule :

•Ainsi : et on a alors :

( ) 13500 1300 100 4000100 100 103,28

13000 1300 120 4000

dépense totale date arrivée qutésdatedépartLp

dépense totale date départ

voiture

voiture voiture vélo véloLp Ip Ip

13000 13000,972

13000 1300 120 4000

120 40000,028

13000 1300 120 4000

voiture

vélo

1/0 0,972 ( ) 0,028 ( ) 0,972 103.85 0,028 83,33 103,28Lp Ip voiture Ip vélo

vélo

Page 16: Chapitre 2 : Etude d’une série chronologique - Le GEAN

Lissage d’une série chronologique

par les moyennes mobiles

• Pour illustrer les techniques utilisées nous considèrerons

les nombres d’entrées par mois (en millions) dans les

salles de cinéma en France.

Page 17: Chapitre 2 : Etude d’une série chronologique - Le GEAN

L’objectif est d’estimer des tendances sur des séries chronologiques en diminuant

l’amplitude des oscillations. On utilise pour cela des moyennes mobiles d’ordres plus

ou moins importants. Ainsi une moyenne mobile d’ordre 3 est calculée à partir des

relevés sur 3 mois successifs (le résultat étant affectée à la date médiane des trois

dates utilisées) :

02 02 02 16,22 23,24 14,87

3( 2002) 18,113 3

jan fev mary y yMM t Février

Page 18: Chapitre 2 : Etude d’une série chronologique - Le GEAN

Moyenne mobile d’ordre pair

• Une moyenne calculée avec 4 valeurs, par exemple

doit être affectée à la date médiane (ici 2,5). Or cette date

(dans le cas des moyennes mobiles d’ordre pair) ne correspond

pas à une date de la série. La moyenne calculée avec les

quatre valeurs suivantes vaut et doit être

affectée à la date 3,5. L’idée est donc de calculer la moyenne

des deux moyennes ci-dessus et de l’affecter à la date 3

(médiane de 2,5 et 3,5). Il s’ensuit que :

1 2 3 4

4

y y y y

2 3 4 5

4

y y y y

1 2 3 4 2 3 4 514( 3)

2 4 4

y y y y y y y yMM t

1 12 2 13

112( 7) ( ,..., ) ( ,..., )

2MM t moyenne y y moyenne y y

Page 19: Chapitre 2 : Etude d’une série chronologique - Le GEAN
Page 20: Chapitre 2 : Etude d’une série chronologique - Le GEAN

Décomposer une série

chronologique

Page 21: Chapitre 2 : Etude d’une série chronologique - Le GEAN

Généralités

• Une série se décompose souvent selon quatre composantes : la tendance T (évolution durable, régulière), les fluctuations conjoncturelles C (oscillations autour de la tendance, irrégulières en amplitude et durée), le mouvement saisonnier S (mouvement périodique, d’amplitudes similaires et de périodicité inférieure ou égale à l’année) et les variations accidentelles A.

• Le lissage d’une série est une transformation qui limite les oscillations dues aux composantes C, S et A d’une série. Plus les moyennes mobiles sont d’un ordre élevé, plus le lissage est important. Si l’on veut identifier la tendance, il convient de choisir une moyenne d’ordre élevé. Si l’objectif est d’aplanir légèrement la série, le choix d’une moyenne mobile d’ordre faible doit être effectué.

• Lorsque la série présente une composante saisonnière de périodicité constante, on peut utiliser la moyenne mobile d’ordre égal à la périodicité pour éliminer le mouvement saisonnier. C’est à peu près le cas de la série étudiée précédemment avec la MM12 qui rend assez bien compte de la tendance.

Page 22: Chapitre 2 : Etude d’une série chronologique - Le GEAN

• L’estimation de la tendance par la moyenne mobile

en éliminant la composante saisonnière présente

deux inconvénients :

– Si la périodicité du mouvement est longue (par exemple 12

mois comme dans le cas précédent), l’obligation de choisir

une MM12 entraîne un lissage qui risque d’être excessif

(cela élimine la composante saisonnière mais aussi toutes

les autres variations que l’on peut souhaiter laisser

apparentes) ;

– D’autre part elle ne donne pas d’estimation pour les

premières et dernières dates de la série (les 6 premières

et 6 dernières pour une MM12).

• Un moyen de pallier ces deux inconvénients est

d’utiliser la méthodes des rapports saisonniers.

Correction des variations saisonnières

Page 23: Chapitre 2 : Etude d’une série chronologique - Le GEAN

• Nous allons détailler la méthode citée précédemment à partir des chiffres d’affaires trimestriels des commerces d’une station de sport d’hiver. La méthode de correction des variations saisonnières permet, en 5 étapes de passer de la série brute à la série dite corrigée des variations saisonnières (série CVS)

80

90

100

110

120

130

140

150

T3 20

02

T4 20

02

T1 20

03

T2 20

03

T3 20

03

T4 20

03

T1 20

04

T2 20

04

T3 20

04

T4 20

04

T1 20

05

T2 20

05

T3 20

05

T4 20

05

T1 20

06

T2 20

06

Page 24: Chapitre 2 : Etude d’une série chronologique - Le GEAN

Modèle utilisé

• Nous allons utiliser un modèle simplifié par rapport

aux généralités énoncées précédemment puisque la

décomposition de la série brute Y se fera uniquement

par l’estimation d’un mouvement saisonnier S et d’une

tendance X qui est l’agrégation des composantes T,C

et A vues précédemment. On suppose alors que le

modèle multiplicatif suivant va nous permettre

d’estimer ces deux composantes :

Y X S

Page 25: Chapitre 2 : Etude d’une série chronologique - Le GEAN

Etape 1 : Première estimation de X

par la moyenne mobile.

• La périodicité du mouvement étant d’une

année, soit 4 trimestres, une première

estimation de X notée est réalisée à

partir des moyennes mobiles d’ordre 4 (les

données étant trimestrielles)

• Remarque : Si les données avaient été

mensuelles nous aurions utilisé une

MM12.

1X

Page 26: Chapitre 2 : Etude d’une série chronologique - Le GEAN

Etape 2 : 1ère estimation du mouvement saisonnier S

• Une première estimation du mouvement saisonnier S est donc faite à

chaque date par le rapport saisonnier :

1

1

( )( )

tys t

x t

Page 27: Chapitre 2 : Etude d’une série chronologique - Le GEAN

Vérification de la saisonnalité

Page 28: Chapitre 2 : Etude d’une série chronologique - Le GEAN

Etape 3 : Deuxième estimation du

mouvement saisonnier

• Les rapports saisonniers, par exemple du premier

trimestre, prennent des valeurs différentes. Or, par

définition, le mouvement saisonnier doit être

parfaitement périodique. Il convient donc de calculer un

coefficient saisonnier unique pour chaque 1er trimestre,

puis de faire de même avec chaque autre trimestre.

• Le coefficient saisonnier d’un trimestre est calculé en

faisant la moyenne des rapports saisonniers obtenus

pour chaque année sur ce trimestre :

1 2003 1 2004 1 2005

2

( ) ( ) ( )( )

3

i i ii

s T s T s Ts T

iT

Page 29: Chapitre 2 : Etude d’une série chronologique - Le GEAN
Page 30: Chapitre 2 : Etude d’une série chronologique - Le GEAN

Etape 4 : Troisième estimation du

mouvement saisonnier S

• Le mouvement saisonnier ne devant pas avoir d’effet sur

une année complète, on s’attend à ce que la moyenne

des coefficients saisonniers soit de 1. Or la moyenne

des coefficients saisonniers ne vaut pas 1 mais 0.9966.

Il convient donc de corriger chaque coefficient en le

divisant par 0.9966 :

23

( )( )

0.9966

ii

s Ts T

Page 31: Chapitre 2 : Etude d’une série chronologique - Le GEAN

Date CA global

T3 2002 98 0,9029 0,906

T4 2002 100 0,9986 1,002

T1 2003 110 101 1,0891 1,1126 1,1164

T2 2003 98 101 0,9703 0,9724 0,9757

T3 2003 94 102,38 0,9182 0,9029 0,906

T4 2003 104 103,75 1,0024 0,9986 1,002

T1 2004 117 105 1,1143 1,1126 1,1164

T2 2004 102 107,38 0,9499 0,9724 0,9757

T3 2004 100 111,25 0,8989 0,9029 0,906

T4 2004 117 115,75 1,0108 0,9986 1,002

T1 2005 135 119 1,1345 1,1126 1,1164

T2 2005 120 120,38 0,9969 0,9724 0,9757

T3 2005 108 121,13 0,8916 0,9029 0,906

T4 2005 120 122,13 0,9826 0,9986 1,002

T1 2006 138 1,1126 1,1164

T2 2006 125 0,9724 0,9757

1( )x t2 ( )is T

1( )s t 3( )is T

Page 32: Chapitre 2 : Etude d’une série chronologique - Le GEAN

Etape 5 : Deuxième estimation de

X : série CVS

• On réalise une deuxième estimation de X en

posant :

• Cette dernière estimation de la tendance

s’appelle la série CVS, c’est-à-dire corrigée des

variations saisonnières.

• Avec la méthode utilisée on a donc, d’après la

relation ci-dessus :

2

3

( )( )

( )

y tx t

s t

Y X S

Page 33: Chapitre 2 : Etude d’une série chronologique - Le GEAN

Graphique comparatif

80

90

100

110

120

130

140

150

T3

20

02

T4

20

02

T1

20

03

T2

20

03

T3

20

03

T4

20

03

T1

20

04

T2

20

04

T3

20

04

T4

20

04

T1

20

05

T2

20

05

T3

20

05

T4

20

05

T1

20

06

T2

20

06

série brute

mm4

cvs