Thèse_New1 GENIAL §§§§§
-
Upload
sarah-abdelgheffar -
Category
Documents
-
view
979 -
download
6
Transcript of Thèse_New1 GENIAL §§§§§
République Algérienne Démocratique Et Populaire
Ministère de l’Enseignement Supérieur et de la Recherche Scientifique
Université des Sciences et de la Technologie
Houari Boumediene
Faculté des mathématiques Département de probabilités et statistique
Mémoire de fin d’études En vue de l’obtention du diplôme d’Ingénieur d’Etat en Statistique
THEME
Encadré par : Proposé par : Mr Hacène BELBACHIR Mr Ahmed MENKOURA (NAFTAL)
Présenté par : Mr. Mohamed OSMAN Mr. Cherif YAKOUBENE
Devant le jury : Mme H. GUERBYENNE Présidente Mr. A.AKNOUCHE Examinateur Mme K.DJABALLAH Examinatrice
Promotion 2005-2006
DÉDICACES Je dédie ce modeste travail
A ma très chère mère, à mon père
A mes sœurs, à mon frère Khaled
A mes grands-parents qui m’ont tous aidé et soutenus et qui
m’ont réservé les moyens tout au long de mes études.
mes tentes Malika, Baya, Aldjia,
A mes cousines, cousins Mohamed Reda, Ali, Tarek, et
A toute la famille petits avant les grands
A Abdelkader, Oualid, mes amis de toujours
Cherif, mon ami partenaire « binôme » qui a tant donné
pour que nous achevions ce travail,
A toute la promotion 2005 – 2006 probabilités et statistique
pour leurs soutien et encouragement,
A Anissa, Fella, Sihem et Smail,
Kamel, Hichem, Ameur
Aux prochaines promotions que je ne manquerai pas
d’encourager,
A Samir, Rafik, Bilel, Mourad
A tous les étudiants de R.O.
A tous ceux qui m’ont aidé,
A tous ceux que j’aime,
A tous les musulmans frères,
A tout le peuple Algérien, Palestinien, Irakien
Avec toute ma gratitude
Mohamed.O
DÉDICACES Je dédie ce mémoire :
A ma très chère mère, à mon père
A mes sœurs, à mes fréres
A toute ma famille.
A mon ami Mohamed « binôme »
A Mhend, Toufik , Oualid mes amis de toujours
A toute la promotion 2005 – 2006 probabilités et statistique
Pour leur soutien et encouragement,
A Anissa, Fella, Sihem et Smail,
Kamel, Hichem, Ameur
Aux prochaines promotions que je ne manquerai pas
d’encourager,
A Samir, Rafik, Mourad
A tous les étudiants de R.O.
A tous ceux qui m’ont aidé,
A tous les musulmans frères,
Cherif.Y
REMERCIEMENTS
Louange à Dieu, le miséricordieux, sans Lui rien de tout cela n'aurait
pu être.
Nous remerciement le bon Dieu qui nous a orienté au chemin du
savoir et les portes de la science. Nous tenons à remercier vivement tous
ceux qui nous ont aidés de prés ou de loin à l’élaboration de ce mémoire ;
nous pensons particulièrement à :
-Monsieur Hècene.BELBACHIR, qui nous a guidées avec ses conseils,
ses orientations techniques et surtout à l’attention particulière qu’il a
donné à notre projet, et qui nous a accompagné au long de notre travail.
-Madame Hafida.GUERBYENNE. Pour avoir accepter de présider
notre soutenance et pour son aide et sa contribution et ses précieux conseils
et sa gentillesse.
-Madame Khadija.DJABALLAH. Examinatrice, pour son aide et sa
contribution et ses précieux conseils et sa gentillesse.
-Monsieur Malek. AKNOUCHE. Examinateur, pour son aide et sa
contribution et ses précieux conseils.
-Madame Djenet.SEDDIKI membre de jury qui nous a fait l'honneur
d'en faire partie.
De même nos remerciements vont au personnel de NAFTAL, en
particulier :
Mr H.MENKOURA, Mr K. HEMMI, Mr M.KECHROUDE.
Nous remercions également nos familles respectivement qui nous ont
aidés, encouragées et soutenues dans les moments difficiles tout au long de
la préparation de cette thèse.
Nous remercions toute personne parmi nos camarades ou autre qui
nous ont aidées de prés ou de loin à la réalisation de ce mémoire.
Enfin, nous remercions tous ceux qui nous ont encouragé tout au long
de notre Parcours universitaire et ceux qui ont contribué à notre
formation mais que nous N’avons pas cités.
A toute ces personnes, nous leurs disons merci infiniment.
SOMMAIRE
Introduction et Problématique : 1
PRESENTATION GENERALE DE NAFTAL 3
Partie théorique Chapitre 1 : Généralités sur les séries chronologiques : 1.1 Introduction………………………………………….......……………………… 10 1.2 Stationnarité. …………………………………………………………………… 10 1.2.1 Définition d’un processus stationnaire au sens strict………………………. 10 1.2.2Definition d’un processus stationnaire de second ordre……………………. 10 1.3 Premiers indices descriptifs d’une série temporelle……………………………. 11 1.3.1 Indice de la moyenne et la variance……………………………………….. 11 1.3.2 Indice de dépendance……………………………………………………… 11 1.4 La classe des processus aléatoire ARMA……………………………………… 13 1.4.1Géneralités et notations…………………………………………………….. 13 1.4.2 Définition des processus ARMA…………………………………………… 13
2 Les démarches préliminaire pour analyser une série chronologique : 2.1 Représentation graphique de la série………………………………………….. 17 2.2 Les composantes temporelles de la série……………………………………… 17 2.2.1 La tendance………………………………………………………………. 17 2.2.2 Saisonnalité………………………………………………………………. 17 2.2.3 Facteur irrégulier…………………………………………………………. 17 2.2.4 Composante cyclique……………………………………………………. 17 2.3 Type de décomposition………………………………………………………. 17 2.3.1 Le modèle additif ……………………………………………………… 18 2.3.2 Le modéle multiplicatif………………………………………………….. 18 2.4 Le test de schéma……………………………………………………………… 18 2.4.1 Le test graphique…………………………………………………………. 18 2.5 La technique de détection de la saisonnalité et de la tendance………………… 19 2.5.1 La technique graphique…………………………………………………… 19 2.5.2 La technique analytique…………………………………………………. 19
Chapitre 2 : Méthode de lissage exponentiel : 2.1 Introduction…………………………………………………………………… 22 2.2 Principe de base……………………………………………………………….. 22 2.3 Description de la méthode…………………………………………………….. 22 2.4 Lissage exponentiel simple……………………………………………………. 22 2.5 Choix de coefficient de lissage………………………………………………… 25 2.6 Lissage exponentiel double…………………………………………………… 25 2.7 Méthode de Holt-Winters …………………………………………………….
25 Chapitre 3 : Processus non stationnaire, tests de racine unitaire 3.1 Généralités sur la non stationnarité……………………………………………… 28 3.1.1 Processus de type DS et TS……………………………………………….. 28 3.1.1.1 Les processus de type TS……………………………………………. 28 3.1.1.2 Les processus de type DS……………………………………………. 28 3.1.1.3 Conséquences d’une mauvaise stationnarisation du processus TS…. 29 3.1.2 Processus autorégressif moyenne mobile………………………………… . 29 3.1.3 Processus autorégressif moyenne mobile intégré saisonnier………………. 30 3.2 Tests de racine unitaire………………………………………………………….. 30
3.2.1 Le test de Dickey-Fuller simple ……………………………………………... 30 3.2.2 Le test de Dickey-Fuller augmenté……………………………………….. 32 3.2.3 L’algorithme de Dickey-Fuller augmenté………………………………... 33
Chapitre 4 : Méthodologie de Box et Jenkins 4.1 Méthodologie de Box et Jenkins………………………………………… 35 4.1.1 Les démarches de la méthodologie de Box et Jenkins………………….. 35 4.2 L’estimation du modéle…………………………………………………………. 37
4.2.1 Méthode d’estimation……………………………………………………… 37 4.3 Les tests de validation…………………………………………………………. 37 4.3.1 Tests sur les paramètres…………………………………………………… 37 4.3.2 Tests sur les résidus………………………………………………………… 38 4.4 Choix du modèle……………………………………………………………… 41 4.5 Prévision……...........................................………………………………… 41 4.5.1 Transformation de la série ………………………….. 42 4.5.2 Prédicteur pour un modèle ARMA ………………………. 42
Chapitre 5 : Les processus à mémoire longue 5.1 Généralité et définition de la mémoire longue………………………………… 45 5.2 Bruit blanc fractionnaire ARFIMA (0.d.0)……………………………………. 45 5.3 Processus ARFIMA (p.d.q)…………………………………………………… 46 5.4 Test de mémoire longue………………………………………………………… 46 5.4.1 Test de LO (1991)………………………………………………………….. 46 5.4.2 Test de Labato et Robinson (1998)……………………………………….. 47 5.5 Les méthodes d’estimation des processus ARFIMA………………………… 47 5.5.1 Méthode en deux étapes………………………………………………. 47 5.6 Prévision d’un processus ARFIMA(p.d.q). …………………………………... 48
Chapitre6 : Modéle VAR 6.1 Présentation du modèle VAR standard……………………………………….. 50 6.1.1 Ecriture du modèle VAR standard……………………………………….. 50 6.1.2 Condition de stationnarité……………………………………………….. 50 6.1.3 Concept d’innovation………………………………………………………. 51 6.2 Estimation d’un modèle VAR standard………………………………………. 52 6.3 Estimation du nombre de décalages p………………………………………… 54 6.3.1 Estimation du nombre de décalages à partir d’un critère d’information… 55 6.3.2 Estimation du nombre de décalages à partir de tests du rapport de vraisemblance………………………………………………………………………
56
6.4Calcul des fonctions de réponse du modèle VAR standard…………………… 57 6.4.1Utilités du concept d’innovation en simulation…………………………… 57 6.4.2 Fonctions de réponse du modèle VAR standard……………………………. 58 6.4.3 Décomposition de la variance des erreurs de prévision du modèle VAR standard 60 Partie application : Lissage exponentiel…………………………………………………………………… 63 Box & Jenkins……………………………………………….………………………… 68 ARFIMA……………………………………………………..…….……………….... 114VAR……………………………………………………………………………………. 119Conclusion ……………………………………………………..…………….……….. 137Conclusion générale…………………………………………..….…………………… 140-Annexes ………………………………………………..…………………………….. 142-Bibliographie ……………………………………..…………………………………. 144
1
Introduction et Problématique :
Les mutations économiques que connaît notre pays, à savoir son passage d’une
économie dirigée à une économie de marché, ont interpellé toutes les entreprises nationales à
s’adapter à ce nouvel environnement économique.
NAFTAL compte parmi ces entreprises qui se préparent sérieusement à évoluer dans un
nouveau contexte à travers notamment la mise en place d’une nouvelle organisation adapté
aux nouveaux enjeux économiques et ce, en prévision de l’installation de la concurrence
étrangère.
Forte des expériences du passé, NAFTAL, qui a recouvert sa santé financière grâce
notamment à la recapitalisation, a décidé de se projeter résolument dans l’avenir avec l’appui
de l’élaboration d’une stratégie de développement rationnelle et cohérente qui tient compte
des enjeux et des exigences du nouveau contexte économique national et international.
Entre 2000-2006, la demande des produits pétroliers a enregistré une croissance
significative. Les ventes de carburants culminés est de prés de 7 millions de tonnes (d’après
NAFTAL magazine).
La demande ainsi estimée fait ressortir la nécessité de définir, d’un point de vue
organisationnel, de nouvelles approches pour renforcer la position de NAFTAL dans un
marché libre des produits pétroliers, ouvert à la concurrence et qui imposera davantage les
enjeux de la commercialisation de la rentabilité de la réalité des prix. L’environnement
économique national nouveau caractérisé par la disparition du monopole et la libre initiative
va se traduire pour NAFTAL par l’émergence de la concurrence aussi bien dans l’importation
que dans la distribution et la commercialisation des produits pétroliers sur le marché national
(d’après NAFTAL magazine).
Pour cela NAFTAL : branche carburant (Aviation-Marine) souhaiterait procéder à une
prévision des ventes de carburants (Aviation et Marine) à court et à long terme en se basant
sur des méthodes statistiques. Nous allons tenter dans ce travail de répondre partiellement à
leurs attentes.
2
C’est ainsi que le sujet qui nous a été proposé s’intitule :
Modélisation VAR et ARFIMA en Vu de la Prévision des Quantités de Ventes de
Carburants Aviation et Marine
Notre travail est scindé en deux parties :
Partie Théorique : Nous commençons dans une première étape tout d’abord par une étude univariée en
nous basant sur la méthode de lissage exponentiel de Holt-Winters, ensuite la méthodologie
de Box et Jenkins, et la modélisation ARFIMA.
Dans la deuxième étape, nous complétons l’étude univariée par une étude multivariée
(modèle VAR).
Enfin, nous nous proposons de comparer les quatre méthodes en nous basant sur l’erreur
moyenne quadratique pour en tirer la méthode la plus appropriée
Le plan de notre travail est le suivant:
• Chapitre 1 : Notions et généralités sur les séries chronologiques.
• Chapitre 2 : Les démarches préliminaires pour analyser une série chronologique.
• Chapitre 3 : L’étude de la Méthode de Lissage exponentiel (Holt et Winters ) .
• Chapitre 4 : Non stationnarité, test de racine unitaire.
• Chapitre 5 : Modélisation via la méthodologie de Box-Jenkins .
• Chapitre 6 : Les modèles à mémoire longue appelés modèles ARFIMA
• Chapitre 7 : Modélisation multivariée .
Partie Application :
• Application de la méthode de Holt et Winters.
• Application de la méthodologie de Box et Jenkins.
• Application de la modélisation ARFIMA.
• Application de la méthode VAR
Nous avons développé un didacticiel sous DELPHI, pour le logiciel « EVIEWS » afin
de permettre aux utilisateurs de bien manipuler et maîtriser le logiciel.
3
PRESENTATION GENERALE DE NAFTAL I-1 HISTORIQUE :
Issue de SONATRACH, l’entreprise nationale de raffinage de distribution des produits a été créée par le Décret N 80/101 du 06 Avril 1980.
Entrée en activité le 01er Janvier 1982, elle est chargée de l’industrie, du
raffinage et de la distribution des produits pétroliers sous le sigle NAFTAL. En 1987, l’activité raffinage est séparée de l’activité distribution
La raison sociale de la société change suite à cette séparation des activités et NAFTAL est désormais chargé de la commercialisation et de la distribution des produits pétroliers et dérivés.
A partir de 1998, elle change de statut et devient filiale à 100% de SONATRACH.
L’appellation NAFTAL provient de :
NAFT : Pétrole AL : Aldjazair.
ORGANISATIONS DE NAFTAL : Les directions principales sont :
LBP : Lubrifiant, Bitumes, Pneumatique, a pour mission principale :
Elaboration, et suivi des politiques et programmes nationaux par marché et activé des Lubrifiants, Pneumatiques, Bitumes
D.C : Direction Centrale, a pour principale :
GPL : Gaz Pétrole Liquéfie, a pour mission principale :
Gestion des produits propane (vente, Approvisionnement, Distribution.)
B.CR : Branche, Carburant, a pour missions principales :
Elaborer le programme d’approvisionnement en Carburant, en Collaboration avec la Branche Commercialisation.
Assure l’approvisionnement en Carburant et produits spéciaux des centres relevant de la Branche de commercialisation.
4
B.I : Branche International, a pour mission principale : Elle s’occupe des projets d’association avec le compare international.
D.E : Direction Exécutif, a pour mission principale :
B.COM : Branche Commercialisation, a pour mission principale : Assure l’approvisionnent et la commercialisation des produits Aviation et Marine pour la satisfaction des besoins de la clientèles dans les meilleures condition d’efficacité et de coût.
Description des l’abréviation utilisée :
Branche Lubrifient bitume pneumatique
Direction Central
Branche Gaz Pétrole Liquéfié
Branche carburant
Branche international
Direction Exécutif
Branche Commercialisation
Dir. Centrale
Branche Carburant
Branche GPL
Dir. Exécu
Branche Inter
Branche Comm
Branche LBP
Direction. Général NAFTAL
6
Historique de la branche carburant (BCR)
Suite à la décentralisation de la Sonatrach,la division AVM créé le 19 avril 1978,était chargée de commercialiser des produits aviation et marine aux nivaux des port et aéroport.
Par décision du 26jeuin 2002,l’AVM a été dissoute et,par conséquent, elle fut remplacer par la branche carburant qui est chargée de la commercialisation des produit carburant « terre mer,aviation ».
Pour réaliser ses missions, elle dispose d’un certain nombre d’infrastructures et moyens (dépôt, centres aviation, centres marine, camions, bridges, camion aviateurs, barges d’avitaillement…etc.).
MISSIONS Branche Carburant
A / LES MISSIONS :
Elaborer le programme d’approvisionnement en Carburants, en collaboration avec la Branche Commercialisation ;
Conclure et gérer les contrats d’approvisionnement de Carburants et produits spéciaux ;
Assurer l’approvisionnement en Carburants et produits spéciaux des centres relevant de la Branche Commercialisation ;
Assurer la distribution des Carburants au réseau de points de vente et autres clientèles ;
Définir les niveaux de stocks optimaux et en assurer le maintien ;
Tenir des réunions de coordination régulière avec la Branche Commercialisation pour définir et ajuster les programmes d’approvisionnement mensuels des districts Commercialisation en Carburants et produits spéciaux ;
Exploiter, réhabiliter, moderniser et développer les infrastructures de stockage et les moyens de distribution de la Branche Carburants ;
Mettre en place un suivi régulier des relations avec les fournisseurs ;
7
Veiller à l’utilisation optimale des ressources humaines et prendre toutes les mesures permettant d’en augmenter productivité et d’en relever le niveau de formation ;
Mettre en œuvre toute action ou initiative d’étude de coût, d’optimisation du flux de distribution et de réduction des coûts visant à renforcer la position commerciale et l’image de la société sur le marché ;
Mettre en place un système de veille ou surveillance la concurrence ;
Mettre en place un système de procédure de gestion centralisé en vue de suivre et de s’assurer de l’exécution.
Les produits de NAFTAL Branche Carburant, division AVM sont:
o JET A1 (Produits Aviation) o AVGAS Aviation o Gas Oil Marine o Fuel Bunker C Marine o Fuel BTS Marine o HUILES.
Tâches & responsabilité :
o Assiste et conseille le Directeur dans la définition, l’analyse et la mise en œuvre de politiques, stratégies et objectifs à atteindre sur la base d’études élaborées par les Directions de la Branche
o Participe à l’élaboration des objectifs et politiques de développement de la Société pour les domaines d’activité relevant de la Branche
o Assure le traitement des dossiers particuliers qui lui sont confiés par la hiérarchie
o Coordonne, à la demande du Directeur de Branche, les travaux effectués par les Directions et en prépare les synthèses
o Peut être appelé, en cas de nécessité, à assurer l’intérim d’une Direction
o Est chargé de la rédaction des procès verbaux des différentes réunions
o Participe, à la demande du Directeur de Branche, aux différentes Commissions de la Société
o Peut représenter la Branche ou la Société auprès des autorités politiques, administratives ou organismes nationaux
Partie Théorique
Chapitre 1
Généralités sur Les séries chronologiques
Chapitre 1 Généralités sur les séries chronologiques
10
1.1 Introduction : Dans de nombreux domaines comme la biologie, la climatologie l’économétrie, on
enregistre des observations au cours du temps pour constituer ce que l’on appelle une série chronologique.
Une série chronologique est une suite d’observations indicée par le temps (t), représentant l’évolution d’un phénomène dans le temps.
Certaines séries peuvent s’observer de manière continue, certaines autres correspondent à des observations réalisées en des intervalles de temps fixes a priori : heure, jour, mois, année…
De telles suites de données sont notée {xt ; t=1,…,T}.
Les méthodes que nous exposons font référence à ce type de donnée. 1.2 Stationnarité : La stationnarité est la clef de l’analyse des séries temporelles avant d’effectuer des testes
spécifiques sur cette série et de chercher à la modéliser.
Nous commencerons par donner la définition d’un processus stationnaire au sens strict (ou stationnarité forte), et ensuite celle de la stationnarité du second ordre (ou stationnarité faible).
1.2.1. Définition d’un processus stationnaire au sens strict : Le processus xt
est dit strictement ou fortement stationnaire si quel que soit le n-uplet du temps (t1,t2,…,tn ) t1<t2<…. <tn , tel que ti ∈Z et pour tout temps h∈Z avec ti+h∈Z : ∀i, i=1...n , la suite ( xx htnht ++
,...,1 ) a la même loi de probabilité que le vecteur ( xx tnt ,...,1 ).
Autrement dit, la stationnarité stricte signifie que la distribution conjointe de ( xx tnt
,...,1
) est invariante par translation dans le temps.
Cette condition est difficile à vérifier en pratique, c’est pourquoi on utilise en général une version plus faible de la stationnarité, à savoir la stationnarité au second ordre.
1.2.2. Définition d’un processus stationnaire au second ordre : Un processus xt est dit stationnaire au second ordre, ou stationnaire au sens faible, si
les trois conditions suivantes sont satisfaites :
....,..)(, tdeteindependanmt xt=ΕΖ∈∀
.)(, 2 ⟨∞ΕΖ∈∀ xtt
...).(),cov(,),( 2 tdetindependanhht xx httγ=Ζ∈∀
+
Chapitre 1 Généralités sur les séries chronologiques
11
1.3 Premiers indices descriptifs d’une série temporelle : Il est bien utile de disposer de quelques indices numériques qui résument une
série ),...,( 1 xx T.
1.3.1 Indice de la moyenne et la variance: Les expressions de la moyenne et de la variance d’une série temporelle est :
-Moyenne : µ (t)= )(xtΕ
-Variance : ).()(2 xtVt =σ
1.3.2 Indice de dépendance :
Fonction d’autocovariance :
Soit xtun processus aléatoire de variance finie, on appelle fonction d’autocovariance
γ h(t) de xt
la fonction :
))].())(([().cov()( xxxxxx hthttthttht
+++Ε−Ε−Ε==γ
Cette fonction fournit des informations sur la variabilité de la série et sur les liaisons temporelles qui existent entre les différentes composantes de la série
Dans le cas d’un processus stationnaire du second ordre γ h(t) =γ h
est indépendante de t
La fonction d’autocovariance d’un processus stationnaire xtvérifie les
propriétés suivantes : • .0)(].))([().cov( 22
0≥==Ε−Ε== σγ xttttt xxxxx V
• .
0γγ ≤h
• ..:. pairefonction
hh γγ −=
Fonction d’autocorrélation notée FAC: On appelle fonction d’autocorrélation d’un processus stationnaire xt
la fonction :
.,)()(
),cov(
0
Ζ∈==+
+ hxVxV htt
htthh
xxγγρ
Cette fonction vérifie les trois propriétés suivantes :
Chapitre 1 Généralités sur les séries chronologiques
12
.1
0=ρ
.
0ρρ ≤h
..: pairefonction
hh ρρ −=
Fonction d’autocorrélation partielle notée FAP : Elle mesure la corrélation entre htt XetX − , l’influence des variables ,1 1t h iX i h− + < < −
ayant été retirée. Soit la matrice des corrélations formées des (h-1) premières autocorrélations.
1 1
1 2
1 2
1 ...1...
. 1
.
...1
h
h
h
h h
P
ρ ρρ ρ
ρ ρ
−
−
− −
⎡ ⎤⎢ ⎥⎢ ⎥⎢ ⎥
= ⎢ ⎥⎢ ⎥⎢ ⎥⎢ ⎥⎢ ⎥⎣ ⎦
Nh∈
La fonction d’autocorrélation partielle est donnée par : h
hh p
P *=ρ .
Où *hP est le déterminant de la matrice ∗hP obtenue à partir de hP , en remplaçant la
dernière colonne de celle-ci par le vecteur ),...,( 1 hρρ .
Ainsi
1 1
1 2
1
1 ...1...
.*
.
...
h
h h
P
ρ ρρ ρ
ρ ρ−
⎡ ⎤⎢ ⎥⎢ ⎥⎢ ⎥
= ⎢ ⎥⎢ ⎥⎢ ⎥⎢ ⎥⎢ ⎥⎣ ⎦
On peut se passer de ce calcul matriciel qui n’est souvent pas facile à faire. Pour cela, on
a recours à une écriture récurrente de iiρ tel que :
avec 1,...,1,,1,1 −=−= −−− ijjiiiijiij ρρρρ et 2,...,i h= . ⎪⎪⎪
⎩
⎪⎪⎪
⎨
⎧
=−
−
=
=
∑
∑−
=−
−
=−−
hi
isi
i
jjji
i
jjijii
ii ,.....,21
1
1
1,1
1
1,1
1
ρρ
ρρρ
ρ
ρ
Chapitre 1 Généralités sur les séries chronologiques
13
Cet algorithme résolvant les équations de Yule-Walker de manière récursive est appelé
algorithme de Durbin (1960).
1.4 La classe des processus aléatoire ARMA :
1.4.1 Généralités et notations :
Processus bruit blanc :
tε est un processus bruit blanc si : 2
( ) 0. .( ) . .
( . ) 0. . .
t
t
t s
t TVAR t T
COV pour t sσ
εε
ε ε
⎧ Ε = ∀ ∈⎪ = ∀ ∈⎨⎪ = ≠⎩
Opérateur linéaire :
Opérateur de retard : On note B l’opérateur retard, il est défini par : .
1xBx tt −=
Si on applique m fois cet opérateur, on a la relation suivante : .xxB mttm
−=
On constate ainsi que l’opérateur retard transforme une variable xten sa valeur passée.
Le polynôme retard )(BΦ est défini comme suit :
....1)( 221
pp BBBB Φ−−Φ−Φ−=Φ
Opérateur d’avance : Soit F l’opérateur inverse de B : B*F=I., I étant l’opérateur identité.
L’opérateur F est appelé opérateur avance: .1xxF tt +=
Si on applique m fois cet opérateur, on a la relation suivante :
.xxF mttm
+=
Opérateur de différence : On note ∇ l’opérateur (1-B) et m∇ l’opérateur (1- mB ) ainsi :
.xxx mttt
m
−−=∇
où m∇ S’appelle opérateur de différentiation de retard m.
1.4.2. Définition des processus ARMA :
Chapitre 1 Généralités sur les séries chronologiques
14
Il s’agit d’une très grande famille de processus stationnaires qui présente l’avantage d’être un bon outil de prévision ;
Processus autorégressifs AR (p):
Un processus { Ztxt ∈; } est appelé autorégressif d’ordre p si c’est une solution de l’équation :
( )
.t tB
tx εΦ =⎧⎪
⎨∀ ∈Ζ⎪⎩
telle que :
{ }, .t t est un processus bruit blancε• ∈Ζ
.')( pordredsifautoregresopérateurappeléestBΦ•
Si une série { Ztxt ∈; } est la réalisation d’un tel processus. Alors on peut écrire
( ) ttB x εΦ = sous la forme :
1 1 ... .t p t p ttx xx φ φ ε− −= + + +
avec:
....1 tdetsindependanréelsparamétresdespφφ•
Condition nécessaire et suffisante de la causalité et d’inversibilité :
Une condition nécessaire et suffisante pour que le modèle autorégressif
1 1 2 2t t t p t p tX X X Xφ φ φ ε− − −= + + + + soit causal (annexe 1) est que les racines de la
fonction caractéristique : ( ) 010 221 =−−−−⇔=Φ p
p BBBB φφφ soient en valeur absolue
supérieures à 1 c'est-à-dire 1B > . D’après la définition d’inversibilité (annexe 1), un modèle autorégressif d’ordre fini est toujours inversible.
Fonction d’ autocorrélation :
Pour obtenir les autocorrélations d’un processus AR (p), il suffit de multiplier chaque
membre de l’équation 1 1 ... .t p t p ttx xx φ φ ε− −= + + + par x kt−
tel que (k>0) ; en prenant ensuite
l’espérance de la variable et en divisant l’ensemble par 0γ , on obtient ainsi :
1
i p
k i k ii
ρ φ ρ=
−=
=∑ 0.k∀ >
En écrivant cette relation pour différentes valeurs de k (k=1,…,p),on obtient les
équations de Yule-Walker .
Fonction autocorrélation partielle :
Chapitre 1 Généralités sur les séries chronologiques
15
Les autocorrélations partielles, notées ,k d’un processus AR (p)
tptpttt XXXcX εφφφ +++++= −−− 2211 sont nulles pour tout ordre supérieur à p
),0( pkPk >∀= et non nulles pour tout ordre inférieur à p. De plus on a ppP φ= . Seuls les p premiers termes de la FAP sont significativement différents de 0.
Processus moyenne mobile MA (q) : Un processus { Ζ∈txt
; } est appelé processus moyenne mobile d’ordre q s’il est défini par la relation suivante :
( )*
.t t
B
tx ε= Θ⎧⎪
⎨∀ ∈Ζ⎪⎩
telle que :
{ }, .t t est un processus bruit blancε• ∈Ζ
( ) ' .B est appelé moyenne mobile d ordre q•Θ
Si une série { Ztxt ∈; } est la réalisation d’un tel processus. Alors on peut écrire
( )* ttBx ε= Θ sous la forme :
1 1 ... .t t q t qtx ε θ ε θ ε− −= − − −
Avec :
1,..., .qdes paramétres réels independants de tθ θ•
Condition nécessaire et suffisante de causalité et d’inversibilité: Une condition nécessaire et suffisante pour que le modèle moyenne mobile
qtqtttX −− −−−= εθεθε 11 soit inversible est que les racines de la fonction
caractéristique ( ) 0)1(0 221 =−−−−⇔=Θ q
qBBBB θθθ soient en valeurs absolues
supérieures à 1 1B > .
D’après la définition de causalité (annexe 1), un modèle moyenne mobile d’ordre fini est
toujours causal, car c’est une combinaison linéaire finie d’un processus
stationnaire{ }Ztt ∈,ε .
Fonction d’autocorrélation : La fonction d’autocorrélation d’un processus MA (q) est donnée sous la forme :
Chapitre 1 Généralités sur les séries chronologiques
16
1 12 2
0 1
...1 .
1 ...0 .
k k q k qkk
q
si k q
si k q
θ θ θ θ θγργ θ θ
+ −− + + +⎧= = ≤ ≤⎪ + + +⎨
⎪ >⎩
Fonction autocorrélation partielle :
La fonction d’autocorrélation partielle kP d’un processus MA (q) { }ZtXt ∈,
défini par tt BX ε)(Θ= se comporte comme une exponentielle ou une sinusoïdale amortie.
Processus ARMA (p, q) : On appelle un processus { },tx t Z∈ autorégressif moyenne mobile d’ordre (p, q) noté
ARMA (p, q) s’il s’écrit sous la forme suivante :
( ) ( ) ,t tB x B εΦ = Θ avec :{ }Ztt ∈,ε : est un bruit blanc de variance 2σ .
( ) piIRBBBB ip
p ,,1,1 221 …=∀∈−−−−=Φ φφφφ .
qiIRBBBB iq
q ,,1,,1)( 22
11 =∀∈−−−−=Θ θθθθ .
telle que :
{ }, .t t est un processus bruit blancε• ∈Ζ
Si une série { Ztxt ∈; } est la réalisation d’un tel processus, alors on peut écrire :
1 1... ... .q pet sont des paramètres réels independants de tθ θ φ φ•
Relation entre les processus AR(p) et MA(q) :
Soit le processus de type MA (1) : 1 1.t ttx ε θ ε −= −
Qui s’écrit aussi
1 1. (1 ).t t ttB Bx ε θ ε ε θ= − = −
D’où :
1 10 01
1 * * * ( ) .(1 )
i ii i i i
t i it t ti i
B B qui est un processus AR telle queB x x xε θ ψ ψ θ
θ
=∞ =∞
= =
= = = ∞ =− ∑ ∑
sous la condition 11 ≤θ
Chapitre 1 Généralités sur les séries chronologiques
17
2. Les démarches préliminaires pour analyser une série chronologique
2.1 Représentation graphique de la série: La première étape pour analyser une série chronologique est de la représenter
graphiquement pour mieux visualiser l’évolution de cette chronique (croissance, saisonnalité, période, oscillation, rupture…), cet examen nous permettra après de choisir un modéle approprié ainsi que de détecter d’éventuelles anomalies.
2.2 Les composantes temporelles de la série : L’examen de cette série met en évidence quatre composantes ; cette approche suppose
que la structure de la chronique peut être décomposée en éléments simples (modélisables) pour ensuite être reconstituées pour donner une prévision de la chronique ; ce sont :
2.2.1 La tendance (trend) notée Tt : Cette tendance représente l’évolution à long terme de la série, elle se représente comme
une fonction du temps (linéaire ou non) ; et décrit une structure d’évolution déterministe.
Celle-ci est souvent la composante la plus importante dans une série chronologique.
Cette tendance peut avoir :
1. Un caractère linéaire : la série croit d’une même quantité à chaque période ;
2. Un caractère exponentiel : la série croit à un taux constant ; des formulations plus complexes (par exemple polynomiales ou logistiques) peuvent être proposées.
2.2.2 Le facteur saisonnier notée St: C’est une composante marquée par des fluctuations plus ou moins régulières, d’une
intensité qui peut être variable et d’une période beaucoup plus faible que celle de la composante cyclique.
2.2.3 Les irrégularités ou résiduelle notée Rt: C’est un mouvement qui regroupe tout ce qui n’a pas été pris par la tendance et le facteur
saisonnier ; il contient donc de nombreuses fluctuations ponctuelles, de faibles amplitudes n’ayant pas d’incidence à moyen ou à long terme sur l’allure générale de la série : on parle parfois de mouvement erratique pour le caractériser.
Ce sont des fluctuations difficiles à analyser mais les plus intéressantes à modéliser pour la prévision à court terme.
2.2.4 La composante cyclique notée Ct :
C’est un mouvement d’allure quasi-périodique de mouvement ascendant (période de prospérité) et descendant (période de dépression) dont l’ensemble forme une dynamique oscillatoire retraçant le cycle économique.
2.3 Type de décomposition :
Chapitre 1 Généralités sur les séries chronologiques
18
Après avoir détecté par des méthodes graphiques ou analytiques quelles sont les composantes présentes, il faut proposer un modèle :
2.3.1 Le modèle additif :
La relation fonctionnelle la plus simple entre ces différentes composantes est la forme linéaire additive :
.
...1
.
⎩⎨⎧
=
++=
TtRSTX tttt
Dans ce modèle, on suppose que les amptitudes des variations saisonnières et des fluctuations résiduelles ne dépendent pas de la tendance.
2.3.2 Le modèle multiplicatif :
Si on observe des amptitudes variables (des saisonnalités et des irrégularités) avec la
tendance, on préféra une forme multiplicative complète de la forme :
....1
.**
⎩⎨⎧
=
=
TtRSTX tttt
Notons qu’une simple transformation logarithmique redonne la forme linéaire. Elle est très utilisée en économie.
Parfois les effets à court terme ne sont pas amplifiés par les effets à moyen et à long terme ; c’est à dire que la tendance et le facteur saisonnier sont multiplicatifs et les irrégularités additives, le modèle retenue est le modèle multiplicatif de la forme :
⎩⎨⎧
=
+=
....1
.*
TtRSTX tttt
2.4 Le test de schéma :
2.4.1 Le test graphique : Pour identifier graphiquement le modèle, il suffit de relier les deux grands pics par une
droite (D1) et le deux derniers creux par une autre droite (D2).
- Si les deux droites (D1, D2) sont parallèles alors le modèle est additif.
- Si les deux droites (D1, D2) ne sont pas parallèles, alors le modèle est multiplicatif.
Exemple : soit les deux graphes (G1) et (G2) :
Chapitre 1 Généralités sur les séries chronologiques
19
12000
14000
16000
18000
20000
22000
24000
26000
2000 2001 2002 2003 2004
ADDITIF
0
50
100
150
200
250
2000 2001 2002 2003 2004
MULTIPLICATIF
2.5 Les techniques de détection de la saisonnalité et de la tendance : 2.5.1 La technique graphique :
D’après les définitions précédentes les facteurs de la tendance et de la saisonnalité, peuvent être détectes graphiquement.
2.5.2 Les techniques analytiques :
L’examen du graphique ne suffit pas très souvent pour mettre en évidence une
saisonnalité, donc il est nécessaire d’utiliser le test de Fisher à partir de l’analyse de la
variance (test d’ANOVA).
D1
D2
D1
D2
Chapitre 1 Généralités sur les séries chronologiques
20
Test de Fisher :
On considère n: Le nombre d’années. P: Le nombre d’observations dans l’année
jiX : La valeur de la série pour la ième année et la jème période.
La moyenne générale ..X , la moyenne de l’année i .iX , la moyenne de la période j jX .
La variance année et la variance période sont définies respectivement par :
1
)(1
2...
−
−=
∑=
n
XXpVAR
n
ii
A ,
1
)(1
2...
−
−=∑=
p
XXnVAR
p
jj
P
La variance résiduelle :)1)(1(
)(1 1
2....
−−
−−−=∑∑= =
pn
XXXXVAR
n
i
p
jjiji
R
L’équation de la variance totale : RPAT VARVARVARVAR ++=1
)(1 1
2..
−
−=∑∑= =
n
XXn
i
p
jji
L’hypothèse est : 0H « pas de saisonnalité » contre 1H : « il existe une saisonnalité
La valeur calculée R
P
VARVARF =0 que l’on compare à la valeur tabulée α
21 vvF
avec ( )11 −= Pv , ( )( )112 −−= Pnv degré de liberté
Si 0F α21 vvF on rejette 0H , la série est saisonnière.
Soient les hypothèses : 0H : « La série n’est pas affectée d’une tendance »
Contre 1H : « La série est affectée d’une tendance »
On calcule R
A
VARVARF =1 que l’on compare avec α
23 vvF
Avec ( )13 −= nv , ( )( )112 −−= Pnv degré de liberté
Si 1F α23 vvF on rejette l’hypothèse nulle, la série est affectée d’une tendance.
Concernant l’existence de la tendance, le test de Fisher s’avère faible, il convient d’effectuer
un autre test.
Chapitre 2
Méthode du lissage exponentiel
Chapitre 2 Méthode de lissage exponentiel
22
2.1 Introduction : La prévision à court terme a connu des développements importants durant les dernières
années, elle constitue la base de l'action. La prise de décision repose en effet toujours sur des prévisions, c'est ainsi qu'une entreprise commerciale s'intéresse aux prévisions des ventes futures pour faire face à la demande, gérer sa production ainsi que ses stocks, mais aussi orienter sa politique commerciale ( prix, produits et marketing). De même, on essaie de prévoir les rendements d'un investissement, la pénétration d'un marché ou l'effet de la modération salariale sur l'emploi.
Les développements de la pratique statistique ont permis de disposer d'un certain nombre d'outils de calcul, les méthodes de lissage exponentiel font l'objet de ce chapitre, ces méthodes datent du début des années soixante (HOLT en 1957 et BROWN en 1962). Ils justifient amplement leurs utilisations.
Après avoir fait un lissage exponentiel simple qui ne peut être utilisé en présence d'une tendance ou d'une saisonnalité, nous passons au lissage double et à la méthode de HOLT, ces dernièrs peuvent convenir pour des séries présentant une tendance. Le lissage de WINTERS intervient dans les cas ou la tendance et la composante saisonnière sont juxtaposées soit de manière additive soit de manière multiplicative.
2.2 Principe de base : La méthode de lissage exponentiel repose sur l'idée suivante : les informations contenues
dans une série chronologique ont d'autant plus d'importance qu’elles sont plus récentes. Pour effectuer une prévision, il faut affecter aux informations un poids d'autant plus faible qu'elles proviennent d'époques plus éloignées.
2.3 Description de la méthode : Si 1 2, , , , , , , nx x x sont les termes d'une chronique, la méthode du lissage exponentiel
consiste à prendre comme prévision :
, 1,ˆ ˆ(1 )n h n n hx x x −= −α +α telle que 0 1≤α≤ , h et l’horizon.
où α : appelée constante de lissage est généralement comprise entre 0 et 1.
Pour débuter le processus de lissage, il convient de choisir une valeur pour la constante. Ce choix est très important car il conditionne la prévision future à travers le degré de pondération que l'on affecte au passé récent et au passé lointain et ceci pour assurer une bonne qualité de prévision.
2.4 Lissage exponentiel simple: Cette méthode ne doit être employée que sur une série qui ne présente ni tendance ni
composante saisonnière.
En prenant en compte toute l'histoire de la chronique de sorte que plus nous nous éloignons de la prévision moins l'influence des observations correspondantes est importante . Cette décroissance de l'influence est de type exponentiel ce qui justifie l’appellation.
Chapitre 2 Méthode de lissage exponentiel
23
Nous disposons d'une série chronologique x = ( nxx ,,1 … ) de longueur enregistrée aux dates 1, . . ., n. Nous nous situons à la date n et nous souhaitons prévoir la valeur x hn+ non encore observée à l'horizon h. Nous notons cette prévision : hnx ,ˆ . L'entier n est parfois appelé base de la prévision
Les formules de lissage sont :
, 1,ˆ ˆ(1 )n h n n hx x x −= −α +α telle que 0 1≤α≤ …………. (∗ ).
avec 1, 1,ˆ h hx x= (initialisation).
Il existe d'autres initialisations 1x ₁ comme la moyenne de la série.
Dans le choix deα , nous distinguons les deux cas particuliers suivants :
Si α =0, alors toutes les prévisions sont identiques, les prévisions restent inchangées, on dit dans ce cas que le lissage est inerte.
Si α=1, la prévision est égale à la dernière valeur observée, la nouvelle valeur lissée est toujours égale à la dernière réalisation, dans ce cas on dit que le lissage est hyper réactif.
La relation (∗ ) peut être développée en remontant dans le temps (n-1, n-2, n-3,...,1 ,0) et laisse apparaître que la nouvelle valeur lissée est une combinaison linéaire de toutes les observations du passé affectée d'un poids décroissant avec l'âge, les poids sont de plus en plus faibles au fur et à mesure que l'on s'éloigne de l'observation actuelle.
On retrouve : 1
,0
ˆ (1 ) .n
jn h n j
j
x x−
−=
= −α α∑
Remarques: La formule , 1,ˆ ˆ(1 ) .n h n n hx x xα α −= − + permet
d'interpréter ,ˆn hx comme le barycentre de ,n hx et de 1,ˆn hx − affecté respectivement des masses (1-α ) et α .
d'interpréter le lissage comme une moyenne pondrée de la dernière réalisation et de la dernière valeur lissée.
de réécrire cette formule sous la forme suivante :
, 1, 1,ˆ ˆ ˆ(1 )( ).n h n h n n hx x x xα− −= + − −
Le lissage apparaît comme le résultat de la dernière valeur lissée corrigée par une pondération de l'écart entre la réalisation et la prévision.
Lorsque α est proche de 0 (α ≃0), la pondération s'étale sur un grand nombre de termes dépendant du passé, la mémoire du phénomène étudié est forte et la prévision est peut réactive aux dernières observations.
Lorsque α est proche de 1 (α ≃1), les observations les plus récentes ont un poids prépondérant sur les anciens termes, la mémoire du phénomène étudié est faible et la prévision est très réactive aux dernières observations.
On peut retrouver l'équation du lissage exponentiel en employant une approche très simple basée sur le concept de la fonction de prévision, telle que:
,ˆ ...( )n h nx a= Ω
Chapitre 2 Méthode de lissage exponentiel
24
où na est une constante qui dépend de l'origine de prévision.
On choisit na en utilisant un critère de moindres carrés pondérés, avec des coefficients de pondération décroissant exponentiellement quand on recule dans le passé, de la forme de jβ , on l’appelle facteur d’escompte .
En appliquant la prévision au passé de la série, l'erreur de prévision est la différence n j nx a− − . La somme des carrés des erreurs à minimiser est alors de la forme :
2
0
( ) ( ) .jn n j n
jQ a x aβ −
≥
= −∑ ²
Egalons à zéro la dérivées par rapport à na de cette expression:
0( ) 2 ( ) 0.j
n n j nj
Q a x aβ −≥
= − − =∑
Ce qui entraîne l'équation :
0 0.j j
n j nj j
x aβ β−≥ ≥
=∑ ∑ or 1
0(1 )j
jβ β −
≥
= −∑
d’où
0
ˆ (1 ) ............(**)jn n j
ja xβ β −
≥
= − ∑
L'expression (∗∗) est exactement ce que nous avons trouvé pour la prévision ,ˆn hx (relation
(∗) ) du lissage exponentiel simple tel que le facteur d'escompte β est remplacé par la constante de lissage α c'est-à-dire β α=
On remarque que (voir relation (*).
, 1,
1
1
ˆ ˆ(1 ) .(1 ) d 'après la relation ( ).ˆ ˆ .
. ' :(1 )( ) .
n h n n h
n n n
n n n n n n
n n n
n n n n
x x xa x ax x e x e xx e a d oua e a a
α α
α α
α α
−
−
−
= − +
= − + Ω
− = ⇒ = +
= +
= − + +
1
1
1 1
1
.(1 ) . . 0. :(1 )( ) .
. . .0 1.
n n n n n
n n n
n n n n n
n n n
e e a a aa e a si alors
a e a e a
a e a avec
α α αα α α α
α γα
γ γ
−
−
− −
−
= − + − += − + ≠
−= + = +
= + ≤ ≤
En conséquence , nous pouvons dire que le lissage exponentiel simple est justifié dans le cas d'une fonction de prévision constante, dans le contexte de moindres carrés pondérés , et elle ne sera vraiment constante que si l'on choisit un facteur d'escompteβ égale à 1, ce qui correspond à 1α = .
Chapitre 2 Méthode de lissage exponentiel
25
2.5 Choix du coefficient de lissage: Pour débuter le processus de lissage, il convient de choisir une valeur pour la constanteα ,
ce choix est très important car il conditionne la prévision future à travers le degré de pondération que l'on affecte au passé récent et au passé lointain.
Divers procédures d'estimation ont été établit, on s'intéresse à la méthode la plus classique qui consiste à retenir une valeur de α qui minimise l'écart entre la prévision et la réalisation sur la partie connue de la chronique. Pour optimiser le choix de la constanteα , il suffit de :
Choisir un des critères d'optimisation : le critère MSE (Mean square error ou moyenne des carrées des résidus) satisfait ce besoin.
Choisir un ensemble de valeurs de α pour effectuer un balayage, par exemple les valeurs de 0 à 1 par pas de 0,1.
Choisir la prévision initiale.
Pour chaque valeur de α choisie, on effectue l'ensemble du lissage exponentiel par application des formules suivantes:
Pour n=1 à N….faire
1ˆ.......... .ˆ.......... .
........... .
n n n
n n n
x x ex e xfin
α−− →
− →
Choisir la valeur de α qui améliore aux mieux le critère MSE (celle qui fournit la plus petite moyenne des carrées des résidus).
2.6 Lissage exponentiel double: Les formules précédentes permettent de calculer une prévision pour des séries
chronologiques stationnaires sans tendance, nous pouvons définir un lissage exponentiel double qui est utilisé en cas de série présentant une tendance.
On part d'une fonction de prévision linéaire de la forme:
, 1, 2,ˆ ˆ ˆn h n nx a a h= +
Notons que :
1, 2,ˆ ˆ. .n na et a sont des coefficients dépendant de n
On cherche à déterminer les valeurs des deux paramètres par le critère des moindres carrées escomptesβ , tel que le facteur d'escompte est remplacer par α c'est-à-dire β α= .
2.7 Méthode de Holt-Winters Cette approche a pour but d'améliorer et de généraliser le Lissage Exponentiel Simple.
Nous étudions plusieurs cas particuliers de cette méthode :
- ajustement d'une droite affine (sans saisonnalité)
- ajustement d'une droite affine plus une composante saisonnière - ajustement d'une constante plus une composante saisonnière
Chapitre 2 Méthode de lissage exponentiel
26
Cette méthode est plus souple que le lissage exponentiel amélioré, dans la mesure où elle fait intervenir deux constantes β et γ au lieu d’uneα Telle que 0 < β < 1 et 0 < γ < 1 deux constantes fixées et les formules de mise à jour :
( ) ( ) ( )( ) ( ) ( ) ( )
1 1 2
2 1 1 2
ˆ ˆ ˆ1 1 1
ˆ ˆ ˆ ˆ1 1 1na x a n a n
a a n a n a n
β β
γ γ
= + − − + −⎡ ⎤⎣ ⎦= − − + − −⎡ ⎤⎣ ⎦
La prévision prend la forme :
, 1 2ˆ ˆ ˆ ( )n hx a h a n= +
siααγαβ
+−
=−=111 2 et alors :
( ) ( )( ) ( ) ( )
( ) ( ) ( )
( ) ( ) ( ) ( ) ( )
( ) ( ) ( )
( ) ( ) ( ) ( ) ( )
21 1 2
21,1 1 2
2 21 2
22
2 2 1 1 22
21 2
2
2 1 1 22
ˆ ˆ ˆ( ) 1 1
ˆ ˆ ˆ1 1 1
ˆ ˆ1 1 1
1ˆ ˆ ˆ ˆ ˆ( ) 1 1 1
1ˆ ˆ1 1 1
1ˆ ˆ ˆ ˆ1 1 1
1
n n
n
a n a n a n
x x a n a n
a n a n x
a n a n a n a n a n
a n a n
a n a n a n a n
α
α
α α
αα
αα
αα
−
= − + − +⎡ ⎤⎣ ⎦
⎡ ⎤− − + − + −⎣ ⎦
= − + − + −⎡ ⎤⎣ ⎦
−⎡ ⎤= − + − − + −⎡⎣⎣ ⎦−
− − − + −⎡ ⎤⎣ ⎦
−= − + − − − −⎡ ⎤⎣ ⎦−
Remarque : Si β et γ sont petits, le lissage est fort puisque alorsα est grand et que nous tenons compte
du passé lointain.
Chapitre 3
Non stationnarité, tests
de racine unitaire
Chapitre 3 Non stationnarité, tests de racine unitaire
28
3.1 Généralités sur la non stationnarité : La plupart des réalisations économiques et financières sont des réalisations de processus
non stationnaires.
D’après la définition de la stationnarité au second ordre : un processus non stationnaire est un processus qui ne satisfait pas l’une ou l’autre de ces deux conditions, Ainsi l’origine de la non stationnarité peut provenir d’une dépendance du moment d’ordre un (l’espérance) par rapport au temps, ou d’une dépendance de la variance ou des autocovariances par rapport au temps .
La difficulté réside dans le fait qu’il existe différentes sources de non stationnarité et qu’à chaque origine de la non stationnarité est associée une méthode propre de stationnarisation.
Les cas de non stationnarité les plus fréquents sont analysés à partir de deux types de processus : les processus de type TS (time stationary) et les processus de type DS (differency stationary).
3.1.1 Processus de type DS et TS : Le fait que la stationnarité puisse être de type déterministe ou stochastique, nous amène
à définir la classe des processus de type TS (trend stationary) et la classe des processus de type DS (differency stationary).
3.1.1.1 Les processus de type TS : ( ), Ζ∈txt est un processus de type TS s’il peut s’écrire sous la forme :
( ) .t tx f t ε= +
Où ( )f t est une fonction déterministe du temps et tε est un bruit blanc.
Il est évident que le processus ne satisfait pas la définition de la stationnarité de second ordre puisque il viole la premeir condition de la définition d’un processus stationnaire :
( ) ( ) dépend du temps, ( ) 0.t tE x f t car E ε= =
Étude des chocs sur les processus de type TS : L’une des propriétés importantes de ce type de processus est la propriété de non
persistance de chocs, cela signifie que lorsqu’un processus de type TS subit un choc positif ou négatif à une date donnée, l’influence de ce choc a tendance à s’estomper au cours du temps . La variable considérée rejoint sa dynamique de long terme déterminée par ( )f t .
Stationnarisation d’un processus de type TS : Pour stationnariser un processus de type TS, il convient de retirer la composante
déterministe ( )f t en régressant la série tx
3.1.1.2 Les processus DS : ( ), Ζ∈txt est un processus non stationnaire de type DS (differency stationnary) d’ordre
(d), qui désigne l’ordre d’intégration, si le processus filtré par td xB)1( − est stationnaire. On
dit alors que ( ), Ζ∈txt est un processus intégré d’ordre (d) noté I (d).
Chapitre 3 Non stationnarité, tests de racine unitaire
29
Ordre d’intégration (d): ( ), Ζ∈txt est un processus DS intégré d’ordre (d) si et seulement si : le polynôme )(Bφ associé à sa composante autorégressive admet (d) racine unitaire :
( ) ( ) (1 ) ( )dt tB x z avec B B Bφ φ= = − Φ
∼.
tz est un processus stationnaire, les racines du polynôme ( )BΦ∼
sont toutes supérieures en module à l’unité.
Étude des chocs sur les processus de type DS : L’influence d’un choc tε à une date donnée sur un processus non stationnaire de type DS
est permanente.
Stationnarisation d’un processus de type DS : Pour stationnariser un processus de type DS d’ordre (d), il convient d’appliquer le filtre
( ) .1 dB−
3.1.1.3 Conséquences d’une mauvaise stationnarisation du processus :
Conséquence sur un processus TS : Soit le processus ( ), Ζ∈txt de type TS défini par : 0 1 .t tx a a t ε= + +
L’application d’un filtre aux différences premières 1 1 1(1 ) .t t t t t tx B x x x a ε ε− −Δ = − = − = + − nous permet de définir un processus txΔ stationnaire.
{ }
12 2 2
1
2
2
( ) .[( ) ] 2 .
2 0( ) 1;1 .
0 sin
t
t
E x aE x a
pour hh pour h
on
ε
ε
ε
σ
σγ σ
∗ Δ =∗ Δ = + < ∞
⎧ =⎪∗ = − = −⎨⎪⎩
Le processus obtenu txΔ n’a pas les caractéristiques d’un bruit blanc puisque sa fonction d’autocovariance n’est pas la fonction d’autocovariance d’un bruit blanc. Ce qui conduit à une autocovariance fallacieuse du résidu du filtre
Conséquence sur un processus DS : L’extraction d’une tendance linéaire d’un processus DS conduit à créer artificiellement
une forte autocorrélation des résidus aux premiers retards et donc apparaît un mouvement pseudo-périodique des résidus.
3.1.2 Processus autorégressif moyenne mobile intégré d’ordre (p, d, q) : Ce sont des modèles ARMA intégrés notés ARIMA. Ils sont issus des séries
stationnarisées par l’application du filtre aux différences et ceci, bien entendu dans le cas des processus DS détectés par le test de Dickey- Fuller. Le processus tX suit un ARIMA (p, d, q), s’il est solution d’une équation aux différences stochastiques du type
ttd BXBB ε)()1()( Θ=−Φ .
Chapitre 3 Non stationnarité, tests de racine unitaire
30
3.1.3. Processus autorégressif moyenne mobile intégré saisonnier : Il est possible que certaines séries chronologiques soient caractérisées par une allure
graphique périodique. Pour cela, il est important de les analyser en tenant compte de l’effet saisonnier. Box et Jenkins (1970) ont proposé une classe de modèles particuliers appelée : classe de modèles ARIMA saisonniers.
Modèles saisonniers mixtes : SARIMA Ce sont des extensions des modèles ARMA et ARIMA. Ils représentent généralement des
séries marquées par une saisonnalité, comme c’est le plus souvent le cas pour des séries économiques voire financières. Ces séries peuvent mieux s’ajuster par des modèles saisonniers. Ce sont les modèles SARIMA (p, d, q) (P, D, Q) qui répondent au modèle:
ts
stDsds
s BBXBBBB ε)()()1()1()()( ΘΘ=−−ΦΦ Où : ( ) p
p BBBB φφφ −−−−=Φ 2211 : Polynôme autorégressif non saisonnier d’ordre p.
( ) PsPs
sss
ss BBBB φφφ −−−−=Φ 2
211 : Polynôme autorégressif saisonnier d’ordre Ps. q
qBBBB θθθ −−−−=Θ 22
111)( : Polynôme moyenne mobile non saisonnier d’ordre q.
QsQsss
ss BBBB θθθ −−−−=Θ 2
21
11)( : Polynôme moyenne mobile saisonnier d’ordre Qs. dB)1( − : Opérateur de différence d’ordre d.
DsB )1( − : Opérateur de différence saisonnière d’ordre D. ),0( 2
εσε BBt → , s correspond à la saisonnalité.
Modèles saisonniers purs : (SARMA) Un processus stochastique { }ZtXt ∈, est dit processus autorégressif moyenne mobile
saisonnier pur d’ordre ( )( ),0, , ,s
p q P D Q , si son évolution satisfait la forme suivante : t
sst
Dsss BBXBBB ε)()()1()()( ΘΘ=−ΦΦ
),0( 2εσε BBt → , s correspond à la saisonnalité.
3.2 Test de racine unitaire : Les tests de racine unitaire sont des tests paramétriques qui servent à détecter la non
stationnarité des processus, parmi les tests les plus utilisés en raison de leurs simplicités on trouve les tests de Dickey - Fuller.
3.2.1 Le Test de Dickey- Fuller simple (1979): Le test de Dickey –Fuller considère les trois modèles suivants
Modèle [1] : modèle sans constante ni tendance déterministe : 2(1 ) (0, )t t tB X ou BB ερ ε ε σ− = ∼
Modèle [2] : modèle avec constante sans tendance déterministe : 2(1 )( ) (0, )t t tB X ou BB ερ μ ε ε σ− − = ∼
Modèle [3] : modèle avec constante et tendance déterministe : 2(1 )( ) (0, )t t tB X t ou BB ερ μ α ε ε σ− − − = ∼
Chapitre 3 Non stationnarité, tests de racine unitaire
31
Le principe général du test consiste à tester l’hypothèse nulle de présence d’une racine unitaire (on dit alors que tX est intègré d’ordre 1), contre l’hypothèse alternative d’absence de racine unitaire (on dit alors que tX est intègré d’ordre 0).
Ecrivons plus précisément les hypothèses nulle et alternative pour chacun des trois modèles considérés :
Modèle [1] :
0 1
1 1
: 1 . ( ).: 1 . ( . 1 ( (1))).
t t t t
t t t t
H X X X suit un processus de marche aleatoire sans dériveH X X X suit un processus autoregressif d ordre AR
ρ ερ ρ ε
−
−
= ⇔ = + ⇒⎧⎨ ⇔ = + ⇒⎩ ≺
Modèle [2] : 0 1
1 1
: 1 ( ).: 1 . . (1 ) ( (1) ).
t t t t
t t t t
H X X X suit un processus de marche aleatoire sans dériveH X X avec X suit un processus AR avec dérive
ρ ερ ρ γ ε γ μ ρ
−
−
= ⇔ = + ⇒⎧⎨ ⇔ = + + = − ⇒⎩ ≺
Modèle [3] :
0 1 .
1 1
: 1 ( .).: 1 * . . (1 ) . . (1 ).
( ).
t t t t
t t t
t
H X X X suit un processus de marche aleatoire avec dériveH X X t avec et
X est un processus TS avec erreurs ARMA
ρ β ερ ρ λ δ ε λ α ρ ρβ δ β ρ
−
−
= ⇔ = + + ⇒⎧⎪ ⇔ = + + + = − + = −⎨⎪ ⇒⎩
≺
En pratique, on estime les modèles sous la forme suivante :
Modèle [1] : 1 .t t tX Xφ ε−Δ = +
Modèle [2] : 1 .t t tX Xφ γ ε−Δ = + +
Modèle [3] : 1 * .t t tX X tφ λ δ ε−Δ = + + +
Avec, pour chaque modèle, 1−= ρφ et 2(0, )t BB εε σ∼ On teste alors l’hypothèse nulle 0=φ (non stationnarité) contre l’hypothèse
alternative 0φ < (stationnarité).
Règle de décision :
Si la valeur calculée de la t-statistique associée à φ est inférieure à la valeur critique (en se referant aux table de Dickey et Fuller (annexe 2)), on rejette l’hypothèse nulle de non stationnarité.
Si la valeur calculée de la t-statistique associée à φ est supérieure à la valeur critique, on accepte l’hypothèse nulle de non stationnarité.
Stratégie séquentielle de test en trois grandes étapes :
• Etape 1 : on estime le modèle [3]. On commence par tester la significativité de la tendance en se référant aux tables de Dickey-Fuller (annexe 2) deux cas peuvent se présenter :
Si la tendance n’est pas significative, on passe à l’étape 2.
Si la tendance est significative, on teste l’hypothèse nulle de racine unitaire en comparant la t –statistique de φ aux valeurs tabulées par Dickey et Fuller (annexe 2). On a alors deux possibilités :
Chapitre 3 Non stationnarité, tests de racine unitaire
32
o Si on accepte l’hypothèse nulle, tX est non stationnaire. Dans ce cas, il faut la différencier et recommencer la procédure de test sur la série en différence première.
o Si l’on rejette l’hypothèse nulle, tX est stationnaire. Dans ce cas, la procédure de test s’arrête et l’on peut directement travailler sur tX
• Etape 2 : cette étape ne doit être appliquée que si la tendance dans le modèle précèdent n’est pas significative. On estime le modèle [2] et l’on commence par tester la significative de la constante en se referant aux tables de Dickey-Fuller (annexe 2) :
Si la constante n’est pas significative, on passe à l’étape 3.
Si la constante est significative, on teste l’hypothèse nulle de racine unitaire en comparant la t-statistique de φ aux valeurs tabulées par Dickey Fuller (annexe 2), on se trouve alors deux possibilités :
o Si l’on accepte l’hypothèse nulle, tX est non stationnaire .dans ce cas, il faut la différencier et recommencer la procédure de test sur la série en différence première.
o Si l’on rejette l’hypothèse nulle, tX est stationnaire. Dans ce cas la
procédure de test s’arrête et l’on peut directement travailler sur tX .
• Etape 3 : cette étape ne doit être appliquée que si la constante dans le modèle précèdent n’est pas significative. On estime alors le modèle [1] et on teste l’hypothèse nulle de racine unitaire en utilisant les valeurs critiques du tableau :
Si l’on accepte l’hypothèse nulle, tX est non stationnaire. Dans ce cas, il faut la différencier et recommencer la procédure de test sur la série en différence première.
Si l’on rejette l’hypothèse nulle, tX est stationnaire, la procédure de test
s’arrête et l’on peut directement travailler sur tX
3-2-2 Test de Dickey Fuller augmenté: Tout comme dans le cas du test de Dickey Fuller (DF) simple, trois modèles se distinguent
dans le test de Dickey Fuller augmenté (ADF) :
• Modèle [1’] : modèle sans constante ni tendance déterministe :
11
.p
t t j t j tj
X X Xφ γ η− −=
Δ = + Δ +∑
• Modèle [2’] : modèle avec constante sans tendance déterministe :
11
.p
t t j t j tj
X X Xφ μ γ η− −=
Δ = + + Δ +∑
• Modèle [3’] : modèle avec constante et avec tendance déterministe :
11
.p
t t j t j tj
X X t Xφ λ δ γ η− −=
Δ = + + + Δ +∑
La mise en œuvre du test ADF est similaire à celle du test de DF simple :
On adopte la même stratégie séquentielle descendante partant de l’estimation du modèle [3’]. Les statistiques de test sont les mêmes que dans le cas du test DF simple. Il convient cependant de remarquer que l’application du test ADF nécessite au préalable de choisir le nombre de retards p à introduire de sorte à blanchir les résidus.
Chapitre 3 Non stationnarité, tests de racine unitaire
33
3-2-3 Algorithme de Dickey –Fuller augmenté :
Telle que :
0HA : accepter l’hypothèse nulle H0.
0HR : rejeter l’hypothèse nulle H0
11
.p
t t j t j tj
X X X t Cφ φ β ε− −=
Δ = + Δ + + +∑
β=0
11
.p
t t j t j tj
CX X Xφ φ ε− −=
Δ = + Δ + +∑
C=0
Φ=0
Φ=0
Φ=0
Un processus de type DS et TS
0HR
Un processus de type DS
(Filtre aux
Un processus de type TS (Régression sur le temps)
Le processus est Stationnaire (Fin)
Le processus est Stationnaire (Fin)
Un processus de type DS
(Filtre aux différences)
11
.p
t t j t j tj
X X Xφ φ ε− −=
Δ = + Δ +∑
0HA
0HR 0HA
0HA
0HA
0HA
0HR
0HR
0HR
19
Chapitre 4
Méthodologie de Box & Jenkins
et Tests sur les résidus
Chapitre 4 Méthodologie de Box & Jenkins
35
5.1 Méthodologie de Box et Jenkins :
La méthode de Box et Jenkins qui a fait l’objet d’importantes d’applications dans le domaine de la prévision, est présenté ici par cet organigramme:
Box et Jenkins ont développé une véritable méthodologie de recherche systématique d’un modèle adéquat, ils se réfèrent à deux types de modèles ; les modèles moyennes mobiles, les modèles autorégressifs, ou une combinaison des deux.
4.1.1 Les démarches de la méthodologie de Box et Jenkins : Analyse exploratoire des données.
Analyse graphique de la série (saisonnalité, tendance).
Analyse analytique de la série :
Test de Fisher (saisonnalité).
Test de Dickey Fuller (tendance).
Stationnarisation de la serie.
Filtre à la différence d’ordre d.
Filtre aux différences saisonnier d’ordre D.
Filtre par régression.
Identification du modèle.
Estimation des paramètres.
Test de validation.
Prévision.
IDENTIFICATION
ESTIMATION
VALIDATION
OUINON
Chapitre 4 Méthodologie de Box & Jenkins
36
Différentes étapes de la méthodologie de BOX & JENKINS Note : ce diagramme est repris de l’ouvrage de Régis Bourbonnais et Jean-Claude
Usinier.
Analyse du graphique et du corrélogramme
Analyse de la saisonnalité
Test de DICKEY-FULLER
Régression sur le temps Si TS
Passage aux Différences Si DS
Série stationnaire
Analyse des corrélogrammes simple et partiel
Détermination des ordres p et q du processus ARMA
Estimation des paramètres
Test de STUDENT les coefficients non significatifs sont supprimés
Oui
Prévision par ARMA
Recoloration de la série (saisonnalité,……..)
Non ajout d’un ordre p
Test sur les résidus sont-ils des bruits blancs
Chapitre 4 Méthodologie de Box & Jenkins
37
4.2. L’estimation du modèle : Après avoir identifié l’ordre du processus ARMA, il convient d’estimer les paramètres du
modèle, puis de vérifier à partir d’un certain nombre de tests statistiques que l’estimation du modèle est valide.
4.2.1. Méthode d’estimation : Parmi les méthodes les plus utilisées pour l’estimation des paramètres du modèle ARMA,
θ et φ , figurent la méthode du maximum de vraisemblance et la méthode des moindres carrées.
4.3. Les tests de validation :
Après l’étape de l’identification et l’estimation des paramètres du modèle, plusieurs modèles sont estimés et c’est l’ensemble de ces modèles qui subissent alors l’épreuve des tests.
4.3.1. Test sur les paramètres :
Test de Student : On effectue un test classique de Student sur chacun des paramètres du processus ARMA,
Il peut arriver qu’un ou plusieurs paramètres ne soient pas significativement différents de 0, alors le modèle estimé est rejeté et on retourne à l’étape d’estimation en éliminant la variable dont le coefficient n’est pas significatif.
H0 « p 0φ = » contre H1 « p 0φ ≠ ».
La statistique du test :p
p
ptφ
φ σφ
ˆˆ ˆ
ˆ= .
La règle de décision est alors
ˆ 1 / 2.
ˆ 1 / 2
* . on accepte l'hypothése nulle de processus ( 1, ).
* . l'hypothese nulle est rejetée et on retient un processus ( , ).
p
p
si t t ARMA p q
si t t ARMA p q
αφ
αφ
−
−
⎧ −⎪⎨⎪ ≥⎩
≺
Les mêmes démarches sont valables pour les paramètres .qθ
Le coefficient de détermination :
Pour chaque modèle estimé, le coefficient de détermination correspondant R2 est:
Chapitre 4 Méthodologie de Box & Jenkins
38
( )2
21 .t
tt
Rx x
ε= −
−∑
∑(Coefficient de détermination normal).
( )
22
211 * t
tt
nRn p q x x
ε−= −
− − −∑
∑. (Coefficient de détermination corrigé)
(Coefficient de détermination corrigé.).
si
2
2
0.7 (le modéle estimé ajuste bien la chronique).0.5 (le modéle estimé ajuste mal la chronique).
(on ne peut rien dire).
si Rsi R
si non
⎧ ⇒⎪ ⇒⎨⎪ ⇒⎩
≺
4.3.2 Tests sur les résidus : L’objectif de ces tests est de vérifier que les résidus estimés suivent bien un processus
bruit blanc.
Rappelons qu’un processus bruit blanc est un processus de moyenne nulle, de variance constante et non autocorrélé, et pas nécessairement gaussien.
Test de nullité de la moyenne :
Soit résidusdescalculéemoyennelaetmE
t
t :)var()(
2 εσε
ε
⎩⎨⎧
==
.
On accepte l’hypothèse 0Η au seuil %5=α si : %51
1ˆ −≤
−nt
nσ
ε
L'hypothèse de test : "0:""0": 10 ≠Η=Η mcontrem
La statistique de test : Z= ˆ1n
εσ
−
.
La règle de décision : si Z 5%1nt −≤ on accepte l'hypothèse H0
Test d’existence d’une tendance (point de retournement) :
Il teste la nature aléatoire des résidus, on dira que la suite des données
1ε , 2ε , …, nε présente un point de retournement à la date i si :
1−iε iε≺ 1+iε Où 1−iε iε 1+iε≺
Chapitre 4 Méthodologie de Box & Jenkins
39
Soit la variable aléatoire tΧ tel que :
tΧ =⎩⎨⎧01
La variable aléatoire tΧ suit la loi Bernoulli de paramètre 2/3.
Si T désigne le nombre total des points de retournement alors on a :
T=∑−
=
Χ1
2
n
ii ; ( )TΕ =
3)2(2 −n ; ( )Tarν =
902916 −n .
Sous l’hypothèse que ( iε ) forment une suite de variables aléatoires Indépendantes et
identiquement distribuées :
La statistique U= ⎯→⎯−
)var()(
TTET
N (0,1) , pour n>50
Donc on accepte l’hypothèse 0Η : « les iε sont non corrélés» si U 96.1≺ et cela au seuil
05,0=α
Test de recherche d’autocorrélation (Durbin–Watson) Le test de Durbin Watson est un test qui détecte l’autocorrélation d’ordre 1, sous la
forme : t t 1 t .−ε = ρε +η ou 2t N(0. )ε ≈ σ .
Le test d’hypothèse:
0
1
H : 0(absence.de.corrélation)H : 0(présence.de.corrèlation)
⎧ ρ =⎪⎪⎨⎪ ρ ≠⎪⎩
La statistique de Durbin Watson utilisée est :
( )
n2
t t 1t 2
n2t
t 1
DW−
=
=
ε −ε=
ε
∑
∑ Cette statistique comprise entre 0 et 4.
Ou tε : l’estimateur des résidus du model.
Cette statistique est comprise entre 0 et 4 et vaut 2 lorsque ρ =0
Durbin et Watson ont tabulé les valeurs critiques de DW au seuil 5 % en fonction de la taille de la série et du nombre de variables explicatives.
Test de Box Pierce :
Ce test est basé sur la statistique de Quenouille Q= 2
1* ( )
k
k tk
n r ε=∑ qui est fonction de la
somme des carrés des autocorrélations de la FAC. Il permet de vérifier l’hypothèse :
S’il présente un point de retournement à la date t Sinon S’il présente un point de retournement à la date t Sinon
Chapitre 4 Méthodologie de Box & Jenkins
40
.0...210 ===== KH ρρρ
H1 : il existe au moins un iρ significativement différent de 0.
Pour effectuer ce test, il est conseillé de choisir K entre 20 et 30.
L’hypothèse H0 rejette au seuil de 5 % si Q est supérieur au quantile 2χ 0.95 de la loi .2χ
Test de Ljung et Box: Nous pouvons utiliser aussi une statistique, dont les propriétés asymptotiques sont
meilleures, dérivée de la première qui est le Q′de Ljung et Box : 2
1
( )( 2)k
i t
i
rQ n nn iε
=
′ = +−∑ .
Les tests du Skewness et de Kurtosis :
La statistique de test : 1/ 2
1/211 1
0 telle que β : cooefficient de skewness6 /
vn
β −=
22 2
3 telle que β : coefficient de kurtosis.24 / nβν −
=
Les hypothèses :
H0 : 1 0(absence d'symétrie)ν = et 2 0(aplatissement normal)ν = .
La règle de décision : 1 21.96 et 1.96 (on accepte l'hypothese de normalite).
si non on rejette l'hypothese de normalite.siν ν ⇒⎧⎨⎩
≺ ≺
Le test de Jarque et Bera Il s’agit d’un test qui regroupe les résultats précédents.
La statistique du test :
21 2/ 6* / 24( 3)s n nβ β= + −
Les hypothèses : H0 : normalité des résidus au seuil α.
La règle de décision : 21 (2)on rejette l'hypothese de normalitési s αχ −≥ .
Test d’homoscédasticité (l’effet ARCH)
Chapitre 4 Méthodologie de Box & Jenkins
41
Les modèles classiques de prévision fondés sur les modèles ARMA supposent des séries temporelles à variance constante (hypothèse d’homoscedasticité).
Cette modélisation néglige l’information éventuelle contenue dans le facteur résiduel de la chronique.
Les modèles de type ARCH (autorégressive conditionnellement heteroscedastiques) permettent de modéliser des chroniques qui ont une volatilité (ou variance ou variabilité) instantanée qui dépend du passé.
Il est ainsi possible d’élaborer une prévision dynamique de la chronique en termes de moyenne et de variance.
L’effet ARCH est repéré grâce au corrélogramme des carrés des résidus.
Si un ou plusieurs termes sont significativement différents de zéro (l’existence d’une corrélation entre les carrés des résidus) on dit qu’il y a effet ARCH.
Ceci est confirmé par le test d’effet ARCH :
Le modèle ARCH est spécifie par :
ttt hu .=ε Avec indépendants identiquement distribuéstu et ∑=
−+=p
iitith
1
20
2 εαα
Statistique du Multiplicateur de Lagrange LM= 2nR avec n = le nombre d’observations servant au calcul de la régression.
R2= le coefficient de détermination.
Soit l’hypothèse H0 : « 0...21 ==== pααα » contre H1 : « iα non tous nul »
Règle de décision : Si LM < 2 ( )pχ on accepte 0H .
Dans le cas contraire LM > )(2 pχ à p degré de liberté compris entre 1 et 3, on rejette H0 et le processus est justifiable d’un modèle ARCH (p).
Si p >3 le modèle sera justifiable d’un modèle de type GARCH.
5.4. Choix du modèle : On fait appel à des critères d’information afin de choisir le modèle optimal parmi tous les
modèles repérés :
Le critère AIC introduit par Akaike :
AIC (p, q) = log [σ2] + Nqp )(*2 +
Le critère BIC de Schwartz :
BIC (p, q) = log [σ2] + (p+q) * NN )log(
Le modèle optimal est celui qui minimise ces deux critères.
4.5 Prévision :
Chapitre 4 Méthodologie de Box & Jenkins
42
4.5.1 Transformation de la série :
Lorsque on a appliqué différentes transformations (exemple différenciation dans le cas
d’une série I (1)) afin d’identifier le modèle ARMA, il est nécessaire lors de la phase de
prévision de prendre en compte la transformation retenue et de recolorer la prévision.
Plusieurs cas sont possibles :
Si le processus contient une tendance déterministe, on extrait cette dernière par
régression afin d’obtenir une série stationnaire lors de la phase de prévision, on
adjoint aux prévisions réalisées sur la composante ARMA stationnaire, la
projection de la tendance.
Si la transformation résulte de l’application d’un filtre linéaire (de type par
exemple différence premières), on réalise les prévisions sur la série filtrée
stationnaire e l’on reconstruit ensuite par inversion du filtre les prévisions sur la
série initiale.
4.5.2 Prédicteur pour un modèle ARMA :
On considère un modèle ARMA ( )qp, tel que :
qtqttptptt XXX −−−− ++++++= εθεθεφφ 1111
Avec : ( ) ( )22 ,0, εσεθφ diietIR tqp ⋅⋅∈ ∗ .
Appliquons le théorème de Wold au processus { }Ζ∈tX t , et considérons la forme
MA (∞) correspondante : 100
== −
∞
=∑ αεα jtj
jtX .∞≺jα
Il s’ensuit que la meilleure prévision que l’on peut faire de 1+tX compte tenu de toute
l’information disponible jusqu’à la date t, notée )1(ˆtX , est donnée par :
( )0211 ,...,,,)1(ˆ XXXXXEX ttttt −−+=
( )0211 ,...,,, εεεε −−+= ttttXE jtj
j −+
∞
=∑= 1
1
εα
Dés lors, l’erreur de prévision est donnée par la réalisation en 1+t de l’innovation qui en t
n’est pas connue : 11 )1(ˆ++ =− ttt XX ε
Plus généralement pour une prévision à un horizon k on a :
jktkj
jt kX −+
∞
=∑= εα)(ˆ et jkt
k
jjtkt kXX −+
−
=+ ∑=− εα
1
0
)(ˆ
Déterminons un intervalle de confiance sur la prévision ),(ˆ kX t sous l’hypothèse de normalité
des résidus tε . On montre alors que :
Chapitre 4 Méthodologie de Box & Jenkins
43
[ ])1,0(
)(ˆvar
)(ˆ
21 N
kXX
kXX l
Ttkt
tkt
∞→+
+ →−
−
Or on sait que :
[ ]{ } 21
0
22
1
0
2
εσαεα ∑∑−
=
−
=−++ =⎥
⎦
⎤⎢⎣
⎡⎟⎠⎞
⎜⎝⎛=−
k
jj
k
jjktjtkt EkXXE )(ˆ
D’où [ ]
)1,0()(ˆ
211
02
NkXX l
Tk
j j
tkt
∞→−
=
+ →−
∑ ασε
On peut donc construire un intervalle de confiance sous la forme :
⎥⎥
⎦
⎤
⎢⎢
⎣
⎡
⎟⎟⎠
⎞⎜⎜⎝
⎛±= ∑
−
=ε
ασα ˆ)(ˆ
21
1
0
22k
jjt tkXIC
Chapitre 5
Les processus
à mémoire longue
Chapitre 5 Les processus a mémoire longue
45
5.1. Généralité et définition de la mémoire longue : Un processus stationnaire Xt est un processus à mémoire longue s’il existe un nombre
réelα , telle que 0 1α≺ ≺ , et une constante c, c 0,vérifiant :
lim 1.k
k ck α
ρ−→∞
=
où ρ est la fonction d’autocorrelation et k le retard.
Par conséquent, les autocorrelations d’un processus à mémoire longue vérifient la relation asymptotique suivante : k ck αρ −≈ quand k→ ∞ .
5.2. Bruit blanc fractionnaire ARFIMA(0.d.0) : Le processus ARFIMA le plus simple est le processus ARFIMA (0.d.0) ou bruit
fractionnaire de paramètre d en temps discret. Il se définit comme suit :
(1 ) .dt tB X ε− =
où B est l’opérateur retard et tξ est un bruit blanc.
Le développement binomial est donné par :
0(1 )d d j
jj
B Bπ∞
=
∇ = − =∑ où 0
( ) 1( ).( 1) ( )j
k j
j d k dj d k
π≤
Γ − − −= =Γ + Γ − ∏
≺ pour j=0.1…
où Γ étant la fonction euclidienne de seconde espèce.
Le processus ainsi défini est le processus ARFIMA (0.d.0). Les propriétés de ce modèle sont largement développées dans Hos King (1981). Nous reprenons ici que les bases principales.
Si d <1/2, Xt est stationnaire et a une représentation moyenne mobile infinie :
0
(1 ) ( ) .dt t t k t k
kX B Bε ε θ ε
∞−
−=
= − = Θ =∑
où 1( ) .. .
( ) ( 1) ( )
d
kd k k pour k
d k dθ
−Γ += ≈ →∞Γ Γ + Γ
.
Si d >-1/2, Xt est inversible et a la représentation autorégressive infinie suivante :
0
(1 ) ( ) .dt t k t k t
kB X B X Xφ ε
∞
−=
− = Φ = =∑
où1( ) .. .
( ) ( 1) ( )
d
kk d k pour k
d k dφ
− −Γ −= ≈ →∞Γ − Γ + Γ −
.
Chapitre 5 Les processus a mémoire longue
46
5.3. Processus ARFIMA (p.d.q) : Un processus ARFIMA (p.d.q) ou d ∈ ] [1/ 2.1/ 2− est définie par :
( ) ( )t tB X Bφ θ ε= Ou : 2(1 ) , , (0. ).dt tB ou BBε υ υ σ−= −
Où ( ) ( )B et Bφ θ sont des polynômes de degrés respectivement p et q.
Les conditions de stationnarité et d’inversibilité des processus ARFIMA (p.d.q) sont :
Si d <1/2 et ( ) 0Bφ = possède toutes ses racines à l’extérieur du cercle unité du plans complexe. Xt est stationnaire.
Si d >-1/2 et ( ) 0.BΘ = possède toutes ses racines à l’extérieur du cercle unité du plans complexes. Xt est inversible.
Finalement Xt est stationnaire et inversible lorsque -1/2<d<1/2.
5.4. Test de mémoire longue : Il existe plusieurs types de tests de mémoire longue. Nous allons présenter ici deux tests :
Le test de LO (1991) qui repose sur l’analyse de la statistique R/S.
Test de Labato et Robinson (1998).
5.4.1.Test de Lo (1991) :
L’exposant de Hurst est donné par :TLogQLogH T≈
La relation entre l’exposant de Hurst et le degré d’intégration fractionnaire
est21: += dH .
Si ( )21012
1 <<<< dH : le processus est à mémoire longue ou persistant.
Si :)0(21 == dH le processus se réduit au processus standard ARMA.
Si ( )021
210 <<−<< dH : le processus est anti-persistant.
Lo a défini une statistique R/S qui, tout en restant sensible à la mémoire longue, est
invariante sous une classe générale de processus à mémoire courte.
La statistique R/S notée TQ , s’écrit :
1
1/ ( )( ) 11 1
max ( ) ( )minT TT
k T
k kQ R s q j T j Ts q k Tj j
X X X X≤ ≤
⎡ ⎤⎢ ⎥
= = ⎢ ⎥⎢ ⎥≤ ≤= =⎣ ⎦
− − −∑ ∑ .
Chapitre 5 Les processus a mémoire longue
47
où 2 2
1 1 1( ) 1/ ( ) 2 / ( ) ( )( )
qT T
T j T j j T t j Tj j i j
s q T X X T w q X X X X−= = = +
⎡ ⎤= − + − −⎢ ⎥
⎣ ⎦∑ ∑ ∑ .
telle que : ( ) 1 , .1j
jw q q Tq
= − <+
5.4.2. Test de Labato et Robinson (1998) : Labato et Robinson (1998) ont proposé un test du type multiplicateur de Lagrange de
l’hypothèse nulle I(0) contre l’alternative I(d) avec d ≠ 0.
La statistique de test est donnée par :
11/ 2
1
( )
( )
m
j jj
m
jj
ILR m
I
ν λ
λ
=
=
= −∑
∑
où 1
1log log
m
ji
j m iν −
=
= − ∑ .
où I(λj) est le périodogramme de Xt et m le nombre d’ordonnées du périodogramme. Asymptotiquement, la statistique de test suit une loi normale centrée réduite.
5.5. Les méthodes d’estimation des processus ARFIMA : Les méthodes d’estimation des processus ARFIMA peuvent être regroupées en deux
catégories. La première (la méthode en deux étapes) consiste à estimer d’abord le paramètre d . Une fois cette estimation réalisée, la série corrigée ))1(( ˆ
td XB− permet de
déterminer les paramètres de la partie ARMA (p, q) du processus ARFIMA (p, d, q). La seconde méthode (méthode en une étape) consiste à estimer tous les paramètres simultanément par la méthode du maximum de vraisemblance, chacune de ces deux méthodes comprend des techniques d’estimation.
5.5.1 Méthode en deux étapes : (méthode basée sur l’exposant de Hurst) Lors de son analyse sur les crues du Nil, Hurst (1951) a introduit une statistique
permettant de détecter la présence des phénomènes de mémoire longue, cette statistique, notée SR , est particulièrement intéressante dans la mesure où elle donne lieu à un coefficient,
appelé exposant de Hurst, permettant de classifier les séries temporelles en fonction de la nature de leur mémoire.
Chapitre 5 Les processus a mémoire longue
48
5.6 Prévision d’un processus ARFIMA (p, d, q) : Soit un processus ARFIMA (p, d , q) causal et inversible tel que :
ttd BXBB ε)()1()( Θ=−Φ ………. (1) -
( )2,0 εσε BBt → , ⎢⎣⎡
⎥⎦⎤−∈
21,
21d
0)( ≠Φ μ
où μ < 1 (causalité) et 0)( ≠Θ γ , γ <1 (inversibilité).
μ et γ sont les racines des polynômes Φ etΘ respectivement
(1) peut s’écrire : jtj
jtX −
∞
=∑= εψ
0…………… (2)
ou bien : jtj
jt X −
∞
=∑=
0πε …………… (3)
(1) et (2) donnent : dpqj
jj ZZZZ −−
∞
=
−ΦΘ=∑ )1()()( 1
0ψ
(1) et (3) donnent: dqpj
jj ZZZZ )1()()( 1
0−ΘΦ= −
∞
=∑π et 1<Z
Par définition : ),........,,,........,/(ˆ2121 nnhnhn XXXXEX εεε++ =
où n est le nombre d’observations, h l’horizon et hnX +ˆ la prévision.
jhnj
jhnX −+
∞
=+ ∑= εψ
0
),...,,,...,/(ˆ11
0nnjhn
jjhn XXEX εεεψ −+
∞
=+ ∑= ),...,,.../( 11
0nnjhn
jj XXE εεεψ −+
∞
=∑=
⎩⎨⎧ ≤−
= −+−+ nonsi
jhsiXXXE jhn
nnjhn 0
0),........,,,........,/( 2121
εεεεε
jhnhj
jhnX −+
∞
=+ ∑= εψˆ
Il existe un écart entre les observations et les prévisions appelé erreur de prévision noté
hne +ˆ tel que : ∑∑−
=−+
−
=+++ ==−=
1
0
2221
0
2 )()ˆ()ˆvar(h
jjjhn
h
jjhnhnhn EXXEe ψσεψ ε
D’où l’intervalle de prévision : 2/11
0
2 )(96.1ˆ ∑−
=+ ±=
h
jjhnX ψσ ε si les erreurs sont gaussiennes .
Chapitre 6
Le modèle VAR
Chapitre 6 Le modèle VAR
50
Un modèle VAR est un outil économique particulièrement adapté pour mesurer et utiliser en simulation, l’ensemble des liaisons dynamiques à l’intérieur d’un groupe de variables donné. Toutes les variables sont initialement considérées comme étant potentiellement endogènes. En règle générale, la modélisation VAR « standard» consiste à modéliser un vecteur de variables stationnaires à partir de sa propre histoire et chaque variable est donc expliquée par le passé de l’ensemble des variables.
La forme standard de ce type de modèle est caractérisée par les points suivants :
Les variables à modéliser sont toutes stationnaires.
Les variables à modéliser sont toutes potentiellement endogènes.
Le nombre de décalages associé à chaque variable dans chaque équation est identique.
6.1 Présentation du modèle VAR standard 6.1.1 Ecriture du modèle VAR standard Soit ( )1 2, , , n
t t t tX x x x ′= … un vecteur stationnaire de dimension ( )1n× .
La modélisation de ce vecteur sous la forme d’un processus ( )VAR p s’écrit
1 1 2 2 1, ,t t t p t p tX C X X X t Tε− − −= +Φ +Φ + +Φ + =… …
avec ( ) ( )1, , , 0,nt t t t iidNε ε ε ε= ≈ ∑ où ∑ est une matrice diagonale, ( ): 1 ,C n× et
( ): pour 1, , .i n n i pΦ × =
L’hypothèse que ∑ est une matrice diagonale est cruciale dans la modélisation VAR et
dans l’utilisation du modèle VAR en simulation (calcul des fonctions de réponse et décomposition de la variance de l’erreur de prévision).
Une autre écriture fréquemment rencontrée de ce modèle VAR est la suivante : ( ) 1, ,t tB X C t TεΦ = + =
où ( ) ( )11 ppB B BΦ = −Φ − Φ… est un polynôme en l’opérateur retard L caractérisé par
.kt t kB X X −=
Enfin, dans le cas où toutes les variables sont centrées, l’écriture du modèle VAR se ramène à ( ) ( )1, , 1t tB X t TεΦ = =
C’est cette écriture qui sera retenue par la suite
6.1.2 Condition de stationnarité Le terme de droite du modèle ( )VAR p défini par l’équation (1) représente le mécanisme
supposé avoir engendré le vecteur tX . Ce mécanisme est purement dynamique. Or les éléments du vecteur tX étant stationnaires, il est nécessaire que les mécanismes dynamiques définis par ce terme de droite génèrent effectivement une dynamique stationnaire. Pour que cela soit assuré, les racines en B du polynôme caractéristique ( )11 p
pB B−Φ − Φ… doivent être de module supérieur à l’unité (ou hors du cercle unité dans le jargon consacré).
Chapitre 6 Le modèle VAR
51
Exemple : Soit la modélisation ( )1VAR du processus stationnaire non centré
( )1 2t t tX x x ′= de dimension 2 :
1 1 11 1
2 2 22 1
t t t
t t t
cx xcx x
εε
1 11,1 1,2 −1 12,1 2,2 −
⎛ ⎞⎛ ⎞ φ φ ⎛ ⎞ ⎛ ⎞⎛ ⎞= + +⎜ ⎟⎜ ⎟ ⎜ ⎟ ⎜ ⎟⎜ ⎟ ⎜ ⎟φ φ⎝ ⎠⎝ ⎠ ⎝ ⎠ ⎝ ⎠⎝ ⎠
La condition de stationnarité de ce processus ( )1VAR est obtenue par le calcul des racines en B du polynôme :
( )1
1 00 1
B BI B B
B B
1 1 1 11,1 1,2 1,1 1,21 1 1 12,1 2,2 2,1 2,2
⎛ ⎞ ⎛ ⎞φ φ 1−φ −φ⎛ ⎞−Φ = − =⎜ ⎟ ⎜ ⎟⎜ ⎟ ⎜ ⎟ ⎜ ⎟φ φ −φ 1−φ⎝ ⎠ ⎝ ⎠ ⎝ ⎠
Les racines en B de ce modèle VAR(1) sont obtenues en calculant les racines en B de : ( ) ( )( ) 2
1det 0 1 1 0I B B B B1 1 1 11,1 2,2 1,2 2,1−Φ = ⇔ −φ −φ −φ φ =
La stationnarité du modèle VAR est assurée si les deux racines en B de cette équation sont de module supérieur à l’unité.
6.1.3 Concept d’innovation Dans le cadre d’un modèle VAR, le vecteur tε de taille ( )1n× est appelé vecteur des
innovations de tX . Le concept d’innovation joue un rôle clef dans la modélisation VAR et dans l’utilisation des modèles VAR en simulation.
Pour saisir facilement ce concept, il suffit de réécrire tout d’abord le modèle VAR précédent sous la forme suivante :
( )1 1 2 2t t t p t p tX X X X ε− − −− Φ +Φ + +Φ =…
Or, d’après l’équation (1), la meilleure prévision linéaire du vecteur tX qu’il est possible de réaliser en ( )1t − est donné par :
( ), 1 1 1 2 2 1
1 1 2 2
/prévut t t t p t p t
t t p t p
X E X X X Inf
X X X− − − − −
− − −
= Φ +Φ + +Φ
= Φ +Φ + +Φ
…
…
où ( )1. / tE Inf − représente l’opérateur "espérance conditionnelle à l’information
disponible à la date ( )1t − ".
Le vecteur tε peut donc être finalement réécrit sous la forme :
( ), 1 2prévut t t tX Xε −= −
Soit encore au niveau de chacun des éléments de tε
( )1/ pour 1, ,j j jt t t tx E x Inf j nε −= − = …
On s’aperçoit ainsi que si le modèle (1) est le "vrai modèle" ayant engendré le vecteur tX (cette hypothèse est faite lors de toute modélisation et n’est donc pas spécifique aux
Chapitre 6 Le modèle VAR
52
modèles VAR), le vecteur tε représente la part de tX qui n’était pas prévisible à la date précédente ( )1t − . En considérant que l’économie (autrement dit ici le vecteur tX ) subit à chaque date des chocs aléatoires ou des "innovations" imprévisibles qui font dévier la valeur que prend effectivement le vecteur X à une date t quelconque, de la valeur de X qui était prévisible en ( )1t − pour la date t, on s’aperçoit immédiatement sur l’écriture (2) que les chocs aléatoires survenant à la date t sont donnée par tε . On appellera donc tε le vecteur des innovations du vecteur X à la date t ou bien encore le vecteur des chocs d’innovations affectant X à la date t (ou affectant tX plus simplement).
Ces innovations représentent donc les chocs affectant l’économie à chaque date. Nous verrons par la suite qu’elles seront "considérées" comme des variables exogènes du modèle VAR et seront utilisées comme telles en simulation.
Exemple: Soit ( )1 2 3, ,t t t tX x x x ′= un processus vectoriel stationnaire centré de dimension 3. Une modélisation VAR(1) de ce vecteur s’écrit :
1 1 11
2 2 21
3 3 31
t t t
t t t
t t t
x xx xx x
εεε
1 1 11,1 1,2 2,3 −1 1 12,1 2,2 2,3 −1 1 13,1 3,2 3,3 −
⎛ ⎞ ⎛ ⎞⎛ ⎞ ⎛ ⎞φ φ φ⎜ ⎟ ⎜ ⎟⎜ ⎟ ⎜ ⎟
= φ φ φ +⎜ ⎟ ⎜ ⎟⎜ ⎟ ⎜ ⎟⎜ ⎟ ⎜ ⎟⎜ ⎟ ⎜ ⎟φ φ φ⎝ ⎠ ⎝ ⎠⎝ ⎠ ⎝ ⎠
Considérons par exemple la variable 2x . La prévision en ( )1t − de la valeur de 2tx est
donnée par
( ) ( )2 1 2 31 1 1 1
1 2 31 1 1
/prévu
t t t t t
t t t
x E x x x Inf
x x x
1 1 12,1 − 2,2 − 2,3 − −
1 1 12,1 − 2,2 − 2,3 −
= φ + φ + φ
= φ + φ + φ
La valeur de l’innovation affectant 2x à la date t est donc égale à :
( )2 2 2prévu
t t tx x ε− =
6.2. Estimation d’un modèle VAR standard Dans le cas d’un vecteur tX stationnaire et d’un modèle VAR(p) usuel où chaque
variable intervient dans chaque équation avec le même nombre de décalages, l’inférence classique s’applique et le modèle peut être convenablement estimé à l’aide de la méthode des Moindres Carrés Ordinaires sur chaque équation séparément.
L’objectif n’est pas ici de fournir une démonstration rigoureuse de tous ces résultats mais de mettre ce résultat en évidence de façon heuristique pour faire apparaître le modèle VAR comme la forme réduite usuelle d’un modèle économétrique et pour justifier l’applicabilité des résultats économétrique auxquels le modélisateur non spécialiste des séries temporelles est habitué
Le modèle VAR(p) présenté dans l’équation (1) est tout d’abord réécrit sous une forme plus proche de celle généralement retenue en économétrie classique :
Chapitre 6 Le modèle VAR
53
Soit tY le vecteur de dimension ( )1np× et soit ′Π la matrice de dimension ( )n np×
définis par ( )1
1et =t
t p
t p
XY
X
−
−
⎛ ⎞⎜ ⎟ ′= Π Φ Φ⎜ ⎟⎜ ⎟⎝ ⎠
…
Le modèle (1) peut alors être réécrit selon
t t tX Y ε′= Π +
où la matrice ′Π contient l’ensemble des matrices 1, , .i i pΦ =
Sous l’hypothèse ( )0,t iidNε ≈ ∑ , la distribution du vecteur tX conditionnelle à
l’histoire de ce vecteur ( )pour 1, 2,t kX k− = … est donnée par :
( ) ( )1 2/ , , ,t t t tX X X N Y− − ′≈ Π ∑…
La densité conditionnelle de l’observation de la période t (pour t quelconque) est alors :
( ) ( ) ( ) ( )1
1 1221
1/ , 2 exp . . .2
n
t t t t t tf X X X Y X Yπ − − −−
⎧ ⎫′′ ′= ∑ − −Π ∑ −Π⎨ ⎬⎩ ⎭
On peut donc en déduire la vraisemblance de l’échantillon :
( ) ( )1 2 0 1 11
, , , / , , / ,T
T p t tt
f X X X X X f X X− + −=
=∏
Il vient ensuite pour la log-vraisemblance de l’échantillon :
( ) ( ) ( ) ( ) ( )1 1
1
1θ 2 . .2 2 2
T
t t t tt
nT TL Log Log X Y X Yπ − −
=
⎡ ⎤′′ ′= − + ∑ − −Π ∑ −Π⎢ ⎥⎣ ⎦∑
Où ( )θ ,′= Π ∑ représente l’ensemble des paramètres du modèle.
L’estimateur du maximum de vraisemblance de ′Π obtenu par application de la méthode des moindres carrés ordinaires aboutit alors à
1
1 1
ˆT T
t t t tt t
X Y Y Y−
= =
⎡ ⎤⎡ ⎤′ ′′Π = ⎢ ⎥⎢ ⎥⎣ ⎦⎣ ⎦∑ ∑
Notons que les estimateurs des éléments de la jème ligne de la matrice ′Π sont obtenus en régressant j
tx sur tY : 1
1 1
ˆT T
j t t t tt t
x Y Y Yπ−
= =
⎡ ⎤⎡ ⎤′ ′= ⎢ ⎥⎢ ⎥⎣ ⎦⎣ ⎦∑ ∑
Chapitre 6 Le modèle VAR
54
L’utilisation de l’estimateur ˆ ′Π de la matrice ′Π permet ensuite d’obtenir l’estimateur de la matrice de variance-covariance ∑ . En effet la valeur estimée du vecteur des innovations est donnée par :
ˆt̂ t tX Yε ′= −Π
par définition de la matrice de variance-covariance des innovations, il vient ensuite :
1
1ˆ ˆ ˆ.T
t ttTε ε
=
′∑ = ∑
L’élément ( ),i i de la matrice ∑̂ correspond à la variance estimée de l’innovation de la
variable ( )2
1
1 ˆˆ:T
it i t
tx
Tσ ε
=
′= ∑ alors que l’élément ( ),i j de la matrice ∑̂ correspond à la
covariance estimée des innovations des variables itx et
1
1 ˆ ˆˆ:T
j i jt i j t t
tx
Tσ ε ε
=
′= ∑
D’un point de vue théorique, la présentation de la modélisation VAR standard ne présente donc aucune difficulté particulière pour l’économètre classique une fois connu le nombre de décalages p à utiliser.
6.3. Estimation du nombre de décalages p La théorie économique ne donne que très peu d’informations sur le nombre de décalages
p à retenir dans la modélisation d’un vecteur de variables X sous une forme VAR(p). De plus, il n’existe aucune procédure établie pour déterminer le nombre de décalages adéquat. Tout au plus pourrait-on dire que le nombre de décalages à retenir est celui qui permet de modéliser "convenablement" le vecteur X et d’aboutir à un vecteur d’innovations (qui est en fait la partie non modélisée de X) qui soit de type bruit blanc.
Si cette remarque de bon sens semble déjà suggérer une méthode de détermination du nombre de décalages, il faut également remarquer que le nombre de paramètres à estimer pour un modèle VAR est égal à pn2 (ou (pn2 +n) en prenant en compte les termes constants contenus dans le vecteur C) et augmente de n2 avec chaque nouveau décalage. Un nombre trop élevé de décalages risque donc d’épuiser rapidement les degrés de libertés.
A partir de ces deux remarques, trois méthodes sont plus particulièrement retenues pour estimer le nombre de décalages p dans la pratique des modèles VAR :
Une méthode basée sur l’examen des propriétés statistiques des innovations du modèle VAR
Une méthode basée sur l’utilisation de critères d’information
Une méthode basée sur des tests de nullité emboîtée sur les paramètres associés au dernier décalage du modèle.
Chapitre 6 Le modèle VAR
55
Une première méthode de détermination du nombre p de décalages consiste à vérifier la blancheur des résidus de modèles VAR(p) successivement estimée pour p=1,2,3….
En partant du modèle VAR d’ordre minimal (p = 1), il suffit alors d’arrêter la procédure pour le nombre de décalages p pour lequel les résidus sont de type bruit blanc. La blancheur des résidus peut être examinée à partir de différents tests de non autocorrélation (test de Ljung-Box ou Box-Pierce, test type multiplicateur de Lagrange, etc.), de normalité (Skewness, Kurtosis, Barque-Jéra) et d’absence d’hétéroscédasticité conditionnelle (test d’absence d’effets ARCH).
6.3.1 Estimation du nombre de décalages à partir d’un critère d’information Une seconde méthode consiste à déterminer le nombre de décalages en utilisant un
critère d’information. Les critères d’information sont basés sur l’idée selon laquelle l’ajout d’une variable explicative (ou d’un ensemble de variables explicatives) à un modèle existant aboutit d’un coté à une amélioration plus ou moins importante de la part expliquée des variables modélisées (apport informatif) et d’un autre côté à une réduction des degrés de libertés pour l’estimateur. Cette réduction des degrés de liberté est considérée comme une pénalité liée à l’incorporation d’une variable explicative additionnelle.
La valeur du critère d’information peut être calculée pour chaque modèle estimé. Dans le cas des modèles VAR, la procédure de détermination du nombre de décalages à partir des critères d’informations consiste donc à estimer un modèle VAR d’ordre minimal (p = 1) et de calculer la valeur prise par le critère d’information) pour ce modèle, En estimant le modèle VAR d’ordre immédiatement supérieur (p = 2) et en recalculant la valeur correspondante du critère d’information, on décide de conserver le décalage p=2 si l’apport informatif du second décalage est supérieur au coût qu’il occasionne en termes de réduction de degrés de liberté.
Dans le cas où le décalage p=2 est conservé, la procédure est prolongée en estimant le modèle VAR(3) et en comparant le critère d’information obtenu pour ce modèle avec celui obtenu pour le modèle précédent VAR(2). Le nombre de décalages est ainsi systématiquement augmenté tant que l’apport informatif du dernier décalage est supérieur au coût qu’il occasionne. Lorsqu’un décalage occasionne un coût supérieur au gain informatif, la procédure s’arrête et le décalage précédent apparaît être le décalage "optimal".
En pratique, il suffit donc de déterminer "à priori" un nombre de décalages maximal pmax et d’estimer successivement les modèles VAR(p) pour p =1,… , pmax. Pour chaque modèle estimé, la valeur du critère d’information correspondante est calculée et est notée CRIT(p) pour p =1,… , pmax .
Le nombre de décalages optimal p̂ est choisi comme celui pour lequel la valeur de critère d’information est maximale (ou minimale selon la forme du critère retenu) :
( )maxmax 1, ,1, ,
ˆ max minp pp p
p ou CRIT P==
=……
Dans le cadre de la modélisation VAR, parmi les critères qui sont fréquemment utilisés : le critère du Final Predictor Error (FPE), le critère d’information de Schwartz (SC) et le critère d’information de Hannan-Quinn (HQ), le critère d’information d’ Akaike(AIC).
Chapitre 6 Le modèle VAR
56
Tous les critères sont basés sur le choix d’un nombre de décalages qui minimise une expression dans laquelle intervient à la fois le nombre de décalages (p), la taille de l’échantillon (T), le nombre de variables (n) et le déterminant de la matrice de variance-covariance des innovations obtenues à partir d’un VAR(p) (noté ( )det p∑ dans les formules relatives à chaque critère). Ce dernier élément est en fait un indicateur de la qualité statistique du modèle qui décroît lorsque la qualité statistique du modèle s’améliore.
En notant ( )p∑ la matrice de variance-covariance du modèle VAR(p), les expressions correspondant à ces différents critères sont les suivants :
- Critère FPE (Final Predictor Error) : ( )1 det1
pT np pT np⎡ ⎤+ +
∑⎢ ⎥− −⎣ ⎦
- Critère AIC (Akaike Information Criterion): ( )22log det pnp
T∑ +⎡ ⎤⎣ ⎦
- Critère SC (Shwartz Criterion) : ( ) ( ) 2loglog det
Tp pn
T∑ +⎡ ⎤⎣ ⎦
- Critère HQ (Hannan Quinn) : ( ) ( ) 22log loglog det
Tp pn
T⎡ ⎤⎣ ⎦∑ +⎡ ⎤⎣ ⎦
Plusieurs auteurs ont déjà réalisé des évaluations comparatives de ces différents critères afin d’analyser leur capacités respectives à sélectionner le bon modèle
6.3.2. Estimation du nombre de décalages à partir de tests du rapport de vraisemblance
Une troisième procédure consiste à déterminer le nombre de décalages du modèle VAR. Les tests utilisés sont des tests du rapport de vraisemblance qui prennent une forme simple dans le cas des modèles VAR. En effet, la valeur de la log-vraisemblance du modèle VAR éstimé est égale à
( ) ( ) ( )1 1
1
1ˆ ˆˆ ˆ ˆθ 22 2 2
T
t tt
nT TL Log Logπ ε ε− −
=
′= − + ∑ − ∑∑
Etant donné que1
1ˆ ˆ ˆ ,T
t ttTε ε
=
′∑ = ∑ le dernier élément du terme de droite se réduit ici à
1
1
1 ˆˆ ˆ2 2
T
t tt
nTε ε−
=
′∑ =∑
Les tests du rapport de vraisemblance associé à une hypothèse nulle 0H donnée sont bâtis sur le double du rapport des vraisemblance (ou de la différence des Log-vraisemblance) estimées pour le modèle contraint ( )( )0 θL et pour le modèle non contraint ( )( )1 θL . La statistique de test correspondante dans le cas d’un modèle VAR se réduit donc à :
( ) ( )( ) { }1 0 0 1ˆ ˆˆ ˆ2 θ θRV L L T Log Log= − = ∑ − ∑
Chapitre 6 Le modèle VAR
57
Un résultat standard sur la distribution de cette statistique permet de montrer que
( ) ( )( ) ( )21 02 θ θ χRV L L rest= − ≈
Avec rest = nombre de restrictions sous 0H , sous l’hypothèse nulle 0H .
La procédure de détermination du nombre de décalages d’un modèle VAR consiste donc ici à déterminer "à priori" un nombre de décalages maximal pmax et d’estimer simultanément le modèle VAR(pmax) et le modèle VAR(pmax-1). L’estimation des deux modèles permet alors de réaliser un test du rapport de vraisemblance associé à l’hypothèse nulle
max0 : 0.pH Φ =
En effet, cette procédure s’arrête dés que l’hypothèse nulle des paramètres associés au dernier décalage est rejetée par les données. Le modèle VAR correspondant à ce décalage est finalement retenu.
Remarque: dans la pratique, il est fréquent de combiner ces trois méthodes pour s’assurer que le nombre de décalages retenu est statistiquement adéquat.
6.4. Calcul des fonctions de réponse du modèle VAR standard La forme autorégressive d’un modèle VAR est presque toujours non interprétable en
termes économiques car elle ne représente que la forme réduite d’un modèle structurel sous-jacent. Sauf cas particulier, la simulation de modèle VAR estimé ne fournit donc pas d’informations économiquement interprétables quant à la forme structurelle sous jacente au modèle VAR. La simulation de la forme structurelle sous jacente peut être effectué. Elle nécessite cependant que le modèle VAR estimé soit préalablement transformé pour être mis sous la forme d’un modèle VAR structurel.
6.4.1. Utilité du concept d’innovation en simulation La simulation d’un modèle VAR fait immédiatement surgir une première difficulté pour
l’économètre classique. En effet, La simulation d’un modèle structurel repose généralement sur l’analyse des effets statiques et dynamiques d’une variation d’une ou plusieurs variables exogènes sur les variables endogènes du modèle. Or un modèle VAR standard ne contient pas de variables exogènes!. Pour simuler un modèle VAR, il est en fait nécessaire de considérer les innovations comme des variables exogènes et d’analyser les effets des variations d’une ou plusieurs innovations (on parlera d’un "choc d’innovation") sur les variables du modèle VAR.
Soit itε l’innovation associée à la variable i
tx du vecteur tX .
Par définition, cette innovation est égale à ( )/ 1
prévui i it t t tx xε −= − et représente la part de la
valeur prise par la variable ix en t qui n’a pas été anticipée rationnellement en ( )1t − à partir du modèle VAR retenu.
Cette part est supposée représenter les chocs nouveaux ayant affecté la valeur de ix à la date t et ayant fait dévier i
tx de la valeur qu’elle aurait du avoir d’après l’information disponible et utilisée en ( )1t − . Autrement dit, i
tε représente un choc en t "non anticipé en
Chapitre 6 Le modèle VAR
58
( )1t − " sur ix . Le fait que ce choc faisant augmenter itx de 1 unité par rapport à la valeur
qu’elle aurait du prendre d’après l’information disponible en ( )1t − .
Simuler le modèle VAR revient en fait à tracer les effets dynamiques des chocs d’innovations de chacune des variables (ou de certaines d’entre elles uniquement) sur les variables du vecteur X (ou sur certaines d’entre elles).
7.4.2. Fonctions de réponse du modèle VAR standard
Le calcul des fonctions de réponse est immédiat dans le cas d’un modèle VAR standard dont les innovations ne sont pas corrélées instantanément :
( ) ( ), 0 , avec .i jt t i jCov i j i jε ε σ= = ∀ ≠
Dans ce cas, les innovations ne sont pas instantanément reliées. Il est donc possible de simuler tour à tour les effets d’un choc sur l’une des innovations sans prendre en considération les éventuels effets de ce choc sur la variation d’une autre innovation. Dans ce cas, le calcul des fonctions de réponse est extrêmement simple.
Le calcul des fonctions de réponse d’un modèle VAR passe par le calcul de la forme Moyenne Mobile Vectorielle (ou forme VMA) du modèle VAR. Cette forme VMA est obtenue par inversion du polynôme ( ).BΦ
Soit l’écriture suivante du modèle VAR(p) défini par l’équation (1)
( ) t tB X εΦ =
Sous l’hypothèse que les racines en L du polynôme ( )BΦ sont hors du cercle unité,
( )1 B−Φ existe et est un polynôme en B d’ordre fini : ( )1 21 2B I B B−Φ = +Ψ +Ψ +
avec ( ): pour 1,2, et lim 0k kkn n k
→∞Ψ × = Ψ =
La forme VMA du modèle VAR(p) s’écrit donc :
( )( ) ( )
1
1 1 2 2
2t t
t
t t t
X B
BI
ε
εε ε ε
−
− −
= Φ
= Ψ
= +Ψ +Ψ +
Les fonctions de réponse du modèle VAR sont directement obtenues à partir des matrices , 1,2,k kΨ = associées aux innovations décalées. Plus précisément, le calcul des fonctions de réponses de modèle VAR revient à analyser comment la variation à une date t quelconque d’une innovation iε de la variable ix quelconque de X va affecter l’ensemble des variables ( )1 2, , , n
t t tx x x pour les dates , 1, 2, .t t t+ +
Les fonctions de réponse cumulées entre l’innovation iε et la variable jx à k périodes en avant ( ), ,j i kFRI sont égales à :
Chapitre 6 Le modèle VAR
59
, , pour 1,2,j
t kj i k i
t
xFRI kε+∂
= =∂
Les fonctions de réponse instantanées entre l’innovation iε et la variable jx à une périodes en avant ( ), ,j i kFRC sont égales à :
, ,0
pour 1,2,jk
t sj i k i
s t
xFRC kε+
=
∂= =
∂∑
Or d’après (3) et l’hypothèse de stationnarité de tX , il vient :
1 1 2 2 1 1 2 2t t t t t l l t t l t lX I X Iε ε ε ε ε ε− − + + + − + −= +Ψ +Ψ + ⇔ = +Ψ +Ψ +
On a donc :
, pour 1,2,j j
j it k tki i
t t k
x x lε ε+
−
∂ ∂= = Ψ =
∂ ∂
Où ,j ikΨ représente l’élément ( ),j i de la matrice kΨ .
Les fonctions de réponse instantanées et cumulées correspondantes à l’effet à k périodes en avant d’un choc de l’innovation iε sur la variable jx peuvent donc être réécrites selon :
, ,, , , ,
0et
kj i j i
j i k k j i k ss
FRI FRC=
= Ψ = Ψ∑
Enfin, les effets multiplicateurs totaux des innovations sur les variables du vecteur X sont donnés par :
( )1 20
1 pour 1,2,k
t s
s t
X I kε+
=
∂= + Ψ +Ψ + = Ψ =
∂∑
où ( )1Ψ est une matrice de taille ( )n n× .
Les fonctions de réponses sont généralement présentées sous la forme d’un tracé permettant de visualiser simplement les effets instantanées et dynamiques associés aux chocs d’innovation sur les variables du vecteur tX .
Remarque 1: L’écriture (2) de la forme VMA fait apparaître que les effets instantanés induits par les chocs d’innovations sur le vecteur tX sont égaux à la matrice identité de taille
( )n n× :
1 pour0 pour
jti
t t
i jX xIi jε ε=⎧∂ ∂
= ⇔ = ⎨ ≠∂ ∂ ⎩
Tout choc d’innovation unitaire sur une variable i fait donc varier instantanément la
variable ix d’une unité (ce résultat est évident puisque par définition ( ) prévui i it t tx x ε= + ) et la
variable jx de 0 unité (pour i j≠ ).
Chapitre 6 Le modèle VAR
60
Remarque2 : D’après l’hypothèse de stationnarité de tX (et donc du modèle VAR étant supposé avoir engendré tX ), les fonctions de réponse instantanées et cumulées du modèle VAR doivent vérifier pour tout couple ( ),i j :
, ,, , , ,lim 0 et lim constantej ij i k j i kk kFRI FRC FRC ∞
→∞ →∞= = =
La vérification de cet effet de convergence des fonctions de réponse permet de vérifier à posteriori la stationnarité du processus VAR.
6.4.3. Décomposition de la variance des erreurs de prévision du modèle VAR standard
Soit itx la valeur de l’élément i de tX et soit ( )i
t t kE x + l’espérance conditionnelle de la
valeur de it kx + réalisé à la date t. En d’autres termes, ( )i
t t kE x + représente la prévision linéaire
de it kx + réalisé à la date t.
Soit ( )( )i it k t t kVar x E x+ +− la variance de l’erreur de prévision à k périodes en avant. Il
est possible de calculer la part de ( )( )i it k t t kVar x E x+ +− qui est due au jème choc du modèle
VAR (soit jtε ). Ce calcul correspond à la décomposition de la variance de l’erreur de
prévision du modèle VAR.
Pour faire ce calcul simplement, nous rappelons rapidement un résultat de calcul matriciel usuel
Soit ( ) avec , 1, , ,i j i j nσ∑ = = … une matrice diagonale de dimension ( ),n n (on a
donc 0 pour et 0 pour i j i ji j i jσ σ≠ = = ≠ ).
Soit ( ) avec , 1, ,i jR r i j n= = une matrice diagonale de dimension ( ),n n et soit iR la ième colonne de la matrice R. Un résultat usuel de calcul matriciel permet de montrer que la matrice ∑ étant diagonale, on a
1
n
ii i ii
R R R Rσ=
′′∑ =∑
PARTIE
APPLICATION
Application Lissage exponentiel
63
Analyse de la série vente de carburant JET A1 secteur Aviation National :
La série JAN est tendancielle et présente aussi une composante saisonnière qui
intervient de façon multiplicative, c’est pour cela qu’on a appliqué la technique multiplicative
de Holt & Winters.
Parameters: Alpha 0.5200 Beta 0.0000 Gamma 0.0000 Sum of Squared Residuals 5.55E+08 Root Mean Squared Error 2049.664
Le tableau ci-dessus comporte : Les coefficients de lissage qui minimisent la somme des carrés résiduels et qui sont :
Coefficient de lissage de la moyenne noté α= 0.5200.
Coefficient de lissage de la tendance noté β =0.0000
Coefficient de lissage de la saisonnalité noté γ = 0,000 La racine moyenne des carrés résiduels : RMSE = 2049.664
Prévision : Les prévisions sont calculées pour la période allant de janvier 2006 à Décembre 2006 Diagramme séquentiel de la série brute JAN et des prévisions :
Remarque : Les quantités de carburants sont en milliers de tonnes.
prévision JAN Janvier 2006 27542.4072 Février 2006 24899.7827 Mars 2006 28238.1796 Avril 2006 27509.2703 Mai 2006 26792.7844 Juin 2006 25909.4509
Juillet 2006 29244.5123 Août 2006 30058.7333
Septembre 2006 28518.1544 Octobre 2006 25881.8044
Novembre2006 27022.0719 décembre2006 28044.4801
64
Analyse de la série vente de carburant JET A1 secteur Aviation Etrangère :
La série JAE est tendancielle et présente aussi une composante saisonnière qui intervient
de façon multiplicative, c’est pour cela qu’on a appliqué la technique multiplicative de Holt &
Winters.
Le tableau ci-dessus comporte : Les coefficients de lissage qui minimisent la somme des carrés résiduels et qui sont :
Coefficient de lissage de la moyenne noté α= 0.6600.
Coefficient de lissage de la tendance noté β =0.0000
Coefficient de lissage de la saisonnalité noté γ = 0,000 La racine moyenne des carrés résiduels : RMSE = 358.1386
Prévision : Les prévisions sont calculées pour la période allant de janvier 2006 à Décembre 2006 Diagramme séquentiel de la série brute JAE et des prévisions :
Remarque : Les quantités de carburants sont en milliers de tonnes.
Parameters: Alpha 0.6600 Beta 0.0000 Gamma 0.0000 Sum of Squared Residuals 16930748 Root Mean Squared Error 358.1386
prévision JAE Janvier 2006 4249.33902 Février 2006 3637.6644 Mars 2006 4068.42458 Avril 2006 4125.16432 Mai 2006 4226.8494 Juin 2006 3967.68175
Juillet 2006 4696.11771 Août 2006 4294.42568
Septembre 2006 4005.86643 Octobre 2006 4150.11976
Novembre2006 4109.20486 décembre2006 4741.52595
65
Analyse de la série vente de carburant Fuel-oil secteur Marine Nationale :
La série FN est tendancielle et présente aussi une composante saisonnière qui intervient
de façon multiplicative, c’est pour cela qu’on a appliqué la technique multiplicative de Holt &
Winters .
Parameters: Alpha 0.3500 Beta 0.0000 Gamma 0.0000 Sum of Squared Residuals 1.11E+09 Root Mean Squared Error 2904.533
Le tableau ci-dessus comporte : Les coefficients de lissage qui minimisent la somme des carrés résiduels et qui sont :
Coefficient de lissage de la moyenne noté α= 0.3500
Coefficient de lissage de la tendance noté β =0.0000
Coefficient de lissage de la saisonnalité noté γ = 0,000 La racine moyenne des carrés résiduels : RMSE = 2904.533
Prévision : Les prévisions sont calculées pour la période allant de janvier 2006 à Décembre 2006 Diagramme séquentiel de la série brute FN et des prévisions :
Remarque : Les quantités de carburants sont en milliers de tonnes.
prévision FN Janvier 2006 26146,0924 Février 2006 22161,4455 Mars 2006 26728,015 Avril 2006 26496,0203 Mai 2006 25551,5049 Juin 2006 24767,9815
Juillet 2006 29793,8169 Août 2006 28296,0462
Septembre 2006 27201,0912 Octobre 2006 28965,654
Novembre2006 22008,8657 décembre2006 25130,4277
66
Analyse de la série vente de carburant Fuel-oil secteur Marine Etrangère :
La série FE est tendancielle non saisonnière, c’est pour cela qu’on a appliqué la
technique multiplicative de Holt & Winters .
Parameters: Alpha 0.4100 Beta 0.0100 Sum of Squared Residuals 4.72E+08 Root Mean Squared Error 1891.048
Le tableau ci-dessus comporte :
Les coefficients de lissage qui minimisent la somme des carrés résiduels et qui sont :
Coefficient de lissage de la moyenne noté α= 0.4100
Coefficient de lissage de la tendance noté β =0.0100 La racine moyenne des carrés résiduels : RMSE = 1891.048
Prévision : Les prévisions sont calculées pour la période allant de janvier 2006 à Décembre 2006 Diagramme séquentiel de la série brute FE et des prévisions :
Remarque : Les quantités de carburants sont en milliers de tonnes.
Remarque importante:nous remarquons que les coefficients γ et β sont nuls pour les séries JAN,JEA,FE bien que ses dernières aient une composante saisonnière est quelques une ont dune composante tendancielle de type TS (d'après l'étude de Box et Jenkins présentée dans le chapitre suivant)
prévision FN Janvier 2006 552,955261 Février 2006 474,691447 Mars 2006 396,427633 Avril 2006 318,163819 Mai 2006 239,900005 Juin 2006 161,636191
Juillet 2006 183,372377 Août 2006 195,108563
Septembre 2006 173,155251 Octobre 2006 151,419065
Novembre2006 229,682879 décembre2006 307,946694
Application Box & Jenkins
Application Box & Jenkins
68
Analyse de la série vente de carburant
JET A1 secteur Aviation National :
Plusieurs étapes préliminaires sont nécessaires avant d’effectuer des tests spécifiques sur
une série chronologique et de chercher à la modéliser, il convient d’étudier quelques
caractéristiques stochastiques en particulier sa moyenne et sa variance.
Notation : Nous notons la série vente de carburant jet A1 secteur national JAN.
Identification
Les données de la série des ventes de carburant jet A1 (notée : JAN) sur une période de
dix ans, les observations sont mensuelles ; de janvier 1995 à décembre 2005. L'unité de
mesure est en milliers de tonnes.
Diagramme séquentiel de la série brute JAN :
Graphe de la moyenne et la variance de la série brute JAN :
Graphe de la moyenne
05000
10000150002000025000300003500040000
1 3 5 7 9 11
JAN
Graphe de la variance
020000004000000
60000008000000
1000000012000000
1400000016000000
1 3 5 7 9 11
JAN
Application Box & Jenkins
69
D’après les deux graphes précédents, on remarque que la moyenne et la variance varient
au cours du temps. On peut donc dire que cette série semble non stationnaire..
Pour vérifier ceci, on va appliquer des tests statistiques juste après la présentation des
corrélogrammes simple et partiel de la série brute.
Corrélogramme de la série brute JAN :
Nous remarquons dans le corrélogramme simple que presque tous les pics sont pratiquement à l’extérieure de l’intervalle de confiance, le corrélogramme partiel est marqué aussi par la présence des pics sortant au retard 1,3,4,9,12 et 13
. D’où la série brute est donc générée par un processus non stationnaire .
Application Box & Jenkins
70
Test de FISHER: Pour détecter la saisonnalité de la série on a fait appel à l’analyse de la variance
(ANOVA) à deux facteurs sans répétition. Table de l’ANOVA (à 2 facteurs) données par logiciel SPSS :
Source des variations
Somme des carrés
Degré de liberté
Moyenne des carrés
F Probabilité Valeur critique pour
F Lignes 271775141 11 24706831 5.57733365 4.766E-07 1.87673166
Colonnes 1633056117 10 163305612 36.8646989 1.2291E-30 1.9178259 Erreur 487285068 110 4429864.25 Total 2392116326 131
Test d’influence de facteur ligne (mois) : Fstat= 5.5773 > Fthéo= 1.8767 donc (on rejette l’hypothèse nulle) la série est affectée
d’une saisonnalité.
Test d’influence de facteur colonne (années) : Fstat= 36.86 > Fthéo= 1.9178 donc (on rejette l’hypothèse nulle) la série est peut être
affectée d’une tendance.
Afin de traiter l’effet de saisonnalité sur notre série ou encore la stationnariser, nous lui
avons appliqué la différence saisonnière d’ordre 12.
Notation : Nous notons la série JAN désaisonnalisé par DJAN.
Graphe de la série DJAN :
Application Box & Jenkins
71
Corrélogramme de la série DJAN :
En observant le graphe ainsi que le corrélogramme de la série DJAN, nous remarquons que la saisonnalité a été absorbée. Un recours au test de racine unitaire permet d’affirmer ou d’infirmer la stationnarité de la série en question.
Test de Dickey- Fuller Augmenté:
On procède à l’estimation par la méthode des moindres carrées avec d=1 des trois modèles [4],[5] et [6] de Dickey-Fuller sur la série DJAN(car les résidus forment un bruit blanc).
Remarque On choisit le retard d=1 qui minimise le critères d’informations d’Akaike et Schwarz
Etape (1) : Model 4 : Test sur la tendance :
11
.d
t t j t j tj
X X c t Xφ φβ ε− −=
Δ = + + + Δ +∑
Avec tε est un processus stationnaire
Application Box & Jenkins
72
Nous testons alors la présence d’une tendance dans le processus en testant la nullité du
coefficient de la tendanceβ . Le résultat est donné dans le tableau suivant:
On remarque que la t- statistique de la tendance = -0.772 est inférieure aux valeurs critiques 3.53 et 2.79 et 2.73 (données par la table de Dickey- Fuller) pour les seuils 1%, 5%,10% On le confirme par prob = 0.4414 supérieure à 0.05. Donc la tendance n’est pas significativement différente de zéro, on passe alors à l’étape (2)
Etape (2) : Model 5 : Test sur la constante
11
.d
t t j t j tj
X cX Xφ φ ε− −=
Δ = + + Δ +∑
Avec tε est un processus stationnaire
Nous testons la présence d’une constante dans le processus en testant la nullité du
coefficient de la constante. Le résultat de l’affichage pour la série DJAN est donné dans le
tableau suivant:
Application Box & Jenkins
73
On remarque que la t-statistique de la constante (c) = 0.209 est inférieure aux valeurs
critiques 3.78 et 3.11 et 2.73 (données par la table de Dickey- Fuller) pour les seuils 1% et 5% et 10% On le confirme par prob = 0.8342 supérieure à 0.05. Donc la constante n’est pas significativement différente de zéro, on passe alors à l’étape (3)
Etape (3) :
Model 6: Test de la racine unitaire :
11
.d
t t j t j tj
X X Xφ φ ε− −=
Δ = + Δ +∑ Avec tε est un processus stationnaire
Nous testons alors la présence d’une racine unitaire dans le processus en testant la nullité du paramètre Φ à l’aide d’une statistique de Student
Φ̂t , où Φ̂ désigne l’estimateur des
moindres carrés ordinaires (MCO). Le résultat de l’affichage pour la série DJAN est donné dans le tableau suivant.
La statistique de Student Φ̂
t = - 2.77 est inférieure aux valeurs critiques -2.584, -1.943 et -1.614 (données par la table de Dickey- Fuller) pour les seuils 1%, 5% et 10% d’où la série ne possède pas de racine unitaire (on rejette l’hypothèse nulle “ 0φ = “). La série DJAN est donc stationnaire. Il convient à présent d’estimer le modèle susceptible de la représenter, en observant les corrélogrammes simple et partiel de la série stationnaire DJAN, nous remarquons que la fonction d’autocorrélation simple (AC) possède des valeurs importantes aux retards q=1,2,3,..,11, et que la fonction d’autocorrélation partielle (PAC) possède des valeurs importantes aux retards p=1, 2 ,12, par conséquent nous avons plusieurs modèles candidats parmi lesquels nous avons sélectionné le modèle : SARIMA (1.0.1)(0.1.1).
Estimation des paramètres de model :
Application Box & Jenkins
74
Nous remarquons que tous les paramètres du modèle sont significativement différents de zéro.
En effet les rapports des coefficients du modèle sont en valeurs absolues supérieures à 1.96, ce qui est confirmé par la probabilité de nullité des coefficients qui sont tous inférieures à 0.05.
Tests sur les résidus : Test de validation des paramètres :
De la représentation graphique des inverses des racines des polynômes de retards moyenne mobile et autorégressif nous constatons qu’ils sont tous supérieures à 1 en module (leurs inverses sont en module, inférieures à 1).
Représentation graphique des séries : résiduelle ( tε ) ; actuelle et estimée:
A partir de la représentation graphique des séries résiduelles, actuelles et estimée nous
constatons que le model estimé ajuste mieux la série DJAN.
Application Box & Jenkins
75
Corrélogramme simple et partiel des résidus :
L’analyse du corrélogramme des résidus, montre que tous les termes sont à l’intérieur de l’intervalle de confiance (illustré par des pointillés sur le graphique). Ce qui nous entraîne à dire que les résidus forment un bruit blanc.
Test de point de retournement :
0H : « Les iε forment un bruit blanc » contre
1H : « Il existe une corrélation entre les iε tel que : i = n,1 » Après les calculs à l’aide du logiciel MATLAB nous avons obtenu les résultats suivants Nombre de points de retournements p = 60 Espérance de la stat du test E (p) = 80 Variance de la statistique du test VAR(p) =16 La statistique du teste est T= 0.92 T = 0.92 est inférieure à 1.96 (tabulée) d’où on accepte l’hypothèse 0H : « Les iε
forment un bruit blanc » au seuil de 0,05.
Test de Box – Ljung :
Nous avons à tester l’hypothèse nulle : 0H : « Les autocorrélations jusqu’au pas k, (k=N/4) ne sont pas significatives » C'est-à-dire
H 0 : « 0...21 ==== Kρρρ » Contre 1H : « 45,,1: …=∃ jjρ tel que 0≠jρ ».
Ce test est basé sur la statistique de Box-Ljung au pas k : ∑= −
+=K
k
k
knnnQ
1
2
)1(γ
.
Application Box & Jenkins
76
Si )(295,0 qpKQ −−< χ , nous acceptons l’hypothèse H 0 .
La probabilité de la statistique de Box-Ljung est supérieure à 0,05 à n’importe quel retard et la valeur de la statistique de Box-Ljung quand k = 30, p = 1, q = 12 est égale à 27.359, inférieure à
295.,0χ (17) = 27.59. Nous concluons alors que les erreurs ne sont pas corrélées.
Test de Durbin-Watson : (Test de détection d’autocorrélation d’ordre1 des erreurs) :
Nous testons H 0 : « 0=ρ » contre 1H : « 0≠ρ ». La statistique de Durbin-Watson (DW=1.993855 2≈ ) nous constatons que les résidus
d’ordre 1 ne sont pas corrélés. Test de Normalité : Les tests sont effectués à partir des valeurs empiriques des coefficients de Skewness,
Kurtosis et la statistique de Jarque-Bera, nous avons l’histogramme suivant:
Test de Skewness (asymétrie) et de Kurtosis (aplatissement) :
Nous testons les hypothèses suivantes :⎪⎩
⎪⎨
⎧
≠≠
==
00:
00:
211
210
γγ
γγ
ouH
etH
Test de Skewness :
N6
0211
1−
=β
γ
Test de Kurtosis :
N24
322
−=β
γ
où : 232
3211 μ
μβ = : est le coefficient de Skewness (l’indicateur d’asymétrie des résidus)
22
42 μ
μβ = : est le coefficient de Kurtosis (le degré d’aplatissement de la loi des
résidus). Sous l’hypothèse H 0 et si le nombre d’observations est assez grand (N >30), nous
avons :
232
3211 μ
μβ = ( )16,0 ⎟⎟
⎠
⎞⎜⎜⎝
⎛→℘
∞→ NN
N
Application Box & Jenkins
77
22
42 μ
μβ = ( )224,0 ⎟⎟
⎠
⎞⎜⎜⎝
⎛→℘
∞→ NN
N
Après calculs nous avons obtenu :
Test de skewness : 1/ 21
1
0 0.306326 01.364 1.96
6 6N 119
β + +γ = = = ≺
Test de Kurtosis : 22
3 4.751797 33,900 1.96
24 24N 119
β − −γ = = =
Test de Jarque et Bera :
Nous définissons la statistique S par : S = ( )221 3
246−+ ββ NN
Sous (1) et (2) : S ( )221 αχ −→
Nous testons 0H : « accepter la normalité des résidus au seuil α =0,05 » contre
1H : « il n’ y a pas de normalité des résidus ».
Si S ( )221 αχ −> nous rejetons l’hypothèse 0H sinon nous l’acceptons
La statistique de Jarque – Bera=14.11086 elle est supérieure à )2(2χ = 5,99.
D’après les tests précédents, nous concluons que les résidus forment un bruit blanc non gaussien.
Test d'effet ARCH :
L’analyse du corrélogramme des résidus carrés, montre que tous les termes sont à l’intérieur de l’intervalle de confiance, ce qui nous entraîne à dire que pas d’effet ARCH.
Conclusion : Nous pouvons conclure d’après ces tests que le modèle qui ajuste le mieux la série est :
SARIMA (1.0.1)(0.1.1) qui s’écrit sous la forme suivante : 12 12(1 0.945162 )(1 ) (1 0.433123 )*(1 0.451035 )t tB B JAN B B ε− − = + +
Application Box & Jenkins
78
Prévision : Les prévisions sont calculées pour la période allant de janvier 2006 à Décembre 2006 Diagramme séquentiel de la série brute JAN et des prévisions
prévision JAN Janvier 2006 27611,1864
Février 2006 26032,2365
Mars 2006 25764,223
Avril 2006 26484,7609 Mai 2006 25626,018
Juin 2006 25343,9037
Juillet 2006 28430,7901
Août 2006 29926,5701 Septembre
2006 28368,3942
Octobre 2006 26835,2154 Novembre200
6 29177,2587 décembre2006 28070,493
Remarque : Les quantités de carburants sont en milliers de tonnes.
Application Box & Jenkins
79
Analyse de la série vente de carburant JET A1 secteur Aviation Etrangère :
Plusieurs étapes préliminaires sont nécessaires avant d’effectuer des tests spécifiques sur une série chronologique et de chercher à la modéliser, il convient d’étudier ces caractéristiques stochastiques c'est-à-dire sa moyenne et sa variance.
Notation : Nous notons la série vente de carburant jet A1 secteur aviation étrangère JAE.
Identification
Les données de la série des ventes de carburant jet A1 (notée : JAE ) sur une période de dix ans, les observations sont mensuelles ; de janvier 1995 à décembre 2005.L'unité de mesure est en milliers de tonnes.
Diagramme séquentiel de la série brute JAE :
Graphe de la moyenne et la variance de la série brute JAE :
moyenne
0
500
1000
1500
2000
2500
3000
3500
4000
4500
1 3 5 7 9 11
moyenne
variance
0
100000
200000
300000
400000
500000
600000
1 2 3 4 5 6 7 8 9 1 11
variance
Application Box & Jenkins
80
D’après les deux graphes précédents, on remarque que la moyenne et la variance varient au cours du temps. On peut donc dire que cette série semble non stationnaire..
Pour vérifier ceci, on va appliquer des tests statistiques juste après la présentation des corrélogrammes simple et partiel de la série brute Corrélogramme de la série JAE:
Nous remarquons dans le corrélogramme simple que presque tous les pics sont pratiquement à l’extérieure de l’intervalle de confiance, le corrélogramme partiel est marqué aussi par la présence d’un seul pic sortant au1er retard d’où la série brute est donc générée par un processus non stationnaire .
Test de FISHER: Pour détecter la saisonnalité de la série on a fait appel à l’analyse de variance (ANOVA) à deux facteurs sans répétition
Table de l’ANOVA (à 2 facteurs) données par logiciel SPSS: Source des variations
Somme des carrés Degré de liberté Moyenne des carrés F Probabilité
Valeur critique pour
F Lignes 5520713.11 11 501883.01 3.36400777 0.00049586 1.87673166
Colonnes 109984312.00 10 10998431.20 73.7199847 4.5556E-44 1.91782590Erreur 16411118.80 110 149191.98 Total 131916143.00 131 Teste d’influence de facteur ligne (mois) : Fstat= 3.364 > Fthéo= 1.8767 donc (on rejette l’hypothèse nulle) la série est affectée d’une
saisonnalité
Application Box & Jenkins
81
Teste d’influence de facteur colonne (années) : Fstat= 73.7199 > Fthéo= 1.9178 donc (on rejette l’hypothèse nulle) la série est peut être
affectée d’une tendance.
Afin de traiter l’effet de saisonnalité sur notre série ou encore la stationnariser nous lui
Avons appliqué la différence saisonnière d’ordre 12. Notation : Nous notons la série JAE désaisonnalisé par DJAE
Graphe de la série DJAE :
Corrélogramme de la série DJAE :
En observant le graphe ainsi que le corrélogramme de la série DJAE, nous remarquons que la saisonnalité a été absorbée .Un recours au test de racine unitaire permet d’affirmer ou d’infirmer la stationnarité de la série en question.
Application Box & Jenkins
82
Test de Dickey- Fuller Augmenté: on procède à l’estimation par la méthode des moindres carrées avec d=1 des trois modèles
[4], [5] et [6] de Dickey-Fuller sur la série DJAE (car les résidus forment un bruit blanc
Remarque On choisit le retard d=1 qui minimise le critères d’informations d’Akaike et de Schwarz Etape (1) : Modèle 4 : Test sur la tendance :
Avec tε est un processus stationnaire Nous testons alors la présence d’une tendance dans le processus en testant la nullité du
coefficient de la tendance β , Le résultat de l’affichage pour la série DJAE est donné dans le
tableau suivant:
On remarque que la t- statistique de la tendance =3.149 est inférieure à 3.53 pour le seuil 1% mais supérieur aux valeurs 2.79 et 2.73 au seuils 5% et 10% (données par la table de Dickey- Fuller) .On le confirme ça par prob = 0.0018 est inférieure 0.05. La tendance n’est pas significativement différente de zéro.
Alors d’après le même tableau on remarque que : La statistique de Student
Φ̂t = -5.1657 est inférieure aux valeurs critiques -4.037, -3.448 et
-3.149 (données par la table de Dickey- Fuller) pour les seuils 1%, 5% et 10% D’où la série ne possède pas de racine unitaire (on rejette l’hypothèse nulle “ 0φ = “)
donc non stationnarité de type TS on confirme cela par la probabilité( prob = 0.0058 )est inférieure à 0.05).
La série DJAE est non stationnaire de type TS Donc pour stationnariser cette série il faut faire un ajustement. Le meilleur ajustement du processus est l’ajustement cubique car R 2 associé égale 0,362
est le plus grand d’après les résultats obtenus par le logiciel SPSS :
11
.d
t t j t j tj
X X c t Xφ φβ ε− −=
Δ = + + + Δ +∑
Application Box & Jenkins
83
Tableau (1)
La série JAE après désaisonnalisation peut être ajustée par une fonction cubique
Estimation de la tendance cubique : Estimons l’équation d’ajustement ty qui est donnée par la formule suivante :
33
2210 tbtbtbbyt ⋅+⋅+⋅+= , les cœfficients b 0 , b1 , b 2 et b 3 sont données par le Tableau (1)
Notation : Nous notons la série ajustée par AJU t elle est donnée par la formule :
AJU t = DJAEt - yt .
Diagramme séquentiel de la série DJAE avec Ajustement
DAJE
Séquence
140120100806040200
2000
1000
0
-1000
Observé
Cubique
D’où la série qu’on va étudier maintenant c’est la série AJU t Graphe de la série AJU t :
Application Box & Jenkins
84
11
.d
t t j t j tj
X X c t Xφ φβ ε− −=
Δ = + + + Δ +∑
Corrélogramme de la série AJU t :
Pour vérifier si la série ajustée AJU t ne nécessite pas une différenciation (ne possède pas de racine unitaire), nous appliquons une deuxième fois le teste de Dickey-Fuller (mais cette fois sur la série ajustée AJU t) les résultats sont tels que:
Etape (1) : Model 4 : Test sur la tendance :
Application Box & Jenkins
85
11
.d
t t j t j tj
X cX Xφ φ ε− −=
Δ = + + Δ +∑
Avec tε est un processus stationnaire
Nous testons alors la présence d’une tendance dans le processus en testant la nullité du coefficient de la tendanceβ . Le résultat de l’affichage pour la série AJU t est donné dans le tableau suivant:
On remarque que la t- statistique de la tendance = -0.0388 est inférieure aux valeurs critiques 3.53 et 2.79 et 2.73 (données par la table de Dickey- Fuller) pour les seuils 1%, 5%,10% On le confirme par la prob = 0.9691 supérieure à 0.05. Donc la tendance n’est pas significativement différente de zéro, on passe alors à l’étape (2)
Etape (2) : Model 5 : Test sur la constante
Avec tε est un processus stationnaire
Nous testons la présence d’une constante dans le processus en testant la nullité du coefficient de la constante. Le résultat de l’affichage pour la série AJU t est donné dans le tableau suivant:
On remarque que la t-statistique de la constante (c) = 0.000922 est inférieure aux valeurs critiques 3.22 et 2.54 et 2.17 (données par la table de Dickey- Fuller) pour les seuils 1% , 5% et 10% On le confirme par prob = 0.9993 supérieure à 0.05. Donc la constante n’est pas significativement différente de zéro, on passe alors à l’étape (3)
Etape (3) : Model 6: Test de la racine unitaire :
1
1.
d
t t j t j tj
X X Xφ φ ε− −=
Δ = + Δ +∑
Application Box & Jenkins
86
Avec tε est un processus stationnaire.
Nous testons alors la présence d’une racine unitaire dans le processus en testant la nullité du paramètre Φ à l’aide d’une statistique de Student
Φ̂t , où Φ̂ désigne l’estimateur des moindres carrés
ordinaires (MCO). Le résultat de l’affichage pour la série AJU t est donné dans le tableau suivant.
La statistique de Student
Φ̂t = - 7.858 est inférieure aux valeurs critiques -2.584, -1.943 et
-1.614 (données par la table de Dickey- Fuller) pour les seuils 1%, 5% et 10% d’où la série ne possède pas de racine unitaire (on rejette l’hypothèse nulle “ 0φ = “). La série AJU t est donc stationnaire. Il convient à présent d’estimer le modèle susceptible de la représenter, en observant les corrélogrammes simple et partiel de la série stationnaire AJU t, nous remarquons que la fonction d’autocorrélation simple (AC) possède des valeurs importantes aux retards q=1,12,… , et que la fonction d’autocorrélation partielle (PAC) possède des valeurs importantes aux retards p=1, 2 ,12,… par conséquent nous avons plusieurs modèles candidats parmi lesquels nous avons sélectionné le modèle :
Sarima (1.1.0)(1.1.1)
Estimation des paramètres de model :
Nous remarquons que tous les paramètres du modèle sont significativement différents de zéro. En effet les rapports des coefficients du modèle sont en valeurs absolues supérieures à 1.96, ce qui est confirmé par la probabilité de nullité des coefficients qui sont tous inférieures à 0.05.
Application Box & Jenkins
87
Tests sur les résidus : Test de validation des paramètres:
De la représentation graphique des inverses des racines des polynômes de retards moyenne mobile et autorégressif nous constatons qu’ils sont tous supérieures à 1 en module (leurs inverses sont en module, inférieures à 1).
Représentation graphique des séries : résiduelle ( tε ) ; actuelle et estimée:
A partir de la représentation graphique des séries résiduelles, actuelles et estimée nous
constatons que le model estimé ajuste mieux la série DAJN.
Corrélogrammes simple et partiel des résidus :
Application Box & Jenkins
88
L’analyse du corrélogramme des résidus, montre que tous les termes sont à l’intérieur de
l’intervalle de confiance (illustré par des pointillés sur le graphique). Ce qui nous entraîne à dire que les résidus forment un bruit blanc.
Test de point de retournement : 0H : « Les iε forment un bruit blanc » contre
1H : « Les iε ne forment pas un bruit blanc tel que : i = n,1 » Après les calculs à l’aide du logiciel MATLAB nous avons obtenu les résultats suivants Nombre de points de retournements p = 75 Espérance de la stat du test E (p) = 70 Variance de la statistique du test VAR(p) = 19 La statistique du teste est T= 1.2 T = 1.2 est inférieure à 1.96 (tabulée) d’où on accepte l’hypothèse 0H : « Les iε
forment un bruit blanc » au seuil de 0,05
Test de Box – Ljung : Nous avons à tester l’hypothèse nulle :
0H : « Les autocorrélations jusqu’au pas k, (k=N/4) ne sont pas significatives » C'est-à-dire H 0 : « 0...21 ==== Kρρρ » Contre 1H : « 45,,1: …=∃ jjρ tel que 0≠jρ ».
Ce test est basé sur la statistique de Box-Ljung au pas k : ∑= −
+=K
k
k
knnnQ
1
2
)1(γ
.
Application Box & Jenkins
89
Si )(295,0 qpKQ −−< χ , nous acceptons l’hypothèse H 0 .
La probabilité de la statistique de Box-Ljung est supérieure à 0,05 à n’importe quel retard et la valeur de la statistique de Box-Ljung quand k = 30, p = 2 , q = 1 est égale à 16.422, inférieure à 2
95.,0χ (27) = 40.11. Nous concluons alors que les erreurs ne sont pas corrélées.
Test de Durbin-Watson : (Test de détection d’autocorrélation d’ordre1 des erreurs) : Nous testons H 0 : « 0=ρ » contre 1H : « 0≠ρ ». La statistique de Durbin-Watson (DW=2.058 2≈ ) nous constatons que les résidus
d’ordre 1 ne sont pas corrélés. Test de Normalité : Les tests sont effectués à partir des valeurs empiriques des coefficients de Skewness,
Kurtosis et la statistique de Jarque-Bera, nous avons l’histogramme suivant:
-t Test de Skewness (asymétrie) et de Kurtosis (aplatissement) :
Nous testons les hypothèses suivantes :⎪⎩
⎪⎨
⎧
≠≠
==
00:
00:
211
210
γγ
γγ
ouH
etH
Test de Skewness :
N6
0211
1−
=β
γ
Test de Kurtosis :
N24
322
−=β
γ
où : 232
3211 μ
μβ = : est le coefficient de Skewness (l’indicateur d’asymétrie des résidus)
22
42 μ
μβ = : est le coefficient de Kurtosis (le degré d’aplatissement de la loi des résidus).
Sous l’hypothèse H 0 et si le nombre d’observations est assez grand (N >30), nous avons :
232
3211 μ
μβ = ( )16,0 ⎟⎟
⎠
⎞⎜⎜⎝
⎛→℘
∞→ NN
N
22
42 μ
μβ = ( )224,0 ⎟⎟
⎠
⎞⎜⎜⎝
⎛→℘
∞→ NN
N
Après calculs nous avons obtenu :
Application Box & Jenkins
90
Test de skewness : 1/ 21
1
0 0.019704 00.0835<1.96.
6 6N 108
β + +γ = = = Donc :
On accepte l’hypothèse nulle 0H (aplatissement Normal)
Test de Kurtosis : 22
3 2.448338 31,170 1.96.
24 24N 108
β − −γ = = = ≺ Donc :
On accepte l’hypothèse nulle 0H (asymétrie) Nous acceptons l’hypothèse de normalité en ce qui concerne la symétrie et l’aplatissement
de la distribution ( 21 γγ et sont inférieurs à 1,96), Ce qui est confirmé par la statistique de
Jarque et Bera.
Test de Jarque et Bera :
La statistique de Jarque et Bera noté (S) est égale à 1.376 ; elle est inférieure à la valeur
99,5)2(295,0 =χ d’où les résidus sont gaussiens.
Test effet ARCH :
Application Box & Jenkins
91
L’analyse du corrélogramme des résidus carrés, montre que tous les termes sont à l’intérieur de l’intervalle de confiance, ce qui nous entraîne à dire que pas d’effet ARCH.
Conclusion : Nous pouvons conclure d’après ces tests que le modèle qui ajuste le mieux la série est : Sarima (1.1.0)(1.1.1)qui s’écrit sous la forme suivante : .)891910.01()1)(1()329961.01)(395849.01( 121212
tt BJAEBBBB ξ+=−−−−
Prévision : Les prévisions sont calculées pour la période allant de janvier 2006 à Décembre 2006
Application Box & Jenkins
92
Diagramme séquentiel de la série brute JAE et des prévisions
prévision JAE
Janvier 2006 4124.58408
Février 2006 4132.7257
Mars 2006 4570.19352
Avril 2006 4394.5555
Mai 2006 4566.20834
Juin 2006 4829.54963
Juillet 2006 5752.69921
Août 2006 5815.18974
Septembre 2006 5780.73036
Octobre 2006 5440.57075
Novembre2006 5456.10994
décembre2006 5383.597
Remarque : Les quantités de carburants sont en milliers de tonnes
Analyse de la série vente de carburant
Application Box & Jenkins
93
Fuel-oil secteur Marine Nationale :
Plusieurs étapes préliminaires sont nécessaires avant d’effectuer des tests spécifiques sur
une série chronologique et de chercher à la modéliser, il convient d’étudier quelques
caractéristiques stochastiques en particulier sa moyenne et sa variance.
Notation : Nous notons la série vente de carburant Fuel-oil secteur National FN.
Identification
Les données de la série des ventes de carburant Fuel-oil (notée : FN) sur une période de
dix ans, les observations sont mensuelles ; de janvier 1995 à décembre 2005. L'unité de
mesure est le millier de tonnes.
Diagramme séquentiel de la série brute FN :
Cette série exhibe une faible tendance avec des fluctuations plus aux moins régulières Graphe de la moyenne et la variance de la série brute FN :
moyenne
0
5000
10000
15000
20000
25000
30000
1 2 3 4 5 6 7 8 9 1 11
moyenne
variance
0
20000000
40000000
60000000
80000000
100000000
120000000
1 3 5 7 9 11
variance
D’après les deux graphes précédents, on remarque que la moyenne et la variance varient au cours du temps. On peut donc dire que cette série semble non stationnaire.
Application Box & Jenkins
94
Pour vérifier ceci, on va appliquer des tests statistiques juste après la présentation des corrélogrammes simple et partiel de la série brute.
Corrélogramme de la série brute FN :
D'après le corrélogramme simple de la série on remarque que les pics aux retards 1,…,9sont à l'extérieur de la bande de confiance et les autocorrélations prennent une allure décroissante. Le corrélogramme partiel est marqué par des pics significatif au retard 1et 2 .
Alors d’après l’analyse graphique on peut dire que la série FN semble non stationnaire
Test de FISHER: Pour détecter la saisonnalité de la série on a fait appel à l’analyse de la variance
(ANOVA) à deux facteurs sans répétition. Table de l’ANOVA (à 2 facteurs) données par logiciel SPSS :
Source des variations
Somme des carrés
Degré de liberté
Moyenne des carrés F Probabilité
Valeur critique pour
F Lignes 280910554 11 25537323.1 2.75775868 0.00340777 1.87673166 Colonnes 1958479112 10 195847911 21.1494868 2.1327E-21 1.9178259 Erreur 1018619056 110 9260173.23 Total 3258008722 131
Test d’influence de facteur ligne (mois) : Fstat= 2.7577 > Fthéo= 1.8767 donc (on rejette l’hypothèse nulle) la série est affectée d’une
saisonnalité Test d’influence de facteur colonne (années) : Fstat= 21.1494 > Fthéo= 1.9178 donc (on rejette l’hypothèse nulle) la série est peut être
affectée d’une tendance.
Application Box & Jenkins
95
Afin de traiter l’effet de saisonnalité sur notre série ou encore la stationnariser, nous lui
avons appliqué la différence saisonnière d’ordre 12.
Notation : Nous notons la série FN désaisonnalisé par DFN. Graphe de la série DFN :
Corrélogramme de la série DFN:
En observant le graphe de la série DFN sa moyenne est presque satable au cours du temps il semble que la série soit stationnaire en moyenne, ainsi Nous remarquons que la fonction d’autocorrélation simple de la série DFN diminue rapidement, nous pouvons donc dire que cette série semble stationnaire. Pour confirmer ou infirmer cette hypothèse nous appliquons le test de Dickey-Fuller Augmenter qui nécessite tout d’abord de sélectionner le nombre de retard p qui minimise le critère d’Akaike.
Test de Dickey- Fuller Augmenté:
Application Box & Jenkins
96
On procède à l’estimation par la méthode des moindres carrées avec d=1 des trois modèles [4], [5] et [6] de Dickey-Fuller sur la série DFN.
Remarque On choisit le retard d=1 qui minimise le critères d’informations d’Akaike et de Schwarz Etape (1) : Modèle 4 : Test sur la tendance :
Avec tε est un processus stationnaire
Nous testons alors la présence d’une tendance dans le processus en testant la nullité du coefficient de la tendanceβ . Le résultat est donné dans le tableau suivant:
On remarque que la t- statistique de la tendance =2.79814 est inférieure à 3.53 pour le seuil 1% mais supérieur aux valeurs 2.79 et 2.73 au seuils 5% et 10% (données par la table de Dickey- Fuller) .On le confirme ça par prob = 0.006 est inférieure 0.05. la tendance n’est pas significativement différente de zéro ,de plus :
La statistique de StudentΦ̂
t = -4.991788 est inférieure aux valeurs critiques -4.037, -3.448 et -3.149 (données par la table de Dickey- Fuller) pour les seuils 1%, 5% et 10%
D’où la série ne possède pas de racine unitaire (on rejette l’hypothèse nulle “ 0φ = “) donc non stationnarité de type TS on confirme ça par la prob = 0.0058 est inférieure à 0.05).
La série DFE est non stationnaire de type TS Donc pour stationnariser cette série il faut faire un ajustement. Le meilleur ajustement du processus est l’ajustement cubique car R 2 associé égale 0,362
est le plus grand D’après les résultats obtenus par le logiciel SPSS : Dependent Mth Rsq d.f. F Sigf b0 b1 b2 b3 DFN LIN .156 118 21.80 .000 -2278.10 53.2261 DFN LOG .066 118 8.34 .005 -3968.20 1287.08 DFN INV .000 118 7.7E-03 .930 957.75 -349.24 DFN QUA .190 117 13.68 .000 -315.26 -43.305 .7978DFN CUB .192 116 9.18 .000 307.93 -103.86 2.0437 -.0069
Tableau (1)
La série FN après désaisonnalisation peut être ajustée par une forme cubique Estimation de la tendance cubique :
11
.d
t t j t j tj
X X c t Xφ φβ ε− −=
Δ = + + + Δ +∑
Application Box & Jenkins
97
Estimons l’équation d’ajustement ty qui est donnée par la formule suivante : 3
32
210 tbtbtbbyt ⋅+⋅+⋅+= , les cœfficients b 0 , b1 , b 2 et b 3 sont données par le
Tableau (1)
Notation : Nous notons la série ajustée par AD t elle est donnée par la formule :
AD t = t tDFN y− .
Diagramme séquentiel de la série DFN avec Ajustement
DFN
Séquence
140120100806040200
20000
10000
0
-10000
Observé
Cubique
Nous devons rétablir le Test de Dickey-Fuller sur la série DFN ajustée c'est-à-dire AD t :
Etape (3) : Modèle 6: Test de la racine unitaire :
11
.d
t t j t j tj
X X Xφ φ ε− −=
Δ = + Δ +∑ Avec tε est un processus stationnaire.
Nous testons alors la présence d’une racine unitaire dans le processus en testant la nullité
du paramètre Φ à l’aide d’une statistique de StudentΦ̂
t , où Φ̂ désigne l’estimateur des moindres carrés ordinaires (MCO). Le résultat de l’affichage pour la série AD t est donné dans le tableau suivant:
Application Box & Jenkins
98
La statistique de StudentΦ̂
t = - 5.0515 est inférieure aux valeurs critiques -2.584, -1.943 et -1.614 (données par la table de Dickey- Fuller) pour les seuils 1%, 5% et 10% d’où la série ne possède pas de racine unitaire (on rejette l’hypothèse nulle “ 0φ = “). La série AD t est donc stationnaire.
Il convient à présent d’estimer le modèle susceptible de la représenter. Corrélogramme de la série AD t :
En observant les corrélogrammes simple et partiel de la série stationnaire AD t, nous remarquons que la fonction d’autocorrélation simple (AC) possède des valeurs importantes aux retards q=1,12,3,7,… , et que la fonction d’autocorrélation partielle (PAC) possède des valeurs importantes aux retards p=1, 2,7,12,… par conséquent nous avons plusieurs modèles candidats parmi lesquels nous avons sélectionné le modèle :
SARIMA (2.1.0)(0.1.1).
Estimation des paramètres de model :
Nous remarquons que tous les paramètres du modèle sont significativement différents de zéro. En effet les rapports des coefficients du modèle sont en valeurs absolues supérieures à 1.96, ce
qui est confirmé par la probabilité de nullité des coefficients qui sont tous inférieures à 0.05. Tests sur les résidus :
Application Box & Jenkins
99
Test de validation des paramètres: De la représentation graphique des inverses des racines des polynômes de retards
moyenne mobile et autorégressif nous constatons qu’ils sont tous supérieures à 1 en module (leurs inverses sont en module, inférieures à 1).
Représentation graphique des séries : résiduelle ( tε ) ; actuelle et estimée:
A partir de la représentation graphique des séries résiduelles, actuelles et estimée nous
constatons que le modèle estimé ajuste mieux la série AD. Corrélogrammes simple et partiel des résidus :
Application Box & Jenkins
100
L’analyse du corrélogramme des résidus, montre que tous les termes sont à l’intérieur de
l’intervalle de confiance (illustré par des pointillés sur le graphique). Ce qui nous entraîne à
dire que les résidus forment un bruit blanc.
Test de point de retournement :
0H : « Les iε forment un bruit blanc » contre
1H : « Les iε ne forment pas un bruit blanc » Après les calculs à l’aide du logiciel MATLAB nous avons obtenu les résultats suivants Nombre de points de retournements p = 76 Espérance de la statistique du test E (p) = 73 Variance de la statistique du test VAR(p) = 20 La statistique du test est T= 0.6 T = 0.6 est inférieure à 1.96 (tabulée) d’où on accepte l’hypothèse 0H : « Les iε
forment un bruit blanc » au seuil de 0,05
Test de Box – Ljung :
Nous avons à tester l’hypothèse nulle : 0H : « Les autocorrélations jusqu’au pas k, (k=N/4) ne sont pas significatives » C'est-à-dire
H 0 : « 0...21 ==== Kρρρ » Contre 1H : « 45,,1: …=∃ jjρ tel que 0≠jρ ».
Ce test est basé sur la statistique de Box-Ljung au pas k : ∑= −
+=K
k
k
knnnQ
1
2
)1(γ
.
Si )(295,0 qpKQ −−< χ , nous acceptons l’hypothèse H 0 .
Application Box & Jenkins
101
La probabilité de la statistique de Box-Ljung est supérieure à 0,05 à n’importe quel retard et la valeur de la statistique de Box-Ljung quand k = 30, p = 2 , q = 1 est égale à 20.473, inférieure à 2
95.,0χ (27) = 40.11 Nous concluons alors que les erreurs ne sont pas corrélées.
Test de Durbin-Watson : (Test de détection d’autocorrélation d’ordre1 des erreurs) :
Nous testons H 0 : « 0=ρ » contre 1H : « 0≠ρ ». La statistique de Durbin-Watson (DW=2.10 2≈ ) nous constatons que les résidus
d’ordre 1 ne sont pas corrélés. Test de Normalité : Les tests sont effectués à partir des valeurs empiriques des coefficients de Skewness,
Kurtosis et la statistique de Jarque-Bera, nous avons l’histogramme suivant:
Test de Skewness (asymétrie) et de Kurtosis (aplatissement) :
Nous testons les hypothèses suivantes :⎪⎩
⎪⎨
⎧
≠≠
==
00:
00:
211
210
γγ
γγ
ouH
etH
Test de Skewness :
N6
0211
1−
=β
γ
Test de Kurtosis :
N24
322
−=β
γ
où : 232
3211 μ
μβ = : est le coefficient de Skewness (l’indicateur d’asymétrie des résidus)
2
2
42 μ
μβ = : est le coefficient de Kurtosis (le degré d’aplatissement de la loi des
résidus). Sous l’hypothèse H 0 et si le nombre d’observations est assez grand (N >30), nous avons :
232
3211 μ
μβ = ( )16,0 ⎟⎟
⎠
⎞⎜⎜⎝
⎛→℘
∞→ NN
N
22
42 μ
μβ = ( )224,0 ⎟⎟
⎠
⎞⎜⎜⎝
⎛→℘
∞→ NN
N
Application Box & Jenkins
102
Après calculs nous avons obtenu :
Test de skewness : 1g =
1/ 21 0
6
b
N
+=
11360805861.0 +
= 3,497>1.96 donc :
On rejette l’hypothèse nulle 0H (aplatissement Normal)
Test de Kurtosis : 2g = 2 324
b
N
−=
5.793996 324 113
−= 6,062>1.96 donc :
On rejette l’hypothèse nulle 0H (asymétrie) Alors : les résidus ne sont pas gaussiens. Ce qui est confirmé par le test de Jaque-Bera
Test de Jarque et Bera :
la statistique de Jaque Bera=48.98>5.911.Donc : on rejette l’hypothèse nulle 0H (normalité)
noté (S) est égale à 48.98 ; elle est supérieure à la valeur 99,5)2(295,0 =χ d’où les résidus ne
sont pas gaussiens.
. Conclusion : Nous pouvons conclure d’après ces tests que le modèle qui ajuste le mieux la série est : SARIMA (2.1.0)(0.1.1)qui s’écrit sous la forme suivante :
tt BFNBBBB ξ)888587.01)1)(1)(195202.0203857.01( 12127 +=−−+− Prévision : Les prévisions sont calculées pour la période allant de janvier 2006 à Décembre 2006 Diagramme séquentiel de la série brute FN et des prévisions
Remarque : Les quantités de carburants sont en milliers de tonnes
prévision FN Janvier 2006 26422,3403 Février 2006 25159,6582 Mars 2006 28103,5815 Avril 2006 28918,9406 Mai 2006 29677,0913 Juin 2006 30241,7849
Juillet 2006 33999,8893 Août 2006 33501,7876
Septembre 2006 32960,7763 Octobre 2006 33918,9098
Novembre2006 29451,4462 décembre2006 32445,0728
Application Box & Jenkins
103
Analyse de la série vente de carburant Fuel-oil secteur Marine Etrangère :
Plusieurs étapes préliminaires sont nécessaires avant d’effectuer des tests spécifiques sur
une série chronologique et de chercher à la modéliser, il convient d’étudier ces
caractéristiques stochastiques c'est-à-dire sa moyenne et sa variance.
Notation : Nous notons la série vente de carburant jet A1 secteur aviation étrangère FE.
Identification
Les données de la série des ventes de carburant fuol-oil etranger (notée : FE ) sur une
période de dix ans, les observations sont mensuelles ; de janvier 1995 à décembre
2005.L'unité de mesure est en milliers de tonnes.
Diagramme séquentiel de la série brute FE :
Graphe de la moyenne et la variance de la série brute FE :
moyenne
0
1000
2000
3000
4000
5000
6000
1 2 3 4 5 6 7 8 9 10 11
moyenne
variance
0
2000000
4000000
6000000
8000000
10000000
12000000
1 3 5 7 9 11
variance
Application Box & Jenkins
104
D’après les deux graphes précédents, on remarque que la moyenne et la variance varient
au cours du temps. On peut donc dire que cette série semble non stationnaire..
Pour vérifier ceci, on va appliquer des tests statistiques juste après la présentation des corrélogrammes simple et partiel de la série brute
Corrélogramme de la série FE:
D'après le corrélogramme simple de la série on remarque que les pics aux retards 1,…,7,10,..,13 sont à l'extérieur de la bande de confiance et les autocorrélations prennent une allure décroissante. Le corrélogramme partiel est marqué par des pics significatif au retard 1,2,5,9,11et 19.
En effet, la fonction d’autocorrélation simple estimée (colonne AC) ne décroît pas de manière rapide vers zéro .
Test de FISHER: Pour détecter la saisonnalité de la série on a fait appel à l’analyse de variance (ANOVA) à deux facteurs sans répétition
Application Box & Jenkins
105
Table de l’ANOVA (à 2 facteurs) données par logiciel SPSS:
Source des variations
Somme des carrés
Degré de liberté
Moyenne des carrés F
Probabilité
Valeur critique pour
F
Lignes 38868993.4 4 3533544.85 1.33826868 0,21320
372 1,87673166
Colonnes 261316593 10 261316593 9.89691168 1,1668E
-11 1,9178259Erreur 290442374 110 2640385.22 Total 590627961 131
Test d’influence de facteur ligne (mois) : Fstat= 1.33826< Fthéo= 1.8767 donc (on accepte l’hypothèse nulle) la série n’est pas
affectée d’une saisonnalité Test d’influence de facteur colonne (années) : Fstat= 9.89691 > Fthéo= 1.9178 donc (on rejette l’hypothèse nulle) la série est peut être
affectée d’une tendance.
En observant le graphe ainsi que le corrélogramme de la série FE, nous remarquons que la
série semble non stationnaire .Un recours au test de racine unitaire permet d’affirmer ou
d’infirmer la stationnarité de la série en question.
Test de Dickey- Fuller Augmenté: on procède à l’estimation par la méthode des moindres carrées avec d=1 des trois modèles
[4], [5] et [6] de Dickey-Fuller sur la série FE (car les résidus forment un bruit blanc
Remarque On choisit le retard d=1 qui minimise le critères d’informations d’Akaike et Schwarz
Application Box & Jenkins
106
Etape (1) : Modèle 4 : Test sur la tendance :
Avec tε est un processus stationnaire Nous testons alors la présence d’une tendance dans le processus en testant la nullité du
coefficient de la tendanceβ , Le résultat de l’affichage pour la série FE est donné dans le
tableau suivant:
On remarque que la t- statistique de la tendance =2.931002 est supérieure à 2.79 et 2.73
au seuils 5% et 10% (données par la table de Dickey- Fuller) .On le confirme par probabilité (prob = 0.004 est inférieure 0.05. La tendance est significativement différente de zéro.Alors d’après le même tableau on remarque que :
La statistique de StudentΦ̂
t = -8.931532 est inférieure aux valeurs critiques -4.0303, -3.4445 et -3.31468 (données par la table de Dickey- Fuller) pour les seuils 1%, 5% et 10%
D’où la série ne possède pas de racine unitaire (on rejette l’hypothèse nulle “ 0φ = “) donc non stationnarité de type TS .
la série FE est non stationnaire de type TS Donc pour stationnariser cette série il faut faire un ajustement. Le meilleur ajustement du processus est l’ajustement cubique car R 2 associé égale 0,362
est le plus grand d’après les résultats obtenus par le logiciel SPSS :
La série FE peut être ajustée par une forme linéaire. Estimation de la tendance linéaire : Estimons l’équation d’ajustement ty qui est donnée par la formule suivante :
tbbyt ⋅+= 10 .
11
.d
t t j t j tj
X X c t Xφ φβ ε− −=
Δ = + + + Δ +∑
Application Box & Jenkins
107
Notation : Nous notons la série ajustée par AJU t elle est donnée par la formule :
AJU t = FEt - yt .
D’où la série qu’on va étudier maintenant c’est la série AJU t Graphe de la série AJU t :
Corrélogramme de la série AJU t :
Application Box & Jenkins
108
Un recours au test de racine unitaire permet d’affirmer ou d’infirmer la stationnarité de la série en question.
Etape (1) : Modèle 4 : Test sur la tendance :
Avec tε est un processus stationnaire Nous testons alors la présence d’une tendance dans le processus en testant la nullité du
coefficient de la tendanceβ . Le résultat de l’affichage pour la série AJU t est donné dans le
tableau suivant:
On remarque que la t- statistique de la tendance = 0.284562 est inférieure aux valeurs critiques 3.53 et 2.79 et 2.73 (données par la table de Dickey- Fuller) pour les seuils 1%, 5%,10% On le confirme par la prob = 0.7764 supérieure à 0.05. Donc la tendance n’est pas significativement différente de zéro, on passe alors à l’étape (2)
Etape (2) : Modèle 5 : Test sur la constante
Avec tε est un processus stationnaire
Nous testons la présence d’une constante dans le processus en testant la nullité du coefficient de la constante. Le résultat de l’affichage pour la série AJU t est donné dans le tableau suivant:
11
.d
t t j t j tj
X X c t Xφ φβ ε− −=
Δ = + + + Δ +∑
11
.d
t t j t j tj
X cX Xφ φ ε− −=
Δ = + + Δ +∑
Application Box & Jenkins
109
On remarque que la t-statistique de la constante (c) = 0.125585 est inférieure aux valeurs
critiques 3.22 et 2.54 et 2.17 (données par la table de Dickey- Fuller) pour les seuils 1% , 5% et 10% On le confirme par prob = 0.9003 supérieure à 0.05. Donc la constante n’est pas significativement différente de zéro, on passe alors à l’étape (3) Etape (3) : Modèle 6: Test de la racine unitaire :
11
.d
t t j t j tj
X X Xφ φ ε− −=
Δ = + Δ +∑ Avec tε est un processus stationnaire.
Nous testons alors la présence d’une racine unitaire dans le processus en testant la nullité du
paramètre Φ à l’aide d’une statistique de StudentΦ̂
t , où Φ̂ désigne l’estimateur des moindres carrés ordinaires (MCO). Le résultat de l’affichage pour la série AJU t est donné dans le tableau suivant.
La statistique de Student
Φ̂t = - 19.24054 est inférieure aux valeurs critiques -2.584, -
1.943 et -1.614 (données par la table de Dickey- Fuller) pour les seuils 1%, 5% et 10% d’où la série ne possède pas de racine unitaire (on rejette l’hypothèse nulle “ 0φ = “). La série AJU t est donc stationnaire. Il convient à présent d’estimer le modèle susceptible de la représenter, en observant les corrélogrammes simple et partiel de la série stationnaire AJU t, nous remarquons que la fonction d’autocorrélation simple (AC) possède des valeurs importantes aux retards q=1,12,… , et que la fonction d’autocorrélation partielle (PAC) possède des valeurs importantes aux retards p=1, 2 ,12,… par conséquent nous avons plusieurs modèles candidats parmi lesquels nous avons sélectionné le modèle : ARIMA (3.1.3)
Estimation des paramètres de modèle :
Application Box & Jenkins
110
Nous remarquons que tous les paramètres du modèle sont significativement différents de zéro.
En effet les rapports des coefficients du modèle sont en valeurs absolues supérieures à 1.96, ce qui est confirmé par la probabilité de nullité des coefficients qui sont tous inférieures à 0.05.
Tests sur les résidus :
Test de validation des paramètres:
De la représentation graphique des inverses des racines des polynômes de retards moyenne mobile et autorégressif nous constatons qu’ils sont tous supérieures à 1 en module (leurs inverses sont en module, inférieures à 1).
Représentation graphique des séries : résiduelle ( tε ) ; actuelle et estimée:
A partir de la représentation graphique des séries résiduelle, actuelles et estimée nous
constatons que le model estimé ajuste mieux la série FE.
Application Box & Jenkins
111
Corrélogrammes simple et partiel des résidus :
L’analyse du corrélogramme des résidus, montre que tous les termes sont à l’intérieur de l’intervalle de confiance (illustré par des pointillés sur le graphique). Ce qui nous entraîne à dire que les résidus forment un bruit blanc.
Test de point de retournement :
0H : « Les iε forment un bruit blanc » contre
1H : « Les iε ne forment pas un bruit blanc tel que : i = n,1 » Après les calculs à l’aide du logiciel MATLAB nous avons obtenu les résultats suivants Nombre de points de retournements p = 85 Espérance de la statistique du test E (p) = 74 Variance de la statistique du test VAR(p) = 30 La statistique du test est T= 1.2 T = 1.8 est inférieure à 1.96 (tabulée) d’où on accepte l’hypothèse 0H : « Les iε
forment un bruit blanc » au seuil de 0,05
Test de Box – Ljung :
Nous avons à tester l’hypothèse nulle : 0H : « Les autocorrélations jusqu’au pas k, (k=N/4) ne sont pas significatives » C'est-à-dire
H 0 : « 0...21 ==== Kρρρ » Contre 1H : « 45,,1: …=∃ jjρ tel que 0≠jρ ».
Ce test est basé sur la statistique de Box-Ljung au pas k : ∑= −
+=K
k
k
knnnQ
1
2
)1(γ
.
Si )(295,0 qpKQ −−< χ , nous acceptons l’hypothèse H 0 .
Application Box & Jenkins
112
La probabilité de la statistique de Box-Ljung est supérieure à 0,05 à n’importe quel retard et la valeur de la statistique de Box-Ljung quand k = 33, p = 3 , q = 3 est égale à 18.846 inférieure à 2
95.,0χ (27) = 40.11 Nous concluons alors que les erreurs ne sont pas orrélées.
Test de Durbin-Watson : (Test de détection d’autocorrélation d’ordre1 des erreurs) :
Nous testons H 0 : « 0=ρ » contre 1H : « 0≠ρ ». La statistique de Durbin-Watson (DW=2.003 2≈ ) nous constatons que les résidus
d’ordre 1 ne sont pas corrélés. Test de Normalité : Les tests sont effectués à partir des valeurs empiriques des coefficients de Skewness,
Kurtosis et la statistique de Jarque-Bera, nous avons l’histogramme suivant:
-t Test de Skewness (asymétrie) et de Kurtosis (aplatissement) :
Nous testons les hypothèses suivantes :⎪⎩
⎪⎨
⎧
≠≠
==
00:
00:
211
210
γγ
γγ
ouH
etH
Test de Skewness :
N6
0211
1−
=β
γ
Test de Kurtosis :
N24
322
−=β
γ
où : 232
3211 μ
μβ = : est le coefficient de Skewness (l’indicateur d’asymétrie des résidus)
2
2
42 μ
μβ = : est le coefficient de Kurtosis (le degré d’aplatissement de la loi des résidus).
Sous l’hypothèse H 0 et si le nombre d’observations est assez grand (N >30), nous avons :
232
3211 μ
μβ = ( )16,0 ⎟⎟
⎠
⎞⎜⎜⎝
⎛→℘
∞→ NN
N
22
42 μ
μβ = ( )224,0 ⎟⎟
⎠
⎞⎜⎜⎝
⎛→℘
∞→ NN
N
Application Box & Jenkins
113
Après calculs nous avons obtenu :
Test de skewness : 1/ 21
1
0 0.252499 01.1385<1.96.
6 6N 1221.1385
β + +γ = = = Donc :
On accepte l’hypothèse nulle 0H (aplatissement Normal)
Test de Kurtosis : 22
3 3.5277 30.7388 1.96.
24 24N 122
β − −γ = = = ≺ Donc :
On accepte l’hypothèse nulle 0H (asymétrie) Nous acceptons l’hypothèse de normalité en ce qui concerne la symétrie et l’aplatissement de la
distribution ( 21 γγ et sont inférieurs à 1,96), Ce qui est confirmé par la statistique de Jarque et Bera.
Test de Jarque et Bera :
La statistique de Jarque et Bera noté (S) est égale à 2.401 ; elle est inférieure à la valeur
99,5)2(295,0 =χ d’où les résidus sont gaussiens.
Conclusion : Nous pouvons conclure d’après ces tests que le modèle qui ajuste le mieux la série est : ARIMA (3.1.3) qui s’écrit sous la forme suivante :
2 10 3
10 15
(1 0.236236 0.326708 0.177887 )(1 )
(1 0.23255 0.430185 0.36597 )t
t
B B B B FE
B B B ε
− − − − =
− + +
Prévision : Les prévisions sont calculées pour la période allant de janvier 2006 à Décembre 2006 Diagramme séquentiel de la série brute JAE et des prévisions
prévision JAE
Janvier 2006 4124.58408
Février 2006 4132.7257
Mars 2006 4570.19352
Avril 2006 4394.5555
Mai 2006 4566.20834
Juin 2006 4829.54963
Juillet 2006 5752.69921
Août 2006 5815.18974
Septembre 2006 5780.73036
Octobre 2006 5440.57075
Novembre2006 5456.10994
décembre2006 5383.597
Remarque : Les quantités de carburants sont en milliers de tonnes
Application ARFIMA
Application ARFIMA
114
Les corrélogrammes des quatre séries
Test de mémoire longue : On cherche à tester l’hypothèse :
⎢⎣⎡
⎥⎦⎤−∈
21,
21d:"H0 Existence d’une mémoire longue"
⎢⎣⎡
⎥⎦⎤−∉
21,
21d:"H1 Absence de mémoire longue"
Mais auparavant, il est impératif d’estimer le paramètre d’intégration fractionnaire d.
JAI JAE
FE FN
Application ARFIMA
115
Estimation de d : Pour la détermination de l’ordre d’intégration fractionnaire d, on a utilisé la méthode
d’estimation en deux étapes (analyse R/S) basée sur l’exposant de HURST. Pour cela, on a
élaboré un programme informatique.
Résultats du test :
Pour la série JAN : d= 0.0398.
Pour la série JAE: d= 0.0541.
Pour la série FE : d= 0.2396.
Pour la série FN : d=0.0452.
Les résultats du test confirment l’existence d’une mémoire longue pour la série FE et son absence pour les autres séries.
Etude de la série FE :
Estimation et modélisation de la série FE :
Modèle AIC -2LOG(likelihood) ARFIMA (2, 0.2396,2) 0.235790 E +04 0.234790 E +04 ARFIMA (2, 0.2396, 4) 0.236115 E +04 0.234715 E +04
ARMA Model: (1-B)^.2396 X(t) = .0000 X(t-1) + .1000 X(t-2) + Z(t) + .0000 Z(t-1) + .0000 Z(t-2)
Corrélogrammes des résidus:
Application ARFIMA
116
Tests sur les résidus :
Test des points de retournement On a à tester l’hypothèse nulle :
H0 : « les εi ne sont pas corrélés entre eux »
Contre H1 : « Il existe une corrélation entre les εi i =1,n ».
Turning points = 84.000~AN (86.667, sd = 4.8109), p-value = .57937>0.05.
On accepte alors H0.
Test de Box-Lung Le Corrélogramme des résidus du modèle montre que les résidus semblent former un
bruit blanc puisque tous les termes ne sont pas significativement différents de zéro. Nous remarquons aussi que la statistique de Box-Ljung est inférieure à la valeur théorique au seuil 5%
Test de normalité :
Application ARFIMA
117
- Test de skewness : 1g =
n
b
6
02/11 + =
11360805861.0 +
= 1.29<1.96 donc :
On accepte l’hypothèse nulle 0H (aplatissement Normal)
- Test de kurtoisis : 2g =
n
b24
32 − =11124
3793996.5 −= 5.26>1.96 donc :
On rejette l’hypothèse nulle 0H (asymétrie) Alors : les résidus ne sont pas gaussiens. Ce qui est confirmé par le test de Jarque-Bera
- La statistique de Jraque Bera=29.64>5.911.Donc : on rejette l’hypothèse nulle 0H (normalité) Conclusion : D’après les tests précédent on conclut que les résidus forme un bruit blanc non
gaussien.
Test d’homoscédasticité (ARCH) : D’après le corrélogramme des résidus au carré il n’existe pas de pic significativement
différent de zéro et donc pas d’effet ARCH
Prévision :
Année et mois Prévision janv-05 873,6863 févr-05 751,9604 mars-05 666,4125 avr-05 562,8928 mai-05 459,5315 juin-05 350,8888 juil-05 238,5849 août-05 122,21 sept-05 1,5543 oct-05 288,098 nov-05 107,0413 déc-05 -387,0356
Remarques : Les quantités de carburants sont en milliers de tonnes. La dernière prévision c'est à dire celle de mois de décembre 2005 est négative ce qui
nous pousse a dire plus que l'horizon de prévision s'élargit plus la modélisation ARFIMA(dans notre cas) ne donne pas des bonne prévisions.
Application VAR
Application VAR
119
La modélisation VAR sous le logiciel Eviews:
On dispose de 04 séries stationnaires (jae, jan, fe, fn) on travaille sur la période allant de
janvier 1996 à décembre 2005. Les processus ( itY i = 1,4) étant stationnaires, il est possible de modéliser la série
chronologique multivariée tY par un processus VAR. Nous avons, K = 4 et T = 120
(T nombre d’observations de la série itY i = 1,4)
Notation: Jae: Carburant JET A1 secteur aviation région étrangère Jan: Carburant JET A1 secteur aviation région nationale Fe : Carburant fuel-oil secteur marine région étrangère Fn: Carburant fuel-oil secteur marine région nationale Les séries stationnaires sont représentées par les graphes suivants:
Application VAR
120
Estimation du VAR: La première étape consiste à déterminer l’ordre p du processus VAR à retenir, à cette fin
nous avons estimé pour commencer divers processus VAR pour des ordres de retards p allant de 1 à 12, nous devons donc retenir celui dont les critères de Akaike (AIC) et de Schwarz (SC) sont les plus petits.
Nous estimons divers modèles VAR pour p=1 à 12 après plusieurs essais nous avons
retenu un retard p=12. Les critères d'information d'AKAIKE (AIC) de SCHWARZ (SC) et de Hannan-Quinn sont donnés par:
avec
=déterminant de la matrice variance- covariance tel que:
AIC= 70.189 SC=74.957
RESIDFE RESIDFN RESIDJAE RESIDJAN RESIDFE 909829.8 -132962.5 9300.141 -59992.79 RESIDFN -132962.5 6941278. -124212.4 161394.3
RESIDJAE 9300.141 -124212.4 76397.21 58720.83 RESIDJAN -59992.79 161394.3 58720.83 3976582.
Log –vraisemblance, les critères d'information d'Akaike (AIC) et Schwarz (SC)
Application VAR
121
Mais lorsque nous avons estimé les paramètres du modèle VAR(12) avec constante nous
avons remarqué que la t-statistique de la constante est inférieure à 1,96 ; donc la constante n'est pas significative.
⎥⎥⎥⎥
⎦
⎤
⎢⎢⎢⎢
⎣
⎡
+
⎥⎥⎥⎥⎥
⎦
⎤
⎢⎢⎢⎢⎢
⎣
⎡
⎥⎥⎥⎥⎥⎥
⎦
⎤
⎢⎢⎢⎢⎢⎢
⎣
⎡
+
⎥⎥⎥⎥⎥
⎦
⎤
⎢⎢⎢⎢⎢
⎣
⎡
=
⎥⎥⎥⎥
⎦
⎤
⎢⎢⎢⎢
⎣
⎡
=
++=
−
−
−
−
=
−=
∑
∑
t
t
t
t
pt
pt
pt
pt
pppp
pppp
pppp
pppp
p
t
t
t
t
t
tptp
pt
y
y
y
y
aaaa
aaaa
aaaa
aaaa
a
a
a
a
yyyy
Y
YAAY
4
3
2
1
4
3
2
1
44
34
24
14
43
33
23
13
42
32
22
12
41
31
21
11
12
1
04
03
02
01
4
3
2
1
12
10
εεεε
ε
Où A
⎥⎥⎥⎥⎥
⎦
⎤
⎢⎢⎢⎢⎢
⎣
⎡
=
04
03
02
01
0
a
a
a
a
représente l’estimation de la constante et les A p (p =1,...,12) sont des
matrices carrés d’ordre 4 tel que A p les jpia (i,j =1,4) représentent les coefficients
estimés; tt et 21 εε et t3ε et t4ε sont des bruits blancs. Tableau :
Application VAR
122
Application VAR
123
Présentation des résultats: 1érepartie du tableau: résultat de l'estimation Chaque colonne correspond à une équation du modèle VAR, Eviews reporte sur chaque
coefficient estimé son écart-type estimé entre parenthèses et la t-statistique entre crochets 2émepartie du tableau: statistiques associés à une régression MCO standard calculée
équation par équation (i.e. calculées à partir des résidus estimés de chaque équation) 3émepartie du tableau: statistique associée à une régression MCO standard calculée pour
le modèle VAR dans son ensemble
Application VAR
124
La première colonne donne les résultats d'estimation de la première équation (variable fe) La deuxième colonne donne les résultats d'estimation de la deuxième équation (variable fn)
La troisième colonne donne les résultats d'estimation de la troisième équation (variable jae)
La quatrième colonne donne les résultats d'estimation de la quatrième équation (variable jan) donc le VAR estimé s'écrit sous la forme: FE = 0.5138865666*FE(-1) + 0.08851646244*FE(-3) - 0.1858916363*FE(-4) + 0.2129399812*FE(-5) -
0.06753771936*FE(-6) + 0.1100312394*FE(-7) - 0.1354494342*FE(-10) + 0.1950868599*FE(-11) - 0.05601552414*FE(-12) - 0.05207190108*FN(-1) + 0.1542121815*FN(-3) - 0.1297690979*FN(-4) + 0.01309840894*FN(-5) - 0.01016582916*FN(-6) + 0.02924002657*FN(-7) + 0.00940125585*FN(-10) - 0.05809671716*FN(-11) + 0.06204082923*FN(-12) - 0.2885535862*JAE(-1) + 0.7425845812*JAE(-3) - 0.9350288096*JAE(-4) + 0.72221153*JAE(-5) - 0.04131481402*JAE(-6) + 0.4142686105*JAE(-7) + 0.01165554772*JAE(-10) + 0.05390104945*JAE(-11) + 0.205440153*JAE(-12) - 0.02943791762*JAN(-1) - 0.09559081329*JAN(-3) + 0.1748064848*JAN(-4) - 0.03260088414*JAN(-5) - 0.1222785296*JAN(-6) + 0.124394713*JAN(-7) - 0.158152241*JAN(-10) + 0.07565053515*JAN(-11) + 0.01620620952*JAN(-12)
FN = 0.2668463094*FE(-1) + 0.1274586202*FE(-3) - 0.4819189698*FE(-4) - 0.6684105782*FE(-5) +
0.2832104158*FE(-6) + 0.04235964971*FE(-7) + 0.02009687886*FE(-10) + 0.1084720276*FE(-11) - 0.3711201441*FE(-12) - 0.05097990158*FN(-1) + 0.2135230552*FN(-3) + 0.07249170752*FN(-4) - 0.06210024519*FN(-5) - 0.1163635678*FN(-6) - 0.2195410591*FN(-7) - 0.02543579987*FN(-10) - 0.1135588004*FN(-11) - 0.4537274846*FN(-12) + 1.334156666*JAE(-1) + 0.091656488*JAE(-3) - 1.639224531*JAE(-4) + 1.976905728*JAE(-5) + 0.01487653128*JAE(-6) - 0.01103787487*JAE(-7) - 1.66310656*JAE(-10) - 2.291743749*JAE(-11) + 0.6929252057*JAE(-12) - 0.001800288424*JAN(-1) + 0.0577185335*JAN(-3) - 0.1837043566*JAN(-4) - 0.2096021983*JAN(-5) + 0.01093173704*JAN(-6) - 0.1094409864*JAN(-7) + 0.3506146091*JAN(-10) - 0.1775124355*JAN(-11) - 0.2198517455*JAN(-12)
JAE = - 0.01882273148*FE(-1) + 0.01567360967*FE(-3) + 0.01650562139*FE(-4) +
0.06332678143*FE(-5) - 0.02649027611*FE(-6) - 0.00585109903*FE(-7) + 0.01045516186*FE(-10) - 0.01257219655*FE(-11) - 0.01896288183*FE(-12) + 0.01931064853*FN(-1) + 0.006718999501*FN(-3) - 0.005604280877*FN(-4) - 0.002959298683*FN(-5) - 0.001118438836*FN(-6) - 0.00592425837*FN(-7) - 0.004680914032*FN(-10) + 0.001101445776*FN(-11) + 0.0209835476*FN(-12) + 0.3164288494*JAE(-1) + 0.02522073334*JAE(-3) - 0.08550745803*JAE(-4) - 0.02773427551*JAE(-5) + 0.07195401881*JAE(-6) - 0.009741058023*JAE(-7) - 0.2067551668*JAE(-10) + 0.1278039929*JAE(-11) - 0.2127460731*JAE(-12) - 0.03440147237*JAN(-1) + 0.01834208186*JAN(-3) - 0.01254105344*JAN(-4) - 0.002707723161*JAN(-5) + 0.003854667483*JAN(-6) + 0.04109508282*JAN(-7) - 0.01365410628*JAN(-10) - 0.02116113552*JAN(-11) + 0.03479601759*JAN(-12)
JAN = - 0.1399375945*FE(-1) - 0.005335446463*FE(-3) - 0.06008855141*FE(-4) +
0.1013908291*FE(-5) - 0.2529872799*FE(-6) - 0.07732883534*FE(-7) - 0.01190880795*FE(-10) - 0.2903432703*FE(-11) + 0.1495829226*FE(-12) - 0.002996991519*FN(-1) - 0.05049803301*FN(-3) + 0.01076013018*FN(-4) - 0.05969214808*FN(-5) - 0.05408929182*FN(-6) + 0.05509316593*FN(-7) + 0.08264553226*FN(-10) - 0.009874632583*FN(-11) - 0.01736103924*FN(-12) - 0.201687376*JAE(-1) + 0.451964449*JAE(-3) - 0.08484463669*JAE(-4) - 0.9604511724*JAE(-5) + 0.419853133*JAE(-6) - 0.5754540741*JAE(-7) - 0.8438202862*JAE(-10) - 0.6380606547*JAE(-11) - 0.3079768732*JAE(-12) + 0.4617223899*JAN(-1) + 0.2091587066*JAN(-3) - 0.09069666901*JAN(-4) + 0.08404651002*JAN(-5) + 0.07709415443*JAN(-6) + 0.1183870882*JAN(-7) + 0.01818272123*JAN(-10) + 0.03834980612*JAN(-11) - 0.2804770253*JAN(-12)
Application VAR
125
Vérification de la stationnarité du VAR: Test sur les racines :
Les inverses des racines des polynômes autorégressifs (donnés par l’Eviews) des quatre séries sont inférieure en module à 1
L’inverse des racines associées à la partie AR appartient au disque unité. Le VAR est stationnaire.
Tests sur les paramètres : La significativité des coefficients du modèle VAR(12) est confirmée par le test de Student En
tenant compte du tableau des estimations (Tableau) et le fait qu’un coefficient est significativement différent de zéro au seuil 5%, si la t-statistique associée est supérieure à 1.96
Application VAR
126
Résidus simples de la série (FE): Résidus simples de la série (FN):
Application VAR
127
Résidus simples de la série (JAE):
Résidus simples de la série (JAN):
Application VAR
128
Résidus croisés des séries (FN ; FE):
Résidus croisés des séries (JAE ; JAN):
Application VAR
129
Résidus croisés des séries (FE ; JAE):
Résidus croisés des séries (FE ; JAN):
Application VAR
130
Résidus croisés des séries (FN ;JAE):
Résidus croisés des séries (FN ; JAN):
Application VAR
131
Les graphes des résidus simples des quatre séries :
Pour les séries Jan; Jae; Fe; FN on retient les coefficients qui sont significatifs, c'est-à-dire
ceux dont les statistiques de Student (t-stat) sont supérieures en valeur absolue aux valeurs
théoriques (1.96) au seuil de 5%. D’où:
Le modèle VAR(12) s’écrit donc de la façon suivante :
FE = 0.5138865666*FE(-1) + 0.2129399812*FE(-5) + 0.1950868599*FE(-11) + 0.1542121815*FN(-3) - 0.1297690979*FN(-4) - 0.9350288096*JAE(-4) + 0.1748064848*JAN(-4) + 0.124394713*JAN(- 7) - 0.158152241*JAN(-10)
FN = - 0.6684105782*FE(-5) + 0.2135230552*FN(-3) - 0.2195410591*FN(-7) - 0.4537274846*FN(-12)
- 2.291743749*JAE(-11) + 0.3506146091*JAN(-10) JAE = 0.06332678143*FE(-5) - 0.02649027611*FE(-6) - 0.00585109903*FE(-7) +
0.0209835476*FN(-12) + 0.3164288494*JAE(-1) - 0.03440147237*JAN(-1) + 0.04109508282*JAN(-7) + 0.03479601759*JAN(-12)
JAN = 0.4617223899*JAN(-1) - 0.2804770253*JAN(-12)
Remarque: Nous constatons que la série JAN s’écrit uniquement en fonction de ses valeurs passées,
ceci nous pousse à penser que l’approche multivariée pour cette série n’apportera rien en terme de prévisions par rapport à l’approche univarié
Application VAR
132
Tests sur les résidus De la même façon que la méthodologie de Box & Jenkins, il convient de vérifier si les
résidus forment un bruit blanc, une observation des corrélogrammes des résidus des deux séries s’impose.
Globalement, l’analyse des corrélogrammes simples et croisées nous montre que tous les termes sont à l’intérieur de l’intervalle de confiance de là on déduit une absence de corrélation, de plus toutes les probabilités associées sont supérieures à 0.05, ce qui est confirmé par Q-stat pour tous les retards en particulier Q-stat = 15.474 ; 15.546 ; 22.488 ; 23.903 resp des séries (FE, FN,JAE, JAN); (pour h = 30) < 2
0.05 (30) 43.77χ = . Donc les résidus se comportent comme un bruit blanc.
Donc les résidus des séries une à une forment un processus bruit blanc.
Test de Normalité : Résidus de la série (FE):
-test de skewness : 1g =
n
b
6
02/11 +
=0.252499 0
6 108+
= 1,071<1.96 donc :
On accepte l’hypothèse nulle 0H (aplatissement Normal)
-test de kurtosis : 2g =
n
b24
32 −=
3.52793 324 108
−= 1,119<1.96 donc :
On accepte l’hypothèse nulle 0H (asymétrie) Alors : les résidus sont gaussiens. Ce qui est confirmé par le test de Jarque-Berra
Application VAR
133
- La statistique de Jarque-Berra=2,40>5.911.Donc : on accepte l’hypothèse nulle 0H (normalité)
RESIDFE RESIDFN Skewness 0.252499300708926 -0.178678479865026 Kurtosis 3.52779348449417 2.65701587043281 Jarque-Bera 2.40115297368819 1.10403949411112 Probability 0.301020627450904 0.575785693706116 Sum -9634.80974233782 -8939.07126213692 Sum Sq. Dev. 98261617.464214 749657986.861302 Observations 108 108
RESIDJAE RESIDJAN
Skewness -0.0712588488320082 0.281728280741602 Kurtosis 2.78755176016054 4.06493347414021 Jarque-Bera 0.294504969412509 6.5320497046027 Probability 0.863076036404564 0.0381578089195492 Sum -69.9319286509287 -12552.0427659422 Sum Sq. Dev. 8250899.10417633 429470841.548753 Observations 108 108
RESIDFE RESIDFN RESIDJAE RESIDJAN
Skewness 1,071 0,757 0,302 1,195
Kurtosis 1,119 1,393 0,848 8,623
Jarque-Bera 2.401 1.1040 0.294 6.5320
Observations 108 108 108 108
Conclusion : D’après les tests précédents on conclut que les résidus forment un bruit blanc Gaussien sauf pour les résidus de la série JAN
Prévision: Les prévisions sont calculées pour la période allant de janvier 2006 à Décembre 2006
FE FN JAE JAN Janvier 2006 219.9691 22861.44 3889.915 25445.95 Février 2006 760.1325 26087.89 4342.417 23763.63 Mars 2006 247.8898 35924.73 4318.431 23890.61 Avril 2006 1120.071 32969.42 4247.052 24472.81 Mai 2006 434.6242 30365.83 4465.693 24754.62 Juin 2006 1030.656 27410.18 4769.805 23744.89 Juillet 2006 732.0931 35723.78 5989.449 25355.39 Août 2006 508.3732 31954.93 6159.516 26790.62 Septembre 2006 1186.878 32574.07 5882.792 23908.79 Octobre 2006 1143.687 31269.60 5166.946 24080.56 Novembre2006 86.02180 24402.61 5220.334 28424.65 Décembre2006 745.5457 30627.60 5071.127 27387.77
Application VAR
134
Diagrammes séquentiels des quatre séries brutes (FE ,FN,JAE,JAN) et des
prévisions :
Remarque : Les quantités de carburants sont en milliers de tonnes.
Test de causalité au sens de Granger :
Il s’agit ici simplement de tester la nullité jointe de certains cœfficients, en utilisant par
exemple les tests traditionnels de type FISHER. Nous avons donc à tester deux types
d’hypothèses :
H 0 : « la série A ne cause pas la série B » et '0H : « la série B ne cause pas la série A»
tq: A et B sont des séries différentes ( FE, FN, JAE , JAN ) ou : A ≠ B
Application VAR
135
Les résultats de ces tests sont reportés dans le tableau ci – dessous
Lags: 12 Null Hypothesis: Obs F-Statistic Probability FN does not Granger Cause FE 108 2.377 0.010 FE does not Granger Cause FN 1.210 0.290 JAE does not Granger Cause FE 108 0.878 0.571 FE does not Granger Cause JAE 0.842 0.607 JAN does not Granger Cause FE 108 1.583 0.112 FE does not Granger Cause JAN 0.742 0.706 JAE does not Granger Cause FN 108 1.391 0.186 FN does not Granger Cause JAE 0.499 0.909 JAN does not Granger Cause FN 108 1.436 0.165 FN does not Granger Cause JAN 0.801 0.647 JAN does not Granger Cause JAE 108 1.640 0.096 JAE does not Granger Cause JAN 0.542 0.880
D’après le tableau ci-dessus, nous acceptons l’hypothèse H 0 dans la première équation car
la valeur de la statistique de Fisher calculée est inférieure à la statistique de Fisher tabulée,
FStat < F 2,1200.05 = 3.07, de plus la probabilité associée est supérieure au seuil statistique
usuel de 5 % , il n’y a donc pas de causalité au sens de Granger de A vers B , nous acceptons
l’hypothèse '0H
Remarque:
(Sauf pour les séries FE et FN )
La probabilité associée est de 0.01 : elle est inférieure au seuil statistique usuel de 5 % donc
FE explique significativement FN . Il y a donc causalité au sens de Granger de FE vers FN
Conclusion
Conclusion
137
Choix de la méthode de prévision
A cette étape bien précise nous sommes en possession de deux groupes de résultats
associés à deux approches différentes (univariée et multvariée) pour un objectif commun à
savoir effectuer des prévisions. Pour choisir les meilleurs résultats une comparaison sera
entreprise.
Comparaison :
La comparaison des résultats prévisionnels obtenus par les différentes méthodes à savoir
la méthodologie de Holt et Winters et celle de Box et Jenkins et la modélisation VAR est
basée sur la racine carrées de la somme des carrées résidus (RMSE) entre les observations
prévues et les réalisations des séries de ventes.
Les prévisions d'une méthode sont jugées plus fiables si son RMSE est la plus faible par
rapport à celle de l'autre méthode.
Le calcul du RMSE (la racine carrée des moyennes des résidus) mesurant les écarts
prévisionnels moyens pour chaque méthode) est donné par la formule suivante :
RMSE = ∑N
tN 1
21 ε où N est le nombre d’observations
Ainsi, la comparaison entre les différentes méthodes utilisées s’effectuera à partir du
tableau suivant:
Telle que :
RMSE 1 : la racine carrée des moyennes des résidus associée à la méthode Holt et Winters .
RMSE 2 : la racine carrée des moyennes des résidus associée à la méthodologie de Box et
Jenkins.
RMSE 3 : la racine carrée des moyennes des résidus associée à la modélisation ARFIMA.
RMSE 4 : la racine carrée des moyennes des résidus associée à la modélisation VAR.
RMSE 1 RMSE2 RMSE3 RMSE4
FE 1891,04 1679.16 4350,09 958,012
FN 2904,53 2915,33 - 2635,93
JAE 358,13 307,77 - 276,4
JAN 2049,66 2463,67 - -
Conclusion
138
Nous constatons que :
• pour la série vente de carburant fuel-oil secteur Marine Nationale FE le
RMSE 4 < RMSE 2< RMSE 1< RMSE 3.
Nous concluons que les prévisions obtenues par la méthodologie de Box & Jenkins pour
sont plus fiables que celles obtenues par la méthode de Holt et Winters et modélisation
ARFIMA et les prévisions obtenues par la modélisation VAR sont plus fiables que celle
obtenus par la méthodologie de Box & Jenkins
• pour la série vente de carburant fuel-oil secteur Marine Nationale FN.
RMSE 4 < RMSE 1< RMSE 2
Nous concluons que les prévisions obtenues par la méthode de Holt et Winters pour sont
plus fiables que celles obtenues par la méthodologie de Box & Jenkins et les prévisions
obtenues par la modélisation VAR sont plus fiables que celle obtenus par la La méthode
de Holt et Winters
• pour la série vente de carburant Jet A1 secteur aviation étrangère JAE.
RMSE 4 < RMSE 2< RMSE 1
Nous concluons que les prévisions obtenues par la méthodologie de Box & Jenkins pour
sont plus fiables que celles obtenues par la méthode de Holt et Winters et les prévisions
obtenues par la modélisation VAR sont plus fiables que celle obtenus par la méthodologie
de Box & Jenkins.
• pour la série vente de carburant Jet A1 secteur aviation nationale JAN.
RMSE 1< RMSE 2
Nous concluons que les prévisions obtenues par la méthode de Holt et Winters sont plus
fiables que celles obtenues par la méthodologie de Box & Jenkins
Nous concluons enfin que les prévisions obtenues par la modélisation VAR sont plus fiables
que celles obtenues par les autres méthodes
Conclusion Générale
Conclusion générale
140
Conclusion Générale
Au cours de la préparation de notre mémoire de fin d’études, nous avons été amenés à
faire des prévisions à l’aide de diverses méthodes sur différentes séries. et essayer d’attendre l’objectif fixé par notre étude, à savoir trouver le type de modèle qui convienne au problème posé .Pour cela nous avons proposé dans un premier temps d'étudier individuellement les séries en utilisant l’approche univariée qui comporte deux parties :
La première comporte deux méthodes Holt et Winters et Box et Jenkins Le premier point de notre conclusion est destiné aux résultats obtenus dans l’étude des
quatre séries de ventes de carburants (FE. FN, JAN, JAE) En effet, l’application des deux méthodes sur ces séries, nous a permis de conclure que : La méthode Holt & Winters est la plus appropriée pour faire de meilleures prévisions
pour les séries FN et JAN au sens du RMSE La méthode Box et Jenkins est la plus appropriée pour faire de meilleures prévisions
pour les séries FE et JAE au sens du RMSE Pour la modélisation ARFIMA, nous pensons qu’elle est d’une grande importance et
d’une utilité à ne pas négliger car elle traite l’existence de phénomène à mémoire longue ; elle permet en ce sens de préciser le type de mémoire (longue, ou courte) que nous avons à traiter, pour cela il est indispensable de disposer d’un logiciel approprié et performant qui gère la composante tendancielle et surtout saisonnière quel que soit son ordre. (Les résultats de cette modélisation sont obtenus par le logiciel ITSM)
Cependant la méthodologie de Box et Jenkins ne prend pas en compte l’interdépendance
des séries, pour cette raison nous avons proposé par la suite une approche multivariée pour parer aux insuffisances de l’approche univarié.
Etant donné qu’à l’issue de la méthodologie de Box & Jennkins les séries sont rendues
stationnaires, l’application de la modélisation V AR(p) à la base de ces séries est possible, en Utilisant les critères d’informations d’Akaike et le maximum de vraisemblance nous obtenons un ordre de décalage p = 12; à l’instar de la méthode précédente, le modèle V AR(12) subira l’épreuve des tests pour qu’il soit par la suite validé afin d’être exploité pour les prévisions. Néanmoins l’ordre du décalage p = 12 retenu est important, ce qui n’est pas pour diminuer Le nombre de paramètres à estimer qui avoisine 132 paramètres, nous aurions pu diminuer l’ordre du décalage en introduisant une composante moyenne mobile mais le logiciel EVIEWS ne traite pas les modèles VARMA.
Nous achevons notre étude par une comparaison entre les deux méthodes sur la base du
critère RMSE qui permet de conclure que l’approche multivarié nous a permis d’améliorer les Prévisions pour les quatre séries (FE. FN, JAN, JAE) . Lors de cette étude , il nous a été permis d’approfondir nos connaissances dans le
domaine de la prévision à court et à long terme et un savoir faire pour les logiciels statistiques EVIEWS , MATLAB , SPSS , ITSM , XL STAT .
Nous espérons avoir répondu au problème posé et que les résultats trouvés seront d’une
utilité pertinente
Annexe
Annexe 01
142
1.1 Notion de causalité : Un modèle de série chronologique (linéaire ou non) de la forme :
( )qttptttt XXXFX −−−−−= εεε ,,,,,,, 1121 …… est causal, si et seulement si, on peut exprimer le
processus stochastique sous forme d’une combinaison linéaire (finie ou infinie) convergente
en moyenne quadratique, du présent et du passé d’un bruit blanc { }.tε
Remarque :
La causalité n’est pas une propriété du processus { }ZtXt ∈, à lui seul, mais plutôt de la
relation avec{ }Ztt ∈,ε . Par suite, si le modèle est causal, alors le processus { }ZtXt ∈, est
stationnaire, puisque ce dernier s’écrit en fonction de bruit blanc stationnaire.
1.2 Notion d’inversibilité : Un modèle de série chronologique (linéaire ou non) de la forme :
( )qttptttt XXXFX −−−−−= εεε ,,,,,,, 1121 …… est inversible, si et seulement si, on peut exprimer
le processus { }tε sous forme d’une combinaison linéaire (finie ou infinie) convergente en
moyenne quadratique, du présent et du passé du processus stochastique { }tX .
Annexe 02
143
TAB. : Valeurs critiques du test de Dickey-Fuller pour p = 1
T 1 % 5% 10%
Modèle [1]
100 -2.60 -1.95 -1.61
250 -2.58 -1.95 -1.62
500 -2.58 -1.95 -1.62
∞ -2.58 -1.95 -1.62
Modèle [2]
100 -3.51 -2.89 -2.58
250 -3.46 -2.88 -2.57
500 -3.44 -2.87 -2.57
∞ -3.43 -2.86 -2.57
Modèle [3]
100 -4.04 -3.45 -3.15
250 -3.99 -3.43 -3.13
500 -3.98 -3.42 -3.13
∞ -3.96 -3.41 -3.12 Modèle [1] : modèle sans constante, ni tendance déterministe. Modèle [2] : modèle
avec constante, sans tendance. Modèle [3] : modèle avec constante et tendance
TAB. Valeurs critiques de la constante et de la tendance, tests de Dickey-Fuiler Modèle [2] Modèle [3]
Constante Constante Trend
T 1% 5% 10 % 1 % 5% 10% 1 % 5% 10%
100 3.22 2.54 2.17 3.78 3.11 2.73 3.53 2.79 2.38
250 3.19 2.53 2.16 3.74 3.09 2.73 3.49 2.79 2.38
500 3.18 2.52 2.16 3.72 3.08 2.72 3.48 2.78 2.38
∞ 3.18 2.52 2.16 3.71 3.08 2.72 3.46 2.78 2.38
Modèle [2] : modèle avec constante sans tendance déterministe
Modèle [3] : modèle avec constante et tendance.
144
Bibliographie :
Analyse des séries temporelles en économie (Régis Bourbonnais et Michel Terraza).
Econométrie des séries temporelles macroéconomiques et financières (Sandrine Lardic et Valérie Mignon).
Prévision des ventes théorie et pratique (Régis Bourbonnais et Jean-Claude Usunier).
Arthur Charpentier cours de séries temporelles.
Michel Lubrano (Septembre 2004).
Econométrie Appliquée Série Temporelles (Christophe Hurlin).
Maîtrise D économétrie Cours de Série Temporelles Années 1999 a 2004.
Texte :M-C Viano.
Graphique : A.Philippe.
Box, G.E.P. et Jenkins, G.M. (1976). Time Series Analysis, Forecasting and Control, Holden-Day, (revised edition). San Francisco, CA.
Bresson & A. Pirotte (1995), Econométrie des Séries Temporelles Théorie et Application. PUF.
Brockwell & R. A. Davis (1987), Time Series: Theory and Methods. New York: Springer-Verlag.
Gourieroux & A. Monfort (2e édition 1995), Séries Temporelles et Modèles Dynamiques. Economica.