Thèse_New1 GENIAL §§§§§

République Algérienne Démocratique Et Populaire

Ministère de l’Enseignement Supérieur et de la Recherche Scientifique

Université des Sciences et de la Technologie

Houari Boumediene

Faculté des mathématiques Département de probabilités et statistique

Mémoire de fin d’études En vue de l’obtention du diplôme d’Ingénieur d’Etat en Statistique

THEME

Encadré par : Proposé par : Mr Hacène BELBACHIR Mr Ahmed MENKOURA (NAFTAL)

Présenté par : Mr. Mohamed OSMAN Mr. Cherif YAKOUBENE

Devant le jury : Mme H. GUERBYENNE Présidente Mr. A.AKNOUCHE Examinateur Mme K.DJABALLAH Examinatrice

Promotion 2005-2006

DÉDICACES Je dédie ce modeste travail

A ma très chère mère, à mon père

A mes sœurs, à mon frère Khaled

A mes grands-parents qui m’ont tous aidé et soutenus et qui

m’ont réservé les moyens tout au long de mes études.

mes tentes Malika, Baya, Aldjia,

A mes cousines, cousins Mohamed Reda, Ali, Tarek, et

A toute la famille petits avant les grands

A Abdelkader, Oualid, mes amis de toujours

Cherif, mon ami partenaire « binôme » qui a tant donné

pour que nous achevions ce travail,

A toute la promotion 2005 – 2006 probabilités et statistique

pour leurs soutien et encouragement,

A Anissa, Fella, Sihem et Smail,

Kamel, Hichem, Ameur

Aux prochaines promotions que je ne manquerai pas

d’encourager,

A Samir, Rafik, Bilel, Mourad

A tous les étudiants de R.O.

A tous ceux qui m’ont aidé,

A tous ceux que j’aime,

A tous les musulmans frères,

A tout le peuple Algérien, Palestinien, Irakien

Avec toute ma gratitude

Mohamed.O

DÉDICACES Je dédie ce mémoire :

A ma très chère mère, à mon père

A mes sœurs, à mes fréres

A toute ma famille.

A mon ami Mohamed « binôme »

A Mhend, Toufik , Oualid mes amis de toujours

A toute la promotion 2005 – 2006 probabilités et statistique

Pour leur soutien et encouragement,

A Anissa, Fella, Sihem et Smail,

Kamel, Hichem, Ameur

Aux prochaines promotions que je ne manquerai pas

d’encourager,

A Samir, Rafik, Mourad

A tous les étudiants de R.O.

A tous ceux qui m’ont aidé,

A tous les musulmans frères,

Cherif.Y

REMERCIEMENTS

Louange à Dieu, le miséricordieux, sans Lui rien de tout cela n'aurait

pu être.

Nous remerciement le bon Dieu qui nous a orienté au chemin du

savoir et les portes de la science. Nous tenons à remercier vivement tous

ceux qui nous ont aidés de prés ou de loin à l’élaboration de ce mémoire ;

nous pensons particulièrement à :

-Monsieur Hècene.BELBACHIR, qui nous a guidées avec ses conseils,

ses orientations techniques et surtout à l’attention particulière qu’il a

donné à notre projet, et qui nous a accompagné au long de notre travail.

-Madame Hafida.GUERBYENNE. Pour avoir accepter de présider

notre soutenance et pour son aide et sa contribution et ses précieux conseils

et sa gentillesse.

-Madame Khadija.DJABALLAH. Examinatrice, pour son aide et sa

contribution et ses précieux conseils et sa gentillesse.

-Monsieur Malek. AKNOUCHE. Examinateur, pour son aide et sa

contribution et ses précieux conseils.

-Madame Djenet.SEDDIKI membre de jury qui nous a fait l'honneur

d'en faire partie.

De même nos remerciements vont au personnel de NAFTAL, en

particulier :

Mr H.MENKOURA, Mr K. HEMMI, Mr M.KECHROUDE.

Nous remercions également nos familles respectivement qui nous ont

aidés, encouragées et soutenues dans les moments difficiles tout au long de

la préparation de cette thèse.

Nous remercions toute personne parmi nos camarades ou autre qui

nous ont aidées de prés ou de loin à la réalisation de ce mémoire.

Enfin, nous remercions tous ceux qui nous ont encouragé tout au long

de notre Parcours universitaire et ceux qui ont contribué à notre

formation mais que nous N’avons pas cités.

A toute ces personnes, nous leurs disons merci infiniment.

SOMMAIRE

Introduction et Problématique : 1

PRESENTATION GENERALE DE NAFTAL 3

Partie théorique Chapitre 1 : Généralités sur les séries chronologiques : 1.1 Introduction………………………………………….......……………………… 10 1.2 Stationnarité. …………………………………………………………………… 10 1.2.1 Définition d’un processus stationnaire au sens strict………………………. 10 1.2.2Definition d’un processus stationnaire de second ordre……………………. 10 1.3 Premiers indices descriptifs d’une série temporelle……………………………. 11 1.3.1 Indice de la moyenne et la variance……………………………………….. 11 1.3.2 Indice de dépendance……………………………………………………… 11 1.4 La classe des processus aléatoire ARMA……………………………………… 13 1.4.1Géneralités et notations…………………………………………………….. 13 1.4.2 Définition des processus ARMA…………………………………………… 13

2 Les démarches préliminaire pour analyser une série chronologique : 2.1 Représentation graphique de la série………………………………………….. 17 2.2 Les composantes temporelles de la série……………………………………… 17 2.2.1 La tendance………………………………………………………………. 17 2.2.2 Saisonnalité………………………………………………………………. 17 2.2.3 Facteur irrégulier…………………………………………………………. 17 2.2.4 Composante cyclique……………………………………………………. 17 2.3 Type de décomposition………………………………………………………. 17 2.3.1 Le modèle additif ……………………………………………………… 18 2.3.2 Le modéle multiplicatif………………………………………………….. 18 2.4 Le test de schéma……………………………………………………………… 18 2.4.1 Le test graphique…………………………………………………………. 18 2.5 La technique de détection de la saisonnalité et de la tendance………………… 19 2.5.1 La technique graphique…………………………………………………… 19 2.5.2 La technique analytique…………………………………………………. 19

Chapitre 2 : Méthode de lissage exponentiel : 2.1 Introduction…………………………………………………………………… 22 2.2 Principe de base……………………………………………………………….. 22 2.3 Description de la méthode…………………………………………………….. 22 2.4 Lissage exponentiel simple……………………………………………………. 22 2.5 Choix de coefficient de lissage………………………………………………… 25 2.6 Lissage exponentiel double…………………………………………………… 25 2.7 Méthode de Holt-Winters …………………………………………………….

25 Chapitre 3 : Processus non stationnaire, tests de racine unitaire 3.1 Généralités sur la non stationnarité……………………………………………… 28 3.1.1 Processus de type DS et TS……………………………………………….. 28 3.1.1.1 Les processus de type TS……………………………………………. 28 3.1.1.2 Les processus de type DS……………………………………………. 28 3.1.1.3 Conséquences d’une mauvaise stationnarisation du processus TS…. 29 3.1.2 Processus autorégressif moyenne mobile………………………………… . 29 3.1.3 Processus autorégressif moyenne mobile intégré saisonnier………………. 30 3.2 Tests de racine unitaire………………………………………………………….. 30

3.2.1 Le test de Dickey-Fuller simple ……………………………………………... 30 3.2.2 Le test de Dickey-Fuller augmenté……………………………………….. 32 3.2.3 L’algorithme de Dickey-Fuller augmenté………………………………... 33

Chapitre 4 : Méthodologie de Box et Jenkins 4.1 Méthodologie de Box et Jenkins………………………………………… 35 4.1.1 Les démarches de la méthodologie de Box et Jenkins………………….. 35 4.2 L’estimation du modéle…………………………………………………………. 37

4.2.1 Méthode d’estimation……………………………………………………… 37 4.3 Les tests de validation…………………………………………………………. 37 4.3.1 Tests sur les paramètres…………………………………………………… 37 4.3.2 Tests sur les résidus………………………………………………………… 38 4.4 Choix du modèle……………………………………………………………… 41 4.5 Prévision……...........................................………………………………… 41 4.5.1 Transformation de la série ………………………….. 42 4.5.2 Prédicteur pour un modèle ARMA ………………………. 42

Chapitre 5 : Les processus à mémoire longue 5.1 Généralité et définition de la mémoire longue………………………………… 45 5.2 Bruit blanc fractionnaire ARFIMA (0.d.0)……………………………………. 45 5.3 Processus ARFIMA (p.d.q)…………………………………………………… 46 5.4 Test de mémoire longue………………………………………………………… 46 5.4.1 Test de LO (1991)………………………………………………………….. 46 5.4.2 Test de Labato et Robinson (1998)……………………………………….. 47 5.5 Les méthodes d’estimation des processus ARFIMA………………………… 47 5.5.1 Méthode en deux étapes………………………………………………. 47 5.6 Prévision d’un processus ARFIMA(p.d.q). …………………………………... 48

Chapitre6 : Modéle VAR 6.1 Présentation du modèle VAR standard……………………………………….. 50 6.1.1 Ecriture du modèle VAR standard……………………………………….. 50 6.1.2 Condition de stationnarité……………………………………………….. 50 6.1.3 Concept d’innovation………………………………………………………. 51 6.2 Estimation d’un modèle VAR standard………………………………………. 52 6.3 Estimation du nombre de décalages p………………………………………… 54 6.3.1 Estimation du nombre de décalages à partir d’un critère d’information… 55 6.3.2 Estimation du nombre de décalages à partir de tests du rapport de vraisemblance………………………………………………………………………

56

6.4Calcul des fonctions de réponse du modèle VAR standard…………………… 57 6.4.1Utilités du concept d’innovation en simulation…………………………… 57 6.4.2 Fonctions de réponse du modèle VAR standard……………………………. 58 6.4.3 Décomposition de la variance des erreurs de prévision du modèle VAR standard 60 Partie application : Lissage exponentiel…………………………………………………………………… 63 Box & Jenkins……………………………………………….………………………… 68 ARFIMA……………………………………………………..…….……………….... 114VAR……………………………………………………………………………………. 119Conclusion ……………………………………………………..…………….……….. 137Conclusion générale…………………………………………..….…………………… 140-Annexes ………………………………………………..…………………………….. 142-Bibliographie ……………………………………..…………………………………. 144

1

Introduction et Problématique :

Les mutations économiques que connaît notre pays, à savoir son passage d’une

économie dirigée à une économie de marché, ont interpellé toutes les entreprises nationales à

s’adapter à ce nouvel environnement économique.

NAFTAL compte parmi ces entreprises qui se préparent sérieusement à évoluer dans un

nouveau contexte à travers notamment la mise en place d’une nouvelle organisation adapté

aux nouveaux enjeux économiques et ce, en prévision de l’installation de la concurrence

étrangère.

Forte des expériences du passé, NAFTAL, qui a recouvert sa santé financière grâce

notamment à la recapitalisation, a décidé de se projeter résolument dans l’avenir avec l’appui

de l’élaboration d’une stratégie de développement rationnelle et cohérente qui tient compte

des enjeux et des exigences du nouveau contexte économique national et international.

Entre 2000-2006, la demande des produits pétroliers a enregistré une croissance

significative. Les ventes de carburants culminés est de prés de 7 millions de tonnes (d’après

NAFTAL magazine).

La demande ainsi estimée fait ressortir la nécessité de définir, d’un point de vue

organisationnel, de nouvelles approches pour renforcer la position de NAFTAL dans un

marché libre des produits pétroliers, ouvert à la concurrence et qui imposera davantage les

enjeux de la commercialisation de la rentabilité de la réalité des prix. L’environnement

économique national nouveau caractérisé par la disparition du monopole et la libre initiative

va se traduire pour NAFTAL par l’émergence de la concurrence aussi bien dans l’importation

que dans la distribution et la commercialisation des produits pétroliers sur le marché national

(d’après NAFTAL magazine).

Pour cela NAFTAL : branche carburant (Aviation-Marine) souhaiterait procéder à une

prévision des ventes de carburants (Aviation et Marine) à court et à long terme en se basant

sur des méthodes statistiques. Nous allons tenter dans ce travail de répondre partiellement à

leurs attentes.

2

C’est ainsi que le sujet qui nous a été proposé s’intitule :

Modélisation VAR et ARFIMA en Vu de la Prévision des Quantités de Ventes de

Carburants Aviation et Marine

Notre travail est scindé en deux parties :

Partie Théorique : Nous commençons dans une première étape tout d’abord par une étude univariée en

nous basant sur la méthode de lissage exponentiel de Holt-Winters, ensuite la méthodologie

de Box et Jenkins, et la modélisation ARFIMA.

Dans la deuxième étape, nous complétons l’étude univariée par une étude multivariée

(modèle VAR).

Enfin, nous nous proposons de comparer les quatre méthodes en nous basant sur l’erreur

moyenne quadratique pour en tirer la méthode la plus appropriée

Le plan de notre travail est le suivant:

• Chapitre 1 : Notions et généralités sur les séries chronologiques.

• Chapitre 2 : Les démarches préliminaires pour analyser une série chronologique.

• Chapitre 3 : L’étude de la Méthode de Lissage exponentiel (Holt et Winters ) .

• Chapitre 4 : Non stationnarité, test de racine unitaire.

• Chapitre 5 : Modélisation via la méthodologie de Box-Jenkins .

• Chapitre 6 : Les modèles à mémoire longue appelés modèles ARFIMA

• Chapitre 7 : Modélisation multivariée .

Partie Application :

• Application de la méthode de Holt et Winters.

• Application de la méthodologie de Box et Jenkins.

• Application de la modélisation ARFIMA.

• Application de la méthode VAR

Nous avons développé un didacticiel sous DELPHI, pour le logiciel « EVIEWS » afin

de permettre aux utilisateurs de bien manipuler et maîtriser le logiciel.

3

PRESENTATION GENERALE DE NAFTAL I-1 HISTORIQUE :

Issue de SONATRACH, l’entreprise nationale de raffinage de distribution des produits a été créée par le Décret N 80/101 du 06 Avril 1980.

Entrée en activité le 01er Janvier 1982, elle est chargée de l’industrie, du

raffinage et de la distribution des produits pétroliers sous le sigle NAFTAL. En 1987, l’activité raffinage est séparée de l’activité distribution

La raison sociale de la société change suite à cette séparation des activités et NAFTAL est désormais chargé de la commercialisation et de la distribution des produits pétroliers et dérivés.

A partir de 1998, elle change de statut et devient filiale à 100% de SONATRACH.

L’appellation NAFTAL provient de :

NAFT : Pétrole AL : Aldjazair.

ORGANISATIONS DE NAFTAL : Les directions principales sont :

LBP : Lubrifiant, Bitumes, Pneumatique, a pour mission principale :

Elaboration, et suivi des politiques et programmes nationaux par marché et activé des Lubrifiants, Pneumatiques, Bitumes

D.C : Direction Centrale, a pour principale :

GPL : Gaz Pétrole Liquéfie, a pour mission principale :

Gestion des produits propane (vente, Approvisionnement, Distribution.)

B.CR : Branche, Carburant, a pour missions principales :

Elaborer le programme d’approvisionnement en Carburant, en Collaboration avec la Branche Commercialisation.

Assure l’approvisionnement en Carburant et produits spéciaux des centres relevant de la Branche de commercialisation.

4

B.I : Branche International, a pour mission principale : Elle s’occupe des projets d’association avec le compare international.

D.E : Direction Exécutif, a pour mission principale :

B.COM : Branche Commercialisation, a pour mission principale : Assure l’approvisionnent et la commercialisation des produits Aviation et Marine pour la satisfaction des besoins de la clientèles dans les meilleures condition d’efficacité et de coût.

Description des l’abréviation utilisée :

Branche Lubrifient bitume pneumatique

Direction Central

Branche Gaz Pétrole Liquéfié

Branche carburant

Branche international

Direction Exécutif

Branche Commercialisation

Dir. Centrale

Branche Carburant

Branche GPL

Dir. Exécu

Branche Inter

Branche Comm

Branche LBP

Direction. Général NAFTAL

6

Historique de la branche carburant (BCR)

Suite à la décentralisation de la Sonatrach,la division AVM créé le 19 avril 1978,était chargée de commercialiser des produits aviation et marine aux nivaux des port et aéroport.

Par décision du 26jeuin 2002,l’AVM a été dissoute et,par conséquent, elle fut remplacer par la branche carburant qui est chargée de la commercialisation des produit carburant « terre mer,aviation ».

Pour réaliser ses missions, elle dispose d’un certain nombre d’infrastructures et moyens (dépôt, centres aviation, centres marine, camions, bridges, camion aviateurs, barges d’avitaillement…etc.).

MISSIONS Branche Carburant

A / LES MISSIONS :

Elaborer le programme d’approvisionnement en Carburants, en collaboration avec la Branche Commercialisation ;

Conclure et gérer les contrats d’approvisionnement de Carburants et produits spéciaux ;

Assurer l’approvisionnement en Carburants et produits spéciaux des centres relevant de la Branche Commercialisation ;

Assurer la distribution des Carburants au réseau de points de vente et autres clientèles ;

Définir les niveaux de stocks optimaux et en assurer le maintien ;

Tenir des réunions de coordination régulière avec la Branche Commercialisation pour définir et ajuster les programmes d’approvisionnement mensuels des districts Commercialisation en Carburants et produits spéciaux ;

Exploiter, réhabiliter, moderniser et développer les infrastructures de stockage et les moyens de distribution de la Branche Carburants ;

Mettre en place un suivi régulier des relations avec les fournisseurs ;

7

Veiller à l’utilisation optimale des ressources humaines et prendre toutes les mesures permettant d’en augmenter productivité et d’en relever le niveau de formation ;

Mettre en œuvre toute action ou initiative d’étude de coût, d’optimisation du flux de distribution et de réduction des coûts visant à renforcer la position commerciale et l’image de la société sur le marché ;

Mettre en place un système de veille ou surveillance la concurrence ;

Mettre en place un système de procédure de gestion centralisé en vue de suivre et de s’assurer de l’exécution.

Les produits de NAFTAL Branche Carburant, division AVM sont:

o JET A1 (Produits Aviation) o AVGAS Aviation o Gas Oil Marine o Fuel Bunker C Marine o Fuel BTS Marine o HUILES.

Tâches & responsabilité :

o Assiste et conseille le Directeur dans la définition, l’analyse et la mise en œuvre de politiques, stratégies et objectifs à atteindre sur la base d’études élaborées par les Directions de la Branche

o Participe à l’élaboration des objectifs et politiques de développement de la Société pour les domaines d’activité relevant de la Branche

o Assure le traitement des dossiers particuliers qui lui sont confiés par la hiérarchie

o Coordonne, à la demande du Directeur de Branche, les travaux effectués par les Directions et en prépare les synthèses

o Peut être appelé, en cas de nécessité, à assurer l’intérim d’une Direction

o Est chargé de la rédaction des procès verbaux des différentes réunions

o Participe, à la demande du Directeur de Branche, aux différentes Commissions de la Société

o Peut représenter la Branche ou la Société auprès des autorités politiques, administratives ou organismes nationaux

Partie Théorique

Chapitre 1

Généralités sur Les séries chronologiques

Chapitre 1 Généralités sur les séries chronologiques

10

1.1 Introduction : Dans de nombreux domaines comme la biologie, la climatologie l’économétrie, on

enregistre des observations au cours du temps pour constituer ce que l’on appelle une série chronologique.

Une série chronologique est une suite d’observations indicée par le temps (t), représentant l’évolution d’un phénomène dans le temps.

Certaines séries peuvent s’observer de manière continue, certaines autres correspondent à des observations réalisées en des intervalles de temps fixes a priori : heure, jour, mois, année…

De telles suites de données sont notée {xt ; t=1,…,T}.

Les méthodes que nous exposons font référence à ce type de donnée. 1.2 Stationnarité : La stationnarité est la clef de l’analyse des séries temporelles avant d’effectuer des testes

spécifiques sur cette série et de chercher à la modéliser.

Nous commencerons par donner la définition d’un processus stationnaire au sens strict (ou stationnarité forte), et ensuite celle de la stationnarité du second ordre (ou stationnarité faible).

1.2.1. Définition d’un processus stationnaire au sens strict : Le processus xt

est dit strictement ou fortement stationnaire si quel que soit le n-uplet du temps (t1,t2,…,tn ) t1<t2<…. <tn , tel que ti ∈Z et pour tout temps h∈Z avec ti+h∈Z : ∀i, i=1...n , la suite ( xx htnht ++

,...,1 ) a la même loi de probabilité que le vecteur ( xx tnt ,...,1 ).

Autrement dit, la stationnarité stricte signifie que la distribution conjointe de ( xx tnt

,...,1

) est invariante par translation dans le temps.

Cette condition est difficile à vérifier en pratique, c’est pourquoi on utilise en général une version plus faible de la stationnarité, à savoir la stationnarité au second ordre.

1.2.2. Définition d’un processus stationnaire au second ordre : Un processus xt est dit stationnaire au second ordre, ou stationnaire au sens faible, si

les trois conditions suivantes sont satisfaites :

....,..)(, tdeteindependanmt xt=ΕΖ∈∀

.)(, 2 ⟨∞ΕΖ∈∀ xtt

...).(),cov(,),( 2 tdetindependanhht xx httγ=Ζ∈∀

+


11

1.3 Premiers indices descriptifs d’une série temporelle : Il est bien utile de disposer de quelques indices numériques qui résument une

série ),...,( 1 xx T.

1.3.1 Indice de la moyenne et la variance: Les expressions de la moyenne et de la variance d’une série temporelle est :

-Moyenne : µ (t)= )(xtΕ

-Variance : ).()(2 xtVt =σ

1.3.2 Indice de dépendance :

Fonction d’autocovariance :

Soit xtun processus aléatoire de variance finie, on appelle fonction d’autocovariance

γ h(t) de xt

la fonction :

))].())(([().cov()( xxxxxx hthttthttht

+++Ε−Ε−Ε==γ

Cette fonction fournit des informations sur la variabilité de la série et sur les liaisons temporelles qui existent entre les différentes composantes de la série

Dans le cas d’un processus stationnaire du second ordre γ h(t) =γ h

est indépendante de t

La fonction d’autocovariance d’un processus stationnaire xtvérifie les

propriétés suivantes : • .0)(].))([().cov( 22

0≥==Ε−Ε== σγ xttttt xxxxx V

• .

0γγ ≤h

• ..:. pairefonction

hh γγ −=

Fonction d’autocorrélation notée FAC: On appelle fonction d’autocorrélation d’un processus stationnaire xt

la fonction :

.,)()(

),cov(

0

Ζ∈==+

+ hxVxV htt

htthh

xxγγρ

Cette fonction vérifie les trois propriétés suivantes :


12

.1

0=ρ

.

0ρρ ≤h

..: pairefonction

hh ρρ −=

Fonction d’autocorrélation partielle notée FAP : Elle mesure la corrélation entre htt XetX − , l’influence des variables ,1 1t h iX i h− + < < −

ayant été retirée. Soit la matrice des corrélations formées des (h-1) premières autocorrélations.

1 1

1 2

1 2

1 ...1...

. 1

.

...1

h

h

h

h h

P

ρ ρρ ρ

ρ ρ

−

−

− −

⎡ ⎤⎢ ⎥⎢ ⎥⎢ ⎥

= ⎢ ⎥⎢ ⎥⎢ ⎥⎢ ⎥⎢ ⎥⎣ ⎦

Nh∈

La fonction d’autocorrélation partielle est donnée par : h

hh p

P *=ρ .

Où *hP est le déterminant de la matrice ∗hP obtenue à partir de hP , en remplaçant la

dernière colonne de celle-ci par le vecteur ),...,( 1 hρρ .

Ainsi

1 1

1 2

1

1 ...1...

.*

.

...

h

h h

P

ρ ρρ ρ

ρ ρ−

⎡ ⎤⎢ ⎥⎢ ⎥⎢ ⎥

= ⎢ ⎥⎢ ⎥⎢ ⎥⎢ ⎥⎢ ⎥⎣ ⎦

On peut se passer de ce calcul matriciel qui n’est souvent pas facile à faire. Pour cela, on

a recours à une écriture récurrente de iiρ tel que :

avec 1,...,1,,1,1 −=−= −−− ijjiiiijiij ρρρρ et 2,...,i h= . ⎪⎪⎪

⎩

⎪⎪⎪

⎨

⎧

=−

−

=

=

∑

∑−

=−

−

=−−

hi

isi

i

jjji

i

jjijii

ii ,.....,21

1

1

1,1

1

1,1

1

ρρ

ρρρ

ρ

ρ


13

Cet algorithme résolvant les équations de Yule-Walker de manière récursive est appelé

algorithme de Durbin (1960).

1.4 La classe des processus aléatoire ARMA :

1.4.1 Généralités et notations :

Processus bruit blanc :

tε est un processus bruit blanc si : 2

( ) 0. .( ) . .

( . ) 0. . .

t

t

t s

t TVAR t T

COV pour t sσ

εε

ε ε

⎧ Ε = ∀ ∈⎪ = ∀ ∈⎨⎪ = ≠⎩

Opérateur linéaire :

Opérateur de retard : On note B l’opérateur retard, il est défini par : .

1xBx tt −=

Si on applique m fois cet opérateur, on a la relation suivante : .xxB mttm

−=

On constate ainsi que l’opérateur retard transforme une variable xten sa valeur passée.

Le polynôme retard )(BΦ est défini comme suit :

....1)( 221

pp BBBB Φ−−Φ−Φ−=Φ

Opérateur d’avance : Soit F l’opérateur inverse de B : B*F=I., I étant l’opérateur identité.

L’opérateur F est appelé opérateur avance: .1xxF tt +=

Si on applique m fois cet opérateur, on a la relation suivante :

.xxF mttm

+=

Opérateur de différence : On note ∇ l’opérateur (1-B) et m∇ l’opérateur (1- mB ) ainsi :

.xxx mttt

m

−−=∇

où m∇ S’appelle opérateur de différentiation de retard m.

1.4.2. Définition des processus ARMA :


14

Il s’agit d’une très grande famille de processus stationnaires qui présente l’avantage d’être un bon outil de prévision ;

Processus autorégressifs AR (p):

Un processus { Ztxt ∈; } est appelé autorégressif d’ordre p si c’est une solution de l’équation :

( )

.t tB

tx εΦ =⎧⎪

⎨∀ ∈Ζ⎪⎩

telle que :

{ }, .t t est un processus bruit blancε• ∈Ζ

.')( pordredsifautoregresopérateurappeléestBΦ•

Si une série { Ztxt ∈; } est la réalisation d’un tel processus. Alors on peut écrire

( ) ttB x εΦ = sous la forme :

1 1 ... .t p t p ttx xx φ φ ε− −= + + +

avec:

....1 tdetsindependanréelsparamétresdespφφ•

Condition nécessaire et suffisante de la causalité et d’inversibilité :

Une condition nécessaire et suffisante pour que le modèle autorégressif

1 1 2 2t t t p t p tX X X Xφ φ φ ε− − −= + + + + soit causal (annexe 1) est que les racines de la

fonction caractéristique : ( ) 010 221 =−−−−⇔=Φ p

p BBBB φφφ soient en valeur absolue

supérieures à 1 c'est-à-dire 1B > . D’après la définition d’inversibilité (annexe 1), un modèle autorégressif d’ordre fini est toujours inversible.

Fonction d’ autocorrélation :

Pour obtenir les autocorrélations d’un processus AR (p), il suffit de multiplier chaque

membre de l’équation 1 1 ... .t p t p ttx xx φ φ ε− −= + + + par x kt−

tel que (k>0) ; en prenant ensuite

l’espérance de la variable et en divisant l’ensemble par 0γ , on obtient ainsi :

1

i p

k i k ii

ρ φ ρ=

−=

=∑ 0.k∀ >

En écrivant cette relation pour différentes valeurs de k (k=1,…,p),on obtient les

équations de Yule-Walker .

Fonction autocorrélation partielle :


15

Les autocorrélations partielles, notées ,k d’un processus AR (p)

tptpttt XXXcX εφφφ +++++= −−− 2211 sont nulles pour tout ordre supérieur à p

),0( pkPk >∀= et non nulles pour tout ordre inférieur à p. De plus on a ppP φ= . Seuls les p premiers termes de la FAP sont significativement différents de 0.

Processus moyenne mobile MA (q) : Un processus { Ζ∈txt

; } est appelé processus moyenne mobile d’ordre q s’il est défini par la relation suivante :

( )*

.t t

B

tx ε= Θ⎧⎪

⎨∀ ∈Ζ⎪⎩

telle que :


( ) ' .B est appelé moyenne mobile d ordre q•Θ

Si une série { Ztxt ∈; } est la réalisation d’un tel processus. Alors on peut écrire

( )* ttBx ε= Θ sous la forme :

1 1 ... .t t q t qtx ε θ ε θ ε− −= − − −

Avec :

1,..., .qdes paramétres réels independants de tθ θ•

Condition nécessaire et suffisante de causalité et d’inversibilité: Une condition nécessaire et suffisante pour que le modèle moyenne mobile

qtqtttX −− −−−= εθεθε 11 soit inversible est que les racines de la fonction

caractéristique ( ) 0)1(0 221 =−−−−⇔=Θ q

qBBBB θθθ soient en valeurs absolues

supérieures à 1 1B > .

D’après la définition de causalité (annexe 1), un modèle moyenne mobile d’ordre fini est

toujours causal, car c’est une combinaison linéaire finie d’un processus

stationnaire{ }Ztt ∈,ε .

Fonction d’autocorrélation : La fonction d’autocorrélation d’un processus MA (q) est donnée sous la forme :


16

1 12 2

0 1

...1 .

1 ...0 .

k k q k qkk

q

si k q

si k q

θ θ θ θ θγργ θ θ

+ −− + + +⎧= = ≤ ≤⎪ + + +⎨

⎪ >⎩

Fonction autocorrélation partielle :

La fonction d’autocorrélation partielle kP d’un processus MA (q) { }ZtXt ∈,

défini par tt BX ε)(Θ= se comporte comme une exponentielle ou une sinusoïdale amortie.

Processus ARMA (p, q) : On appelle un processus { },tx t Z∈ autorégressif moyenne mobile d’ordre (p, q) noté

ARMA (p, q) s’il s’écrit sous la forme suivante :

( ) ( ) ,t tB x B εΦ = Θ avec :{ }Ztt ∈,ε : est un bruit blanc de variance 2σ .

( ) piIRBBBB ip

p ,,1,1 221 …=∀∈−−−−=Φ φφφφ .

qiIRBBBB iq

q ,,1,,1)( 22

11 =∀∈−−−−=Θ θθθθ .

telle que :


Si une série { Ztxt ∈; } est la réalisation d’un tel processus, alors on peut écrire :

1 1... ... .q pet sont des paramètres réels independants de tθ θ φ φ•

Relation entre les processus AR(p) et MA(q) :

Soit le processus de type MA (1) : 1 1.t ttx ε θ ε −= −

Qui s’écrit aussi

1 1. (1 ).t t ttB Bx ε θ ε ε θ= − = −

D’où :

1 10 01

1 * * * ( ) .(1 )

i ii i i i

t i it t ti i

B B qui est un processus AR telle queB x x xε θ ψ ψ θ

θ

=∞ =∞

= =

= = = ∞ =− ∑ ∑

sous la condition 11 ≤θ


17

2. Les démarches préliminaires pour analyser une série chronologique

2.1 Représentation graphique de la série: La première étape pour analyser une série chronologique est de la représenter

graphiquement pour mieux visualiser l’évolution de cette chronique (croissance, saisonnalité, période, oscillation, rupture…), cet examen nous permettra après de choisir un modéle approprié ainsi que de détecter d’éventuelles anomalies.

2.2 Les composantes temporelles de la série : L’examen de cette série met en évidence quatre composantes ; cette approche suppose

que la structure de la chronique peut être décomposée en éléments simples (modélisables) pour ensuite être reconstituées pour donner une prévision de la chronique ; ce sont :

2.2.1 La tendance (trend) notée Tt : Cette tendance représente l’évolution à long terme de la série, elle se représente comme

une fonction du temps (linéaire ou non) ; et décrit une structure d’évolution déterministe.

Celle-ci est souvent la composante la plus importante dans une série chronologique.

Cette tendance peut avoir :

1. Un caractère linéaire : la série croit d’une même quantité à chaque période ;

2. Un caractère exponentiel : la série croit à un taux constant ; des formulations plus complexes (par exemple polynomiales ou logistiques) peuvent être proposées.

2.2.2 Le facteur saisonnier notée St: C’est une composante marquée par des fluctuations plus ou moins régulières, d’une

intensité qui peut être variable et d’une période beaucoup plus faible que celle de la composante cyclique.

2.2.3 Les irrégularités ou résiduelle notée Rt: C’est un mouvement qui regroupe tout ce qui n’a pas été pris par la tendance et le facteur

saisonnier ; il contient donc de nombreuses fluctuations ponctuelles, de faibles amplitudes n’ayant pas d’incidence à moyen ou à long terme sur l’allure générale de la série : on parle parfois de mouvement erratique pour le caractériser.

Ce sont des fluctuations difficiles à analyser mais les plus intéressantes à modéliser pour la prévision à court terme.

2.2.4 La composante cyclique notée Ct :

C’est un mouvement d’allure quasi-périodique de mouvement ascendant (période de prospérité) et descendant (période de dépression) dont l’ensemble forme une dynamique oscillatoire retraçant le cycle économique.

2.3 Type de décomposition :


18

Après avoir détecté par des méthodes graphiques ou analytiques quelles sont les composantes présentes, il faut proposer un modèle :

2.3.1 Le modèle additif :

La relation fonctionnelle la plus simple entre ces différentes composantes est la forme linéaire additive :

.

...1

.

⎩⎨⎧

=

++=

TtRSTX tttt

Dans ce modèle, on suppose que les amptitudes des variations saisonnières et des fluctuations résiduelles ne dépendent pas de la tendance.

2.3.2 Le modèle multiplicatif :

Si on observe des amptitudes variables (des saisonnalités et des irrégularités) avec la

tendance, on préféra une forme multiplicative complète de la forme :

....1

.**

⎩⎨⎧

=

=

TtRSTX tttt

Notons qu’une simple transformation logarithmique redonne la forme linéaire. Elle est très utilisée en économie.

Parfois les effets à court terme ne sont pas amplifiés par les effets à moyen et à long terme ; c’est à dire que la tendance et le facteur saisonnier sont multiplicatifs et les irrégularités additives, le modèle retenue est le modèle multiplicatif de la forme :

⎩⎨⎧

=

+=

....1

.*

TtRSTX tttt

2.4 Le test de schéma :

2.4.1 Le test graphique : Pour identifier graphiquement le modèle, il suffit de relier les deux grands pics par une

droite (D1) et le deux derniers creux par une autre droite (D2).

- Si les deux droites (D1, D2) sont parallèles alors le modèle est additif.

- Si les deux droites (D1, D2) ne sont pas parallèles, alors le modèle est multiplicatif.

Exemple : soit les deux graphes (G1) et (G2) :


19

12000

14000

16000

18000

20000

22000

24000

26000

2000 2001 2002 2003 2004

ADDITIF

0

50

100

150

200

250

2000 2001 2002 2003 2004

MULTIPLICATIF

2.5 Les techniques de détection de la saisonnalité et de la tendance : 2.5.1 La technique graphique :

D’après les définitions précédentes les facteurs de la tendance et de la saisonnalité, peuvent être détectes graphiquement.

2.5.2 Les techniques analytiques :

L’examen du graphique ne suffit pas très souvent pour mettre en évidence une

saisonnalité, donc il est nécessaire d’utiliser le test de Fisher à partir de l’analyse de la

variance (test d’ANOVA).

D1

D2

D1

D2


20

Test de Fisher :

On considère n: Le nombre d’années. P: Le nombre d’observations dans l’année

jiX : La valeur de la série pour la ième année et la jème période.

La moyenne générale ..X , la moyenne de l’année i .iX , la moyenne de la période j jX .

La variance année et la variance période sont définies respectivement par :

1

)(1

2...

−

−=

∑=

n

XXpVAR

n

ii

A ,

1

)(1

2...

−

−=∑=

p

XXnVAR

p

jj

P

La variance résiduelle :)1)(1(

)(1 1

2....

−−

−−−=∑∑= =

pn

XXXXVAR

n

i

p

jjiji

R

L’équation de la variance totale : RPAT VARVARVARVAR ++=1

)(1 1

2..

−

−=∑∑= =

n

XXn

i

p

jji

L’hypothèse est : 0H « pas de saisonnalité » contre 1H : « il existe une saisonnalité

La valeur calculée R

P

VARVARF =0 que l’on compare à la valeur tabulée α

21 vvF

avec ( )11 −= Pv , ( )( )112 −−= Pnv degré de liberté

Si 0F α21 vvF on rejette 0H , la série est saisonnière.

Soient les hypothèses : 0H : « La série n’est pas affectée d’une tendance »

Contre 1H : « La série est affectée d’une tendance »

On calcule R

A

VARVARF =1 que l’on compare avec α

23 vvF

Avec ( )13 −= nv , ( )( )112 −−= Pnv degré de liberté

Si 1F α23 vvF on rejette l’hypothèse nulle, la série est affectée d’une tendance.

Concernant l’existence de la tendance, le test de Fisher s’avère faible, il convient d’effectuer

un autre test.

Chapitre 2

Méthode du lissage exponentiel

Chapitre 2 Méthode de lissage exponentiel

22

2.1 Introduction : La prévision à court terme a connu des développements importants durant les dernières

années, elle constitue la base de l'action. La prise de décision repose en effet toujours sur des prévisions, c'est ainsi qu'une entreprise commerciale s'intéresse aux prévisions des ventes futures pour faire face à la demande, gérer sa production ainsi que ses stocks, mais aussi orienter sa politique commerciale ( prix, produits et marketing). De même, on essaie de prévoir les rendements d'un investissement, la pénétration d'un marché ou l'effet de la modération salariale sur l'emploi.

Les développements de la pratique statistique ont permis de disposer d'un certain nombre d'outils de calcul, les méthodes de lissage exponentiel font l'objet de ce chapitre, ces méthodes datent du début des années soixante (HOLT en 1957 et BROWN en 1962). Ils justifient amplement leurs utilisations.

Après avoir fait un lissage exponentiel simple qui ne peut être utilisé en présence d'une tendance ou d'une saisonnalité, nous passons au lissage double et à la méthode de HOLT, ces dernièrs peuvent convenir pour des séries présentant une tendance. Le lissage de WINTERS intervient dans les cas ou la tendance et la composante saisonnière sont juxtaposées soit de manière additive soit de manière multiplicative.

2.2 Principe de base : La méthode de lissage exponentiel repose sur l'idée suivante : les informations contenues

dans une série chronologique ont d'autant plus d'importance qu’elles sont plus récentes. Pour effectuer une prévision, il faut affecter aux informations un poids d'autant plus faible qu'elles proviennent d'époques plus éloignées.

2.3 Description de la méthode : Si 1 2, , , , , , , nx x x sont les termes d'une chronique, la méthode du lissage exponentiel

consiste à prendre comme prévision :

, 1,ˆ ˆ(1 )n h n n hx x x −= −α +α telle que 0 1≤α≤ , h et l’horizon.

où α : appelée constante de lissage est généralement comprise entre 0 et 1.

Pour débuter le processus de lissage, il convient de choisir une valeur pour la constante. Ce choix est très important car il conditionne la prévision future à travers le degré de pondération que l'on affecte au passé récent et au passé lointain et ceci pour assurer une bonne qualité de prévision.

2.4 Lissage exponentiel simple: Cette méthode ne doit être employée que sur une série qui ne présente ni tendance ni

composante saisonnière.

En prenant en compte toute l'histoire de la chronique de sorte que plus nous nous éloignons de la prévision moins l'influence des observations correspondantes est importante . Cette décroissance de l'influence est de type exponentiel ce qui justifie l’appellation.


23

Nous disposons d'une série chronologique x = ( nxx ,,1 … ) de longueur enregistrée aux dates 1, . . ., n. Nous nous situons à la date n et nous souhaitons prévoir la valeur x hn+ non encore observée à l'horizon h. Nous notons cette prévision : hnx ,ˆ . L'entier n est parfois appelé base de la prévision

Les formules de lissage sont :

, 1,ˆ ˆ(1 )n h n n hx x x −= −α +α telle que 0 1≤α≤ …………. (∗ ).

avec 1, 1,ˆ h hx x= (initialisation).

Il existe d'autres initialisations 1x ₁ comme la moyenne de la série.

Dans le choix deα , nous distinguons les deux cas particuliers suivants :

Si α =0, alors toutes les prévisions sont identiques, les prévisions restent inchangées, on dit dans ce cas que le lissage est inerte.

Si α=1, la prévision est égale à la dernière valeur observée, la nouvelle valeur lissée est toujours égale à la dernière réalisation, dans ce cas on dit que le lissage est hyper réactif.

La relation (∗ ) peut être développée en remontant dans le temps (n-1, n-2, n-3,...,1 ,0) et laisse apparaître que la nouvelle valeur lissée est une combinaison linéaire de toutes les observations du passé affectée d'un poids décroissant avec l'âge, les poids sont de plus en plus faibles au fur et à mesure que l'on s'éloigne de l'observation actuelle.

On retrouve : 1

,0

ˆ (1 ) .n

jn h n j

j

x x−

−=

= −α α∑

Remarques: La formule , 1,ˆ ˆ(1 ) .n h n n hx x xα α −= − + permet

d'interpréter ,ˆn hx comme le barycentre de ,n hx et de 1,ˆn hx − affecté respectivement des masses (1-α ) et α .

d'interpréter le lissage comme une moyenne pondrée de la dernière réalisation et de la dernière valeur lissée.

de réécrire cette formule sous la forme suivante :

, 1, 1,ˆ ˆ ˆ(1 )( ).n h n h n n hx x x xα− −= + − −

Le lissage apparaît comme le résultat de la dernière valeur lissée corrigée par une pondération de l'écart entre la réalisation et la prévision.

Lorsque α est proche de 0 (α ≃0), la pondération s'étale sur un grand nombre de termes dépendant du passé, la mémoire du phénomène étudié est forte et la prévision est peut réactive aux dernières observations.

Lorsque α est proche de 1 (α ≃1), les observations les plus récentes ont un poids prépondérant sur les anciens termes, la mémoire du phénomène étudié est faible et la prévision est très réactive aux dernières observations.

On peut retrouver l'équation du lissage exponentiel en employant une approche très simple basée sur le concept de la fonction de prévision, telle que:

,ˆ ...( )n h nx a= Ω


24

où na est une constante qui dépend de l'origine de prévision.

On choisit na en utilisant un critère de moindres carrés pondérés, avec des coefficients de pondération décroissant exponentiellement quand on recule dans le passé, de la forme de jβ , on l’appelle facteur d’escompte .

En appliquant la prévision au passé de la série, l'erreur de prévision est la différence n j nx a− − . La somme des carrés des erreurs à minimiser est alors de la forme :

2

0

( ) ( ) .jn n j n

jQ a x aβ −

≥

= −∑ ²

Egalons à zéro la dérivées par rapport à na de cette expression:

0( ) 2 ( ) 0.j

n n j nj

Q a x aβ −≥

= − − =∑

Ce qui entraîne l'équation :

0 0.j j

n j nj j

x aβ β−≥ ≥

=∑ ∑ or 1

0(1 )j

jβ β −

≥

= −∑

d’où

0

ˆ (1 ) ............(**)jn n j

ja xβ β −

≥

= − ∑

L'expression (∗∗) est exactement ce que nous avons trouvé pour la prévision ,ˆn hx (relation

(∗) ) du lissage exponentiel simple tel que le facteur d'escompte β est remplacé par la constante de lissage α c'est-à-dire β α=

On remarque que (voir relation (*).

, 1,

1

1

ˆ ˆ(1 ) .(1 ) d 'après la relation ( ).ˆ ˆ .

. ' :(1 )( ) .

n h n n h

n n n

n n n n n n

n n n

n n n n

x x xa x ax x e x e xx e a d oua e a a

α α

α α

α α

−

−

−

= − +

= − + Ω

− = ⇒ = +

= +

= − + +

1

1

1 1

1

.(1 ) . . 0. :(1 )( ) .

. . .0 1.

n n n n n

n n n

n n n n n

n n n

e e a a aa e a si alors

a e a e a

a e a avec

α α αα α α α

α γα

γ γ

−

−

− −

−

= − + − += − + ≠

−= + = +

= + ≤ ≤

En conséquence , nous pouvons dire que le lissage exponentiel simple est justifié dans le cas d'une fonction de prévision constante, dans le contexte de moindres carrés pondérés , et elle ne sera vraiment constante que si l'on choisit un facteur d'escompteβ égale à 1, ce qui correspond à 1α = .


25

2.5 Choix du coefficient de lissage: Pour débuter le processus de lissage, il convient de choisir une valeur pour la constanteα ,

ce choix est très important car il conditionne la prévision future à travers le degré de pondération que l'on affecte au passé récent et au passé lointain.

Divers procédures d'estimation ont été établit, on s'intéresse à la méthode la plus classique qui consiste à retenir une valeur de α qui minimise l'écart entre la prévision et la réalisation sur la partie connue de la chronique. Pour optimiser le choix de la constanteα , il suffit de :

Choisir un des critères d'optimisation : le critère MSE (Mean square error ou moyenne des carrées des résidus) satisfait ce besoin.

Choisir un ensemble de valeurs de α pour effectuer un balayage, par exemple les valeurs de 0 à 1 par pas de 0,1.

Choisir la prévision initiale.

Pour chaque valeur de α choisie, on effectue l'ensemble du lissage exponentiel par application des formules suivantes:

Pour n=1 à N….faire

1ˆ.......... .ˆ.......... .

........... .

n n n

n n n

x x ex e xfin

α−− →

− →

Choisir la valeur de α qui améliore aux mieux le critère MSE (celle qui fournit la plus petite moyenne des carrées des résidus).

2.6 Lissage exponentiel double: Les formules précédentes permettent de calculer une prévision pour des séries

chronologiques stationnaires sans tendance, nous pouvons définir un lissage exponentiel double qui est utilisé en cas de série présentant une tendance.

On part d'une fonction de prévision linéaire de la forme:

, 1, 2,ˆ ˆ ˆn h n nx a a h= +

Notons que :

1, 2,ˆ ˆ. .n na et a sont des coefficients dépendant de n

On cherche à déterminer les valeurs des deux paramètres par le critère des moindres carrées escomptesβ , tel que le facteur d'escompte est remplacer par α c'est-à-dire β α= .

2.7 Méthode de Holt-Winters Cette approche a pour but d'améliorer et de généraliser le Lissage Exponentiel Simple.

Nous étudions plusieurs cas particuliers de cette méthode :

- ajustement d'une droite affine (sans saisonnalité)

- ajustement d'une droite affine plus une composante saisonnière - ajustement d'une constante plus une composante saisonnière


26

Cette méthode est plus souple que le lissage exponentiel amélioré, dans la mesure où elle fait intervenir deux constantes β et γ au lieu d’uneα Telle que 0 < β < 1 et 0 < γ < 1 deux constantes fixées et les formules de mise à jour :

( ) ( ) ( )( ) ( ) ( ) ( )

1 1 2

2 1 1 2

ˆ ˆ ˆ1 1 1

ˆ ˆ ˆ ˆ1 1 1na x a n a n

a a n a n a n

β β

γ γ

= + − − + −⎡ ⎤⎣ ⎦= − − + − −⎡ ⎤⎣ ⎦

La prévision prend la forme :

, 1 2ˆ ˆ ˆ ( )n hx a h a n= +

siααγαβ

+−

=−=111 2 et alors :

( ) ( )( ) ( ) ( )

( ) ( ) ( )

( ) ( ) ( ) ( ) ( )

( ) ( ) ( )

( ) ( ) ( ) ( ) ( )

21 1 2

21,1 1 2

2 21 2

22

2 2 1 1 22

21 2

2

2 1 1 22

ˆ ˆ ˆ( ) 1 1

ˆ ˆ ˆ1 1 1

ˆ ˆ1 1 1

1ˆ ˆ ˆ ˆ ˆ( ) 1 1 1

1ˆ ˆ1 1 1

1ˆ ˆ ˆ ˆ1 1 1

1

n n

n

a n a n a n

x x a n a n

a n a n x

a n a n a n a n a n

a n a n

a n a n a n a n

α

α

α α

αα

αα

αα

−

= − + − +⎡ ⎤⎣ ⎦

⎡ ⎤− − + − + −⎣ ⎦

= − + − + −⎡ ⎤⎣ ⎦

−⎡ ⎤= − + − − + −⎡⎣⎣ ⎦−

− − − + −⎡ ⎤⎣ ⎦

−= − + − − − −⎡ ⎤⎣ ⎦−

Remarque : Si β et γ sont petits, le lissage est fort puisque alorsα est grand et que nous tenons compte

du passé lointain.

Chapitre 3

Non stationnarité, tests

de racine unitaire

Chapitre 3 Non stationnarité, tests de racine unitaire

28

3.1 Généralités sur la non stationnarité : La plupart des réalisations économiques et financières sont des réalisations de processus

non stationnaires.

D’après la définition de la stationnarité au second ordre : un processus non stationnaire est un processus qui ne satisfait pas l’une ou l’autre de ces deux conditions, Ainsi l’origine de la non stationnarité peut provenir d’une dépendance du moment d’ordre un (l’espérance) par rapport au temps, ou d’une dépendance de la variance ou des autocovariances par rapport au temps .

La difficulté réside dans le fait qu’il existe différentes sources de non stationnarité et qu’à chaque origine de la non stationnarité est associée une méthode propre de stationnarisation.

Les cas de non stationnarité les plus fréquents sont analysés à partir de deux types de processus : les processus de type TS (time stationary) et les processus de type DS (differency stationary).

3.1.1 Processus de type DS et TS : Le fait que la stationnarité puisse être de type déterministe ou stochastique, nous amène

à définir la classe des processus de type TS (trend stationary) et la classe des processus de type DS (differency stationary).

3.1.1.1 Les processus de type TS : ( ), Ζ∈txt est un processus de type TS s’il peut s’écrire sous la forme :

( ) .t tx f t ε= +

Où ( )f t est une fonction déterministe du temps et tε est un bruit blanc.

Il est évident que le processus ne satisfait pas la définition de la stationnarité de second ordre puisque il viole la premeir condition de la définition d’un processus stationnaire :

( ) ( ) dépend du temps, ( ) 0.t tE x f t car E ε= =

Étude des chocs sur les processus de type TS : L’une des propriétés importantes de ce type de processus est la propriété de non

persistance de chocs, cela signifie que lorsqu’un processus de type TS subit un choc positif ou négatif à une date donnée, l’influence de ce choc a tendance à s’estomper au cours du temps . La variable considérée rejoint sa dynamique de long terme déterminée par ( )f t .

Stationnarisation d’un processus de type TS : Pour stationnariser un processus de type TS, il convient de retirer la composante

déterministe ( )f t en régressant la série tx

3.1.1.2 Les processus DS : ( ), Ζ∈txt est un processus non stationnaire de type DS (differency stationnary) d’ordre

(d), qui désigne l’ordre d’intégration, si le processus filtré par td xB)1( − est stationnaire. On

dit alors que ( ), Ζ∈txt est un processus intégré d’ordre (d) noté I (d).


29

Ordre d’intégration (d): ( ), Ζ∈txt est un processus DS intégré d’ordre (d) si et seulement si : le polynôme )(Bφ associé à sa composante autorégressive admet (d) racine unitaire :

( ) ( ) (1 ) ( )dt tB x z avec B B Bφ φ= = − Φ

∼.

tz est un processus stationnaire, les racines du polynôme ( )BΦ∼

sont toutes supérieures en module à l’unité.

Étude des chocs sur les processus de type DS : L’influence d’un choc tε à une date donnée sur un processus non stationnaire de type DS

est permanente.

Stationnarisation d’un processus de type DS : Pour stationnariser un processus de type DS d’ordre (d), il convient d’appliquer le filtre

( ) .1 dB−

3.1.1.3 Conséquences d’une mauvaise stationnarisation du processus :

Conséquence sur un processus TS : Soit le processus ( ), Ζ∈txt de type TS défini par : 0 1 .t tx a a t ε= + +

L’application d’un filtre aux différences premières 1 1 1(1 ) .t t t t t tx B x x x a ε ε− −Δ = − = − = + − nous permet de définir un processus txΔ stationnaire.

{ }

12 2 2

1

2

2

( ) .[( ) ] 2 .

2 0( ) 1;1 .

0 sin

t

t

E x aE x a

pour hh pour h

on

ε

ε

ε

σ

σγ σ

∗ Δ =∗ Δ = + < ∞

⎧ =⎪∗ = − = −⎨⎪⎩

Le processus obtenu txΔ n’a pas les caractéristiques d’un bruit blanc puisque sa fonction d’autocovariance n’est pas la fonction d’autocovariance d’un bruit blanc. Ce qui conduit à une autocovariance fallacieuse du résidu du filtre

Conséquence sur un processus DS : L’extraction d’une tendance linéaire d’un processus DS conduit à créer artificiellement

une forte autocorrélation des résidus aux premiers retards et donc apparaît un mouvement pseudo-périodique des résidus.

3.1.2 Processus autorégressif moyenne mobile intégré d’ordre (p, d, q) : Ce sont des modèles ARMA intégrés notés ARIMA. Ils sont issus des séries

stationnarisées par l’application du filtre aux différences et ceci, bien entendu dans le cas des processus DS détectés par le test de Dickey- Fuller. Le processus tX suit un ARIMA (p, d, q), s’il est solution d’une équation aux différences stochastiques du type

ttd BXBB ε)()1()( Θ=−Φ .


30

3.1.3. Processus autorégressif moyenne mobile intégré saisonnier : Il est possible que certaines séries chronologiques soient caractérisées par une allure

graphique périodique. Pour cela, il est important de les analyser en tenant compte de l’effet saisonnier. Box et Jenkins (1970) ont proposé une classe de modèles particuliers appelée : classe de modèles ARIMA saisonniers.

Modèles saisonniers mixtes : SARIMA Ce sont des extensions des modèles ARMA et ARIMA. Ils représentent généralement des

séries marquées par une saisonnalité, comme c’est le plus souvent le cas pour des séries économiques voire financières. Ces séries peuvent mieux s’ajuster par des modèles saisonniers. Ce sont les modèles SARIMA (p, d, q) (P, D, Q) qui répondent au modèle:

ts

stDsds

s BBXBBBB ε)()()1()1()()( ΘΘ=−−ΦΦ Où : ( ) p

p BBBB φφφ −−−−=Φ 2211 : Polynôme autorégressif non saisonnier d’ordre p.

( ) PsPs

sss

ss BBBB φφφ −−−−=Φ 2

211 : Polynôme autorégressif saisonnier d’ordre Ps. q

qBBBB θθθ −−−−=Θ 22

111)( : Polynôme moyenne mobile non saisonnier d’ordre q.

QsQsss

ss BBBB θθθ −−−−=Θ 2

21

11)( : Polynôme moyenne mobile saisonnier d’ordre Qs. dB)1( − : Opérateur de différence d’ordre d.

DsB )1( − : Opérateur de différence saisonnière d’ordre D. ),0( 2

εσε BBt → , s correspond à la saisonnalité.

Modèles saisonniers purs : (SARMA) Un processus stochastique { }ZtXt ∈, est dit processus autorégressif moyenne mobile

saisonnier pur d’ordre ( )( ),0, , ,s

p q P D Q , si son évolution satisfait la forme suivante : t

sst

Dsss BBXBBB ε)()()1()()( ΘΘ=−ΦΦ

),0( 2εσε BBt → , s correspond à la saisonnalité.

3.2 Test de racine unitaire : Les tests de racine unitaire sont des tests paramétriques qui servent à détecter la non

stationnarité des processus, parmi les tests les plus utilisés en raison de leurs simplicités on trouve les tests de Dickey - Fuller.

3.2.1 Le Test de Dickey- Fuller simple (1979): Le test de Dickey –Fuller considère les trois modèles suivants

Modèle [1] : modèle sans constante ni tendance déterministe : 2(1 ) (0, )t t tB X ou BB ερ ε ε σ− = ∼

Modèle [2] : modèle avec constante sans tendance déterministe : 2(1 )( ) (0, )t t tB X ou BB ερ μ ε ε σ− − = ∼

Modèle [3] : modèle avec constante et tendance déterministe : 2(1 )( ) (0, )t t tB X t ou BB ερ μ α ε ε σ− − − = ∼


31

Le principe général du test consiste à tester l’hypothèse nulle de présence d’une racine unitaire (on dit alors que tX est intègré d’ordre 1), contre l’hypothèse alternative d’absence de racine unitaire (on dit alors que tX est intègré d’ordre 0).

Ecrivons plus précisément les hypothèses nulle et alternative pour chacun des trois modèles considérés :

Modèle [1] :

0 1

1 1

: 1 . ( ).: 1 . ( . 1 ( (1))).

t t t t

t t t t

H X X X suit un processus de marche aleatoire sans dériveH X X X suit un processus autoregressif d ordre AR

ρ ερ ρ ε

−

−

= ⇔ = + ⇒⎧⎨ ⇔ = + ⇒⎩ ≺

Modèle [2] : 0 1

1 1

: 1 ( ).: 1 . . (1 ) ( (1) ).

t t t t

t t t t

H X X X suit un processus de marche aleatoire sans dériveH X X avec X suit un processus AR avec dérive

ρ ερ ρ γ ε γ μ ρ

−

−

= ⇔ = + ⇒⎧⎨ ⇔ = + + = − ⇒⎩ ≺

Modèle [3] :

0 1 .

1 1

: 1 ( .).: 1 * . . (1 ) . . (1 ).

( ).

t t t t

t t t

t

H X X X suit un processus de marche aleatoire avec dériveH X X t avec et

X est un processus TS avec erreurs ARMA

ρ β ερ ρ λ δ ε λ α ρ ρβ δ β ρ

−

−

= ⇔ = + + ⇒⎧⎪ ⇔ = + + + = − + = −⎨⎪ ⇒⎩

≺

En pratique, on estime les modèles sous la forme suivante :

Modèle [1] : 1 .t t tX Xφ ε−Δ = +

Modèle [2] : 1 .t t tX Xφ γ ε−Δ = + +

Modèle [3] : 1 * .t t tX X tφ λ δ ε−Δ = + + +

Avec, pour chaque modèle, 1−= ρφ et 2(0, )t BB εε σ∼ On teste alors l’hypothèse nulle 0=φ (non stationnarité) contre l’hypothèse

alternative 0φ < (stationnarité).

Règle de décision :

Si la valeur calculée de la t-statistique associée à φ est inférieure à la valeur critique (en se referant aux table de Dickey et Fuller (annexe 2)), on rejette l’hypothèse nulle de non stationnarité.

Si la valeur calculée de la t-statistique associée à φ est supérieure à la valeur critique, on accepte l’hypothèse nulle de non stationnarité.

Stratégie séquentielle de test en trois grandes étapes :

• Etape 1 : on estime le modèle [3]. On commence par tester la significativité de la tendance en se référant aux tables de Dickey-Fuller (annexe 2) deux cas peuvent se présenter :

Si la tendance n’est pas significative, on passe à l’étape 2.

Si la tendance est significative, on teste l’hypothèse nulle de racine unitaire en comparant la t –statistique de φ aux valeurs tabulées par Dickey et Fuller (annexe 2). On a alors deux possibilités :


32

o Si on accepte l’hypothèse nulle, tX est non stationnaire. Dans ce cas, il faut la différencier et recommencer la procédure de test sur la série en différence première.

o Si l’on rejette l’hypothèse nulle, tX est stationnaire. Dans ce cas, la procédure de test s’arrête et l’on peut directement travailler sur tX

• Etape 2 : cette étape ne doit être appliquée que si la tendance dans le modèle précèdent n’est pas significative. On estime le modèle [2] et l’on commence par tester la significative de la constante en se referant aux tables de Dickey-Fuller (annexe 2) :

Si la constante n’est pas significative, on passe à l’étape 3.

Si la constante est significative, on teste l’hypothèse nulle de racine unitaire en comparant la t-statistique de φ aux valeurs tabulées par Dickey Fuller (annexe 2), on se trouve alors deux possibilités :

o Si l’on accepte l’hypothèse nulle, tX est non stationnaire .dans ce cas, il faut la différencier et recommencer la procédure de test sur la série en différence première.

o Si l’on rejette l’hypothèse nulle, tX est stationnaire. Dans ce cas la

procédure de test s’arrête et l’on peut directement travailler sur tX .

• Etape 3 : cette étape ne doit être appliquée que si la constante dans le modèle précèdent n’est pas significative. On estime alors le modèle [1] et on teste l’hypothèse nulle de racine unitaire en utilisant les valeurs critiques du tableau :

Si l’on accepte l’hypothèse nulle, tX est non stationnaire. Dans ce cas, il faut la différencier et recommencer la procédure de test sur la série en différence première.

Si l’on rejette l’hypothèse nulle, tX est stationnaire, la procédure de test

s’arrête et l’on peut directement travailler sur tX

3-2-2 Test de Dickey Fuller augmenté: Tout comme dans le cas du test de Dickey Fuller (DF) simple, trois modèles se distinguent

dans le test de Dickey Fuller augmenté (ADF) :

• Modèle [1’] : modèle sans constante ni tendance déterministe :

11

.p

t t j t j tj

X X Xφ γ η− −=

Δ = + Δ +∑

• Modèle [2’] : modèle avec constante sans tendance déterministe :

11

.p

t t j t j tj

X X Xφ μ γ η− −=

Δ = + + Δ +∑

• Modèle [3’] : modèle avec constante et avec tendance déterministe :

11

.p

t t j t j tj

X X t Xφ λ δ γ η− −=

Δ = + + + Δ +∑

La mise en œuvre du test ADF est similaire à celle du test de DF simple :

On adopte la même stratégie séquentielle descendante partant de l’estimation du modèle [3’]. Les statistiques de test sont les mêmes que dans le cas du test DF simple. Il convient cependant de remarquer que l’application du test ADF nécessite au préalable de choisir le nombre de retards p à introduire de sorte à blanchir les résidus.


33

3-2-3 Algorithme de Dickey –Fuller augmenté :

Telle que :

0HA : accepter l’hypothèse nulle H0.

0HR : rejeter l’hypothèse nulle H0

11

.p

t t j t j tj

X X X t Cφ φ β ε− −=

Δ = + Δ + + +∑

β=0

11

.p

t t j t j tj

CX X Xφ φ ε− −=

Δ = + Δ + +∑

C=0

Φ=0

Φ=0

Φ=0

Un processus de type DS et TS

0HR

Un processus de type DS

(Filtre aux

Un processus de type TS (Régression sur le temps)

Le processus est Stationnaire (Fin)

Le processus est Stationnaire (Fin)

Un processus de type DS

(Filtre aux différences)

11

.p

t t j t j tj

X X Xφ φ ε− −=

Δ = + Δ +∑

0HA

0HR 0HA

0HA

0HA

0HA

0HR

0HR

0HR

19

Chapitre 4

Méthodologie de Box & Jenkins

et Tests sur les résidus

Chapitre 4 Méthodologie de Box & Jenkins

35

5.1 Méthodologie de Box et Jenkins :

La méthode de Box et Jenkins qui a fait l’objet d’importantes d’applications dans le domaine de la prévision, est présenté ici par cet organigramme:

Box et Jenkins ont développé une véritable méthodologie de recherche systématique d’un modèle adéquat, ils se réfèrent à deux types de modèles ; les modèles moyennes mobiles, les modèles autorégressifs, ou une combinaison des deux.

4.1.1 Les démarches de la méthodologie de Box et Jenkins : Analyse exploratoire des données.

Analyse graphique de la série (saisonnalité, tendance).

Analyse analytique de la série :

Test de Fisher (saisonnalité).

Test de Dickey Fuller (tendance).

Stationnarisation de la serie.

Filtre à la différence d’ordre d.

Filtre aux différences saisonnier d’ordre D.

Filtre par régression.

Identification du modèle.

Estimation des paramètres.

Test de validation.

Prévision.

IDENTIFICATION

ESTIMATION

VALIDATION

OUINON


36

Différentes étapes de la méthodologie de BOX & JENKINS Note : ce diagramme est repris de l’ouvrage de Régis Bourbonnais et Jean-Claude

Usinier.

Analyse du graphique et du corrélogramme

Analyse de la saisonnalité

Test de DICKEY-FULLER

Régression sur le temps Si TS

Passage aux Différences Si DS

Série stationnaire

Analyse des corrélogrammes simple et partiel

Détermination des ordres p et q du processus ARMA

Estimation des paramètres

Test de STUDENT les coefficients non significatifs sont supprimés

Oui

Prévision par ARMA

Recoloration de la série (saisonnalité,……..)

Non ajout d’un ordre p

Test sur les résidus sont-ils des bruits blancs


37

4.2. L’estimation du modèle : Après avoir identifié l’ordre du processus ARMA, il convient d’estimer les paramètres du

modèle, puis de vérifier à partir d’un certain nombre de tests statistiques que l’estimation du modèle est valide.

4.2.1. Méthode d’estimation : Parmi les méthodes les plus utilisées pour l’estimation des paramètres du modèle ARMA,

θ et φ , figurent la méthode du maximum de vraisemblance et la méthode des moindres carrées.

4.3. Les tests de validation :

Après l’étape de l’identification et l’estimation des paramètres du modèle, plusieurs modèles sont estimés et c’est l’ensemble de ces modèles qui subissent alors l’épreuve des tests.

4.3.1. Test sur les paramètres :

Test de Student : On effectue un test classique de Student sur chacun des paramètres du processus ARMA,

Il peut arriver qu’un ou plusieurs paramètres ne soient pas significativement différents de 0, alors le modèle estimé est rejeté et on retourne à l’étape d’estimation en éliminant la variable dont le coefficient n’est pas significatif.

H0 « p 0φ = » contre H1 « p 0φ ≠ ».

La statistique du test :p

p

ptφ

φ σφ

ˆˆ ˆ

ˆ= .

La règle de décision est alors

ˆ 1 / 2.

ˆ 1 / 2

* . on accepte l'hypothése nulle de processus ( 1, ).

* . l'hypothese nulle est rejetée et on retient un processus ( , ).

p

p

si t t ARMA p q

si t t ARMA p q

αφ

αφ

−

−

⎧ −⎪⎨⎪ ≥⎩

≺

Les mêmes démarches sont valables pour les paramètres .qθ

Le coefficient de détermination :

Pour chaque modèle estimé, le coefficient de détermination correspondant R2 est:


38

( )2

21 .t

tt

Rx x

ε= −

−∑

∑(Coefficient de détermination normal).

( )

22

211 * t

tt

nRn p q x x

ε−= −

− − −∑

∑. (Coefficient de détermination corrigé)

(Coefficient de détermination corrigé.).

si

2

2

0.7 (le modéle estimé ajuste bien la chronique).0.5 (le modéle estimé ajuste mal la chronique).

(on ne peut rien dire).

si Rsi R

si non

⎧ ⇒⎪ ⇒⎨⎪ ⇒⎩

≺

4.3.2 Tests sur les résidus : L’objectif de ces tests est de vérifier que les résidus estimés suivent bien un processus

bruit blanc.

Rappelons qu’un processus bruit blanc est un processus de moyenne nulle, de variance constante et non autocorrélé, et pas nécessairement gaussien.

Test de nullité de la moyenne :

Soit résidusdescalculéemoyennelaetmE

t

t :)var()(

2 εσε

ε

⎩⎨⎧

==

.

On accepte l’hypothèse 0Η au seuil %5=α si : %51

1ˆ −≤

−nt

nσ

ε

L'hypothèse de test : "0:""0": 10 ≠Η=Η mcontrem

La statistique de test : Z= ˆ1n

εσ

−

.

La règle de décision : si Z 5%1nt −≤ on accepte l'hypothèse H0

Test d’existence d’une tendance (point de retournement) :

Il teste la nature aléatoire des résidus, on dira que la suite des données

1ε , 2ε , …, nε présente un point de retournement à la date i si :

1−iε iε≺ 1+iε Où 1−iε iε 1+iε≺


39

Soit la variable aléatoire tΧ tel que :

tΧ =⎩⎨⎧01

La variable aléatoire tΧ suit la loi Bernoulli de paramètre 2/3.

Si T désigne le nombre total des points de retournement alors on a :

T=∑−

=

Χ1

2

n

ii ; ( )TΕ =

3)2(2 −n ; ( )Tarν =

902916 −n .

Sous l’hypothèse que ( iε ) forment une suite de variables aléatoires Indépendantes et

identiquement distribuées :

La statistique U= ⎯→⎯−

)var()(

TTET

N (0,1) , pour n>50

Donc on accepte l’hypothèse 0Η : « les iε sont non corrélés» si U 96.1≺ et cela au seuil

05,0=α

Test de recherche d’autocorrélation (Durbin–Watson) Le test de Durbin Watson est un test qui détecte l’autocorrélation d’ordre 1, sous la

forme : t t 1 t .−ε = ρε +η ou 2t N(0. )ε ≈ σ .

Le test d’hypothèse:

0

1

H : 0(absence.de.corrélation)H : 0(présence.de.corrèlation)

⎧ ρ =⎪⎪⎨⎪ ρ ≠⎪⎩

La statistique de Durbin Watson utilisée est :

( )

n2

t t 1t 2

n2t

t 1

DW−

=

=

ε −ε=

ε

∑

∑ Cette statistique comprise entre 0 et 4.

Ou tε : l’estimateur des résidus du model.

Cette statistique est comprise entre 0 et 4 et vaut 2 lorsque ρ =0

Durbin et Watson ont tabulé les valeurs critiques de DW au seuil 5 % en fonction de la taille de la série et du nombre de variables explicatives.

Test de Box Pierce :

Ce test est basé sur la statistique de Quenouille Q= 2

1* ( )

k

k tk

n r ε=∑ qui est fonction de la

somme des carrés des autocorrélations de la FAC. Il permet de vérifier l’hypothèse :

S’il présente un point de retournement à la date t Sinon S’il présente un point de retournement à la date t Sinon


40

.0...210 ===== KH ρρρ

H1 : il existe au moins un iρ significativement différent de 0.

Pour effectuer ce test, il est conseillé de choisir K entre 20 et 30.

L’hypothèse H0 rejette au seuil de 5 % si Q est supérieur au quantile 2χ 0.95 de la loi .2χ

Test de Ljung et Box: Nous pouvons utiliser aussi une statistique, dont les propriétés asymptotiques sont

meilleures, dérivée de la première qui est le Q′de Ljung et Box : 2

1

( )( 2)k

i t

i

rQ n nn iε

=

′ = +−∑ .

Les tests du Skewness et de Kurtosis :

La statistique de test : 1/ 2

1/211 1

0 telle que β : cooefficient de skewness6 /

vn

β −=

22 2

3 telle que β : coefficient de kurtosis.24 / nβν −

=

Les hypothèses :

H0 : 1 0(absence d'symétrie)ν = et 2 0(aplatissement normal)ν = .

La règle de décision : 1 21.96 et 1.96 (on accepte l'hypothese de normalite).

si non on rejette l'hypothese de normalite.siν ν ⇒⎧⎨⎩

≺ ≺

Le test de Jarque et Bera Il s’agit d’un test qui regroupe les résultats précédents.

La statistique du test :

21 2/ 6* / 24( 3)s n nβ β= + −

Les hypothèses : H0 : normalité des résidus au seuil α.

La règle de décision : 21 (2)on rejette l'hypothese de normalitési s αχ −≥ .

Test d’homoscédasticité (l’effet ARCH)


41

Les modèles classiques de prévision fondés sur les modèles ARMA supposent des séries temporelles à variance constante (hypothèse d’homoscedasticité).

Cette modélisation néglige l’information éventuelle contenue dans le facteur résiduel de la chronique.

Les modèles de type ARCH (autorégressive conditionnellement heteroscedastiques) permettent de modéliser des chroniques qui ont une volatilité (ou variance ou variabilité) instantanée qui dépend du passé.

Il est ainsi possible d’élaborer une prévision dynamique de la chronique en termes de moyenne et de variance.

L’effet ARCH est repéré grâce au corrélogramme des carrés des résidus.

Si un ou plusieurs termes sont significativement différents de zéro (l’existence d’une corrélation entre les carrés des résidus) on dit qu’il y a effet ARCH.

Ceci est confirmé par le test d’effet ARCH :

Le modèle ARCH est spécifie par :

ttt hu .=ε Avec indépendants identiquement distribuéstu et ∑=

−+=p

iitith

1

20

2 εαα

Statistique du Multiplicateur de Lagrange LM= 2nR avec n = le nombre d’observations servant au calcul de la régression.

R2= le coefficient de détermination.

Soit l’hypothèse H0 : « 0...21 ==== pααα » contre H1 : « iα non tous nul »

Règle de décision : Si LM < 2 ( )pχ on accepte 0H .

Dans le cas contraire LM > )(2 pχ à p degré de liberté compris entre 1 et 3, on rejette H0 et le processus est justifiable d’un modèle ARCH (p).

Si p >3 le modèle sera justifiable d’un modèle de type GARCH.

5.4. Choix du modèle : On fait appel à des critères d’information afin de choisir le modèle optimal parmi tous les

modèles repérés :

Le critère AIC introduit par Akaike :

AIC (p, q) = log [σ2] + Nqp )(*2 +

Le critère BIC de Schwartz :

BIC (p, q) = log [σ2] + (p+q) * NN )log(

Le modèle optimal est celui qui minimise ces deux critères.

4.5 Prévision :


42

4.5.1 Transformation de la série :

Lorsque on a appliqué différentes transformations (exemple différenciation dans le cas

d’une série I (1)) afin d’identifier le modèle ARMA, il est nécessaire lors de la phase de

prévision de prendre en compte la transformation retenue et de recolorer la prévision.

Plusieurs cas sont possibles :

Si le processus contient une tendance déterministe, on extrait cette dernière par

régression afin d’obtenir une série stationnaire lors de la phase de prévision, on

adjoint aux prévisions réalisées sur la composante ARMA stationnaire, la

projection de la tendance.

Si la transformation résulte de l’application d’un filtre linéaire (de type par

exemple différence premières), on réalise les prévisions sur la série filtrée

stationnaire e l’on reconstruit ensuite par inversion du filtre les prévisions sur la

série initiale.

4.5.2 Prédicteur pour un modèle ARMA :

On considère un modèle ARMA ( )qp, tel que :

qtqttptptt XXX −−−− ++++++= εθεθεφφ 1111

Avec : ( ) ( )22 ,0, εσεθφ diietIR tqp ⋅⋅∈ ∗ .

Appliquons le théorème de Wold au processus { }Ζ∈tX t , et considérons la forme

MA (∞) correspondante : 100

== −

∞

=∑ αεα jtj

jtX .∞≺jα

Il s’ensuit que la meilleure prévision que l’on peut faire de 1+tX compte tenu de toute

l’information disponible jusqu’à la date t, notée )1(ˆtX , est donnée par :

( )0211 ,...,,,)1(ˆ XXXXXEX ttttt −−+=

( )0211 ,...,,, εεεε −−+= ttttXE jtj

j −+

∞

=∑= 1

1

εα

Dés lors, l’erreur de prévision est donnée par la réalisation en 1+t de l’innovation qui en t

n’est pas connue : 11 )1(ˆ++ =− ttt XX ε

Plus généralement pour une prévision à un horizon k on a :

jktkj

jt kX −+

∞

=∑= εα)(ˆ et jkt

k

jjtkt kXX −+

−

=+ ∑=− εα

1

0

)(ˆ

Déterminons un intervalle de confiance sur la prévision ),(ˆ kX t sous l’hypothèse de normalité

des résidus tε . On montre alors que :


43

[ ])1,0(

)(ˆvar

)(ˆ

21 N

kXX

kXX l

Ttkt

tkt

∞→+

+ →−

−

Or on sait que :

[ ]{ } 21

0

22

1

0

2

εσαεα ∑∑−

=

−

=−++ =⎥

⎦

⎤⎢⎣

⎡⎟⎠⎞

⎜⎝⎛=−

k

jj

k

jjktjtkt EkXXE )(ˆ

D’où [ ]

)1,0()(ˆ

211

02

NkXX l

Tk

j j

tkt

∞→−

=

+ →−

∑ ασε

On peut donc construire un intervalle de confiance sous la forme :

⎥⎥

⎦

⎤

⎢⎢

⎣

⎡

⎟⎟⎠

⎞⎜⎜⎝

⎛±= ∑

−

=ε

ασα ˆ)(ˆ

21

1

0

22k

jjt tkXIC

Chapitre 5

Les processus

à mémoire longue

Chapitre 5 Les processus a mémoire longue

45

5.1. Généralité et définition de la mémoire longue : Un processus stationnaire Xt est un processus à mémoire longue s’il existe un nombre

réelα , telle que 0 1α≺ ≺ , et une constante c, c 0,vérifiant :

lim 1.k

k ck α

ρ−→∞

=

où ρ est la fonction d’autocorrelation et k le retard.

Par conséquent, les autocorrelations d’un processus à mémoire longue vérifient la relation asymptotique suivante : k ck αρ −≈ quand k→ ∞ .

5.2. Bruit blanc fractionnaire ARFIMA(0.d.0) : Le processus ARFIMA le plus simple est le processus ARFIMA (0.d.0) ou bruit

fractionnaire de paramètre d en temps discret. Il se définit comme suit :

(1 ) .dt tB X ε− =

où B est l’opérateur retard et tξ est un bruit blanc.

Le développement binomial est donné par :

0(1 )d d j

jj

B Bπ∞

=

∇ = − =∑ où 0

( ) 1( ).( 1) ( )j

k j

j d k dj d k

π≤

Γ − − −= =Γ + Γ − ∏

≺ pour j=0.1…

où Γ étant la fonction euclidienne de seconde espèce.

Le processus ainsi défini est le processus ARFIMA (0.d.0). Les propriétés de ce modèle sont largement développées dans Hos King (1981). Nous reprenons ici que les bases principales.

Si d <1/2, Xt est stationnaire et a une représentation moyenne mobile infinie :

0

(1 ) ( ) .dt t t k t k

kX B Bε ε θ ε

∞−

−=

= − = Θ =∑

où 1( ) .. .

( ) ( 1) ( )

d

kd k k pour k

d k dθ

−Γ += ≈ →∞Γ Γ + Γ

.

Si d >-1/2, Xt est inversible et a la représentation autorégressive infinie suivante :

0

(1 ) ( ) .dt t k t k t

kB X B X Xφ ε

∞

−=

− = Φ = =∑

où1( ) .. .

( ) ( 1) ( )

d

kk d k pour k

d k dφ

− −Γ −= ≈ →∞Γ − Γ + Γ −

.


46

5.3. Processus ARFIMA (p.d.q) : Un processus ARFIMA (p.d.q) ou d ∈ ] [1/ 2.1/ 2− est définie par :

( ) ( )t tB X Bφ θ ε= Ou : 2(1 ) , , (0. ).dt tB ou BBε υ υ σ−= −

Où ( ) ( )B et Bφ θ sont des polynômes de degrés respectivement p et q.

Les conditions de stationnarité et d’inversibilité des processus ARFIMA (p.d.q) sont :

Si d <1/2 et ( ) 0Bφ = possède toutes ses racines à l’extérieur du cercle unité du plans complexe. Xt est stationnaire.

Si d >-1/2 et ( ) 0.BΘ = possède toutes ses racines à l’extérieur du cercle unité du plans complexes. Xt est inversible.

Finalement Xt est stationnaire et inversible lorsque -1/2<d<1/2.

5.4. Test de mémoire longue : Il existe plusieurs types de tests de mémoire longue. Nous allons présenter ici deux tests :

Le test de LO (1991) qui repose sur l’analyse de la statistique R/S.

Test de Labato et Robinson (1998).

5.4.1.Test de Lo (1991) :

L’exposant de Hurst est donné par :TLogQLogH T≈

La relation entre l’exposant de Hurst et le degré d’intégration fractionnaire

est21: += dH .

Si ( )21012

1 <<<< dH : le processus est à mémoire longue ou persistant.

Si :)0(21 == dH le processus se réduit au processus standard ARMA.

Si ( )021

210 <<−<< dH : le processus est anti-persistant.

Lo a défini une statistique R/S qui, tout en restant sensible à la mémoire longue, est

invariante sous une classe générale de processus à mémoire courte.

La statistique R/S notée TQ , s’écrit :

1

1/ ( )( ) 11 1

max ( ) ( )minT TT

k T

k kQ R s q j T j Ts q k Tj j

X X X X≤ ≤

⎡ ⎤⎢ ⎥

= = ⎢ ⎥⎢ ⎥≤ ≤= =⎣ ⎦

− − −∑ ∑ .


47

où 2 2

1 1 1( ) 1/ ( ) 2 / ( ) ( )( )

qT T

T j T j j T t j Tj j i j

s q T X X T w q X X X X−= = = +

⎡ ⎤= − + − −⎢ ⎥

⎣ ⎦∑ ∑ ∑ .

telle que : ( ) 1 , .1j

jw q q Tq

= − <+

5.4.2. Test de Labato et Robinson (1998) : Labato et Robinson (1998) ont proposé un test du type multiplicateur de Lagrange de

l’hypothèse nulle I(0) contre l’alternative I(d) avec d ≠ 0.

La statistique de test est donnée par :

11/ 2

1

( )

( )

m

j jj

m

jj

ILR m

I

ν λ

λ

=

=

= −∑

∑

où 1

1log log

m

ji

j m iν −

=

= − ∑ .

où I(λj) est le périodogramme de Xt et m le nombre d’ordonnées du périodogramme. Asymptotiquement, la statistique de test suit une loi normale centrée réduite.

5.5. Les méthodes d’estimation des processus ARFIMA : Les méthodes d’estimation des processus ARFIMA peuvent être regroupées en deux

catégories. La première (la méthode en deux étapes) consiste à estimer d’abord le paramètre d . Une fois cette estimation réalisée, la série corrigée ))1(( ˆ

td XB− permet de

déterminer les paramètres de la partie ARMA (p, q) du processus ARFIMA (p, d, q). La seconde méthode (méthode en une étape) consiste à estimer tous les paramètres simultanément par la méthode du maximum de vraisemblance, chacune de ces deux méthodes comprend des techniques d’estimation.

5.5.1 Méthode en deux étapes : (méthode basée sur l’exposant de Hurst) Lors de son analyse sur les crues du Nil, Hurst (1951) a introduit une statistique

permettant de détecter la présence des phénomènes de mémoire longue, cette statistique, notée SR , est particulièrement intéressante dans la mesure où elle donne lieu à un coefficient,

appelé exposant de Hurst, permettant de classifier les séries temporelles en fonction de la nature de leur mémoire.


48

5.6 Prévision d’un processus ARFIMA (p, d, q) : Soit un processus ARFIMA (p, d , q) causal et inversible tel que :

ttd BXBB ε)()1()( Θ=−Φ ………. (1) -

( )2,0 εσε BBt → , ⎢⎣⎡

⎥⎦⎤−∈

21,

21d

0)( ≠Φ μ

où μ < 1 (causalité) et 0)( ≠Θ γ , γ <1 (inversibilité).

μ et γ sont les racines des polynômes Φ etΘ respectivement

(1) peut s’écrire : jtj

jtX −

∞

=∑= εψ

0…………… (2)

ou bien : jtj

jt X −

∞

=∑=

0πε …………… (3)

(1) et (2) donnent : dpqj

jj ZZZZ −−

∞

=

−ΦΘ=∑ )1()()( 1

0ψ

(1) et (3) donnent: dqpj

jj ZZZZ )1()()( 1

0−ΘΦ= −

∞

=∑π et 1<Z

Par définition : ),........,,,........,/(ˆ2121 nnhnhn XXXXEX εεε++ =

où n est le nombre d’observations, h l’horizon et hnX +ˆ la prévision.

jhnj

jhnX −+

∞

=+ ∑= εψ

0

),...,,,...,/(ˆ11

0nnjhn

jjhn XXEX εεεψ −+

∞

=+ ∑= ),...,,.../( 11

0nnjhn

jj XXE εεεψ −+

∞

=∑=

⎩⎨⎧ ≤−

= −+−+ nonsi

jhsiXXXE jhn

nnjhn 0

0),........,,,........,/( 2121

εεεεε

jhnhj

jhnX −+

∞

=+ ∑= εψˆ

Il existe un écart entre les observations et les prévisions appelé erreur de prévision noté

hne +ˆ tel que : ∑∑−

=−+

−

=+++ ==−=

1

0

2221

0

2 )()ˆ()ˆvar(h

jjjhn

h

jjhnhnhn EXXEe ψσεψ ε

D’où l’intervalle de prévision : 2/11

0

2 )(96.1ˆ ∑−

=+ ±=

h

jjhnX ψσ ε si les erreurs sont gaussiennes .

Chapitre 6

Le modèle VAR

Chapitre 6 Le modèle VAR

50

Un modèle VAR est un outil économique particulièrement adapté pour mesurer et utiliser en simulation, l’ensemble des liaisons dynamiques à l’intérieur d’un groupe de variables donné. Toutes les variables sont initialement considérées comme étant potentiellement endogènes. En règle générale, la modélisation VAR « standard» consiste à modéliser un vecteur de variables stationnaires à partir de sa propre histoire et chaque variable est donc expliquée par le passé de l’ensemble des variables.

La forme standard de ce type de modèle est caractérisée par les points suivants :

Les variables à modéliser sont toutes stationnaires.

Les variables à modéliser sont toutes potentiellement endogènes.

Le nombre de décalages associé à chaque variable dans chaque équation est identique.

6.1 Présentation du modèle VAR standard 6.1.1 Ecriture du modèle VAR standard Soit ( )1 2, , , n

t t t tX x x x ′= … un vecteur stationnaire de dimension ( )1n× .

La modélisation de ce vecteur sous la forme d’un processus ( )VAR p s’écrit

1 1 2 2 1, ,t t t p t p tX C X X X t Tε− − −= +Φ +Φ + +Φ + =… …

avec ( ) ( )1, , , 0,nt t t t iidNε ε ε ε= ≈ ∑ où ∑ est une matrice diagonale, ( ): 1 ,C n× et

( ): pour 1, , .i n n i pΦ × =

L’hypothèse que ∑ est une matrice diagonale est cruciale dans la modélisation VAR et

dans l’utilisation du modèle VAR en simulation (calcul des fonctions de réponse et décomposition de la variance de l’erreur de prévision).

Une autre écriture fréquemment rencontrée de ce modèle VAR est la suivante : ( ) 1, ,t tB X C t TεΦ = + =

où ( ) ( )11 ppB B BΦ = −Φ − Φ… est un polynôme en l’opérateur retard L caractérisé par

.kt t kB X X −=

Enfin, dans le cas où toutes les variables sont centrées, l’écriture du modèle VAR se ramène à ( ) ( )1, , 1t tB X t TεΦ = =

C’est cette écriture qui sera retenue par la suite

6.1.2 Condition de stationnarité Le terme de droite du modèle ( )VAR p défini par l’équation (1) représente le mécanisme

supposé avoir engendré le vecteur tX . Ce mécanisme est purement dynamique. Or les éléments du vecteur tX étant stationnaires, il est nécessaire que les mécanismes dynamiques définis par ce terme de droite génèrent effectivement une dynamique stationnaire. Pour que cela soit assuré, les racines en B du polynôme caractéristique ( )11 p

pB B−Φ − Φ… doivent être de module supérieur à l’unité (ou hors du cercle unité dans le jargon consacré).


51

Exemple : Soit la modélisation ( )1VAR du processus stationnaire non centré

( )1 2t t tX x x ′= de dimension 2 :

1 1 11 1

2 2 22 1

t t t

t t t

cx xcx x

εε

1 11,1 1,2 −1 12,1 2,2 −

⎛ ⎞⎛ ⎞ φ φ ⎛ ⎞ ⎛ ⎞⎛ ⎞= + +⎜ ⎟⎜ ⎟ ⎜ ⎟ ⎜ ⎟⎜ ⎟ ⎜ ⎟φ φ⎝ ⎠⎝ ⎠ ⎝ ⎠ ⎝ ⎠⎝ ⎠

La condition de stationnarité de ce processus ( )1VAR est obtenue par le calcul des racines en B du polynôme :

( )1

1 00 1

B BI B B

B B

1 1 1 11,1 1,2 1,1 1,21 1 1 12,1 2,2 2,1 2,2

⎛ ⎞ ⎛ ⎞φ φ 1−φ −φ⎛ ⎞−Φ = − =⎜ ⎟ ⎜ ⎟⎜ ⎟ ⎜ ⎟ ⎜ ⎟φ φ −φ 1−φ⎝ ⎠ ⎝ ⎠ ⎝ ⎠

Les racines en B de ce modèle VAR(1) sont obtenues en calculant les racines en B de : ( ) ( )( ) 2

1det 0 1 1 0I B B B B1 1 1 11,1 2,2 1,2 2,1−Φ = ⇔ −φ −φ −φ φ =

La stationnarité du modèle VAR est assurée si les deux racines en B de cette équation sont de module supérieur à l’unité.

6.1.3 Concept d’innovation Dans le cadre d’un modèle VAR, le vecteur tε de taille ( )1n× est appelé vecteur des

innovations de tX . Le concept d’innovation joue un rôle clef dans la modélisation VAR et dans l’utilisation des modèles VAR en simulation.

Pour saisir facilement ce concept, il suffit de réécrire tout d’abord le modèle VAR précédent sous la forme suivante :

( )1 1 2 2t t t p t p tX X X X ε− − −− Φ +Φ + +Φ =…

Or, d’après l’équation (1), la meilleure prévision linéaire du vecteur tX qu’il est possible de réaliser en ( )1t − est donné par :

( ), 1 1 1 2 2 1

1 1 2 2

/prévut t t t p t p t

t t p t p

X E X X X Inf

X X X− − − − −

− − −

= Φ +Φ + +Φ

= Φ +Φ + +Φ

…

…

où ( )1. / tE Inf − représente l’opérateur "espérance conditionnelle à l’information

disponible à la date ( )1t − ".

Le vecteur tε peut donc être finalement réécrit sous la forme :

( ), 1 2prévut t t tX Xε −= −

Soit encore au niveau de chacun des éléments de tε

( )1/ pour 1, ,j j jt t t tx E x Inf j nε −= − = …

On s’aperçoit ainsi que si le modèle (1) est le "vrai modèle" ayant engendré le vecteur tX (cette hypothèse est faite lors de toute modélisation et n’est donc pas spécifique aux


52

modèles VAR), le vecteur tε représente la part de tX qui n’était pas prévisible à la date précédente ( )1t − . En considérant que l’économie (autrement dit ici le vecteur tX ) subit à chaque date des chocs aléatoires ou des "innovations" imprévisibles qui font dévier la valeur que prend effectivement le vecteur X à une date t quelconque, de la valeur de X qui était prévisible en ( )1t − pour la date t, on s’aperçoit immédiatement sur l’écriture (2) que les chocs aléatoires survenant à la date t sont donnée par tε . On appellera donc tε le vecteur des innovations du vecteur X à la date t ou bien encore le vecteur des chocs d’innovations affectant X à la date t (ou affectant tX plus simplement).

Ces innovations représentent donc les chocs affectant l’économie à chaque date. Nous verrons par la suite qu’elles seront "considérées" comme des variables exogènes du modèle VAR et seront utilisées comme telles en simulation.

Exemple: Soit ( )1 2 3, ,t t t tX x x x ′= un processus vectoriel stationnaire centré de dimension 3. Une modélisation VAR(1) de ce vecteur s’écrit :

1 1 11

2 2 21

3 3 31

t t t

t t t

t t t

x xx xx x

εεε

1 1 11,1 1,2 2,3 −1 1 12,1 2,2 2,3 −1 1 13,1 3,2 3,3 −

⎛ ⎞ ⎛ ⎞⎛ ⎞ ⎛ ⎞φ φ φ⎜ ⎟ ⎜ ⎟⎜ ⎟ ⎜ ⎟

= φ φ φ +⎜ ⎟ ⎜ ⎟⎜ ⎟ ⎜ ⎟⎜ ⎟ ⎜ ⎟⎜ ⎟ ⎜ ⎟φ φ φ⎝ ⎠ ⎝ ⎠⎝ ⎠ ⎝ ⎠

Considérons par exemple la variable 2x . La prévision en ( )1t − de la valeur de 2tx est

donnée par

( ) ( )2 1 2 31 1 1 1

1 2 31 1 1

/prévu

t t t t t

t t t

x E x x x Inf

x x x

1 1 12,1 − 2,2 − 2,3 − −

1 1 12,1 − 2,2 − 2,3 −

= φ + φ + φ

= φ + φ + φ

La valeur de l’innovation affectant 2x à la date t est donc égale à :

( )2 2 2prévu

t t tx x ε− =

6.2. Estimation d’un modèle VAR standard Dans le cas d’un vecteur tX stationnaire et d’un modèle VAR(p) usuel où chaque

variable intervient dans chaque équation avec le même nombre de décalages, l’inférence classique s’applique et le modèle peut être convenablement estimé à l’aide de la méthode des Moindres Carrés Ordinaires sur chaque équation séparément.

L’objectif n’est pas ici de fournir une démonstration rigoureuse de tous ces résultats mais de mettre ce résultat en évidence de façon heuristique pour faire apparaître le modèle VAR comme la forme réduite usuelle d’un modèle économétrique et pour justifier l’applicabilité des résultats économétrique auxquels le modélisateur non spécialiste des séries temporelles est habitué

Le modèle VAR(p) présenté dans l’équation (1) est tout d’abord réécrit sous une forme plus proche de celle généralement retenue en économétrie classique :


53

Soit tY le vecteur de dimension ( )1np× et soit ′Π la matrice de dimension ( )n np×

définis par ( )1

1et =t

t p

t p

XY

X

−

−

⎛ ⎞⎜ ⎟ ′= Π Φ Φ⎜ ⎟⎜ ⎟⎝ ⎠

…

Le modèle (1) peut alors être réécrit selon

t t tX Y ε′= Π +

où la matrice ′Π contient l’ensemble des matrices 1, , .i i pΦ =

Sous l’hypothèse ( )0,t iidNε ≈ ∑ , la distribution du vecteur tX conditionnelle à

l’histoire de ce vecteur ( )pour 1, 2,t kX k− = … est donnée par :

( ) ( )1 2/ , , ,t t t tX X X N Y− − ′≈ Π ∑…

La densité conditionnelle de l’observation de la période t (pour t quelconque) est alors :

( ) ( ) ( ) ( )1

1 1221

1/ , 2 exp . . .2

n

t t t t t tf X X X Y X Yπ − − −−

⎧ ⎫′′ ′= ∑ − −Π ∑ −Π⎨ ⎬⎩ ⎭

On peut donc en déduire la vraisemblance de l’échantillon :

( ) ( )1 2 0 1 11

, , , / , , / ,T

T p t tt

f X X X X X f X X− + −=

=∏

Il vient ensuite pour la log-vraisemblance de l’échantillon :

( ) ( ) ( ) ( ) ( )1 1

1

1θ 2 . .2 2 2

T

t t t tt

nT TL Log Log X Y X Yπ − −

=

⎡ ⎤′′ ′= − + ∑ − −Π ∑ −Π⎢ ⎥⎣ ⎦∑

Où ( )θ ,′= Π ∑ représente l’ensemble des paramètres du modèle.

L’estimateur du maximum de vraisemblance de ′Π obtenu par application de la méthode des moindres carrés ordinaires aboutit alors à

1

1 1

ˆT T

t t t tt t

X Y Y Y−

= =

⎡ ⎤⎡ ⎤′ ′′Π = ⎢ ⎥⎢ ⎥⎣ ⎦⎣ ⎦∑ ∑

Notons que les estimateurs des éléments de la jème ligne de la matrice ′Π sont obtenus en régressant j

tx sur tY : 1

1 1

ˆT T

j t t t tt t

x Y Y Yπ−

= =

⎡ ⎤⎡ ⎤′ ′= ⎢ ⎥⎢ ⎥⎣ ⎦⎣ ⎦∑ ∑


54

L’utilisation de l’estimateur ˆ ′Π de la matrice ′Π permet ensuite d’obtenir l’estimateur de la matrice de variance-covariance ∑ . En effet la valeur estimée du vecteur des innovations est donnée par :

ˆt̂ t tX Yε ′= −Π

par définition de la matrice de variance-covariance des innovations, il vient ensuite :

1

1ˆ ˆ ˆ.T

t ttTε ε

=

′∑ = ∑

L’élément ( ),i i de la matrice ∑̂ correspond à la variance estimée de l’innovation de la

variable ( )2

1

1 ˆˆ:T

it i t

tx

Tσ ε

=

′= ∑ alors que l’élément ( ),i j de la matrice ∑̂ correspond à la

covariance estimée des innovations des variables itx et

1

1 ˆ ˆˆ:T

j i jt i j t t

tx

Tσ ε ε

=

′= ∑

D’un point de vue théorique, la présentation de la modélisation VAR standard ne présente donc aucune difficulté particulière pour l’économètre classique une fois connu le nombre de décalages p à utiliser.

6.3. Estimation du nombre de décalages p La théorie économique ne donne que très peu d’informations sur le nombre de décalages

p à retenir dans la modélisation d’un vecteur de variables X sous une forme VAR(p). De plus, il n’existe aucune procédure établie pour déterminer le nombre de décalages adéquat. Tout au plus pourrait-on dire que le nombre de décalages à retenir est celui qui permet de modéliser "convenablement" le vecteur X et d’aboutir à un vecteur d’innovations (qui est en fait la partie non modélisée de X) qui soit de type bruit blanc.

Si cette remarque de bon sens semble déjà suggérer une méthode de détermination du nombre de décalages, il faut également remarquer que le nombre de paramètres à estimer pour un modèle VAR est égal à pn2 (ou (pn2 +n) en prenant en compte les termes constants contenus dans le vecteur C) et augmente de n2 avec chaque nouveau décalage. Un nombre trop élevé de décalages risque donc d’épuiser rapidement les degrés de libertés.

A partir de ces deux remarques, trois méthodes sont plus particulièrement retenues pour estimer le nombre de décalages p dans la pratique des modèles VAR :

Une méthode basée sur l’examen des propriétés statistiques des innovations du modèle VAR

Une méthode basée sur l’utilisation de critères d’information

Une méthode basée sur des tests de nullité emboîtée sur les paramètres associés au dernier décalage du modèle.


55

Une première méthode de détermination du nombre p de décalages consiste à vérifier la blancheur des résidus de modèles VAR(p) successivement estimée pour p=1,2,3….

En partant du modèle VAR d’ordre minimal (p = 1), il suffit alors d’arrêter la procédure pour le nombre de décalages p pour lequel les résidus sont de type bruit blanc. La blancheur des résidus peut être examinée à partir de différents tests de non autocorrélation (test de Ljung-Box ou Box-Pierce, test type multiplicateur de Lagrange, etc.), de normalité (Skewness, Kurtosis, Barque-Jéra) et d’absence d’hétéroscédasticité conditionnelle (test d’absence d’effets ARCH).

6.3.1 Estimation du nombre de décalages à partir d’un critère d’information Une seconde méthode consiste à déterminer le nombre de décalages en utilisant un

critère d’information. Les critères d’information sont basés sur l’idée selon laquelle l’ajout d’une variable explicative (ou d’un ensemble de variables explicatives) à un modèle existant aboutit d’un coté à une amélioration plus ou moins importante de la part expliquée des variables modélisées (apport informatif) et d’un autre côté à une réduction des degrés de libertés pour l’estimateur. Cette réduction des degrés de liberté est considérée comme une pénalité liée à l’incorporation d’une variable explicative additionnelle.

La valeur du critère d’information peut être calculée pour chaque modèle estimé. Dans le cas des modèles VAR, la procédure de détermination du nombre de décalages à partir des critères d’informations consiste donc à estimer un modèle VAR d’ordre minimal (p = 1) et de calculer la valeur prise par le critère d’information) pour ce modèle, En estimant le modèle VAR d’ordre immédiatement supérieur (p = 2) et en recalculant la valeur correspondante du critère d’information, on décide de conserver le décalage p=2 si l’apport informatif du second décalage est supérieur au coût qu’il occasionne en termes de réduction de degrés de liberté.

Dans le cas où le décalage p=2 est conservé, la procédure est prolongée en estimant le modèle VAR(3) et en comparant le critère d’information obtenu pour ce modèle avec celui obtenu pour le modèle précédent VAR(2). Le nombre de décalages est ainsi systématiquement augmenté tant que l’apport informatif du dernier décalage est supérieur au coût qu’il occasionne. Lorsqu’un décalage occasionne un coût supérieur au gain informatif, la procédure s’arrête et le décalage précédent apparaît être le décalage "optimal".

En pratique, il suffit donc de déterminer "à priori" un nombre de décalages maximal pmax et d’estimer successivement les modèles VAR(p) pour p =1,… , pmax. Pour chaque modèle estimé, la valeur du critère d’information correspondante est calculée et est notée CRIT(p) pour p =1,… , pmax .

Le nombre de décalages optimal p̂ est choisi comme celui pour lequel la valeur de critère d’information est maximale (ou minimale selon la forme du critère retenu) :

( )maxmax 1, ,1, ,

ˆ max minp pp p

p ou CRIT P==

=……

Dans le cadre de la modélisation VAR, parmi les critères qui sont fréquemment utilisés : le critère du Final Predictor Error (FPE), le critère d’information de Schwartz (SC) et le critère d’information de Hannan-Quinn (HQ), le critère d’information d’ Akaike(AIC).


56

Tous les critères sont basés sur le choix d’un nombre de décalages qui minimise une expression dans laquelle intervient à la fois le nombre de décalages (p), la taille de l’échantillon (T), le nombre de variables (n) et le déterminant de la matrice de variance-covariance des innovations obtenues à partir d’un VAR(p) (noté ( )det p∑ dans les formules relatives à chaque critère). Ce dernier élément est en fait un indicateur de la qualité statistique du modèle qui décroît lorsque la qualité statistique du modèle s’améliore.

En notant ( )p∑ la matrice de variance-covariance du modèle VAR(p), les expressions correspondant à ces différents critères sont les suivants :

- Critère FPE (Final Predictor Error) : ( )1 det1

pT np pT np⎡ ⎤+ +

∑⎢ ⎥− −⎣ ⎦

- Critère AIC (Akaike Information Criterion): ( )22log det pnp

T∑ +⎡ ⎤⎣ ⎦

- Critère SC (Shwartz Criterion) : ( ) ( ) 2loglog det

Tp pn

T∑ +⎡ ⎤⎣ ⎦

- Critère HQ (Hannan Quinn) : ( ) ( ) 22log loglog det

Tp pn

T⎡ ⎤⎣ ⎦∑ +⎡ ⎤⎣ ⎦

Plusieurs auteurs ont déjà réalisé des évaluations comparatives de ces différents critères afin d’analyser leur capacités respectives à sélectionner le bon modèle

6.3.2. Estimation du nombre de décalages à partir de tests du rapport de vraisemblance

Une troisième procédure consiste à déterminer le nombre de décalages du modèle VAR. Les tests utilisés sont des tests du rapport de vraisemblance qui prennent une forme simple dans le cas des modèles VAR. En effet, la valeur de la log-vraisemblance du modèle VAR éstimé est égale à

( ) ( ) ( )1 1

1

1ˆ ˆˆ ˆ ˆθ 22 2 2

T

t tt

nT TL Log Logπ ε ε− −

=

′= − + ∑ − ∑∑

Etant donné que1

1ˆ ˆ ˆ ,T

t ttTε ε

=

′∑ = ∑ le dernier élément du terme de droite se réduit ici à

1

1

1 ˆˆ ˆ2 2

T

t tt

nTε ε−

=

′∑ =∑

Les tests du rapport de vraisemblance associé à une hypothèse nulle 0H donnée sont bâtis sur le double du rapport des vraisemblance (ou de la différence des Log-vraisemblance) estimées pour le modèle contraint ( )( )0 θL et pour le modèle non contraint ( )( )1 θL . La statistique de test correspondante dans le cas d’un modèle VAR se réduit donc à :

( ) ( )( ) { }1 0 0 1ˆ ˆˆ ˆ2 θ θRV L L T Log Log= − = ∑ − ∑


57

Un résultat standard sur la distribution de cette statistique permet de montrer que

( ) ( )( ) ( )21 02 θ θ χRV L L rest= − ≈

Avec rest = nombre de restrictions sous 0H , sous l’hypothèse nulle 0H .

La procédure de détermination du nombre de décalages d’un modèle VAR consiste donc ici à déterminer "à priori" un nombre de décalages maximal pmax et d’estimer simultanément le modèle VAR(pmax) et le modèle VAR(pmax-1). L’estimation des deux modèles permet alors de réaliser un test du rapport de vraisemblance associé à l’hypothèse nulle

max0 : 0.pH Φ =

En effet, cette procédure s’arrête dés que l’hypothèse nulle des paramètres associés au dernier décalage est rejetée par les données. Le modèle VAR correspondant à ce décalage est finalement retenu.

Remarque: dans la pratique, il est fréquent de combiner ces trois méthodes pour s’assurer que le nombre de décalages retenu est statistiquement adéquat.

6.4. Calcul des fonctions de réponse du modèle VAR standard La forme autorégressive d’un modèle VAR est presque toujours non interprétable en

termes économiques car elle ne représente que la forme réduite d’un modèle structurel sous-jacent. Sauf cas particulier, la simulation de modèle VAR estimé ne fournit donc pas d’informations économiquement interprétables quant à la forme structurelle sous jacente au modèle VAR. La simulation de la forme structurelle sous jacente peut être effectué. Elle nécessite cependant que le modèle VAR estimé soit préalablement transformé pour être mis sous la forme d’un modèle VAR structurel.

6.4.1. Utilité du concept d’innovation en simulation La simulation d’un modèle VAR fait immédiatement surgir une première difficulté pour

l’économètre classique. En effet, La simulation d’un modèle structurel repose généralement sur l’analyse des effets statiques et dynamiques d’une variation d’une ou plusieurs variables exogènes sur les variables endogènes du modèle. Or un modèle VAR standard ne contient pas de variables exogènes!. Pour simuler un modèle VAR, il est en fait nécessaire de considérer les innovations comme des variables exogènes et d’analyser les effets des variations d’une ou plusieurs innovations (on parlera d’un "choc d’innovation") sur les variables du modèle VAR.

Soit itε l’innovation associée à la variable i

tx du vecteur tX .

Par définition, cette innovation est égale à ( )/ 1

prévui i it t t tx xε −= − et représente la part de la

valeur prise par la variable ix en t qui n’a pas été anticipée rationnellement en ( )1t − à partir du modèle VAR retenu.

Cette part est supposée représenter les chocs nouveaux ayant affecté la valeur de ix à la date t et ayant fait dévier i

tx de la valeur qu’elle aurait du avoir d’après l’information disponible et utilisée en ( )1t − . Autrement dit, i

tε représente un choc en t "non anticipé en


58

( )1t − " sur ix . Le fait que ce choc faisant augmenter itx de 1 unité par rapport à la valeur

qu’elle aurait du prendre d’après l’information disponible en ( )1t − .

Simuler le modèle VAR revient en fait à tracer les effets dynamiques des chocs d’innovations de chacune des variables (ou de certaines d’entre elles uniquement) sur les variables du vecteur X (ou sur certaines d’entre elles).

7.4.2. Fonctions de réponse du modèle VAR standard

Le calcul des fonctions de réponse est immédiat dans le cas d’un modèle VAR standard dont les innovations ne sont pas corrélées instantanément :

( ) ( ), 0 , avec .i jt t i jCov i j i jε ε σ= = ∀ ≠

Dans ce cas, les innovations ne sont pas instantanément reliées. Il est donc possible de simuler tour à tour les effets d’un choc sur l’une des innovations sans prendre en considération les éventuels effets de ce choc sur la variation d’une autre innovation. Dans ce cas, le calcul des fonctions de réponse est extrêmement simple.

Le calcul des fonctions de réponse d’un modèle VAR passe par le calcul de la forme Moyenne Mobile Vectorielle (ou forme VMA) du modèle VAR. Cette forme VMA est obtenue par inversion du polynôme ( ).BΦ

Soit l’écriture suivante du modèle VAR(p) défini par l’équation (1)

( ) t tB X εΦ =

Sous l’hypothèse que les racines en L du polynôme ( )BΦ sont hors du cercle unité,

( )1 B−Φ existe et est un polynôme en B d’ordre fini : ( )1 21 2B I B B−Φ = +Ψ +Ψ +

avec ( ): pour 1,2, et lim 0k kkn n k

→∞Ψ × = Ψ =

La forme VMA du modèle VAR(p) s’écrit donc :

( )( ) ( )

1

1 1 2 2

2t t

t

t t t

X B

BI

ε

εε ε ε

−

− −

= Φ

= Ψ

= +Ψ +Ψ +

Les fonctions de réponse du modèle VAR sont directement obtenues à partir des matrices , 1,2,k kΨ = associées aux innovations décalées. Plus précisément, le calcul des fonctions de réponses de modèle VAR revient à analyser comment la variation à une date t quelconque d’une innovation iε de la variable ix quelconque de X va affecter l’ensemble des variables ( )1 2, , , n

t t tx x x pour les dates , 1, 2, .t t t+ +

Les fonctions de réponse cumulées entre l’innovation iε et la variable jx à k périodes en avant ( ), ,j i kFRI sont égales à :


59

, , pour 1,2,j

t kj i k i

t

xFRI kε+∂

= =∂

Les fonctions de réponse instantanées entre l’innovation iε et la variable jx à une périodes en avant ( ), ,j i kFRC sont égales à :

, ,0

pour 1,2,jk

t sj i k i

s t

xFRC kε+

=

∂= =

∂∑

Or d’après (3) et l’hypothèse de stationnarité de tX , il vient :

1 1 2 2 1 1 2 2t t t t t l l t t l t lX I X Iε ε ε ε ε ε− − + + + − + −= +Ψ +Ψ + ⇔ = +Ψ +Ψ +

On a donc :

, pour 1,2,j j

j it k tki i

t t k

x x lε ε+

−

∂ ∂= = Ψ =

∂ ∂

Où ,j ikΨ représente l’élément ( ),j i de la matrice kΨ .

Les fonctions de réponse instantanées et cumulées correspondantes à l’effet à k périodes en avant d’un choc de l’innovation iε sur la variable jx peuvent donc être réécrites selon :

, ,, , , ,

0et

kj i j i

j i k k j i k ss

FRI FRC=

= Ψ = Ψ∑

Enfin, les effets multiplicateurs totaux des innovations sur les variables du vecteur X sont donnés par :

( )1 20

1 pour 1,2,k

t s

s t

X I kε+

=

∂= + Ψ +Ψ + = Ψ =

∂∑

où ( )1Ψ est une matrice de taille ( )n n× .

Les fonctions de réponses sont généralement présentées sous la forme d’un tracé permettant de visualiser simplement les effets instantanées et dynamiques associés aux chocs d’innovation sur les variables du vecteur tX .

Remarque 1: L’écriture (2) de la forme VMA fait apparaître que les effets instantanés induits par les chocs d’innovations sur le vecteur tX sont égaux à la matrice identité de taille

( )n n× :

1 pour0 pour

jti

t t

i jX xIi jε ε=⎧∂ ∂

= ⇔ = ⎨ ≠∂ ∂ ⎩

Tout choc d’innovation unitaire sur une variable i fait donc varier instantanément la

variable ix d’une unité (ce résultat est évident puisque par définition ( ) prévui i it t tx x ε= + ) et la

variable jx de 0 unité (pour i j≠ ).


60

Remarque2 : D’après l’hypothèse de stationnarité de tX (et donc du modèle VAR étant supposé avoir engendré tX ), les fonctions de réponse instantanées et cumulées du modèle VAR doivent vérifier pour tout couple ( ),i j :

, ,, , , ,lim 0 et lim constantej ij i k j i kk kFRI FRC FRC ∞

→∞ →∞= = =

La vérification de cet effet de convergence des fonctions de réponse permet de vérifier à posteriori la stationnarité du processus VAR.

6.4.3. Décomposition de la variance des erreurs de prévision du modèle VAR standard

Soit itx la valeur de l’élément i de tX et soit ( )i

t t kE x + l’espérance conditionnelle de la

valeur de it kx + réalisé à la date t. En d’autres termes, ( )i

t t kE x + représente la prévision linéaire

de it kx + réalisé à la date t.

Soit ( )( )i it k t t kVar x E x+ +− la variance de l’erreur de prévision à k périodes en avant. Il

est possible de calculer la part de ( )( )i it k t t kVar x E x+ +− qui est due au jème choc du modèle

VAR (soit jtε ). Ce calcul correspond à la décomposition de la variance de l’erreur de

prévision du modèle VAR.

Pour faire ce calcul simplement, nous rappelons rapidement un résultat de calcul matriciel usuel

Soit ( ) avec , 1, , ,i j i j nσ∑ = = … une matrice diagonale de dimension ( ),n n (on a

donc 0 pour et 0 pour i j i ji j i jσ σ≠ = = ≠ ).

Soit ( ) avec , 1, ,i jR r i j n= = une matrice diagonale de dimension ( ),n n et soit iR la ième colonne de la matrice R. Un résultat usuel de calcul matriciel permet de montrer que la matrice ∑ étant diagonale, on a

1

n

ii i ii

R R R Rσ=

′′∑ =∑

PARTIE

APPLICATION

Application Lissage exponentiel

63

Analyse de la série vente de carburant JET A1 secteur Aviation National :

La série JAN est tendancielle et présente aussi une composante saisonnière qui

intervient de façon multiplicative, c’est pour cela qu’on a appliqué la technique multiplicative

de Holt & Winters.

Parameters: Alpha 0.5200 Beta 0.0000 Gamma 0.0000 Sum of Squared Residuals 5.55E+08 Root Mean Squared Error 2049.664

Le tableau ci-dessus comporte : Les coefficients de lissage qui minimisent la somme des carrés résiduels et qui sont :

Coefficient de lissage de la moyenne noté α= 0.5200.

Coefficient de lissage de la tendance noté β =0.0000

Coefficient de lissage de la saisonnalité noté γ = 0,000 La racine moyenne des carrés résiduels : RMSE = 2049.664

Prévision : Les prévisions sont calculées pour la période allant de janvier 2006 à Décembre 2006 Diagramme séquentiel de la série brute JAN et des prévisions :

Remarque : Les quantités de carburants sont en milliers de tonnes.

prévision JAN Janvier 2006 27542.4072 Février 2006 24899.7827 Mars 2006 28238.1796 Avril 2006 27509.2703 Mai 2006 26792.7844 Juin 2006 25909.4509

Juillet 2006 29244.5123 Août 2006 30058.7333

Septembre 2006 28518.1544 Octobre 2006 25881.8044

Novembre2006 27022.0719 décembre2006 28044.4801

64

Analyse de la série vente de carburant JET A1 secteur Aviation Etrangère :

La série JAE est tendancielle et présente aussi une composante saisonnière qui intervient

de façon multiplicative, c’est pour cela qu’on a appliqué la technique multiplicative de Holt &

Winters.


Coefficient de lissage de la moyenne noté α= 0.6600.



Prévision : Les prévisions sont calculées pour la période allant de janvier 2006 à Décembre 2006 Diagramme séquentiel de la série brute JAE et des prévisions :


Parameters: Alpha 0.6600 Beta 0.0000 Gamma 0.0000 Sum of Squared Residuals 16930748 Root Mean Squared Error 358.1386

prévision JAE Janvier 2006 4249.33902 Février 2006 3637.6644 Mars 2006 4068.42458 Avril 2006 4125.16432 Mai 2006 4226.8494 Juin 2006 3967.68175

Juillet 2006 4696.11771 Août 2006 4294.42568

Septembre 2006 4005.86643 Octobre 2006 4150.11976

Novembre2006 4109.20486 décembre2006 4741.52595

65

Analyse de la série vente de carburant Fuel-oil secteur Marine Nationale :

La série FN est tendancielle et présente aussi une composante saisonnière qui intervient

de façon multiplicative, c’est pour cela qu’on a appliqué la technique multiplicative de Holt &

Winters .

Parameters: Alpha 0.3500 Beta 0.0000 Gamma 0.0000 Sum of Squared Residuals 1.11E+09 Root Mean Squared Error 2904.533


Coefficient de lissage de la moyenne noté α= 0.3500



Prévision : Les prévisions sont calculées pour la période allant de janvier 2006 à Décembre 2006 Diagramme séquentiel de la série brute FN et des prévisions :


prévision FN Janvier 2006 26146,0924 Février 2006 22161,4455 Mars 2006 26728,015 Avril 2006 26496,0203 Mai 2006 25551,5049 Juin 2006 24767,9815

Juillet 2006 29793,8169 Août 2006 28296,0462

Septembre 2006 27201,0912 Octobre 2006 28965,654

Novembre2006 22008,8657 décembre2006 25130,4277

66

Analyse de la série vente de carburant Fuel-oil secteur Marine Etrangère :

La série FE est tendancielle non saisonnière, c’est pour cela qu’on a appliqué la

technique multiplicative de Holt & Winters .

Parameters: Alpha 0.4100 Beta 0.0100 Sum of Squared Residuals 4.72E+08 Root Mean Squared Error 1891.048

Le tableau ci-dessus comporte :

Les coefficients de lissage qui minimisent la somme des carrés résiduels et qui sont :

Coefficient de lissage de la moyenne noté α= 0.4100

Coefficient de lissage de la tendance noté β =0.0100 La racine moyenne des carrés résiduels : RMSE = 1891.048

Prévision : Les prévisions sont calculées pour la période allant de janvier 2006 à Décembre 2006 Diagramme séquentiel de la série brute FE et des prévisions :


Remarque importante:nous remarquons que les coefficients γ et β sont nuls pour les séries JAN,JEA,FE bien que ses dernières aient une composante saisonnière est quelques une ont dune composante tendancielle de type TS (d'après l'étude de Box et Jenkins présentée dans le chapitre suivant)


Juillet 2006 183,372377 Août 2006 195,108563



Application Box & Jenkins


68

Analyse de la série vente de carburant

JET A1 secteur Aviation National :

Plusieurs étapes préliminaires sont nécessaires avant d’effectuer des tests spécifiques sur

une série chronologique et de chercher à la modéliser, il convient d’étudier quelques

caractéristiques stochastiques en particulier sa moyenne et sa variance.

Notation : Nous notons la série vente de carburant jet A1 secteur national JAN.

Identification

Les données de la série des ventes de carburant jet A1 (notée : JAN) sur une période de

dix ans, les observations sont mensuelles ; de janvier 1995 à décembre 2005. L'unité de

mesure est en milliers de tonnes.

Diagramme séquentiel de la série brute JAN :

Graphe de la moyenne et la variance de la série brute JAN :

Graphe de la moyenne

05000

10000150002000025000300003500040000

1 3 5 7 9 11

JAN

Graphe de la variance

020000004000000

60000008000000

1000000012000000

1400000016000000

1 3 5 7 9 11

JAN


69

D’après les deux graphes précédents, on remarque que la moyenne et la variance varient

au cours du temps. On peut donc dire que cette série semble non stationnaire..

Pour vérifier ceci, on va appliquer des tests statistiques juste après la présentation des

corrélogrammes simple et partiel de la série brute.

Corrélogramme de la série brute JAN :

Nous remarquons dans le corrélogramme simple que presque tous les pics sont pratiquement à l’extérieure de l’intervalle de confiance, le corrélogramme partiel est marqué aussi par la présence des pics sortant au retard 1,3,4,9,12 et 13

. D’où la série brute est donc générée par un processus non stationnaire .


70

Test de FISHER: Pour détecter la saisonnalité de la série on a fait appel à l’analyse de la variance

(ANOVA) à deux facteurs sans répétition. Table de l’ANOVA (à 2 facteurs) données par logiciel SPSS :

Source des variations

Somme des carrés

Degré de liberté

Moyenne des carrés

F Probabilité Valeur critique pour

F Lignes 271775141 11 24706831 5.57733365 4.766E-07 1.87673166

Colonnes 1633056117 10 163305612 36.8646989 1.2291E-30 1.9178259 Erreur 487285068 110 4429864.25 Total 2392116326 131

Test d’influence de facteur ligne (mois) : Fstat= 5.5773 > Fthéo= 1.8767 donc (on rejette l’hypothèse nulle) la série est affectée

d’une saisonnalité.

Test d’influence de facteur colonne (années) : Fstat= 36.86 > Fthéo= 1.9178 donc (on rejette l’hypothèse nulle) la série est peut être

affectée d’une tendance.

Afin de traiter l’effet de saisonnalité sur notre série ou encore la stationnariser, nous lui

avons appliqué la différence saisonnière d’ordre 12.

Notation : Nous notons la série JAN désaisonnalisé par DJAN.

Graphe de la série DJAN :


71

Corrélogramme de la série DJAN :

En observant le graphe ainsi que le corrélogramme de la série DJAN, nous remarquons que la saisonnalité a été absorbée. Un recours au test de racine unitaire permet d’affirmer ou d’infirmer la stationnarité de la série en question.

Test de Dickey- Fuller Augmenté:

On procède à l’estimation par la méthode des moindres carrées avec d=1 des trois modèles [4],[5] et [6] de Dickey-Fuller sur la série DJAN(car les résidus forment un bruit blanc).

Remarque On choisit le retard d=1 qui minimise le critères d’informations d’Akaike et Schwarz

Etape (1) : Model 4 : Test sur la tendance :

11

.d

t t j t j tj

X X c t Xφ φβ ε− −=

Δ = + + + Δ +∑

Avec tε est un processus stationnaire


72

Nous testons alors la présence d’une tendance dans le processus en testant la nullité du

coefficient de la tendanceβ . Le résultat est donné dans le tableau suivant:

On remarque que la t- statistique de la tendance = -0.772 est inférieure aux valeurs critiques 3.53 et 2.79 et 2.73 (données par la table de Dickey- Fuller) pour les seuils 1%, 5%,10% On le confirme par prob = 0.4414 supérieure à 0.05. Donc la tendance n’est pas significativement différente de zéro, on passe alors à l’étape (2)

Etape (2) : Model 5 : Test sur la constante

11

.d

t t j t j tj

X cX Xφ φ ε− −=

Δ = + + Δ +∑


Nous testons la présence d’une constante dans le processus en testant la nullité du

coefficient de la constante. Le résultat de l’affichage pour la série DJAN est donné dans le

tableau suivant:


73

On remarque que la t-statistique de la constante (c) = 0.209 est inférieure aux valeurs

critiques 3.78 et 3.11 et 2.73 (données par la table de Dickey- Fuller) pour les seuils 1% et 5% et 10% On le confirme par prob = 0.8342 supérieure à 0.05. Donc la constante n’est pas significativement différente de zéro, on passe alors à l’étape (3)

Etape (3) :

Model 6: Test de la racine unitaire :

11

.d

t t j t j tj


Δ = + Δ +∑ Avec tε est un processus stationnaire

Nous testons alors la présence d’une racine unitaire dans le processus en testant la nullité du paramètre Φ à l’aide d’une statistique de Student

Φ̂t , où Φ̂ désigne l’estimateur des

moindres carrés ordinaires (MCO). Le résultat de l’affichage pour la série DJAN est donné dans le tableau suivant.

La statistique de Student Φ̂

t = - 2.77 est inférieure aux valeurs critiques -2.584, -1.943 et -1.614 (données par la table de Dickey- Fuller) pour les seuils 1%, 5% et 10% d’où la série ne possède pas de racine unitaire (on rejette l’hypothèse nulle “ 0φ = “). La série DJAN est donc stationnaire. Il convient à présent d’estimer le modèle susceptible de la représenter, en observant les corrélogrammes simple et partiel de la série stationnaire DJAN, nous remarquons que la fonction d’autocorrélation simple (AC) possède des valeurs importantes aux retards q=1,2,3,..,11, et que la fonction d’autocorrélation partielle (PAC) possède des valeurs importantes aux retards p=1, 2 ,12, par conséquent nous avons plusieurs modèles candidats parmi lesquels nous avons sélectionné le modèle : SARIMA (1.0.1)(0.1.1).

Estimation des paramètres de model :


74

Nous remarquons que tous les paramètres du modèle sont significativement différents de zéro.

En effet les rapports des coefficients du modèle sont en valeurs absolues supérieures à 1.96, ce qui est confirmé par la probabilité de nullité des coefficients qui sont tous inférieures à 0.05.

Tests sur les résidus : Test de validation des paramètres :

De la représentation graphique des inverses des racines des polynômes de retards moyenne mobile et autorégressif nous constatons qu’ils sont tous supérieures à 1 en module (leurs inverses sont en module, inférieures à 1).

Représentation graphique des séries : résiduelle ( tε ) ; actuelle et estimée:

A partir de la représentation graphique des séries résiduelles, actuelles et estimée nous

constatons que le model estimé ajuste mieux la série DJAN.


75

Corrélogramme simple et partiel des résidus :

L’analyse du corrélogramme des résidus, montre que tous les termes sont à l’intérieur de l’intervalle de confiance (illustré par des pointillés sur le graphique). Ce qui nous entraîne à dire que les résidus forment un bruit blanc.

Test de point de retournement :

0H : « Les iε forment un bruit blanc » contre

1H : « Il existe une corrélation entre les iε tel que : i = n,1 » Après les calculs à l’aide du logiciel MATLAB nous avons obtenu les résultats suivants Nombre de points de retournements p = 60 Espérance de la stat du test E (p) = 80 Variance de la statistique du test VAR(p) =16 La statistique du teste est T= 0.92 T = 0.92 est inférieure à 1.96 (tabulée) d’où on accepte l’hypothèse 0H : « Les iε

forment un bruit blanc » au seuil de 0,05.

Test de Box – Ljung :

Nous avons à tester l’hypothèse nulle : 0H : « Les autocorrélations jusqu’au pas k, (k=N/4) ne sont pas significatives » C'est-à-dire

H 0 : « 0...21 ==== Kρρρ » Contre 1H : « 45,,1: …=∃ jjρ tel que 0≠jρ ».

Ce test est basé sur la statistique de Box-Ljung au pas k : ∑= −

+=K

k

k

knnnQ

1

2

)1(γ

.


76

Si )(295,0 qpKQ −−< χ , nous acceptons l’hypothèse H 0 .

La probabilité de la statistique de Box-Ljung est supérieure à 0,05 à n’importe quel retard et la valeur de la statistique de Box-Ljung quand k = 30, p = 1, q = 12 est égale à 27.359, inférieure à

295.,0χ (17) = 27.59. Nous concluons alors que les erreurs ne sont pas corrélées.

Test de Durbin-Watson : (Test de détection d’autocorrélation d’ordre1 des erreurs) :

Nous testons H 0 : « 0=ρ » contre 1H : « 0≠ρ ». La statistique de Durbin-Watson (DW=1.993855 2≈ ) nous constatons que les résidus

d’ordre 1 ne sont pas corrélés. Test de Normalité : Les tests sont effectués à partir des valeurs empiriques des coefficients de Skewness,

Kurtosis et la statistique de Jarque-Bera, nous avons l’histogramme suivant:

Test de Skewness (asymétrie) et de Kurtosis (aplatissement) :

Nous testons les hypothèses suivantes :⎪⎩

⎪⎨

⎧

≠≠

==

00:

00:

211

210

γγ

γγ

ouH

etH

Test de Skewness :

N6

0211

1−

=β

γ

Test de Kurtosis :

N24

322

−=β

γ

où : 232

3211 μ

μβ = : est le coefficient de Skewness (l’indicateur d’asymétrie des résidus)

22

42 μ

μβ = : est le coefficient de Kurtosis (le degré d’aplatissement de la loi des

résidus). Sous l’hypothèse H 0 et si le nombre d’observations est assez grand (N >30), nous

avons :

232

3211 μ

μβ = ( )16,0 ⎟⎟

⎠

⎞⎜⎜⎝

⎛→℘

∞→ NN

N


77

22

42 μ

μβ = ( )224,0 ⎟⎟

⎠

⎞⎜⎜⎝

⎛→℘

∞→ NN

N

Après calculs nous avons obtenu :

Test de skewness : 1/ 21

1

0 0.306326 01.364 1.96

6 6N 119

β + +γ = = = ≺

Test de Kurtosis : 22

3 4.751797 33,900 1.96

24 24N 119

β − −γ = = =

Test de Jarque et Bera :

Nous définissons la statistique S par : S = ( )221 3

246−+ ββ NN

Sous (1) et (2) : S ( )221 αχ −→

Nous testons 0H : « accepter la normalité des résidus au seuil α =0,05 » contre

1H : « il n’ y a pas de normalité des résidus ».

Si S ( )221 αχ −> nous rejetons l’hypothèse 0H sinon nous l’acceptons

La statistique de Jarque – Bera=14.11086 elle est supérieure à )2(2χ = 5,99.

D’après les tests précédents, nous concluons que les résidus forment un bruit blanc non gaussien.

Test d'effet ARCH :

L’analyse du corrélogramme des résidus carrés, montre que tous les termes sont à l’intérieur de l’intervalle de confiance, ce qui nous entraîne à dire que pas d’effet ARCH.

Conclusion : Nous pouvons conclure d’après ces tests que le modèle qui ajuste le mieux la série est :

SARIMA (1.0.1)(0.1.1) qui s’écrit sous la forme suivante : 12 12(1 0.945162 )(1 ) (1 0.433123 )*(1 0.451035 )t tB B JAN B B ε− − = + +


78

Prévision : Les prévisions sont calculées pour la période allant de janvier 2006 à Décembre 2006 Diagramme séquentiel de la série brute JAN et des prévisions

prévision JAN Janvier 2006 27611,1864

Février 2006 26032,2365

Mars 2006 25764,223

Avril 2006 26484,7609 Mai 2006 25626,018

Juin 2006 25343,9037

Juillet 2006 28430,7901

Août 2006 29926,5701 Septembre

2006 28368,3942

Octobre 2006 26835,2154 Novembre200

6 29177,2587 décembre2006 28070,493



79

Analyse de la série vente de carburant JET A1 secteur Aviation Etrangère :

Plusieurs étapes préliminaires sont nécessaires avant d’effectuer des tests spécifiques sur une série chronologique et de chercher à la modéliser, il convient d’étudier ces caractéristiques stochastiques c'est-à-dire sa moyenne et sa variance.

Notation : Nous notons la série vente de carburant jet A1 secteur aviation étrangère JAE.

Identification

Les données de la série des ventes de carburant jet A1 (notée : JAE ) sur une période de dix ans, les observations sont mensuelles ; de janvier 1995 à décembre 2005.L'unité de mesure est en milliers de tonnes.

Diagramme séquentiel de la série brute JAE :

Graphe de la moyenne et la variance de la série brute JAE :

moyenne

0

500

1000

1500

2000

2500

3000

3500

4000

4500

1 3 5 7 9 11

moyenne

variance

0

100000

200000

300000

400000

500000

600000

1 2 3 4 5 6 7 8 9 1 11

variance


80

D’après les deux graphes précédents, on remarque que la moyenne et la variance varient au cours du temps. On peut donc dire que cette série semble non stationnaire..

Pour vérifier ceci, on va appliquer des tests statistiques juste après la présentation des corrélogrammes simple et partiel de la série brute Corrélogramme de la série JAE:

Nous remarquons dans le corrélogramme simple que presque tous les pics sont pratiquement à l’extérieure de l’intervalle de confiance, le corrélogramme partiel est marqué aussi par la présence d’un seul pic sortant au1er retard d’où la série brute est donc générée par un processus non stationnaire .

Test de FISHER: Pour détecter la saisonnalité de la série on a fait appel à l’analyse de variance (ANOVA) à deux facteurs sans répétition

Table de l’ANOVA (à 2 facteurs) données par logiciel SPSS: Source des variations

Somme des carrés Degré de liberté Moyenne des carrés F Probabilité

Valeur critique pour

F Lignes 5520713.11 11 501883.01 3.36400777 0.00049586 1.87673166

Colonnes 109984312.00 10 10998431.20 73.7199847 4.5556E-44 1.91782590Erreur 16411118.80 110 149191.98 Total 131916143.00 131 Teste d’influence de facteur ligne (mois) : Fstat= 3.364 > Fthéo= 1.8767 donc (on rejette l’hypothèse nulle) la série est affectée d’une

saisonnalité


81

Teste d’influence de facteur colonne (années) : Fstat= 73.7199 > Fthéo= 1.9178 donc (on rejette l’hypothèse nulle) la série est peut être


Afin de traiter l’effet de saisonnalité sur notre série ou encore la stationnariser nous lui

Avons appliqué la différence saisonnière d’ordre 12. Notation : Nous notons la série JAE désaisonnalisé par DJAE

Graphe de la série DJAE :

Corrélogramme de la série DJAE :

En observant le graphe ainsi que le corrélogramme de la série DJAE, nous remarquons que la saisonnalité a été absorbée .Un recours au test de racine unitaire permet d’affirmer ou d’infirmer la stationnarité de la série en question.


82

Test de Dickey- Fuller Augmenté: on procède à l’estimation par la méthode des moindres carrées avec d=1 des trois modèles

[4], [5] et [6] de Dickey-Fuller sur la série DJAE (car les résidus forment un bruit blanc

Remarque On choisit le retard d=1 qui minimise le critères d’informations d’Akaike et de Schwarz Etape (1) : Modèle 4 : Test sur la tendance :

Avec tε est un processus stationnaire Nous testons alors la présence d’une tendance dans le processus en testant la nullité du

coefficient de la tendance β , Le résultat de l’affichage pour la série DJAE est donné dans le

tableau suivant:

On remarque que la t- statistique de la tendance =3.149 est inférieure à 3.53 pour le seuil 1% mais supérieur aux valeurs 2.79 et 2.73 au seuils 5% et 10% (données par la table de Dickey- Fuller) .On le confirme ça par prob = 0.0018 est inférieure 0.05. La tendance n’est pas significativement différente de zéro.

Alors d’après le même tableau on remarque que : La statistique de Student

Φ̂t = -5.1657 est inférieure aux valeurs critiques -4.037, -3.448 et

-3.149 (données par la table de Dickey- Fuller) pour les seuils 1%, 5% et 10% D’où la série ne possède pas de racine unitaire (on rejette l’hypothèse nulle “ 0φ = “)

donc non stationnarité de type TS on confirme cela par la probabilité( prob = 0.0058 )est inférieure à 0.05).

La série DJAE est non stationnaire de type TS Donc pour stationnariser cette série il faut faire un ajustement. Le meilleur ajustement du processus est l’ajustement cubique car R 2 associé égale 0,362

est le plus grand d’après les résultats obtenus par le logiciel SPSS :

11

.d

t t j t j tj


Δ = + + + Δ +∑


83

Tableau (1)

La série JAE après désaisonnalisation peut être ajustée par une fonction cubique

Estimation de la tendance cubique : Estimons l’équation d’ajustement ty qui est donnée par la formule suivante :

33

2210 tbtbtbbyt ⋅+⋅+⋅+= , les cœfficients b 0 , b1 , b 2 et b 3 sont données par le Tableau (1)

Notation : Nous notons la série ajustée par AJU t elle est donnée par la formule :

AJU t = DJAEt - yt .

Diagramme séquentiel de la série DJAE avec Ajustement

DAJE

Séquence

140120100806040200

2000

1000

0

-1000

Observé

Cubique

D’où la série qu’on va étudier maintenant c’est la série AJU t Graphe de la série AJU t :


84

11

.d

t t j t j tj


Δ = + + + Δ +∑

Corrélogramme de la série AJU t :

Pour vérifier si la série ajustée AJU t ne nécessite pas une différenciation (ne possède pas de racine unitaire), nous appliquons une deuxième fois le teste de Dickey-Fuller (mais cette fois sur la série ajustée AJU t) les résultats sont tels que:

Etape (1) : Model 4 : Test sur la tendance :


85

11

.d

t t j t j tj


Δ = + + Δ +∑


Nous testons alors la présence d’une tendance dans le processus en testant la nullité du coefficient de la tendanceβ . Le résultat de l’affichage pour la série AJU t est donné dans le tableau suivant:

On remarque que la t- statistique de la tendance = -0.0388 est inférieure aux valeurs critiques 3.53 et 2.79 et 2.73 (données par la table de Dickey- Fuller) pour les seuils 1%, 5%,10% On le confirme par la prob = 0.9691 supérieure à 0.05. Donc la tendance n’est pas significativement différente de zéro, on passe alors à l’étape (2)

Etape (2) : Model 5 : Test sur la constante


Nous testons la présence d’une constante dans le processus en testant la nullité du coefficient de la constante. Le résultat de l’affichage pour la série AJU t est donné dans le tableau suivant:

On remarque que la t-statistique de la constante (c) = 0.000922 est inférieure aux valeurs critiques 3.22 et 2.54 et 2.17 (données par la table de Dickey- Fuller) pour les seuils 1% , 5% et 10% On le confirme par prob = 0.9993 supérieure à 0.05. Donc la constante n’est pas significativement différente de zéro, on passe alors à l’étape (3)

Etape (3) : Model 6: Test de la racine unitaire :

1

1.

d

t t j t j tj


Δ = + Δ +∑


86

Avec tε est un processus stationnaire.

Nous testons alors la présence d’une racine unitaire dans le processus en testant la nullité du paramètre Φ à l’aide d’une statistique de Student

Φ̂t , où Φ̂ désigne l’estimateur des moindres carrés

ordinaires (MCO). Le résultat de l’affichage pour la série AJU t est donné dans le tableau suivant.

La statistique de Student

Φ̂t = - 7.858 est inférieure aux valeurs critiques -2.584, -1.943 et

-1.614 (données par la table de Dickey- Fuller) pour les seuils 1%, 5% et 10% d’où la série ne possède pas de racine unitaire (on rejette l’hypothèse nulle “ 0φ = “). La série AJU t est donc stationnaire. Il convient à présent d’estimer le modèle susceptible de la représenter, en observant les corrélogrammes simple et partiel de la série stationnaire AJU t, nous remarquons que la fonction d’autocorrélation simple (AC) possède des valeurs importantes aux retards q=1,12,… , et que la fonction d’autocorrélation partielle (PAC) possède des valeurs importantes aux retards p=1, 2 ,12,… par conséquent nous avons plusieurs modèles candidats parmi lesquels nous avons sélectionné le modèle :

Sarima (1.1.0)(1.1.1)


Nous remarquons que tous les paramètres du modèle sont significativement différents de zéro. En effet les rapports des coefficients du modèle sont en valeurs absolues supérieures à 1.96, ce qui est confirmé par la probabilité de nullité des coefficients qui sont tous inférieures à 0.05.


87

Tests sur les résidus : Test de validation des paramètres:




constatons que le model estimé ajuste mieux la série DAJN.

Corrélogrammes simple et partiel des résidus :


88

L’analyse du corrélogramme des résidus, montre que tous les termes sont à l’intérieur de

l’intervalle de confiance (illustré par des pointillés sur le graphique). Ce qui nous entraîne à dire que les résidus forment un bruit blanc.

Test de point de retournement : 0H : « Les iε forment un bruit blanc » contre

1H : « Les iε ne forment pas un bruit blanc tel que : i = n,1 » Après les calculs à l’aide du logiciel MATLAB nous avons obtenu les résultats suivants Nombre de points de retournements p = 75 Espérance de la stat du test E (p) = 70 Variance de la statistique du test VAR(p) = 19 La statistique du teste est T= 1.2 T = 1.2 est inférieure à 1.96 (tabulée) d’où on accepte l’hypothèse 0H : « Les iε

forment un bruit blanc » au seuil de 0,05

Test de Box – Ljung : Nous avons à tester l’hypothèse nulle :

0H : « Les autocorrélations jusqu’au pas k, (k=N/4) ne sont pas significatives » C'est-à-dire H 0 : « 0...21 ==== Kρρρ » Contre 1H : « 45,,1: …=∃ jjρ tel que 0≠jρ ».


+=K

k

k

knnnQ

1

2

)1(γ

.


89


La probabilité de la statistique de Box-Ljung est supérieure à 0,05 à n’importe quel retard et la valeur de la statistique de Box-Ljung quand k = 30, p = 2 , q = 1 est égale à 16.422, inférieure à 2

95.,0χ (27) = 40.11. Nous concluons alors que les erreurs ne sont pas corrélées.

Test de Durbin-Watson : (Test de détection d’autocorrélation d’ordre1 des erreurs) : Nous testons H 0 : « 0=ρ » contre 1H : « 0≠ρ ». La statistique de Durbin-Watson (DW=2.058 2≈ ) nous constatons que les résidus



-t Test de Skewness (asymétrie) et de Kurtosis (aplatissement) :


⎪⎨

⎧

≠≠

==

00:

00:

211

210

γγ

γγ

ouH

etH

Test de Skewness :

N6

0211

1−

=β

γ

Test de Kurtosis :

N24

322

−=β

γ

où : 232

3211 μ


22

42 μ

μβ = : est le coefficient de Kurtosis (le degré d’aplatissement de la loi des résidus).

Sous l’hypothèse H 0 et si le nombre d’observations est assez grand (N >30), nous avons :

232

3211 μ

μβ = ( )16,0 ⎟⎟

⎠

⎞⎜⎜⎝

⎛→℘

∞→ NN

N

22

42 μ

μβ = ( )224,0 ⎟⎟

⎠

⎞⎜⎜⎝

⎛→℘

∞→ NN

N



90


1

0 0.019704 00.0835<1.96.

6 6N 108

β + +γ = = = Donc :

On accepte l’hypothèse nulle 0H (aplatissement Normal)


3 2.448338 31,170 1.96.

24 24N 108

β − −γ = = = ≺ Donc :

On accepte l’hypothèse nulle 0H (asymétrie) Nous acceptons l’hypothèse de normalité en ce qui concerne la symétrie et l’aplatissement

de la distribution ( 21 γγ et sont inférieurs à 1,96), Ce qui est confirmé par la statistique de

Jarque et Bera.


La statistique de Jarque et Bera noté (S) est égale à 1.376 ; elle est inférieure à la valeur

99,5)2(295,0 =χ d’où les résidus sont gaussiens.

Test effet ARCH :


91

L’analyse du corrélogramme des résidus carrés, montre que tous les termes sont à l’intérieur de l’intervalle de confiance, ce qui nous entraîne à dire que pas d’effet ARCH.

Conclusion : Nous pouvons conclure d’après ces tests que le modèle qui ajuste le mieux la série est : Sarima (1.1.0)(1.1.1)qui s’écrit sous la forme suivante : .)891910.01()1)(1()329961.01)(395849.01( 121212

tt BJAEBBBB ξ+=−−−−

Prévision : Les prévisions sont calculées pour la période allant de janvier 2006 à Décembre 2006


92

Diagramme séquentiel de la série brute JAE et des prévisions

prévision JAE

Janvier 2006 4124.58408

Février 2006 4132.7257

Mars 2006 4570.19352

Avril 2006 4394.5555

Mai 2006 4566.20834

Juin 2006 4829.54963

Juillet 2006 5752.69921

Août 2006 5815.18974

Septembre 2006 5780.73036

Octobre 2006 5440.57075

Novembre2006 5456.10994

décembre2006 5383.597

Remarque : Les quantités de carburants sont en milliers de tonnes

Analyse de la série vente de carburant


93

Fuel-oil secteur Marine Nationale :


une série chronologique et de chercher à la modéliser, il convient d’étudier quelques

caractéristiques stochastiques en particulier sa moyenne et sa variance.

Notation : Nous notons la série vente de carburant Fuel-oil secteur National FN.

Identification

Les données de la série des ventes de carburant Fuel-oil (notée : FN) sur une période de

dix ans, les observations sont mensuelles ; de janvier 1995 à décembre 2005. L'unité de

mesure est le millier de tonnes.

Diagramme séquentiel de la série brute FN :

Cette série exhibe une faible tendance avec des fluctuations plus aux moins régulières Graphe de la moyenne et la variance de la série brute FN :

moyenne

0

5000

10000

15000

20000

25000

30000

1 2 3 4 5 6 7 8 9 1 11

moyenne

variance

0

20000000

40000000

60000000

80000000

100000000

120000000

1 3 5 7 9 11

variance

D’après les deux graphes précédents, on remarque que la moyenne et la variance varient au cours du temps. On peut donc dire que cette série semble non stationnaire.


94

Pour vérifier ceci, on va appliquer des tests statistiques juste après la présentation des corrélogrammes simple et partiel de la série brute.

Corrélogramme de la série brute FN :

D'après le corrélogramme simple de la série on remarque que les pics aux retards 1,…,9sont à l'extérieur de la bande de confiance et les autocorrélations prennent une allure décroissante. Le corrélogramme partiel est marqué par des pics significatif au retard 1et 2 .

Alors d’après l’analyse graphique on peut dire que la série FN semble non stationnaire

Test de FISHER: Pour détecter la saisonnalité de la série on a fait appel à l’analyse de la variance

(ANOVA) à deux facteurs sans répétition. Table de l’ANOVA (à 2 facteurs) données par logiciel SPSS :


Somme des carrés

Degré de liberté

Moyenne des carrés F Probabilité


F Lignes 280910554 11 25537323.1 2.75775868 0.00340777 1.87673166 Colonnes 1958479112 10 195847911 21.1494868 2.1327E-21 1.9178259 Erreur 1018619056 110 9260173.23 Total 3258008722 131

Test d’influence de facteur ligne (mois) : Fstat= 2.7577 > Fthéo= 1.8767 donc (on rejette l’hypothèse nulle) la série est affectée d’une

saisonnalité Test d’influence de facteur colonne (années) : Fstat= 21.1494 > Fthéo= 1.9178 donc (on rejette l’hypothèse nulle) la série est peut être



95

Afin de traiter l’effet de saisonnalité sur notre série ou encore la stationnariser, nous lui

avons appliqué la différence saisonnière d’ordre 12.

Notation : Nous notons la série FN désaisonnalisé par DFN. Graphe de la série DFN :

Corrélogramme de la série DFN:

En observant le graphe de la série DFN sa moyenne est presque satable au cours du temps il semble que la série soit stationnaire en moyenne, ainsi Nous remarquons que la fonction d’autocorrélation simple de la série DFN diminue rapidement, nous pouvons donc dire que cette série semble stationnaire. Pour confirmer ou infirmer cette hypothèse nous appliquons le test de Dickey-Fuller Augmenter qui nécessite tout d’abord de sélectionner le nombre de retard p qui minimise le critère d’Akaike.

Test de Dickey- Fuller Augmenté:


96

On procède à l’estimation par la méthode des moindres carrées avec d=1 des trois modèles [4], [5] et [6] de Dickey-Fuller sur la série DFN.

Remarque On choisit le retard d=1 qui minimise le critères d’informations d’Akaike et de Schwarz Etape (1) : Modèle 4 : Test sur la tendance :


Nous testons alors la présence d’une tendance dans le processus en testant la nullité du coefficient de la tendanceβ . Le résultat est donné dans le tableau suivant:

On remarque que la t- statistique de la tendance =2.79814 est inférieure à 3.53 pour le seuil 1% mais supérieur aux valeurs 2.79 et 2.73 au seuils 5% et 10% (données par la table de Dickey- Fuller) .On le confirme ça par prob = 0.006 est inférieure 0.05. la tendance n’est pas significativement différente de zéro ,de plus :

La statistique de StudentΦ̂

t = -4.991788 est inférieure aux valeurs critiques -4.037, -3.448 et -3.149 (données par la table de Dickey- Fuller) pour les seuils 1%, 5% et 10%

D’où la série ne possède pas de racine unitaire (on rejette l’hypothèse nulle “ 0φ = “) donc non stationnarité de type TS on confirme ça par la prob = 0.0058 est inférieure à 0.05).

La série DFE est non stationnaire de type TS Donc pour stationnariser cette série il faut faire un ajustement. Le meilleur ajustement du processus est l’ajustement cubique car R 2 associé égale 0,362

est le plus grand D’après les résultats obtenus par le logiciel SPSS : Dependent Mth Rsq d.f. F Sigf b0 b1 b2 b3 DFN LIN .156 118 21.80 .000 -2278.10 53.2261 DFN LOG .066 118 8.34 .005 -3968.20 1287.08 DFN INV .000 118 7.7E-03 .930 957.75 -349.24 DFN QUA .190 117 13.68 .000 -315.26 -43.305 .7978DFN CUB .192 116 9.18 .000 307.93 -103.86 2.0437 -.0069

Tableau (1)

La série FN après désaisonnalisation peut être ajustée par une forme cubique Estimation de la tendance cubique :

11

.d

t t j t j tj


Δ = + + + Δ +∑


97

Estimons l’équation d’ajustement ty qui est donnée par la formule suivante : 3

32

210 tbtbtbbyt ⋅+⋅+⋅+= , les cœfficients b 0 , b1 , b 2 et b 3 sont données par le

Tableau (1)

Notation : Nous notons la série ajustée par AD t elle est donnée par la formule :

AD t = t tDFN y− .

Diagramme séquentiel de la série DFN avec Ajustement

DFN

Séquence

140120100806040200

20000

10000

0

-10000

Observé

Cubique

Nous devons rétablir le Test de Dickey-Fuller sur la série DFN ajustée c'est-à-dire AD t :

Etape (3) : Modèle 6: Test de la racine unitaire :

11

.d

t t j t j tj


Δ = + Δ +∑ Avec tε est un processus stationnaire.

Nous testons alors la présence d’une racine unitaire dans le processus en testant la nullité

du paramètre Φ à l’aide d’une statistique de StudentΦ̂

t , où Φ̂ désigne l’estimateur des moindres carrés ordinaires (MCO). Le résultat de l’affichage pour la série AD t est donné dans le tableau suivant:


98


t = - 5.0515 est inférieure aux valeurs critiques -2.584, -1.943 et -1.614 (données par la table de Dickey- Fuller) pour les seuils 1%, 5% et 10% d’où la série ne possède pas de racine unitaire (on rejette l’hypothèse nulle “ 0φ = “). La série AD t est donc stationnaire.

Il convient à présent d’estimer le modèle susceptible de la représenter. Corrélogramme de la série AD t :

En observant les corrélogrammes simple et partiel de la série stationnaire AD t, nous remarquons que la fonction d’autocorrélation simple (AC) possède des valeurs importantes aux retards q=1,12,3,7,… , et que la fonction d’autocorrélation partielle (PAC) possède des valeurs importantes aux retards p=1, 2,7,12,… par conséquent nous avons plusieurs modèles candidats parmi lesquels nous avons sélectionné le modèle :

SARIMA (2.1.0)(0.1.1).


Nous remarquons que tous les paramètres du modèle sont significativement différents de zéro. En effet les rapports des coefficients du modèle sont en valeurs absolues supérieures à 1.96, ce

qui est confirmé par la probabilité de nullité des coefficients qui sont tous inférieures à 0.05. Tests sur les résidus :


99

Test de validation des paramètres: De la représentation graphique des inverses des racines des polynômes de retards

moyenne mobile et autorégressif nous constatons qu’ils sont tous supérieures à 1 en module (leurs inverses sont en module, inférieures à 1).



constatons que le modèle estimé ajuste mieux la série AD. Corrélogrammes simple et partiel des résidus :


100

L’analyse du corrélogramme des résidus, montre que tous les termes sont à l’intérieur de

l’intervalle de confiance (illustré par des pointillés sur le graphique). Ce qui nous entraîne à

dire que les résidus forment un bruit blanc.



1H : « Les iε ne forment pas un bruit blanc » Après les calculs à l’aide du logiciel MATLAB nous avons obtenu les résultats suivants Nombre de points de retournements p = 76 Espérance de la statistique du test E (p) = 73 Variance de la statistique du test VAR(p) = 20 La statistique du test est T= 0.6 T = 0.6 est inférieure à 1.96 (tabulée) d’où on accepte l’hypothèse 0H : « Les iε






+=K

k

k

knnnQ

1

2

)1(γ

.



101

La probabilité de la statistique de Box-Ljung est supérieure à 0,05 à n’importe quel retard et la valeur de la statistique de Box-Ljung quand k = 30, p = 2 , q = 1 est égale à 20.473, inférieure à 2

95.,0χ (27) = 40.11 Nous concluons alors que les erreurs ne sont pas corrélées.





Test de Skewness (asymétrie) et de Kurtosis (aplatissement) :


⎪⎨

⎧

≠≠

==

00:

00:

211

210

γγ

γγ

ouH

etH

Test de Skewness :

N6

0211

1−

=β

γ

Test de Kurtosis :

N24

322

−=β

γ

où : 232

3211 μ


2

2

42 μ

μβ = : est le coefficient de Kurtosis (le degré d’aplatissement de la loi des

résidus). Sous l’hypothèse H 0 et si le nombre d’observations est assez grand (N >30), nous avons :

232

3211 μ

μβ = ( )16,0 ⎟⎟

⎠

⎞⎜⎜⎝

⎛→℘

∞→ NN

N

22

42 μ

μβ = ( )224,0 ⎟⎟

⎠

⎞⎜⎜⎝

⎛→℘

∞→ NN

N


102


Test de skewness : 1g =

1/ 21 0

6

b

N

+=

11360805861.0 +

= 3,497>1.96 donc :

On rejette l’hypothèse nulle 0H (aplatissement Normal)

Test de Kurtosis : 2g = 2 324

b

N

−=

5.793996 324 113

−= 6,062>1.96 donc :

On rejette l’hypothèse nulle 0H (asymétrie) Alors : les résidus ne sont pas gaussiens. Ce qui est confirmé par le test de Jaque-Bera


la statistique de Jaque Bera=48.98>5.911.Donc : on rejette l’hypothèse nulle 0H (normalité)

noté (S) est égale à 48.98 ; elle est supérieure à la valeur 99,5)2(295,0 =χ d’où les résidus ne

sont pas gaussiens.

. Conclusion : Nous pouvons conclure d’après ces tests que le modèle qui ajuste le mieux la série est : SARIMA (2.1.0)(0.1.1)qui s’écrit sous la forme suivante :

tt BFNBBBB ξ)888587.01)1)(1)(195202.0203857.01( 12127 +=−−+− Prévision : Les prévisions sont calculées pour la période allant de janvier 2006 à Décembre 2006 Diagramme séquentiel de la série brute FN et des prévisions



Juillet 2006 33999,8893 Août 2006 33501,7876




103

Analyse de la série vente de carburant Fuel-oil secteur Marine Etrangère :


une série chronologique et de chercher à la modéliser, il convient d’étudier ces

caractéristiques stochastiques c'est-à-dire sa moyenne et sa variance.

Notation : Nous notons la série vente de carburant jet A1 secteur aviation étrangère FE.

Identification

Les données de la série des ventes de carburant fuol-oil etranger (notée : FE ) sur une

période de dix ans, les observations sont mensuelles ; de janvier 1995 à décembre

2005.L'unité de mesure est en milliers de tonnes.

Diagramme séquentiel de la série brute FE :

Graphe de la moyenne et la variance de la série brute FE :

moyenne

0

1000

2000

3000

4000

5000

6000

1 2 3 4 5 6 7 8 9 10 11

moyenne

variance

0

2000000

4000000

6000000

8000000

10000000

12000000

1 3 5 7 9 11

variance


104

D’après les deux graphes précédents, on remarque que la moyenne et la variance varient

au cours du temps. On peut donc dire que cette série semble non stationnaire..

Pour vérifier ceci, on va appliquer des tests statistiques juste après la présentation des corrélogrammes simple et partiel de la série brute

Corrélogramme de la série FE:

D'après le corrélogramme simple de la série on remarque que les pics aux retards 1,…,7,10,..,13 sont à l'extérieur de la bande de confiance et les autocorrélations prennent une allure décroissante. Le corrélogramme partiel est marqué par des pics significatif au retard 1,2,5,9,11et 19.

En effet, la fonction d’autocorrélation simple estimée (colonne AC) ne décroît pas de manière rapide vers zéro .

Test de FISHER: Pour détecter la saisonnalité de la série on a fait appel à l’analyse de variance (ANOVA) à deux facteurs sans répétition


105

Table de l’ANOVA (à 2 facteurs) données par logiciel SPSS:


Somme des carrés

Degré de liberté

Moyenne des carrés F

Probabilité


F

Lignes 38868993.4 4 3533544.85 1.33826868 0,21320

372 1,87673166

Colonnes 261316593 10 261316593 9.89691168 1,1668E

-11 1,9178259Erreur 290442374 110 2640385.22 Total 590627961 131

Test d’influence de facteur ligne (mois) : Fstat= 1.33826< Fthéo= 1.8767 donc (on accepte l’hypothèse nulle) la série n’est pas

affectée d’une saisonnalité Test d’influence de facteur colonne (années) : Fstat= 9.89691 > Fthéo= 1.9178 donc (on rejette l’hypothèse nulle) la série est peut être


En observant le graphe ainsi que le corrélogramme de la série FE, nous remarquons que la

série semble non stationnaire .Un recours au test de racine unitaire permet d’affirmer ou

d’infirmer la stationnarité de la série en question.

Test de Dickey- Fuller Augmenté: on procède à l’estimation par la méthode des moindres carrées avec d=1 des trois modèles

[4], [5] et [6] de Dickey-Fuller sur la série FE (car les résidus forment un bruit blanc

Remarque On choisit le retard d=1 qui minimise le critères d’informations d’Akaike et Schwarz


106

Etape (1) : Modèle 4 : Test sur la tendance :


coefficient de la tendanceβ , Le résultat de l’affichage pour la série FE est donné dans le

tableau suivant:

On remarque que la t- statistique de la tendance =2.931002 est supérieure à 2.79 et 2.73

au seuils 5% et 10% (données par la table de Dickey- Fuller) .On le confirme par probabilité (prob = 0.004 est inférieure 0.05. La tendance est significativement différente de zéro.Alors d’après le même tableau on remarque que :


t = -8.931532 est inférieure aux valeurs critiques -4.0303, -3.4445 et -3.31468 (données par la table de Dickey- Fuller) pour les seuils 1%, 5% et 10%

D’où la série ne possède pas de racine unitaire (on rejette l’hypothèse nulle “ 0φ = “) donc non stationnarité de type TS .

la série FE est non stationnaire de type TS Donc pour stationnariser cette série il faut faire un ajustement. Le meilleur ajustement du processus est l’ajustement cubique car R 2 associé égale 0,362

est le plus grand d’après les résultats obtenus par le logiciel SPSS :

La série FE peut être ajustée par une forme linéaire. Estimation de la tendance linéaire : Estimons l’équation d’ajustement ty qui est donnée par la formule suivante :

tbbyt ⋅+= 10 .

11

.d

t t j t j tj


Δ = + + + Δ +∑


107

Notation : Nous notons la série ajustée par AJU t elle est donnée par la formule :

AJU t = FEt - yt .

D’où la série qu’on va étudier maintenant c’est la série AJU t Graphe de la série AJU t :

Corrélogramme de la série AJU t :


108

Un recours au test de racine unitaire permet d’affirmer ou d’infirmer la stationnarité de la série en question.

Etape (1) : Modèle 4 : Test sur la tendance :


coefficient de la tendanceβ . Le résultat de l’affichage pour la série AJU t est donné dans le

tableau suivant:

On remarque que la t- statistique de la tendance = 0.284562 est inférieure aux valeurs critiques 3.53 et 2.79 et 2.73 (données par la table de Dickey- Fuller) pour les seuils 1%, 5%,10% On le confirme par la prob = 0.7764 supérieure à 0.05. Donc la tendance n’est pas significativement différente de zéro, on passe alors à l’étape (2)

Etape (2) : Modèle 5 : Test sur la constante


Nous testons la présence d’une constante dans le processus en testant la nullité du coefficient de la constante. Le résultat de l’affichage pour la série AJU t est donné dans le tableau suivant:

11

.d

t t j t j tj


Δ = + + + Δ +∑

11

.d

t t j t j tj


Δ = + + Δ +∑


109

On remarque que la t-statistique de la constante (c) = 0.125585 est inférieure aux valeurs

critiques 3.22 et 2.54 et 2.17 (données par la table de Dickey- Fuller) pour les seuils 1% , 5% et 10% On le confirme par prob = 0.9003 supérieure à 0.05. Donc la constante n’est pas significativement différente de zéro, on passe alors à l’étape (3) Etape (3) : Modèle 6: Test de la racine unitaire :

11

.d

t t j t j tj


Δ = + Δ +∑ Avec tε est un processus stationnaire.

Nous testons alors la présence d’une racine unitaire dans le processus en testant la nullité du

paramètre Φ à l’aide d’une statistique de StudentΦ̂

t , où Φ̂ désigne l’estimateur des moindres carrés ordinaires (MCO). Le résultat de l’affichage pour la série AJU t est donné dans le tableau suivant.

La statistique de Student

Φ̂t = - 19.24054 est inférieure aux valeurs critiques -2.584, -

1.943 et -1.614 (données par la table de Dickey- Fuller) pour les seuils 1%, 5% et 10% d’où la série ne possède pas de racine unitaire (on rejette l’hypothèse nulle “ 0φ = “). La série AJU t est donc stationnaire. Il convient à présent d’estimer le modèle susceptible de la représenter, en observant les corrélogrammes simple et partiel de la série stationnaire AJU t, nous remarquons que la fonction d’autocorrélation simple (AC) possède des valeurs importantes aux retards q=1,12,… , et que la fonction d’autocorrélation partielle (PAC) possède des valeurs importantes aux retards p=1, 2 ,12,… par conséquent nous avons plusieurs modèles candidats parmi lesquels nous avons sélectionné le modèle : ARIMA (3.1.3)

Estimation des paramètres de modèle :


110

Nous remarquons que tous les paramètres du modèle sont significativement différents de zéro.

En effet les rapports des coefficients du modèle sont en valeurs absolues supérieures à 1.96, ce qui est confirmé par la probabilité de nullité des coefficients qui sont tous inférieures à 0.05.

Tests sur les résidus :

Test de validation des paramètres:



A partir de la représentation graphique des séries résiduelle, actuelles et estimée nous

constatons que le model estimé ajuste mieux la série FE.


111

Corrélogrammes simple et partiel des résidus :

L’analyse du corrélogramme des résidus, montre que tous les termes sont à l’intérieur de l’intervalle de confiance (illustré par des pointillés sur le graphique). Ce qui nous entraîne à dire que les résidus forment un bruit blanc.



1H : « Les iε ne forment pas un bruit blanc tel que : i = n,1 » Après les calculs à l’aide du logiciel MATLAB nous avons obtenu les résultats suivants Nombre de points de retournements p = 85 Espérance de la statistique du test E (p) = 74 Variance de la statistique du test VAR(p) = 30 La statistique du test est T= 1.2 T = 1.8 est inférieure à 1.96 (tabulée) d’où on accepte l’hypothèse 0H : « Les iε






+=K

k

k

knnnQ

1

2

)1(γ

.



112

La probabilité de la statistique de Box-Ljung est supérieure à 0,05 à n’importe quel retard et la valeur de la statistique de Box-Ljung quand k = 33, p = 3 , q = 3 est égale à 18.846 inférieure à 2

95.,0χ (27) = 40.11 Nous concluons alors que les erreurs ne sont pas orrélées.





-t Test de Skewness (asymétrie) et de Kurtosis (aplatissement) :


⎪⎨

⎧

≠≠

==

00:

00:

211

210

γγ

γγ

ouH

etH

Test de Skewness :

N6

0211

1−

=β

γ

Test de Kurtosis :

N24

322

−=β

γ

où : 232

3211 μ


2

2

42 μ

μβ = : est le coefficient de Kurtosis (le degré d’aplatissement de la loi des résidus).

Sous l’hypothèse H 0 et si le nombre d’observations est assez grand (N >30), nous avons :

232

3211 μ

μβ = ( )16,0 ⎟⎟

⎠

⎞⎜⎜⎝

⎛→℘

∞→ NN

N

22

42 μ

μβ = ( )224,0 ⎟⎟

⎠

⎞⎜⎜⎝

⎛→℘

∞→ NN

N


113



1

0 0.252499 01.1385<1.96.

6 6N 1221.1385

β + +γ = = = Donc :



3 3.5277 30.7388 1.96.

24 24N 122

β − −γ = = = ≺ Donc :

On accepte l’hypothèse nulle 0H (asymétrie) Nous acceptons l’hypothèse de normalité en ce qui concerne la symétrie et l’aplatissement de la

distribution ( 21 γγ et sont inférieurs à 1,96), Ce qui est confirmé par la statistique de Jarque et Bera.


La statistique de Jarque et Bera noté (S) est égale à 2.401 ; elle est inférieure à la valeur

99,5)2(295,0 =χ d’où les résidus sont gaussiens.

Conclusion : Nous pouvons conclure d’après ces tests que le modèle qui ajuste le mieux la série est : ARIMA (3.1.3) qui s’écrit sous la forme suivante :

2 10 3

10 15

(1 0.236236 0.326708 0.177887 )(1 )

(1 0.23255 0.430185 0.36597 )t

t

B B B B FE

B B B ε

− − − − =

− + +

Prévision : Les prévisions sont calculées pour la période allant de janvier 2006 à Décembre 2006 Diagramme séquentiel de la série brute JAE et des prévisions

prévision JAE

Janvier 2006 4124.58408

Février 2006 4132.7257

Mars 2006 4570.19352

Avril 2006 4394.5555

Mai 2006 4566.20834

Juin 2006 4829.54963

Juillet 2006 5752.69921

Août 2006 5815.18974

Septembre 2006 5780.73036

Octobre 2006 5440.57075

Novembre2006 5456.10994

décembre2006 5383.597


Application ARFIMA

Application ARFIMA

114

Les corrélogrammes des quatre séries

Test de mémoire longue : On cherche à tester l’hypothèse :

⎢⎣⎡

⎥⎦⎤−∈

21,

21d:"H0 Existence d’une mémoire longue"

⎢⎣⎡

⎥⎦⎤−∉

21,

21d:"H1 Absence de mémoire longue"

Mais auparavant, il est impératif d’estimer le paramètre d’intégration fractionnaire d.

JAI JAE

FE FN

Application ARFIMA

115

Estimation de d : Pour la détermination de l’ordre d’intégration fractionnaire d, on a utilisé la méthode

d’estimation en deux étapes (analyse R/S) basée sur l’exposant de HURST. Pour cela, on a

élaboré un programme informatique.

Résultats du test :

Pour la série JAN : d= 0.0398.

Pour la série JAE: d= 0.0541.

Pour la série FE : d= 0.2396.

Pour la série FN : d=0.0452.

Les résultats du test confirment l’existence d’une mémoire longue pour la série FE et son absence pour les autres séries.

Etude de la série FE :

Estimation et modélisation de la série FE :

Modèle AIC -2LOG(likelihood) ARFIMA (2, 0.2396,2) 0.235790 E +04 0.234790 E +04 ARFIMA (2, 0.2396, 4) 0.236115 E +04 0.234715 E +04

ARMA Model: (1-B)^.2396 X(t) = .0000 X(t-1) + .1000 X(t-2) + Z(t) + .0000 Z(t-1) + .0000 Z(t-2)

Corrélogrammes des résidus:

Application ARFIMA

116

Tests sur les résidus :

Test des points de retournement On a à tester l’hypothèse nulle :

H0 : « les εi ne sont pas corrélés entre eux »

Contre H1 : « Il existe une corrélation entre les εi i =1,n ».

Turning points = 84.000~AN (86.667, sd = 4.8109), p-value = .57937>0.05.

On accepte alors H0.

Test de Box-Lung Le Corrélogramme des résidus du modèle montre que les résidus semblent former un

bruit blanc puisque tous les termes ne sont pas significativement différents de zéro. Nous remarquons aussi que la statistique de Box-Ljung est inférieure à la valeur théorique au seuil 5%

Test de normalité :

Application ARFIMA

117

- Test de skewness : 1g =

n

b

6

02/11 + =

11360805861.0 +

= 1.29<1.96 donc :


- Test de kurtoisis : 2g =

n

b24

32 − =11124

3793996.5 −= 5.26>1.96 donc :

On rejette l’hypothèse nulle 0H (asymétrie) Alors : les résidus ne sont pas gaussiens. Ce qui est confirmé par le test de Jarque-Bera

- La statistique de Jraque Bera=29.64>5.911.Donc : on rejette l’hypothèse nulle 0H (normalité) Conclusion : D’après les tests précédent on conclut que les résidus forme un bruit blanc non

gaussien.

Test d’homoscédasticité (ARCH) : D’après le corrélogramme des résidus au carré il n’existe pas de pic significativement

différent de zéro et donc pas d’effet ARCH

Prévision :

Année et mois Prévision janv-05 873,6863 févr-05 751,9604 mars-05 666,4125 avr-05 562,8928 mai-05 459,5315 juin-05 350,8888 juil-05 238,5849 août-05 122,21 sept-05 1,5543 oct-05 288,098 nov-05 107,0413 déc-05 -387,0356

Remarques : Les quantités de carburants sont en milliers de tonnes. La dernière prévision c'est à dire celle de mois de décembre 2005 est négative ce qui

nous pousse a dire plus que l'horizon de prévision s'élargit plus la modélisation ARFIMA(dans notre cas) ne donne pas des bonne prévisions.

Application VAR

Application VAR

119

La modélisation VAR sous le logiciel Eviews:

On dispose de 04 séries stationnaires (jae, jan, fe, fn) on travaille sur la période allant de

janvier 1996 à décembre 2005. Les processus ( itY i = 1,4) étant stationnaires, il est possible de modéliser la série

chronologique multivariée tY par un processus VAR. Nous avons, K = 4 et T = 120

(T nombre d’observations de la série itY i = 1,4)

Notation: Jae: Carburant JET A1 secteur aviation région étrangère Jan: Carburant JET A1 secteur aviation région nationale Fe : Carburant fuel-oil secteur marine région étrangère Fn: Carburant fuel-oil secteur marine région nationale Les séries stationnaires sont représentées par les graphes suivants:

Application VAR

120

Estimation du VAR: La première étape consiste à déterminer l’ordre p du processus VAR à retenir, à cette fin

nous avons estimé pour commencer divers processus VAR pour des ordres de retards p allant de 1 à 12, nous devons donc retenir celui dont les critères de Akaike (AIC) et de Schwarz (SC) sont les plus petits.

Nous estimons divers modèles VAR pour p=1 à 12 après plusieurs essais nous avons

retenu un retard p=12. Les critères d'information d'AKAIKE (AIC) de SCHWARZ (SC) et de Hannan-Quinn sont donnés par:

avec

=déterminant de la matrice variance- covariance tel que:

AIC= 70.189 SC=74.957

RESIDFE RESIDFN RESIDJAE RESIDJAN RESIDFE 909829.8 -132962.5 9300.141 -59992.79 RESIDFN -132962.5 6941278. -124212.4 161394.3

RESIDJAE 9300.141 -124212.4 76397.21 58720.83 RESIDJAN -59992.79 161394.3 58720.83 3976582.

Log –vraisemblance, les critères d'information d'Akaike (AIC) et Schwarz (SC)

Application VAR

121

Mais lorsque nous avons estimé les paramètres du modèle VAR(12) avec constante nous

avons remarqué que la t-statistique de la constante est inférieure à 1,96 ; donc la constante n'est pas significative.

⎥⎥⎥⎥

⎦

⎤

⎢⎢⎢⎢

⎣

⎡

+

⎥⎥⎥⎥⎥

⎦

⎤

⎢⎢⎢⎢⎢

⎣

⎡

⎥⎥⎥⎥⎥⎥

⎦

⎤

⎢⎢⎢⎢⎢⎢

⎣

⎡

+

⎥⎥⎥⎥⎥

⎦

⎤

⎢⎢⎢⎢⎢

⎣

⎡

=

⎥⎥⎥⎥

⎦

⎤

⎢⎢⎢⎢

⎣

⎡

=

++=

−

−

−

−

=

−=

∑

∑

t

t

t

t

pt

pt

pt

pt

pppp

pppp

pppp

pppp

p

t

t

t

t

t

tptp

pt

y

y

y

y

aaaa

aaaa

aaaa

aaaa

a

a

a

a

yyyy

Y

YAAY

4

3

2

1

4

3

2

1

44

34

24

14

43

33

23

13

42

32

22

12

41

31

21

11

12

1

04

03

02

01

4

3

2

1

12

10

εεεε

ε

Où A

⎥⎥⎥⎥⎥

⎦

⎤

⎢⎢⎢⎢⎢

⎣

⎡

=

04

03

02

01

0

a

a

a

a

représente l’estimation de la constante et les A p (p =1,...,12) sont des

matrices carrés d’ordre 4 tel que A p les jpia (i,j =1,4) représentent les coefficients

estimés; tt et 21 εε et t3ε et t4ε sont des bruits blancs. Tableau :

Application VAR

122

Application VAR

123

Présentation des résultats: 1érepartie du tableau: résultat de l'estimation Chaque colonne correspond à une équation du modèle VAR, Eviews reporte sur chaque

coefficient estimé son écart-type estimé entre parenthèses et la t-statistique entre crochets 2émepartie du tableau: statistiques associés à une régression MCO standard calculée

équation par équation (i.e. calculées à partir des résidus estimés de chaque équation) 3émepartie du tableau: statistique associée à une régression MCO standard calculée pour

le modèle VAR dans son ensemble

Application VAR

124

La première colonne donne les résultats d'estimation de la première équation (variable fe) La deuxième colonne donne les résultats d'estimation de la deuxième équation (variable fn)

La troisième colonne donne les résultats d'estimation de la troisième équation (variable jae)

La quatrième colonne donne les résultats d'estimation de la quatrième équation (variable jan) donc le VAR estimé s'écrit sous la forme: FE = 0.5138865666*FE(-1) + 0.08851646244*FE(-3) - 0.1858916363*FE(-4) + 0.2129399812*FE(-5) -

0.06753771936*FE(-6) + 0.1100312394*FE(-7) - 0.1354494342*FE(-10) + 0.1950868599*FE(-11) - 0.05601552414*FE(-12) - 0.05207190108*FN(-1) + 0.1542121815*FN(-3) - 0.1297690979*FN(-4) + 0.01309840894*FN(-5) - 0.01016582916*FN(-6) + 0.02924002657*FN(-7) + 0.00940125585*FN(-10) - 0.05809671716*FN(-11) + 0.06204082923*FN(-12) - 0.2885535862*JAE(-1) + 0.7425845812*JAE(-3) - 0.9350288096*JAE(-4) + 0.72221153*JAE(-5) - 0.04131481402*JAE(-6) + 0.4142686105*JAE(-7) + 0.01165554772*JAE(-10) + 0.05390104945*JAE(-11) + 0.205440153*JAE(-12) - 0.02943791762*JAN(-1) - 0.09559081329*JAN(-3) + 0.1748064848*JAN(-4) - 0.03260088414*JAN(-5) - 0.1222785296*JAN(-6) + 0.124394713*JAN(-7) - 0.158152241*JAN(-10) + 0.07565053515*JAN(-11) + 0.01620620952*JAN(-12)

FN = 0.2668463094*FE(-1) + 0.1274586202*FE(-3) - 0.4819189698*FE(-4) - 0.6684105782*FE(-5) +

0.2832104158*FE(-6) + 0.04235964971*FE(-7) + 0.02009687886*FE(-10) + 0.1084720276*FE(-11) - 0.3711201441*FE(-12) - 0.05097990158*FN(-1) + 0.2135230552*FN(-3) + 0.07249170752*FN(-4) - 0.06210024519*FN(-5) - 0.1163635678*FN(-6) - 0.2195410591*FN(-7) - 0.02543579987*FN(-10) - 0.1135588004*FN(-11) - 0.4537274846*FN(-12) + 1.334156666*JAE(-1) + 0.091656488*JAE(-3) - 1.639224531*JAE(-4) + 1.976905728*JAE(-5) + 0.01487653128*JAE(-6) - 0.01103787487*JAE(-7) - 1.66310656*JAE(-10) - 2.291743749*JAE(-11) + 0.6929252057*JAE(-12) - 0.001800288424*JAN(-1) + 0.0577185335*JAN(-3) - 0.1837043566*JAN(-4) - 0.2096021983*JAN(-5) + 0.01093173704*JAN(-6) - 0.1094409864*JAN(-7) + 0.3506146091*JAN(-10) - 0.1775124355*JAN(-11) - 0.2198517455*JAN(-12)

JAE = - 0.01882273148*FE(-1) + 0.01567360967*FE(-3) + 0.01650562139*FE(-4) +

0.06332678143*FE(-5) - 0.02649027611*FE(-6) - 0.00585109903*FE(-7) + 0.01045516186*FE(-10) - 0.01257219655*FE(-11) - 0.01896288183*FE(-12) + 0.01931064853*FN(-1) + 0.006718999501*FN(-3) - 0.005604280877*FN(-4) - 0.002959298683*FN(-5) - 0.001118438836*FN(-6) - 0.00592425837*FN(-7) - 0.004680914032*FN(-10) + 0.001101445776*FN(-11) + 0.0209835476*FN(-12) + 0.3164288494*JAE(-1) + 0.02522073334*JAE(-3) - 0.08550745803*JAE(-4) - 0.02773427551*JAE(-5) + 0.07195401881*JAE(-6) - 0.009741058023*JAE(-7) - 0.2067551668*JAE(-10) + 0.1278039929*JAE(-11) - 0.2127460731*JAE(-12) - 0.03440147237*JAN(-1) + 0.01834208186*JAN(-3) - 0.01254105344*JAN(-4) - 0.002707723161*JAN(-5) + 0.003854667483*JAN(-6) + 0.04109508282*JAN(-7) - 0.01365410628*JAN(-10) - 0.02116113552*JAN(-11) + 0.03479601759*JAN(-12)

JAN = - 0.1399375945*FE(-1) - 0.005335446463*FE(-3) - 0.06008855141*FE(-4) +

0.1013908291*FE(-5) - 0.2529872799*FE(-6) - 0.07732883534*FE(-7) - 0.01190880795*FE(-10) - 0.2903432703*FE(-11) + 0.1495829226*FE(-12) - 0.002996991519*FN(-1) - 0.05049803301*FN(-3) + 0.01076013018*FN(-4) - 0.05969214808*FN(-5) - 0.05408929182*FN(-6) + 0.05509316593*FN(-7) + 0.08264553226*FN(-10) - 0.009874632583*FN(-11) - 0.01736103924*FN(-12) - 0.201687376*JAE(-1) + 0.451964449*JAE(-3) - 0.08484463669*JAE(-4) - 0.9604511724*JAE(-5) + 0.419853133*JAE(-6) - 0.5754540741*JAE(-7) - 0.8438202862*JAE(-10) - 0.6380606547*JAE(-11) - 0.3079768732*JAE(-12) + 0.4617223899*JAN(-1) + 0.2091587066*JAN(-3) - 0.09069666901*JAN(-4) + 0.08404651002*JAN(-5) + 0.07709415443*JAN(-6) + 0.1183870882*JAN(-7) + 0.01818272123*JAN(-10) + 0.03834980612*JAN(-11) - 0.2804770253*JAN(-12)

Application VAR

125

Vérification de la stationnarité du VAR: Test sur les racines :

Les inverses des racines des polynômes autorégressifs (donnés par l’Eviews) des quatre séries sont inférieure en module à 1

L’inverse des racines associées à la partie AR appartient au disque unité. Le VAR est stationnaire.

Tests sur les paramètres : La significativité des coefficients du modèle VAR(12) est confirmée par le test de Student En

tenant compte du tableau des estimations (Tableau) et le fait qu’un coefficient est significativement différent de zéro au seuil 5%, si la t-statistique associée est supérieure à 1.96

Application VAR

126

Résidus simples de la série (FE): Résidus simples de la série (FN):

Application VAR

127

Résidus simples de la série (JAE):

Résidus simples de la série (JAN):

Application VAR

128

Résidus croisés des séries (FN ; FE):

Résidus croisés des séries (JAE ; JAN):

Application VAR

129

Résidus croisés des séries (FE ; JAE):

Résidus croisés des séries (FE ; JAN):

Application VAR

130

Résidus croisés des séries (FN ;JAE):

Résidus croisés des séries (FN ; JAN):

Application VAR

131

Les graphes des résidus simples des quatre séries :

Pour les séries Jan; Jae; Fe; FN on retient les coefficients qui sont significatifs, c'est-à-dire

ceux dont les statistiques de Student (t-stat) sont supérieures en valeur absolue aux valeurs

théoriques (1.96) au seuil de 5%. D’où:

Le modèle VAR(12) s’écrit donc de la façon suivante :

FE = 0.5138865666*FE(-1) + 0.2129399812*FE(-5) + 0.1950868599*FE(-11) + 0.1542121815*FN(-3) - 0.1297690979*FN(-4) - 0.9350288096*JAE(-4) + 0.1748064848*JAN(-4) + 0.124394713*JAN(- 7) - 0.158152241*JAN(-10)

FN = - 0.6684105782*FE(-5) + 0.2135230552*FN(-3) - 0.2195410591*FN(-7) - 0.4537274846*FN(-12)

- 2.291743749*JAE(-11) + 0.3506146091*JAN(-10) JAE = 0.06332678143*FE(-5) - 0.02649027611*FE(-6) - 0.00585109903*FE(-7) +

0.0209835476*FN(-12) + 0.3164288494*JAE(-1) - 0.03440147237*JAN(-1) + 0.04109508282*JAN(-7) + 0.03479601759*JAN(-12)

JAN = 0.4617223899*JAN(-1) - 0.2804770253*JAN(-12)

Remarque: Nous constatons que la série JAN s’écrit uniquement en fonction de ses valeurs passées,

ceci nous pousse à penser que l’approche multivariée pour cette série n’apportera rien en terme de prévisions par rapport à l’approche univarié

Application VAR

132

Tests sur les résidus De la même façon que la méthodologie de Box & Jenkins, il convient de vérifier si les

résidus forment un bruit blanc, une observation des corrélogrammes des résidus des deux séries s’impose.

Globalement, l’analyse des corrélogrammes simples et croisées nous montre que tous les termes sont à l’intérieur de l’intervalle de confiance de là on déduit une absence de corrélation, de plus toutes les probabilités associées sont supérieures à 0.05, ce qui est confirmé par Q-stat pour tous les retards en particulier Q-stat = 15.474 ; 15.546 ; 22.488 ; 23.903 resp des séries (FE, FN,JAE, JAN); (pour h = 30) < 2

0.05 (30) 43.77χ = . Donc les résidus se comportent comme un bruit blanc.

Donc les résidus des séries une à une forment un processus bruit blanc.

Test de Normalité : Résidus de la série (FE):

-test de skewness : 1g =

n

b

6

02/11 +

=0.252499 0

6 108+

= 1,071<1.96 donc :


-test de kurtosis : 2g =

n

b24

32 −=

3.52793 324 108

−= 1,119<1.96 donc :

On accepte l’hypothèse nulle 0H (asymétrie) Alors : les résidus sont gaussiens. Ce qui est confirmé par le test de Jarque-Berra

Application VAR

133

- La statistique de Jarque-Berra=2,40>5.911.Donc : on accepte l’hypothèse nulle 0H (normalité)

RESIDFE RESIDFN Skewness 0.252499300708926 -0.178678479865026 Kurtosis 3.52779348449417 2.65701587043281 Jarque-Bera 2.40115297368819 1.10403949411112 Probability 0.301020627450904 0.575785693706116 Sum -9634.80974233782 -8939.07126213692 Sum Sq. Dev. 98261617.464214 749657986.861302 Observations 108 108

RESIDJAE RESIDJAN

Skewness -0.0712588488320082 0.281728280741602 Kurtosis 2.78755176016054 4.06493347414021 Jarque-Bera 0.294504969412509 6.5320497046027 Probability 0.863076036404564 0.0381578089195492 Sum -69.9319286509287 -12552.0427659422 Sum Sq. Dev. 8250899.10417633 429470841.548753 Observations 108 108

RESIDFE RESIDFN RESIDJAE RESIDJAN

Skewness 1,071 0,757 0,302 1,195

Kurtosis 1,119 1,393 0,848 8,623

Jarque-Bera 2.401 1.1040 0.294 6.5320

Observations 108 108 108 108

Conclusion : D’après les tests précédents on conclut que les résidus forment un bruit blanc Gaussien sauf pour les résidus de la série JAN

Prévision: Les prévisions sont calculées pour la période allant de janvier 2006 à Décembre 2006

FE FN JAE JAN Janvier 2006 219.9691 22861.44 3889.915 25445.95 Février 2006 760.1325 26087.89 4342.417 23763.63 Mars 2006 247.8898 35924.73 4318.431 23890.61 Avril 2006 1120.071 32969.42 4247.052 24472.81 Mai 2006 434.6242 30365.83 4465.693 24754.62 Juin 2006 1030.656 27410.18 4769.805 23744.89 Juillet 2006 732.0931 35723.78 5989.449 25355.39 Août 2006 508.3732 31954.93 6159.516 26790.62 Septembre 2006 1186.878 32574.07 5882.792 23908.79 Octobre 2006 1143.687 31269.60 5166.946 24080.56 Novembre2006 86.02180 24402.61 5220.334 28424.65 Décembre2006 745.5457 30627.60 5071.127 27387.77

Application VAR

134

Diagrammes séquentiels des quatre séries brutes (FE ,FN,JAE,JAN) et des

prévisions :


Test de causalité au sens de Granger :

Il s’agit ici simplement de tester la nullité jointe de certains cœfficients, en utilisant par

exemple les tests traditionnels de type FISHER. Nous avons donc à tester deux types

d’hypothèses :

H 0 : « la série A ne cause pas la série B » et '0H : « la série B ne cause pas la série A»

tq: A et B sont des séries différentes ( FE, FN, JAE , JAN ) ou : A ≠ B

Application VAR

135

Les résultats de ces tests sont reportés dans le tableau ci – dessous

Lags: 12 Null Hypothesis: Obs F-Statistic Probability FN does not Granger Cause FE 108 2.377 0.010 FE does not Granger Cause FN 1.210 0.290 JAE does not Granger Cause FE 108 0.878 0.571 FE does not Granger Cause JAE 0.842 0.607 JAN does not Granger Cause FE 108 1.583 0.112 FE does not Granger Cause JAN 0.742 0.706 JAE does not Granger Cause FN 108 1.391 0.186 FN does not Granger Cause JAE 0.499 0.909 JAN does not Granger Cause FN 108 1.436 0.165 FN does not Granger Cause JAN 0.801 0.647 JAN does not Granger Cause JAE 108 1.640 0.096 JAE does not Granger Cause JAN 0.542 0.880

D’après le tableau ci-dessus, nous acceptons l’hypothèse H 0 dans la première équation car

la valeur de la statistique de Fisher calculée est inférieure à la statistique de Fisher tabulée,

FStat < F 2,1200.05 = 3.07, de plus la probabilité associée est supérieure au seuil statistique

usuel de 5 % , il n’y a donc pas de causalité au sens de Granger de A vers B , nous acceptons

l’hypothèse '0H

Remarque:

(Sauf pour les séries FE et FN )

La probabilité associée est de 0.01 : elle est inférieure au seuil statistique usuel de 5 % donc

FE explique significativement FN . Il y a donc causalité au sens de Granger de FE vers FN

Conclusion

Conclusion

137

Choix de la méthode de prévision

A cette étape bien précise nous sommes en possession de deux groupes de résultats

associés à deux approches différentes (univariée et multvariée) pour un objectif commun à

savoir effectuer des prévisions. Pour choisir les meilleurs résultats une comparaison sera

entreprise.

Comparaison :

La comparaison des résultats prévisionnels obtenus par les différentes méthodes à savoir

la méthodologie de Holt et Winters et celle de Box et Jenkins et la modélisation VAR est

basée sur la racine carrées de la somme des carrées résidus (RMSE) entre les observations

prévues et les réalisations des séries de ventes.

Les prévisions d'une méthode sont jugées plus fiables si son RMSE est la plus faible par

rapport à celle de l'autre méthode.

Le calcul du RMSE (la racine carrée des moyennes des résidus) mesurant les écarts

prévisionnels moyens pour chaque méthode) est donné par la formule suivante :

RMSE = ∑N

tN 1

21 ε où N est le nombre d’observations

Ainsi, la comparaison entre les différentes méthodes utilisées s’effectuera à partir du

tableau suivant:

Telle que :

RMSE 1 : la racine carrée des moyennes des résidus associée à la méthode Holt et Winters .

RMSE 2 : la racine carrée des moyennes des résidus associée à la méthodologie de Box et

Jenkins.

RMSE 3 : la racine carrée des moyennes des résidus associée à la modélisation ARFIMA.

RMSE 4 : la racine carrée des moyennes des résidus associée à la modélisation VAR.

RMSE 1 RMSE2 RMSE3 RMSE4

FE 1891,04 1679.16 4350,09 958,012

FN 2904,53 2915,33 - 2635,93

JAE 358,13 307,77 - 276,4

JAN 2049,66 2463,67 - -

Conclusion

138

Nous constatons que :

• pour la série vente de carburant fuel-oil secteur Marine Nationale FE le

RMSE 4 < RMSE 2< RMSE 1< RMSE 3.

Nous concluons que les prévisions obtenues par la méthodologie de Box & Jenkins pour

sont plus fiables que celles obtenues par la méthode de Holt et Winters et modélisation

ARFIMA et les prévisions obtenues par la modélisation VAR sont plus fiables que celle

obtenus par la méthodologie de Box & Jenkins

• pour la série vente de carburant fuel-oil secteur Marine Nationale FN.

RMSE 4 < RMSE 1< RMSE 2

Nous concluons que les prévisions obtenues par la méthode de Holt et Winters pour sont

plus fiables que celles obtenues par la méthodologie de Box & Jenkins et les prévisions

obtenues par la modélisation VAR sont plus fiables que celle obtenus par la La méthode

de Holt et Winters

• pour la série vente de carburant Jet A1 secteur aviation étrangère JAE.

RMSE 4 < RMSE 2< RMSE 1

Nous concluons que les prévisions obtenues par la méthodologie de Box & Jenkins pour

sont plus fiables que celles obtenues par la méthode de Holt et Winters et les prévisions

obtenues par la modélisation VAR sont plus fiables que celle obtenus par la méthodologie

de Box & Jenkins.

• pour la série vente de carburant Jet A1 secteur aviation nationale JAN.

RMSE 1< RMSE 2

Nous concluons que les prévisions obtenues par la méthode de Holt et Winters sont plus

fiables que celles obtenues par la méthodologie de Box & Jenkins

Nous concluons enfin que les prévisions obtenues par la modélisation VAR sont plus fiables

que celles obtenues par les autres méthodes

Conclusion Générale

Conclusion générale

140

Conclusion Générale

Au cours de la préparation de notre mémoire de fin d’études, nous avons été amenés à

faire des prévisions à l’aide de diverses méthodes sur différentes séries. et essayer d’attendre l’objectif fixé par notre étude, à savoir trouver le type de modèle qui convienne au problème posé .Pour cela nous avons proposé dans un premier temps d'étudier individuellement les séries en utilisant l’approche univariée qui comporte deux parties :

La première comporte deux méthodes Holt et Winters et Box et Jenkins Le premier point de notre conclusion est destiné aux résultats obtenus dans l’étude des

quatre séries de ventes de carburants (FE. FN, JAN, JAE) En effet, l’application des deux méthodes sur ces séries, nous a permis de conclure que : La méthode Holt & Winters est la plus appropriée pour faire de meilleures prévisions

pour les séries FN et JAN au sens du RMSE La méthode Box et Jenkins est la plus appropriée pour faire de meilleures prévisions

pour les séries FE et JAE au sens du RMSE Pour la modélisation ARFIMA, nous pensons qu’elle est d’une grande importance et

d’une utilité à ne pas négliger car elle traite l’existence de phénomène à mémoire longue ; elle permet en ce sens de préciser le type de mémoire (longue, ou courte) que nous avons à traiter, pour cela il est indispensable de disposer d’un logiciel approprié et performant qui gère la composante tendancielle et surtout saisonnière quel que soit son ordre. (Les résultats de cette modélisation sont obtenus par le logiciel ITSM)

Cependant la méthodologie de Box et Jenkins ne prend pas en compte l’interdépendance

des séries, pour cette raison nous avons proposé par la suite une approche multivariée pour parer aux insuffisances de l’approche univarié.

Etant donné qu’à l’issue de la méthodologie de Box & Jennkins les séries sont rendues

stationnaires, l’application de la modélisation V AR(p) à la base de ces séries est possible, en Utilisant les critères d’informations d’Akaike et le maximum de vraisemblance nous obtenons un ordre de décalage p = 12; à l’instar de la méthode précédente, le modèle V AR(12) subira l’épreuve des tests pour qu’il soit par la suite validé afin d’être exploité pour les prévisions. Néanmoins l’ordre du décalage p = 12 retenu est important, ce qui n’est pas pour diminuer Le nombre de paramètres à estimer qui avoisine 132 paramètres, nous aurions pu diminuer l’ordre du décalage en introduisant une composante moyenne mobile mais le logiciel EVIEWS ne traite pas les modèles VARMA.

Nous achevons notre étude par une comparaison entre les deux méthodes sur la base du

critère RMSE qui permet de conclure que l’approche multivarié nous a permis d’améliorer les Prévisions pour les quatre séries (FE. FN, JAN, JAE) . Lors de cette étude , il nous a été permis d’approfondir nos connaissances dans le

domaine de la prévision à court et à long terme et un savoir faire pour les logiciels statistiques EVIEWS , MATLAB , SPSS , ITSM , XL STAT .

Nous espérons avoir répondu au problème posé et que les résultats trouvés seront d’une

utilité pertinente

Annexe

Annexe 01

142

1.1 Notion de causalité : Un modèle de série chronologique (linéaire ou non) de la forme :

( )qttptttt XXXFX −−−−−= εεε ,,,,,,, 1121 …… est causal, si et seulement si, on peut exprimer le

processus stochastique sous forme d’une combinaison linéaire (finie ou infinie) convergente

en moyenne quadratique, du présent et du passé d’un bruit blanc { }.tε

Remarque :

La causalité n’est pas une propriété du processus { }ZtXt ∈, à lui seul, mais plutôt de la

relation avec{ }Ztt ∈,ε . Par suite, si le modèle est causal, alors le processus { }ZtXt ∈, est

stationnaire, puisque ce dernier s’écrit en fonction de bruit blanc stationnaire.

1.2 Notion d’inversibilité : Un modèle de série chronologique (linéaire ou non) de la forme :

( )qttptttt XXXFX −−−−−= εεε ,,,,,,, 1121 …… est inversible, si et seulement si, on peut exprimer

le processus { }tε sous forme d’une combinaison linéaire (finie ou infinie) convergente en

moyenne quadratique, du présent et du passé du processus stochastique { }tX .

Annexe 02

143

TAB. : Valeurs critiques du test de Dickey-Fuller pour p = 1

T 1 % 5% 10%

Modèle [1]

100 -2.60 -1.95 -1.61

250 -2.58 -1.95 -1.62

500 -2.58 -1.95 -1.62

∞ -2.58 -1.95 -1.62

Modèle [2]

100 -3.51 -2.89 -2.58

250 -3.46 -2.88 -2.57

500 -3.44 -2.87 -2.57

∞ -3.43 -2.86 -2.57

Modèle [3]

100 -4.04 -3.45 -3.15

250 -3.99 -3.43 -3.13

500 -3.98 -3.42 -3.13

∞ -3.96 -3.41 -3.12 Modèle [1] : modèle sans constante, ni tendance déterministe. Modèle [2] : modèle

avec constante, sans tendance. Modèle [3] : modèle avec constante et tendance

TAB. Valeurs critiques de la constante et de la tendance, tests de Dickey-Fuiler Modèle [2] Modèle [3]

Constante Constante Trend

T 1% 5% 10 % 1 % 5% 10% 1 % 5% 10%

100 3.22 2.54 2.17 3.78 3.11 2.73 3.53 2.79 2.38

250 3.19 2.53 2.16 3.74 3.09 2.73 3.49 2.79 2.38

500 3.18 2.52 2.16 3.72 3.08 2.72 3.48 2.78 2.38

∞ 3.18 2.52 2.16 3.71 3.08 2.72 3.46 2.78 2.38

Modèle [2] : modèle avec constante sans tendance déterministe

Modèle [3] : modèle avec constante et tendance.

144

Bibliographie :

Analyse des séries temporelles en économie (Régis Bourbonnais et Michel Terraza).

Econométrie des séries temporelles macroéconomiques et financières (Sandrine Lardic et Valérie Mignon).

Prévision des ventes théorie et pratique (Régis Bourbonnais et Jean-Claude Usunier).

Arthur Charpentier cours de séries temporelles.

Michel Lubrano (Septembre 2004).

Econométrie Appliquée Série Temporelles (Christophe Hurlin).

Maîtrise D économétrie Cours de Série Temporelles Années 1999 a 2004.

Texte :M-C Viano.

Graphique : A.Philippe.

Box, G.E.P. et Jenkins, G.M. (1976). Time Series Analysis, Forecasting and Control, Holden-Day, (revised edition). San Francisco, CA.

Bresson & A. Pirotte (1995), Econométrie des Séries Temporelles Théorie et Application. PUF.

Brockwell & R. A. Davis (1987), Time Series: Theory and Methods. New York: Springer-Verlag.

Gourieroux & A. Monfort (2e édition 1995), Séries Temporelles et Modèles Dynamiques. Economica.

Thèse_New1 GENIAL §§§§§

Documents

Transcript of Thèse_New1 GENIAL §§§§§