« Prévision du Risque de Contagion de six Marchés ... · Kurowicka et Cooke (2006), et Joe...

40
« Prévision du Risque de Contagion de six Marchés Financiers : une analyse prédictive par l’approche des Réseaux de Croyance Bayésienne non-paramétrique continu » Lazeni FOFANA Françoise SEYTE DR n°2014-16

Transcript of « Prévision du Risque de Contagion de six Marchés ... · Kurowicka et Cooke (2006), et Joe...

Page 1: « Prévision du Risque de Contagion de six Marchés ... · Kurowicka et Cooke (2006), et Joe (1996)) . L’analyse prédictive du comportement du processus des co-mouvements conditionnels

« Prévision du Risque de Contagion de

six Marchés Financiers : une analyse

prédictive par l’approche des

Réseaux de Croyance Bayésienne

non-paramétrique continu »

Lazeni FOFANA

Françoise SEYTE

DR n°2014-16

Page 2: « Prévision du Risque de Contagion de six Marchés ... · Kurowicka et Cooke (2006), et Joe (1996)) . L’analyse prédictive du comportement du processus des co-mouvements conditionnels

1

Prévision du Risque de Contagion de six Marchés Financiers : une

analyse prédictive par l’approche des Réseaux de Croyance Bayésienne (BBN) non-paramétrique continu

Lazeni Fofanaa, Françoise Seyteb LAMETA-Montpellier, France LAMETA-Montpellier, France [email protected] [email protected]

Abstract

L’objectif de ce papier est d’apporter une réponse à la question de prévisions de la contagion financière en utilisant une approche nouvelle. Nous avons recours à l’analyse prédictive des Réseaux de Croyance Bayésienne (BBN) non-paramétriques. Les arcs du réseau sont utilisés comme sens de causalité ou d’influence ; le nœud en amont représente la cause et le nœud en aval désigne la conséquence de l’événement en amont. Ces événements, eux-mêmes sont observés avec des probabilités de croyance conditionnelle Bayésienne, calculées et mise à jour au fur et à mesure que s’effectue la propagation dans le réseau. En associant corrélations avec la dynamique de causalité conditionnelle et probabilité de propagation des chocs entre les marchés, nous arrivons à éliciter les rangs de corrélations conditionnelles entre les marchés. La modélisation est réalisée à l’aide de la jonction entre les Vines et les copules (Copula-Vines) sur un réseau de croyance Bayésienne avec une technique d’apprentissage de la structure. Un certain nombre d’hypothèses importantes ont également été pris en compte pour réaliser cette modélisation. Concernant ces hypothèses, nous avons considéré la contagion financière comme un système complexe dont la survenance est non déterministe ; autrement dit, les mêmes causes ne produisent pas les mêmes effets. On considère qu’il existe des effets communs cachés, connus sous le nom de Causal Markov Condition, responsables de la propagation des chocs entre les marchés en situation de grands stress. Les marchés considérés dans cet article sont les six grands marchés financiers CAC40, DAX, S&P500, NIKKEI225, FTSE100 et SSEC. Lorsque nous considérons le niveau de co-mouvements atteint pendant la crise des subprimes comme seuil d’alerte, les prévisions du modèle nous révèlent que la contagion financière se comporte comme un système complexe quand les marchés commencent à s’agréger. La structure des co-mouvements se modifie et est différent des comportements bivariées simples. Le deuxième constat que nous faisons est que la zone euro à travers le CAC40 et le DAX constitue un nœud central dans la stabilité du réseau financier actuel, car une fois ces deux marchés en crise, il se crée le plus grand réseau de contagion de notre étude. Enfin, le dernier constat que nous avons fait est qu’à travers le réseau de croyance Bayésienne des six indices construit par apprentissage automatique, le S&P500 se comporte bien comme le ground zero de la contagion dans la crise des subprimes.

Classification JEL: C11, C53, G15, G17, D53, D83

Mots clés : prévision, contagion financière, réseau de croyance Bayésienne, vines, copules, apprentissage de structure,

corrélation, crises financières, marchés financiers

abLAMETA, -UMR : 5474 Université de Montpellier 1 Espace Richter. Av. Raymond DUGRAND C.S. 79606 34960 Montpellier Cedex 2, France.

Page 3: « Prévision du Risque de Contagion de six Marchés ... · Kurowicka et Cooke (2006), et Joe (1996)) . L’analyse prédictive du comportement du processus des co-mouvements conditionnels

2

1. Introduction

A l’ère du «Too interconnected to fail », le système financier s’est considérablement fragilisé ces dernières décennies et cela, à travers des vagues successives de crises. L’événement marquant de cette instabilité, est sans nul doute son caractère systémique et son mode de propagation par effet de contagion sur le réseau financier. Pour décrire cet effet de contagion financière, Eichengreen et al. (1996), stipule que la contagion est une augmentation significative dans la probabilité d’une crise dans un pays, conditionnellement à la réalisation d’une crise dans un autre pays. Dans « Primer on financial contagion », Marcello Pericoli et Massimo Sbracia mentionnent que la contagion est une augmentation significative dans les co-mouvements des prix et des quantités des actifs financiers entre les marchés, conditionnellement à une réalisation d’une crise dans un marché ou un groupe de marchés. En d’autres termes, une crise financière qui affecte un pays donné, peut se propager par sauts aléatoires à travers les marchés internationaux de manière contagieuse et modifier leur degré d’interdépendance. Cependant, la diversification internationale du risque, repose sur le principe fondamental des co-mouvements entre les marchés financiers internationaux. En diversifiant le risque de manière internationale, les investisseurs bénéficient d’une réduction significative du risque de leurs portefeuilles (K.C. Butler, D.C. Joaquin (2002), Roberto A. De Santis and Lucio Sarno (2008)). Des études empiriques montrent qu’une bonne stratégie de diversification du risque doit être celle dont les corrélations entre marchés internationaux sont inférieures aux corrélations observées entre les titres nationaux. Face à cette situation, les gestionnaires de portefeuille cherchent à anticiper les Co-mouvements des marchés. Ils cherchent à anticiper la contagion entre les marchés car c’est elle qui modifie considérablement leur interdépendance temporaire. Ce problème concerne les régulateurs qui eux aussi cherchent à prédire la contagion financière dans le but de faire la différence entre les risques diversifiable et les risques non diversifiable (risque lié à la contagion). Des études récentes tentent de mesurer et de prédire la contagion par l’analyse des Co-mouvements à l’aide des modèles non-linéaires de type DCC-GARCH qui corrigent les problèmes d’hétéroscédasticité évoqués par K. Forbes et R. Rigobon (2002). Il existe à côté de ces modèles, l’approche basée sur le Early Warning System(EWS) pour prédire la contagion financière (A.Cipollini et G. Kapetanios(2008), Kaminsky et al. (1998a)). Cependant, l’analyse et la prévision de la contagion à l’aide de ces méthodes pose un problème majeur qui est la non prise en compte du sens de causalité. A cela s’ajoute le problème de la probabilité de propagation de la crise d’un marché vers d’autres marchés. Selon la méthode DCC-GARCH évoquée, la propagation de la contagion prédite suppose une probabilité de survenance certaine de la contagion, c'est-à-dire un événement ayant une probabilité égale à un, ce qui n’est probablement pas le cas en situation de contagion entre les marchés, mais seulement en cas d’interdépendance de long terme, c’est à dire

( ) | 1P contagion sur un autre marché un marché en criseα = = .

Nous nous sommes penchés sur la question de l’analyse prédictive du risque de contagion en utilisant la dynamique des réseaux de croyance Bayésienne paramétrique et non paramétrique. C’est un outil d’intelligence artificielle efficace pour l’extraction de connaissance à partir de données. Nous avons considéré toutes les hypothèses fondamentales non prises en compte par les précédents modèles. L’idée est de définir la contagion financière comme un système

Page 4: « Prévision du Risque de Contagion de six Marchés ... · Kurowicka et Cooke (2006), et Joe (1996)) . L’analyse prédictive du comportement du processus des co-mouvements conditionnels

3

complexe1 dont la survenance est non déterministe, c'est-à-dire les mêmes causes ne produisent pas les mêmes effets, et peut être un événement d’occurrence rare. On considère qu’il existe des effets communs cachés, responsables de la propagation des chocs entre les marchés en situation de grands stress, connus sous le nom de Causal Markov Condition. Nous avons supposé également que la contagion résulte des Co-mouvements conditionnels entre les marchés financiers, tout en admettant que ces corrélations sont associées à la dynamique de causalité conditionnelle entre les marchés avec une probabilité conditionnelle donnée. Ce montage complexe avec toutes les hypothèses évoquées précédemment a été réalisé sur un réseau de croyance Bayésienne qui est un graphe orienté acyclique, dont les nœuds représentent des variables aléatoires (les événements diagnostiqués). Les arcs du réseau désignent le sens de causalité ou d’influence, le nœud en amont représente la cause et le nœud en aval désigne la conséquence de l’événement en amont. Ces événements eux-mêmes sont observés avec des probabilités de croyance conditionnelle Bayésienne calculées et mise à jour au fur et à mesure lors de la propagation dans le réseau. Le montage Copula-Vines sur le réseau Bayesien permet l’elicitation de la corrélation conditionnelle de rangs en fonction de la probabilité conditionnelle tout en prenant en compte la réflexion asymétrique et la flexibilité des dépendances de queue inférieure/supérieur (Bedford and Cooke (2002, 2001), Kurowicka et Cooke (2006), et Joe (1996)). L’analyse prédictive du comportement du processus des co-mouvements conditionnels et de la structure du réseau de croyance Bayésienne est réalisée grâce aux algorithmes d’apprentissage supervisée (A.M. Hanea, D. Kurowicka, R.M. Cooke, D.A. Ababei (2010)) et automatique. L’objectif de cet article est de proposer une méthode pour la prédiction de la contagion financière. Il s’organise de la façon suivante : dans le deuxième paragraphe, nous aborderons la théorie relative aux réseaux de croyance Bayésienne. Le troisième paragraphe est dédié à l’analyse prédictive de la contagion financière des marchés et enfin nous finirons par une conclusion

2. Réseaux de Croyance Bayésienne ou Bayesian Belief Networks (BBN)

Introduit par [Kim et Pearl, 1987], le réseau de croyance Bayésienne est un modèle de représentation graphique dont les arcs sont acycliques et directs. Les arcs de ce réseau désignent la relation causale conditionnelle qui existe entre deux nœuds c'est-à-dire, la cause et l’effet (la conséquence), et les nœuds quand à eux désignent des variables aléatoires. L’ensemble schématisé par ce réseau peut être vu comme un diagramme d’influence ou de dépendance. Dans la configuration du graphe, le nœud en amont est le nœud parent (la cause) et le nœud en aval désigne l’enfant (la conséquence, l’effet), selon cette direction, on dira que le nœud parent a une influence sur le nœud enfant.

1. Les systèmes complexes sont caractérisés par trois éléments : - ils sont composés d’éléments interactifs -Les règles de comportement sont simples - L’interaction entre les éléments a pour effet que les phénomènes agrégés sont intrinsèquement différents des comportements individuels.

Page 5: « Prévision du Risque de Contagion de six Marchés ... · Kurowicka et Cooke (2006), et Joe (1996)) . L’analyse prédictive du comportement du processus des co-mouvements conditionnels

4

A côté de ces composantes du réseau, nous avons les bords (Edges) qui sont une forme de distribution de probabilité jointe dont une décomposition a la forme suivante:

( ) ( )( )1 21

, ,..., |n

n i ii

P X X X P X cause directe de X=

= ∏ (2.1)

Cette distribution de probabilité jointe représente le produit de la distribution de chaque nœud

et de ses parents. Un nœud sans parent a une distribution non conditionnelle notée( )P X , par

contre un nœud ayant un parent a une distribution conditionnelle ( )|P X Y . L’architecture

du réseau repose sur un système d’apprentissage qui permet d’estimer les paramètres de la distribution de probabilité. Un des avantages de ce type de réseau probabiliste est de pourvoir calculer la distribution d’un nœud inobservé à partir de la valeur d’un nœud observé.

2.1. Dépendance et indépendance conditionnelle

2.1.1. Indépendance conditionnelle

Supposons deux variables X et Y . L’expression ||X Y exprime l’indépendance entre ces

deux variables. La probabilité correspondante selon la loi de Bayes 2 est la suivante :

( ) ( ) ( ),p X Y p X p Y= (2.2)

Si nous introduisons une nouvelle variableZ , alors || |X Y Z représente l’indépendance

conditionnelle des variables X et Y sachantZ . Cette nouvelle forme permet d’obtenir une distribution de probabilité jointe pour les variablesX , Y et Z . Une expression de la distribution de probabilité est définie par :

( ) ( ) ( ), | | |p X Y Z p X Z p Y Z= (2.3)

Nous matérialisons cette forme d’indépendance conditionnelle par le graphe acyclique ci-dessous.

2. Rappel du théorème de Bayes : supposons deux événements A et B La probabilité p(A|B) représente la probabilité de l’événement A conditionnel à l’occurrence de l’événement B. C’est à dire la portion de l’événement B pour laquelle A est vrai. On peut alors poser que : p(A|B) = p(A|B) /p(B). on peut aussi déduire la probabilité à posteriori de A en posant p(A|B) = p(A|B).p(B) /p(B).

Page 6: « Prévision du Risque de Contagion de six Marchés ... · Kurowicka et Cooke (2006), et Joe (1996)) . L’analyse prédictive du comportement du processus des co-mouvements conditionnels

5

X et Y sont conditionnellement indépendantes, étant donnée Z (cause commune). On parle de d-séparation.

2.1.2. Dépendance conditionnelle

Admettons que deux variables X et Y sont marginalement indépendantes, mais conditionnellement dépendantes étant donnéeZ . Ceci est matérialisé sous forme probabiliste par la formule suivante :

( ) ( ) ( ) ( ) ( ) ( ), , , | | |p X Y Z p X Y Z p Z p X Z p Y Z p Z= = (2.4)

X et Y sont conditionnellement dépendantes étant donnée Z (effet commun). On parle de V-séparation.

Il existe une seconde forme de dépendance conditionnelle encore appelée dépendance sérielle que nous représentons par le graphe orienté suivant :

Sa probabilité est définie par :

( ) ( ) ( ) ( ), , | |p X Y Z p Y Z p Z X p X= (2.5)

2.2. Apprentissage et propagation dans les Réseaux de Croyance Bayésienne

Les réseaux de croyance Bayésienne sont utilisés en général pour construire des requêtes probabilistes sur les variables matérialisées par le graphe du réseau. Le principe utilisé pour traiter la requête est fondé sur un mécanisme de propagation. Notons que la propagation dans les réseaux de croyance Bayésienne, peut se faire selon deux approches : soit par l’apprentissage automatique à partir de données, soit au moyen d’apprentissage par acquisition de connaissances avec un expert du domaine. En faisant usage de la table de

Page 7: « Prévision du Risque de Contagion de six Marchés ... · Kurowicka et Cooke (2006), et Joe (1996)) . L’analyse prédictive du comportement du processus des co-mouvements conditionnels

6

probabilités, la propagation peut s’effectuer dans le sens descendant du réseau. Dans ce cas l’observation de la cause, peut servir à déduire la probabilité des effets. La propagation peut également se faire en remontant le réseau, L’idée est que si l’on observe les causes, on peut alors calculer la probabilité des causes à partir de l’observation des effets. La propagation peut se faire en combinant ces deux méthodes c'est-à-dire vers le “haut” comme vers le “bas”. Cependant, le mécanisme de propagation quant à lui est possible grâce à des algorithmes de propagation exacte et approximative. La force de ces réseaux est de mieux comprendre un processus complexe dans le but de faire le diagnostic et la prédiction du comportement de ce

processus. L’idée de croyance Bayésienne est l’incorporation d’une variable intermédiaire entre les variables à analyser. Cette variable intermédiaire renferme les informations nécessaires sur la structure de dépendance ou d’influence grâce au système d’apprentissage intelligente. Ce système d’apprentissage permettra de reconstruire un réseau d’influence correcte du phénomène étudié. L’apprentissage peut être implémenté à l’aide d’algorithme de simulation stochastique basé sur le concept de Markov Blankets et l’algorithme de Logic Sampling3.

Figure 1 : Schéma de propagation

2.2.1. Apprentissage des paramètres de type Gaussien

L’apprentissage des paramètres dans un réseau de croyance Bayésienne est un principe fondamental sur lequel nous pourrons faire des prédictions (Cunlu Zou et Jianfeng Feng(2009)). En général, dans ce type d’apprentissage, la structure du réseau est fixée à priori. Maintenant à partir de ce réseau, il faut estimer les probabilités conditionnelles de chaque nœud du réseau. Ces paramètres peuvent être appris en estimant la distribution de

probabilité ( )P X et la distribution de probabilité conditionnelle( )|P X Y . La densité de

probabilité dans ce cas peut être estimée sous forme paramétrique mais aussi à l’aide d’une estimation non paramétrique. Dans le cadre de l’approche non paramétrique, la distribution des probabilités conditionnelles est tabulée puis mis à jour au fur et à mesure.

3. voir changyun wang “ Bayesian Belief simulation “ pour les details sur les algorithmes de simulations

Page 8: « Prévision du Risque de Contagion de six Marchés ... · Kurowicka et Cooke (2006), et Joe (1996)) . L’analyse prédictive du comportement du processus des co-mouvements conditionnels

7

Par ailleurs ici, c’est l’hypothèse d’une distribution gaussienne qui est effectuée pour l’apprentissage des paramètres µ etσ .

Soit X un vecteur D-dimension, sa distribution multivariée Gaussienne est de la forme :

( )( )

( ) ( )11 1| , exp

1 22 | |2 2

TN X X X

Dµ µ µ

π

− = − − −

∑ ∑∑

(2.6)

Ou µ est le vecteur moyenne D-dimension, ∑ est la matrice de covariance de dimension

D D× , et ∑ est le déterminant de∑ . La distribution du nœud X sans parents est défini

par : ( ) ( )| ,P X N X µ σ� (2.7)

et celle du nœud X avec parents est défini par :

( ) ( ): | | ,TY P X Y y N X W yµ σ= +� (2.8)

Avec T qui désigne la transposée des matrices W et W est le vecteur poids de connexion entre le nœud X et ses parentsY . Cette matrice des poids peut être caractérisée en utilisant la matrice de covariance suivante :

xy yy

W =∑ ∑ (2.9)

L’apprentissage Bayesien, recherche l’espace de toutes les structures possibles dans le but d’identifier l’espace qui décrit le mieux les données d’entrée. Et la meilleure est identifiée à

partir du maximum des probabilités conditionnelles ( )| ,P Data Mθ de l’ensemble des

données (Data) sachant un paramètre donné (θ ) du réseau et une structure du réseau (M ). L’apprentissage permettra d’estimer la moyenne et la covariance de la distribution conditionnelle gaussienne. Supposons X le vecteur D-dimension avec une distribution

Gaussienne ( )| ,N X µ ∑ , et en partitionnant la variable X en deux ensembles disjoints aX

et bX . a

b

XX

X

=

On peut définir le vecteur moyenne µ et la matrice de covariance ∑ de la variable X

partitionnée en aX et bX , par :

a

b

µµ

µ

=

et aa ab

ba bb

=

∑ ∑∑

∑ ∑ (2.10)

Page 9: « Prévision du Risque de Contagion de six Marchés ... · Kurowicka et Cooke (2006), et Joe (1996)) . L’analyse prédictive du comportement du processus des co-mouvements conditionnels

8

Cunlu Zou et Jianfeng Feng(2009) montrent que compte tenu de la forme quadratique de l’exposant de la distribution Gaussienne, on peut obtenir la transformation suivante :

( ) ( )

( ) ( ) ( ) ( )

( ) ( ) ( ) ( )

1 1 1

1 1

1 1

1 1

2 21 1

2 21 1

2 2

T T T

T T

a a a a a a b baa ab

T T

b b a a b b b bba bb

X X X X X const

X X X X

X X X X

µ µ µ

µ µ µ µ

µ µ µ µ

− − −

− −

− −

− − − = − + +

= − − − − − −

= − − − − − −

∑ ∑ ∑

∑ ∑

∑ ∑

(2.11)

De cette façon, en gardant bX constant, on retrouve l’expression de la moyenne et la

distribution de la probabilité conditionnelle( )|a bP X X .

( )1

|a b a b bab bbXµ µ µ−= + −∑ ∑ (2.12)

1

|a b aa ab bb ba

−= −∑ ∑ ∑ ∑ ∑ (2.13)

Les paramètres du réseau peuvent être calculés à travers ces deux équations.

2.2.2. Apprentissage des Paramètres de type non Gaussien

L’apprentissage des paramètres est applicable au modèle non linéaire. Dans ce cas, la distribution de probabilité de la variable X est non gaussienne. Cependant, la non linéarité de la distribution rend l’identification de la forme de la distribution difficile, il faut donc utiliser un mélange de modèle qui a la forme suivante :

( ) ( )1

| ,K

k k kk

P X N Xπ µ=

=∑ ∑ (2.14)

Chaque densité Gaussienne ( )| ,k kN X µ ∑ représente une composante du mélange de

moyenne kµ et covariancek∑ . Le paramètre kπ est appelé le coefficient du mélange qui

satisfait la condition : 1

1K

kk

π=

=∑ (2.15)

La distribution de probabilité conditionnelle de X conditionnelle sur le passé de X et sur Y dans le modèle non linéaire est obtenue comme suit :

( ) ( )| | ,i ii

P X Y y N X wµ γ σ = = + Φ

∑ (2.16)

Ou w est la matrice des poids de connexion entre les nœuds de X et ses parents. Elle peut être estimée par une simple méthode de régression linéaire.

Page 10: « Prévision du Risque de Contagion de six Marchés ... · Kurowicka et Cooke (2006), et Joe (1996)) . L’analyse prédictive du comportement du processus des co-mouvements conditionnels

9

2.2.3. Apprentissage de la structure

L’apprentissage de la structure a pour but de trouver le meilleur graphe représentant l’événement à analyser. Cela revient à trouver un P-map (cartographie qui soit fidèle) d’un modèle d’indépendance associé à une distribution de probabilité de l’échantillon en notre possession. Il y a deux grandes approches d’apprentissage de la structure: celle basée sur l’indépendance conditionnelle ou recherche sous contraintes et l’autre sur l’algorithme de recherche de score. Pour trouver le meilleur graphe, il existe plusieurs algorithmes spécialisés dans cette tâche. Pour l’algorithme basé sur la contrainte, nous commençons avec la connexion totale du réseau et on retire alors les arcs, qui sont conditionnellement indépendants. Pour le second type d’algorithme, une recherche sur tous les graphes possibles est effectuée et par la suite on sélectionne le graphe qui décrit au mieux les relations de dépendance statistique des données observées. Compte tenu de l’explosion du nombre de nœuds lorsqu’on fait une recherche exhaustive dans le réseau, l’évaluation de l’ensemble du graphe devient un travail fastidieux. Pour surmonter cette difficulté, il faut recourir à des algorithmes qui utilisent des techniques de résolution ergonomique adaptées à ce type de problème. Parmi ces algorithmes, nous pouvons citer l’algorithme K2 de Cooper et Herskovits [CH92] , L’algorithme K3 de Bouckaert [Bou93], Algorithme EM structurel, l’algorithme de recherche heuristique Greedy Search qui peuvent être pratiques pour ce type de recherche. Dans cet article l’algorithme utilisé pour la forme paramétrique est le K2. La technique de cet algorithme est d’effectuer des tests sur les parents et ensuite l’insérer dans le réseau en fonction de son ordre. Dans cet ordre, le premier nœud est un nœud sans parent et pour les autres parents, il faut choisir le nœud qui est situé derrière ce nœud. Le meilleur ensemble des parents qui décrivent le réseau est trouvé grâce à la méthode de scoring. En d’autres termes il s’agit de trouver la structure qui présente le meilleur score du réseau Bayesien. Dans ce domaine, il existe deux méthodes populaires qui sont : Le score de métrique Bayesien qui est la vraisemblance marginale du modèle et le critère d’information Bayesien (BIC) défini comme suit :

( ) ( )log | log2

dP Data Nθ − (2.17)

Avec Data les données observées, θ le paramètre du réseau à estimer, d le nombre de

paramètre du réseau à estimer et N le nombre de données. ( )log2

dN est le terme de pénalité

qui permet d’équilibrer la représentation simple et précise de la structure.

Supposons, { }1 2, ,..., NData Y Y Y= un ensemble de données identiquement et

indépendamment distribuées. Alors la log vraisemblance de l’ensemble des données est défini comme suit :

( ) ( ) ( )( )1 1

log | log | log | ,N N

i i ij jpa j

i i j

P Data P Y P Y Yθ θ θ= =

= =∑ ∑ ∏

Page 11: « Prévision du Risque de Contagion de six Marchés ... · Kurowicka et Cooke (2006), et Joe (1996)) . L’analyse prédictive du comportement du processus des co-mouvements conditionnels

10

( )( )1

log | ,N

i ij jpa j

i j

P Y Y θ=

=∑∑ (2.18)

Ou j est un indice des nœuds ou variable dans le réseau Bayesien, ( )pa j est l’ensemble des

parents du nœudj , et jθ sont les paramètres qui définissent la probabilité conditionnelle de

jY sachant ses parents.

Figure2 : Apprentissage et propagation dans un réseau de croyance Bayésienne

Source: David Barber “Bayesian Reasoning and Machine learning” p.202

2.3. Croyance dans les Réseaux Bayésiens

La formalisation des processus de raisonnement avec croyance incertaine est un processus évidemment complexe. Cependant, l’un des outils de modélisation adapté à ce type de problème demeure les réseaux de croyance Bayésienne. Pour arriver à cela, le réseau Bayesien va attribuer à chaque événement un certain degré de croyance qui va être interprété et ensuite quantifié comme la probabilité de réalisation de cet événement. En effet, grâce au système d’apprentissage et au mécanisme d’enrichissement de la base de connaissance du modèle, la probabilité de réalisation d’un événement est révisée au fur et à mesure que de nouveaux éléments de preuves viendront compléter notre connaissance sur l’événement lui-même. La révision périodique du degré de la croyance permet de réévaluer la probabilité de réalisation d’un événement soit à la hausse, soit à la baisse. Pour mettre à jour la croyance,

supposons que nous avons affecté une probabilité arbitraire à priori ( )Pr . à la réalisation d’un

événementα . Après, si nous observons avec exactitude que l’événement α est réalisé, alors

nous effectuons une révision de la probabilité de l’événement α en recalculant ( )Pr . |α .

Nous déduisons que la probabilité est égale à ( )Pr | 1α α = et implicitement ( )Pr | 0α α¬ = .

Cette capacité d’analyse, positionne le réseau de croyance Bayésienne comme un outil efficace de mesure de probabilité non monotone. Pour mesurer le dégré de croyance ou la

Page 12: « Prévision du Risque de Contagion de six Marchés ... · Kurowicka et Cooke (2006), et Joe (1996)) . L’analyse prédictive du comportement du processus des co-mouvements conditionnels

11

probabilité de réalisation d’un événement, nous désignons α comme étant un événement

que nous cherchons à capter la probabilité de réalisation. Cette probabilité notée ( )Pr ω est

comprise dans l’intervalle [ ]0,1 pour chaque état du mondeω .

( ) ( )|

P r P rd e f

ω αα ω

=

= ∑ (2.19)

C’est la somme des probabilités affectées aux états du monde où α est vrai. La cartographie des degrés de croyance est connue sous le nom des états de croyance ou encore distribution de probabilité jointe.

Propriétés de croyance

( )0 Pr 1α≤ ≤ pour tout événement égal à α

( )Pr 0α = lorsque α est un événement incohérent

( )Pr 1α = lorsque α est un événement valide

( ) ( )Pr Pr 1.α α+ ¬ = Cette propriété autorise le calcul de la croyance de l’événement α en

prenant en compte sa négation.

2.4. Réseau de Croyance Bayésienne non-paramétrique continue et analyse des corrélations conditionnelles

2.4.1. Rang de corrélation conditionnelle

Admettons que XF et YF soient les fonctions de distribution cumulatives respectives des

variables aléatoires X et Y . On peut donc définir la corrélation de rang comme suit :

( ) ( ) ( ) ( )( ) ( )( ) ( )( )( )( ) ( )( ), ,

var var

X Y X YX Y X Y

X Y

E F X F Y E F X E F Yr F X F Y

F X F Yρ

−= =

(2.20)

On remarque que la corrélation de rang est la corrélation du produit des moments de rang des variables. Dès lors c’est une mesure suffisamment robuste pour exprimer la relation monotone entre les deux variables X et Y .

La corrélation de rang conditionnelle de X et Y sachant Z est donné par :

, | ,X Y Z X Yr r= % %

(2.21)

Avec ( ),X Y% % les distributions de X et Y sachantZ z= .

Page 13: « Prévision du Risque de Contagion de six Marchés ... · Kurowicka et Cooke (2006), et Joe (1996)) . L’analyse prédictive du comportement du processus des co-mouvements conditionnels

12

2.4.2. Corrélation de rang avec Copule

Nous allons introduire ici, la notion de copule dans la mesure de corrélation de rangs en raison de l’incapacité de la corrélation de rang classique à prendre en compte les dépendances non-monotone. En effet, la corrélation de rang est déterminée à l’aide de la modélisation de la dépendance stochastique de copule bivariée.

Copule (Définition) :

Une copule bivariée C est une distribution sur [ ]20,1

et dont les distributions marginales sont

uniformes sur[ ]0,1 . Les variables aléatoires X et Y sont jointes par la copule C si leur

distribution jointe peut être écrite :

( ) ( ) ( )( ), , ,X Y X YF x y C F x F y= (2.22)

Il est possible de trouver une copule unique qui correspond à toute distribution continue

jointe donnée. Si nous supposons ρΦ une fonction de distribution cumulative normale

standard bivariée de corrélation ρ et une fonction de distribution cumulative normale

standard inverse 1−Φ alors une copule normale peut être définie par :

( ) ( ) ( )( ) [ ]1 1, , ; , 0,1C u v u v u vρ ρ− −= Φ Φ Φ ∈

(2.23)

Avec ρ le paramètre de la copule normale.

La relation entre la corrélation r (corrélation de rang de la variable normale) de la copule normale et le paramètre ρ (produit de moment de corrélation de la variable normale) est

connue et donnée par la transformation Pearson :

( ) ( ), 2sin ,6

X Y r X Yπρ = (2.24)

Définition 2.4.2.1 : (Corrélation partielle)

On peut définir la corrélation partielle sous la forme suivante :

1212;3,..., 11 22n

C

C Cρ =

(2.25)

,i jC est le ( ),ieme

i j cofacteur de la matrice de corrélation partielle.

La corrélation partielle 12;3,...,nρ est interprétée comme la corrélation entre la projection

orthogonale de 1X et 2X sur le plan orthogonal de l’espace engendré par3,..., nX X .

La corrélation partielle peut être calculée à l’aide de la formule récursive suivante :

Page 14: « Prévision du Risque de Contagion de six Marchés ... · Kurowicka et Cooke (2006), et Joe (1996)) . L’analyse prédictive du comportement du processus des co-mouvements conditionnels

13

( ) ( )( )1

2 2 21,3;4,..., 2,3;4,...,

1,2;4,..., 1 1,3;4,..., 2,3;4,...,12;3,...,

.

1 . 1n n

n n nn

ρ ρ

ρ ρ ρρ − −

− −=

(2.26)

La corrélation des rangs contribue dans le déterminant de la matrice de corrélation du réseau de croyance de Bayésienne (DBBNR). Les Vines constituent un moyen de factorisation du déterminant de la matrice de corrélation. Pour un Vine sur n variables, le produit de un moins le carré de corrélations partielles attribués aux bords des Vines, est le même, et est égal au déterminant de la matrice de corrélation. Selon Kurowicka and Cooke (2006), on peut définir le déterminant d’une matrice n dimension− ( 0)D > pour toute corrélation partielle sur

réseau de croyance Bayésienne comme suit :

( );21

ijij DDBBNR ρ−= ∏ (2.27)

Où 2; ijij Dρ désigne la corrélation partielle associée4 à l’arc formé par les nœuds i et j , avec

un ensemble conditionnel ijD et le produit est réalisé sur tous les arcs du réseau de croyance Bayésienne.

2.4.3. Elicitation non paramétrique des corrélations de rang avec Copula-Vine sur réseau de croyance Bayésienne

2.4.3.1. Copula-Vines et corrélation de rang conditionnelle

Les vines sont des modèles graphiques pour la modélisation de la dépendance haute dimension. Ils furent introduits par Bedford and Cooke(2002). Dans la représentation des Vines, les nœuds représentent des variables aléatoires avec des fonctions de distribution inverses. Quant aux bords (Edges), ils spécifient la dépendance conditionnelle bivariée de variables aléatoires continues. Selon la spécification de ces auteurs, un Vine sur n variables

est un ensemble imbriqué d’arbres où les bords (Edges) du iemej arbre devient le nœud (Nodes)

de l’arbre suivant ( 1)iemej + pour 1,..., 1j n= − . Un vine est dit régulier sur n variables

lorsque deux bords (Edges) dans l’arbre j joint par un bord (Edge) dans l’arbre 1j + sont

des bords (Edges) qui partagent un nœud (Node) commun. Il faut noter qu’il existe deux types

Vines, les C-Vines et les D-Vines. Un Vine régulier est dit C-Vines si chaque arbre iT a un

nœud unique dont le degré est de n i− et le nœud de l’arbre iT ayant le degré maximal est

appelé racine. Par contre un D-Vine est un cas spécial d’un vine régulier dans lequel chaque

nœud (Node) en 1T a un dégrée au plus deux ; ce qui signifie donc que chaque nœud dans

4. En général la corrélation partielle n'est pas égale à la corrélation conditionnelle, toutefois, pour la distribution

jointe normale des corrélations partielles et conditionnelles, sont égaux.

Page 15: « Prévision du Risque de Contagion de six Marchés ... · Kurowicka et Cooke (2006), et Joe (1996)) . L’analyse prédictive du comportement du processus des co-mouvements conditionnels

14

l’arbre doit avoir tout au plus deux voisins3. Un Vine est appelé Vine régulier sur n éléments si :

1. ( )1,..., nv T T=

2. 1T est un arbre avec un nœud 1 1,...,N n= et un bord (Edge) noté 1E , et pour 2,..., 1i n= − , iT

est un arbre avec les nœuds 1i iN E−= ;

3. pour 2,..., 1i n= − , si { }2 3,a a a= et { }2 3,b b b= sont deux nœuds dans iN connecté par

un bord (Edge), alors exactement un élément de ia égal à un élément de ib . Avec

2 3 2 3 1, , , ia a b b N+∈ .

Figure 3 : Structure D et C-Vine à 4 variables

D-Vine C-Vine

Source: D. Kurowicka, R.M. Cooke (2008)

L’utilisation des Vines dans la détermination de la matrice de corrélations de rangs est d’une grande importance. Les Vines5 permettent la construction de la distribution bivariée jointe et conditionnelle. Pour y arriver, il faut associer corrélation de rangs conditionnelle6 à chaque bord du Vine. Cette affectation du rang de corrélation sur les bords implémentés par un copula-Vine est consistant. En effet, quand il est nécessaire d'avoir les modèles de copules avec la réflexion asymétrie et flexible de dépendance de queue inférieure / supérieure, alors les copula-Vines peuvent être efficace (Bedford et Cooke (2002, 2001), Kurowicka et Cooke (2006), la section 4.5 de Joe (1997) et Joe (1996)).

2.4.3.2. Construction de distribution jointe conditionnelle avec Copula-Vines

Le vine permet la construction d'une distribution conjointe de deux variables et conditionnelle des distributions bivariées. Mais avant d’arriver à cette construction, nous allons énoncer quelque résultat important sur la fonction de densité conditionnelle. Soit X un vecteur aléatoire n -dimension. Supposons µ l’espérance de X et V sa matrice de covariance.

Considérons une subdivision des variablesX , de µ et V tel que :

Page 16: « Prévision du Risque de Contagion de six Marchés ... · Kurowicka et Cooke (2006), et Joe (1996)) . L’analyse prédictive du comportement du processus des co-mouvements conditionnels

15

, ,a a aa ab

ba bbb b

X V VX V

V VX

µµ

µ

= = =

(2.28)

Avec ( ) ( ) ( ) ( )' ' ' '

1 1 1 1,..., , ,..., , ,..., , ,...,a k b k n a k b k nX X X X X X µ µ µ µ µ µ+ += = = = pour toutk n<

. { }( ),varii i a bV X ∈= et ( )cov ,ab a bV X X= . Et ( )|varb a bX représente la variance conditionnelle

de bX sachant aX .

Proposition : si la subdivision de vecteur aléatoire suit la distribution

( ) ( ), , , aa aba b a b

ba bb

V VX X N V

V Vµ µ

=

� (2.29)

Alors :

(i). la distribution marginale de aX est normale avec une moyenne de aµ et de variance aaV ;

(ii). La distribution conditionnelle de ( )|b aX X est normale avec une moyenne

( ) ( )1| .b a b b ba aa a aE X V V xµ µ−= + − (2.30)

et de variance ( ) 1| |varb a b bb a bb ba aa abX V V V V V−= = − (2.31)

On obtient la distribution conditionnelle ( )|j i jF x , en calculant une intégrale triple. Exemple de

la distribution conditionnelle de

( ) ( ) ( )3 1

3|2 3 21 2 1 31 1 10 0, ,

xF x c x x c v x dx dv= ∫ ∫ . (2.32)

Pour trouver la densité de distribution correspondant à la dépendance d’un Vine, nous allons considérer la Figure3 (D-vine). Ensuite on supposera que les variables aléatoire sur le Vine sont uniformes (0,1). La densité de distribution est définie par la fonction :

( ) ( ) ( ) ( ) ( )1,2 2,3 3,4 4,51 2 3 4 1 2 2 3 3 4 4 5, , , , , , ,r r r rf x x x x c x x c x x c x x c x x= × (2.33)

( ) ( )( ) ( ) ( )( )1,3|2 1,2 2 3 ,2 ; 2 2 ,4|3 2 ,3 3 3 ,4 3; 1 3 ; 2 ; 4, ,r r x r x r r x r xc F x F x c F x F x

( ) ( )( ) ( ) ( )( )( )1,4|2 ,3 2 ,3; 2 3 ,4 ; 31,3|2 1,2 ; 2 1 2 ,4|3 2 ,3 ; 3 23 4; ;,r x r xr r x r xr F x r F xc F F x F F x×

5. Quelques propriétés des vines sont détaillées dans [Kurowicka et Cooke, 2006a]

6. La corrélation de rang (conditionnelle) est la mesure de dépendance d'intérêt en raison de sa proximité relation avec les copules conditionnelles utilisées dans les réseaux de croyance Bayésienne non-paramétriques, vu que cette mesure ne parvient pas à capturer les dépendances non-monotones.

Page 17: « Prévision du Risque de Contagion de six Marchés ... · Kurowicka et Cooke (2006), et Joe (1996)) . L’analyse prédictive du comportement du processus des co-mouvements conditionnels

16

Avec ,i jrc la densité de copule avec corrélation de rang ,i jr et ( )

, ;i j x jr iF x qui est la fonction

de distribution cumulative conditionnelle de iX sachant jX obtenue à partir de copule

bivariée de corrélation de rang ,i jr . Le reste du travail permettant d’échantillonner la

distribution joint spécifiée par la corrélation de rang conditionnelle sur un Vine pour une copule donnée, peut être effectué à l’aide d’algorithme dédié (O. Morales, D. Kurowicka, A.

Roelen (2008)). Pour la simulation, nous allons considérer cinq variables aléatoires 1 5,...,X X

qui permettront de simuler cinq variables uniformes1 5,...,U U compris dans( )0,1 .

( )

( ) ( )( )( ) ( ) ( )( ) ( )

1

2 1,2 ; 12

3 2 ,3; 2 1,2 ; 13 1,3|2 ; 22 ,3 ; 32

1 1

12 1,2; 2

1 13 2,3; 31,3|2;

1 1 14 3,4; 42,4|3; 1,4|2 ,3;

r x

r x r xr Fr xx

r x

r x r F x

r x r F x r F F x

x u

x F u

x F F u

x F F F u

− −

− − −

=

=

=

=

(2.34)

Avec ( ), | ;i j ir k x jF x qui représente la fonction de distribution cumulative conditionnelle de

iX sachant jX obtenu à partir de copule avec pour corrélation de rang , |i jr k et 1F − désigne

l’inverse de cette fonction. À l’aide de la structure du réseau de croyance Bayésienne on

pourra lire l’indépendance conditionnelle de iX et jX sachant kX .

2.4.3.3. Elicitation de corrélation de rangs conditionnelle et inconditionnelle à partir de Probabilité conditionnelle

Dans un réseau de croyance Bayésienne continue non paramétrique, considérons que chaque

variable i de parents 1 ( ),..., p ii i est associé l’arc ( )p i ki i− → par la corrélation de rangs

conditionnelle:

( ) ( ) 1

, ( ),

, ( ) | ,..., ,

0

1 ( ) 1p i p i k

i ip i

i ip i k i i

r k

r k p i− +−

= ≤ ≤ − (2.35)

L’affectation est vide si { }( ) ( ),...,p i p ii i = ∅ et les corrélations de rang sont compris entre

[ ]1,1− .

Page 18: « Prévision du Risque de Contagion de six Marchés ... · Kurowicka et Cooke (2006), et Joe (1996)) . L’analyse prédictive du comportement du processus des co-mouvements conditionnels

17

Figure 4 : Exemple de réseau de croyance Bayésienne à 4 variables

Pour pouvoir éliciter la corrélation de rang, on suppose que la variable X est observée sur

son iemeq quantile. Maintenant on se demande, quelle est la probabilité que Y soit aussi

observée au-delà du iemeq quantile ?

Selon O. Morales, D. Kurowicka et A. Roelen (2008), la réponse à cette question revient à

estimer la probabilité ( )4 31 4 3( ) | ( )X XP P F X q F X q= > > . (2.36)

Cette probabilité de dépassement, peut être calculée en intégrant numériquement la densité

normale bivariée ( )3 4 4,3, ,x xφ ρ sur la région correspondante à la région de dépassement du

quantile ( ) )21 ,q−Φ ∞ . Il s’agit donc de trouver ρ qui satisfait la probabilité conditionnelle

et le transformer en corrélation de rang en utilisant la fonction inverse (précédente).

( ) ( )( )1 1 3 4 4 ,3 3 4

1, ,

1 q qx x dx dx

qφ ρ

− −

∞ ∞

Φ Φ− ∫ ∫ (2.37)

Avec 1−Φ la fonction de distribution cumulative normale standard inverse.

Compte tenu de la propriété d’indépendance zéro et de la corrélation zéro, pour tout

1, 1q P q= − . La valeur de la probabilité conditionnelle dans l’intervalle [ )0,1 q− correspond à

la corrélation négative et la probabilité positive est atteinte lorsque1 1P q> − .

2.4.3.4. Elicitation de corrélation de rang conditionnelle à partir de probabilité d’excès conditionnelle

Il est d’abord question ici, d’étendre la procédure d’elicitation au delà de la corrélation de rangs conditionnelle précédente. En d’autres termes, il s’agit d’utiliser le 50ième percentile pour générer des probabilités d’excès. Ensuite se servir d’une copule pour trouver la relation entre la probabilité de dépassement et la corrélation de rang conditionnelle. En faisant

l’hypothèse que les variables 3X et 2X sont observées au dessus de leur médiane, il sera

question de savoir quelle est la probabilité que 4X sera observée au dessus de sa médiane ? ,

pour résoudre cette elicitation, il faut estimer la probabilité

( )4 3 22 4 3 2( ) 0.5 | ( ) 0.5, ( ) 0.5X X XP P F X F X F X= > > >

(2.38)

Page 19: « Prévision du Risque de Contagion de six Marchés ... · Kurowicka et Cooke (2006), et Joe (1996)) . L’analyse prédictive du comportement du processus des co-mouvements conditionnels

18

Lorsqu’on suppose l’indépendance entre3X , 4X et 2X , sur le réseau de croyance Bayésienne,

la matrice de corrélation de la distribution normale jointe correspondante à cette Vine, a la forme suivante :

4,4 4,3 4,2 4,3 4,2

4,3 3,3 3,2 4,34,3,2

4,2 3,2 2,2 4,2

1

1 0

0 1

ρ ρ ρ ρ ρρ ρ ρ ρρ ρ ρ ρ

= =

(2.39)

Ainsi étant donné la valeur de 4,3r la relation entre 2P et 4,3|2r peut être déterminée par la

transformation en4,2|3ρ , par le calcul de la triple intégrale suivante :

( )4 3 2 4,3 4,2|3 4 3 20 0 0

1, , , ,

0.5 0.5x x x dx dx dxφ ρ ρ

∞ ∞ ∞

⋅ ∫ ∫ ∫ (2.40)

Nous notons que( )4 3 2 4,3 4,2|3, , , ,x x xφ ρ ρ , est la densité de la fonction de distribution normale

avec la matrice de corrélation 4,3,2∑ calculée à partir d’une Vine normale. Seconde

hypothèse, nous supposons que les variables3X , 2X et 1X sont observées au dessus de leur

médiane. Alors quelle est la probabilité que 4X sera observée au dessus de sa médiane ?

Cette elicitation revient à estimer la probabilité :

( )4 3 23 4 3 2 1 1( ) 0.5 | ( ) 0.5, ( ) 0.5, ( ) 0.5X X X XP P F X F X F X F X= ≥ ≥ ≥ ≥

(2.41)

La matrice de corrélation de la distribution jointe correspondant à un D-Vine sur1X , 2X , 3X

et 4X est donnée par la matrice suivante :

4,4 4,3 4,2 4,1 4,3 4,2 4,1

4,3 3,3 3,2 3,1 4,3

4,3,2,14,2 3,2 2,2 2,1 4,2

4,1 3,1 2,1 1,1 4,1

1

1 0 0

0 1 0

0 0 1

ρ ρ ρ ρ ρ ρ ρρ ρ ρ ρ ρρ ρ ρ ρ ρρ ρ ρ ρ ρ

= =

(2.42)

Avec ( )4 3 2 1 4,3 4,2 4,1|3,2, , , , , ,x x x xφ ρ ρ ρ qui représente la fonction de densité des quatre variétés

de distribution normale standard. La relation entre 2P et 4,1|3,2r sera déterminée par la

transformation correspondante à4,1|3,2ρ , par le calcul de la quadruple intégrale suivante :

( )4 3 2 1 4,3 4,2, 4,1|3,2 4 3 2 10 0 0 0

1, , , , ,

0.5 0.5 0.5x x x x dx dx dx dxφ ρ ρ ρ

∞ ∞ ∞ ∞

⋅ ⋅ ∫ ∫ ∫ ∫ (2.43)

Page 20: « Prévision du Risque de Contagion de six Marchés ... · Kurowicka et Cooke (2006), et Joe (1996)) . L’analyse prédictive du comportement du processus des co-mouvements conditionnels

19

2.4.4. L'apprentissage de la structure d'un réseau de croyance Bayésienne non-paramétrique avec Copule

L’apprentissage de la structure d’un réseau de croyance Bayésienne non paramétrique avec copule, est possible grâce à un algorithme élaboré par A.M. Hanea, D. Kurowicka, R.M. Cooke, D.A. Ababei (2010). L’algorithme d’apprentissage utilisé par les auteurs s’appuie sur la connexion entre Copule-Vines et le réseau de croyance Bayésienne. Mais aussi sur une heuristique fondamentale qui stipule que les corrélations partielles sont approximativement égales à la corrélation de rangs. Les hypothèses complémentaires d’apprentissage de la structure exigent que la distinction soit faite entre le déterminant de la matrice de corrélation de rangs empirique (DER); le déterminant de la matrice de corrélation de rangs obtenue en transformant les distributions en une distribution normale (DNR) à l’aide de la transformation de Pearson (1907) et le déterminant de la matrice de corrélation des rangs calculé à l'aide de copule sur un réseau de croyance Bayésienne (DBBN ). Après cela, lorsque que le réseau de croyance Bayésienne n’est pas saturé, alors on observeDBBN DNR> .

Lorsque la corrélation partielle calculée est égale à zéro, cela correspond à une relation d'indépendance conditionnelle encodée dans la structure du réseau de croyance Bayésienne. Étant donné que cette heuristique est parfaitement applicable à une structure déjà construite par un spécialiste, il s’agira donc de chercher à compresser le graphe. On procède à l’élimination de certains arcs en utilisant la méthode de réduction le déterminant de la matrice de corrélation des rangs jusqu'à l’obtention du meilleur graphe possible. En effet, en utilisant le déterminant de la matrice de corrélation partielle conditionnelle associé aux arcs reliant les nœuds du réseau de croyance Bayésienne et l’approche des Vines copula, on peut chercher à éliminer ou ajouter des arcs. Ensuite, on reconstruit le réseau de croyance Bayésienne en ajoutant des arcs entre les variables que si la corrélation de rangs entre ces deux variables est parmi les plus importantes. Supprimer également les arcs du réseau, qui correspondent à des corrélations de rang très petites.

La procédure générale peut être représentée comme suit:

1. Vérifiez que le DER ne soit pas en dehors de la bande de confiance centrale plausible pour le DNR;

2. Construire un squelette de réseau de croyance Bayésienne

3. Si le DNR se trouve à 90% dans la bande de confiance du déterminant du réseau de croyance Bayésienne squelettique, alors arrêter, sinon continuer à l’étapes suivante;

4. Trouver la paire de variables ( ),i jX X de telle sorte que l’arc,i j ne soit pas dans le

réseau de croyance Bayésienne et le 2ijr est supérieure à la corrélation de rangs au carré de

toute autre paire qui ne soit pas dans le réseau de croyance Bayésienne. Ajouter un arc entre les nœuds, i et j et recalculé le DBBN avec l’intervalle de confiance de 90%.

5. Si le DNR se trouve à 90% dans la bande centrale de confiance des DBBN, alors arrêter, sinon répétez l'étape 4.

Page 21: « Prévision du Risque de Contagion de six Marchés ... · Kurowicka et Cooke (2006), et Joe (1996)) . L’analyse prédictive du comportement du processus des co-mouvements conditionnels

20

2.5. Causalité conditionnelle non-linéaire sur réseaux de croyance Bayésienne dynamique

Nous présentons ici le modèle permettant de réaliser l’analyse de causalité de Granger sur un réseau de croyance Bayésienne. Il s’agit d’utiliser toute la structure de ce réseau, ses techniques d’apprentissage pour prédire les relations de causalité conditionnelle des événements analysés (Cunlu Zou et Jianfeng Feng (2009)). L’avantage de ce test de causalité est qu’il supprime toute relation causale existant dans les données pour prendre en compte uniquement celle prédite par le modèle. Cela dit, si nous considérons deux séries temporelles

tX et tZ , il est possible de trouver une représentation autorégressive joint de tX et tZ en

utilisant la connaissance sur leur passé. SupposonsX ,Y et Z trois séries, qui sont supposées stationnaires. L’idée est de savoir comment Ycause X conditionnel àZ . L’expression générale pour ce model non linéaire est :

( ) ( )

( ) ( )

1 2 6

3 4 7

t j j t j j j t jj j

t j j t j j j t jj j

X w X w Z

Z w X w Z

ε

ε

− −

− −

= Φ + Φ + = Φ + Φ +

∑ ∑

∑ ∑ (2.44)

La fonction Φ peut être une fonction kernel de X et Z dont définie par :

( ) ( )2 2exp || || / 2j j XX X X σΦ = − −

( ) ( )2 2exp || || / 2j j ZZ Z Z σΦ = − − (2.45)

Où X et Z représente le centre de X etZ . 2Xσ et 2

Zσ sont les variances de X et Z . La

matrice de covariance des erreurs de prédiction est définie par :

( ) ( )( ) ( )

2 26 6 7 11 12

2 27 6 7 21 22

var cov ,

cov , var

s ss

s s

ε ε εε ε ε

= =

(2.46)

On retrouve alors la représentation autorégressive jointe suivante :

( ) ( ) ( )

( ) ( ) ( )

( ) ( ) ( )

5 6 7 8

8 9 10 9

11 12 13 10

t j j t j j j t j j j t jj j j

t j j t j j j t j j j t jj j j

t j j t j j j t j j j t jj j j

X w X w Y w Z

Y w X w Y w Z

Z w X w Y w Z

ε

ε

ε

− − −

− − −

− − −

= Φ + Φ + Φ +

= Φ + Φ + Φ +

= Φ + Φ + Φ +

∑ ∑ ∑

∑ ∑ ∑

∑ ∑ ∑ (2.47)

Et la matrice de covariance des erreurs peut être exprimée par:

Page 22: « Prévision du Risque de Contagion de six Marchés ... · Kurowicka et Cooke (2006), et Joe (1996)) . L’analyse prédictive du comportement du processus des co-mouvements conditionnels

21

( ) ( ) ( )( ) ( ) ( )( ) ( ) ( )

2 2 2

8 8 9 8 102 2 2

9 8 9 9 10

2 2 210 8 10 8 10

var cov , cov ,

cov , var cov ,

cov , cov , var

XX XY XZ

YX YY YZ

ZX ZY ZZ

ε ε ε ε εε ε ε ε εε ε ε ε ε

= =

∑ ∑ ∑

∑ ∑ ∑ ∑

∑ ∑ ∑ (2.48)

Le test de causalité conditionnelle de Granger de tYvers tX conditionnelle à tZ peut être

défini par :

( )( )

6|

8

| var |ln

| var |t

Y X Zt

Fεε→

=

(2.49)

Il résulte de ce test, que lorsque l’influence causale de tY vers tX est effectuée par le biais

de tZ , alors dans ce cas le coefficient 6 jw est uniformément égal à zéro. On Conclut donc que

le modèle autorégressif pour les deux séries et trois séries seront exactement les mêmes. On

obtient alors ( ) ( )6 8var vart tε ε= . Et on en déduit que | 0Y X ZF → = . Ce qui signifie que tY ne

peut pas améliorer la prédiction de tX en incluant le passé de tY conditionnel à tZ .

Cependant, lorsque ( ) ( )6 8var vart tε ε> et | 0Y X ZF → = , nous concluons qu’il y a influence

directe de Y vers X conditionnelle au passé mesuré deZ .

3. Analyse prédictive du risque de contagion financière sur les six grands marchés financiers

3.1. Hypothèses de modélisation

• Nous supposons que la contagion est un système dynamique et complexe.

• La contagion est la transmission aléatoire du risque vers un marché B sachant que l’origine est un marché A avec une probabilité conditionnelle mesurée par la table de probabilité conditionnelle (CPT).

• L’accroissement des Co-mouvements conditionnelles du risque est une preuve de contagion

• L’orientation des arcs du réseau de croyance Bayésienne représente les sens de causalité conditionnelle.

• Les nœuds du réseau sont des variables aléatoires qui représentent les différents marchés financiers analysés et qui interagissent les uns sur les autres avec une probabilité Bayésienne.

• La corrélation des rangs représente l’influence future entre les variables rattachées à une probabilité de croyance.

Page 23: « Prévision du Risque de Contagion de six Marchés ... · Kurowicka et Cooke (2006), et Joe (1996)) . L’analyse prédictive du comportement du processus des co-mouvements conditionnels

22

• Il peut exister des causes et effets communs cachés entre les marchés qui seraient à l’origine de la contagion financière.

3.2. Méthodologie empirique et résultats

3.2.1. Base de données

Les données étudiées pour la prédiction, concernent les indices du CAC40, S&P500, FTSE100 et NIKKEI225, DAX et SSEC de 2007 à 2010. Nous avons choisi cette période d’observation car nous prenons comme référence la période de la crise des subprimes. Nous avons effectué un prétraitement des données en prenant en compte les données par semaine pour corriger les effets de décalage entre marchés.

3.2.2. Résultats

Nous réalisons l’analyse prédictive du risque de contagion ici, avec une méthodologie hybride c'est-à-dire l’usage de réseau de croyance Bayésienne paramétrique et non paramétrique continu. En pratique, la littérature montre que les réseaux de croyance Bayésienne sont efficaces sur de petits échantillons. Pour la forme paramétrique du modèle, nous utilisons comme données en entrée, la matrice de corrélation empirique calculée à l’aide de la forme non-paramétrique. La première étape de notre démarche concerne la détermination de la matrice de corrélation empirique en utilisant le réseau de croyance Bayésienne non-paramétrique. L’utilisation de la matrice de corrélation est liée au fait que nous considérons cette matrice comme étant dynamique et les paires de corrélation sont des micro-corrélations. À l’aide d’extraction automatique des connaissances des réseaux de croyance Bayésienne paramétrique, nous effectuons la prédiction de la dynamique de causalité conditionnelle globale de la matrice de corrélations empiriques que nous considérons comme des micro-corrélations. Les résultats sont matérialisés par la construction automatique d’un réseau de croyance Bayésienne, puis complétés par un test de causalité conditionnelle non-linéaire. Cette étape nous permet de comprendre la structure complexe des interactions de la matrice de corrélations empiriques avant l’elicitation de la corrélation de rangs conditionnelle à partir de la probabilité conditionnelle. Après cette analyse prédictive préalable, la deuxième étape consiste à la construction automatique et supervisée de notre réseau de croyance Bayésienne non-paramétrique continu selon l’algorithme élaboré par A.M. Hanea, D. Kurowicka, R.M. Cooke, D.A. Ababei (2010) avec comme nœuds, les différents marchés. Le premier objectif est de réaliser la construction d’un graphe saturé par apprentissage automatique qui représentera la dynamique globale des co-mouvements conditionnels des marchés. Ensuite, on calcule les corrélations empiriques après un test de validation de l’usage de copule normale sur le réseau de croyance Bayésienne. Le deuxième objectif est de construire un graphe saturé par apprentissage supervisé en changeant à chaque fois le point de départ de la crise (Ground zero), et prédire les corrélations de rangs conditionnelles. Nous ajoutons à chaque fois des arcs entre les nœuds dont les corrélations empiriques sont élevées, jusqu'à obtention d’un graphe saturé puis nous testons la validité du modèle en vérifiant si le DNR se trouve à 90% dans l’intervalle de confiance. Cependant, on peut également retirer les graphes ayant une corrélation empirique proche de zéro et les réordonner de sorte que la valeur du DNR reste à l'intérieur de l'intervalle de confiance du DBBN.

Page 24: « Prévision du Risque de Contagion de six Marchés ... · Kurowicka et Cooke (2006), et Joe (1996)) . L’analyse prédictive du comportement du processus des co-mouvements conditionnels

23

3.2.2.1. Extraction de connaissances à partir des données à l’aide de réseau de croyance Bayésienne paramétrique

Les premiers tests présentés ici, montrent bien qu’il y a une forte interaction entre les marchés étudiés. Selon les résultats obtenus, la matrice de corrélation, n’est pas si stable que nous le croyons au départ ; il y a une certaine dynamique globale dans la matrice de corrélation. La matrice des micro-corrélations (matrice de corrélation empiriques) change, chaque fois que la structure du réseau est modifiée. En effet, que ce soit avec le réseau de croyance Bayésienne construit par apprentissage automatique ou que ce soit avec le réseau de croyance Bayésienne non-paramétrique, les résultats sont visibles à travers le réseau présenté en dessous. La présence des arcs orientés marque les relations de causalité entre les variables. Quant au test de causalité conditionnelle, la valeur 0 représente l’absence de causalité, par ailleurs la présence de 1 désigne la présence de causalité.

Le réseau Bayesien ci-dessous représente l’interaction dynamique des éléments de la matrice de corrélation de rangs des marchés financiers soumis à notre analyse. Ce réseau est obtenu par construction automatique à l’aide d’apprentissage automatisé. Dans ce réseau acyclique, les différents nœuds identifiés par des chiffres sont les positions des éléments constituant de cette matrice de corrélation empirique. Les arcs montrent le sens d’influence causale qu’exerce chaque élément de la matrice sur les autres éléments en fonction des numéros. Le système d’apprentissage du modèle supprime toutes les relations existant dans les données et prend en compte uniquement les relations trouvées par apprentissage. Une chose est certaine, ces résultats montrent qu’il existe une forte interaction au sein de la matrice de corrélation empirique.

Figure 5 : extraction automatique de connaissance à partir des données

Page 25: « Prévision du Risque de Contagion de six Marchés ... · Kurowicka et Cooke (2006), et Joe (1996)) . L’analyse prédictive du comportement du processus des co-mouvements conditionnels

24

Tableau 1 : Causalité non-linéaire prédite par le réseau de croyance Bayésienne paramétrique

Edges Causality Edges Causality Edges Causality

1 ->1 0 1 ->2 0 1 ->3 0

1 ->4 0 1 ->5 0 1 ->6 0

1->7 0 1 ->8 0 1 ->9 1

1 ->10 0 1 ->11 1 1 ->12 0

2 ->1 0 2 ->2 0 2 ->3 0

2 ->4 0 2 ->5 0 2 ->6 0

2 ->7 0 2->8 0 2 ->9 0

2 ->10 0 2 ->11 0 2 ->12 0

3 ->1 0 3 ->2 0 3 ->3 0

3 ->4 0 3 ->5 0 3 ->6 0

3 ->7 0 3 ->8 0 3 ->9 0

3 ->10 0 3 ->11 0 3 ->12 0

4 ->1 0 4 ->2 0 4 ->3 0

4 ->4 0 4 ->5 0 4 ->6 0

4 ->7 1 4 ->8 0 4 ->9 0

4 ->10 0 4 ->11 0 4 ->12 0

5 ->1 0 5 ->2 0 5 ->3 0

5 ->4 0 5 ->5 0 5 ->6 0

5 ->7 0 5 ->8 0 5 ->9 0

5 ->10 0 5 ->11 0 5 ->12 0

6 ->1 1 6 ->2 0 6 ->3 0

6 ->4 0 6 ->5 0 6 ->6 0

6 ->7 0 6 ->8 1 6 ->9 0

6 ->10 0 6 ->11 0 6 ->12 0

7 ->1 0 7 ->2 0 7 ->3 0

7 ->4 0 7 ->5 0 7 ->6 0

Page 26: « Prévision du Risque de Contagion de six Marchés ... · Kurowicka et Cooke (2006), et Joe (1996)) . L’analyse prédictive du comportement du processus des co-mouvements conditionnels

25

Edeges Causality Edges Causality Edeges Causality

7 ->7 0 7 ->8 0 7 ->9 0

7 ->10 0 7 ->11 0 7 ->12 0

8 ->1 0 8 ->2 0 8 ->3 0

8 ->4 1 8 ->5 0 8 ->6 0

8 ->7 0 8 ->8 0 8 ->9 0

8 ->10 1 8 ->11 0 8 ->12 0

9 ->1 0 9 ->2 0 9 ->3 0

9 ->4 0 9 ->5 0 9 ->6 0

9 ->7 0 9 ->8 0 9 ->9 0

9 ->10 0 9 ->11 0 9 ->12 0

10 ->1 0 10 ->2 0 10 ->3 1

10 ->4 0 10 ->5 0 10 ->6 0

10 ->7 0 10 ->8 0 10 ->9 0

10 ->10 0 10 ->11 0 10 ->11 0

11 ->1 0 11 ->2 1 11 ->3 0

11 ->4 0 11 ->5 0 11 ->5 0

11 ->7 0 11 ->8 0 11 ->8 0

11 ->10 0 11 ->11 0 11 ->12 1

12 ->1 0 12 ->2 0 12 ->3 0

12->4 0 12 ->5 0 12 ->6 0

12 ->7 0 12 ->8 0 12 ->9 0

12 ->10 0 12 ->11 0 12 ->12 0

3.2.2.2. Modélisation haute dimension de la dépendance stochastique et prédiction des co-mouvements sur réseau de croyance Bayésienne non-paramétrique

Dans cette partie, nous effectuons l’analyse prédictive sur les différents indices de marchés dans le but d’obtenir des prédictions de corrélations de rangs conditionnelles entre les marchés. Cela nous permettra d’anticiper le sens et le degré du risque de contagion entre les marchés. Le sens des arcs du réseau, nous situe sur le sens de causalité conditionnelle et les corrélations des rangs conditionnelles sur les arcs obtenus avec le réseau de croyance Bayésienne continu non-paramétrique nous renseignent sur l’ampleur des co-mouvements,

Page 27: « Prévision du Risque de Contagion de six Marchés ... · Kurowicka et Cooke (2006), et Joe (1996)) . L’analyse prédictive du comportement du processus des co-mouvements conditionnels

26

donc de la contagion. Les prévisions du modèle révèlent que si nous approchons le niveau de co-mouvements atteint pendant la crise des subprimes, nous arrivons à faire un nombre de conclusions importants. Nous constatons que la contagion des marchés financiers se comporte comme un système complexe lorsque les marchés commencent à interagir entre eux. En d’autres termes, nous constatons que la structure des co-mouvements entre les marchés se modifie considérablement une fois que la structure du réseau Bayesien change et se complexifie (lorsque les interconnexions du réseau deviennent denses). En effet, lorsque les marchés interagissent fortement, certains marchés financiers qui avaient un faible niveau de co-mouvement commencent à présenter des signes de forte interdépendance temporaire par rapport à un simple cas bivarié. Cependant on observe l’inverse pour certains marchés. Les prévisions montrent à travers le réseau de croyance Bayésienne non-paramétrique des six indices obtenu par apprentissage automatique que le S&P500 est bien le ground zero de la contagion. Le deuxième constat que nous faisons est que la zone euro à travers le CAC40 et le DAX, reste un nœud central dans la stabilité du réseau financier. Une fois ces deux marchés en crise, il se crée le plus grand réseau de contagion de notre étude lorsque nous faisons une comparaison avec les autres.

En considérant le S&P500 comme Ground zero (point de départ de la crise) avec le même niveau les co-mouvements des subprimes comme niveau d’alerte, le modèle révèle que la probabilité de propagation de la crise par contagion vers de le CAC40 sachant qu’elle s’est produite sur le S&P500 est élevée avec un co-mouvement de 0.79. Et le risque que la contagion se déplace du S&P500 vers le CAC40 sachant que FTSE100 et SSEC sont en crise est fort, avec un co-mouvement de 0.79. Le risque que la crise se transmet du S&P500 vers le DAX par contagion sachant que le S&P500 en crise, atteint un niveau de 0.80 et même constat pour 100 40 |FTSE CAC SSEC→ avec un niveau de co-mouvement de 0.80. Par ailleurs, le

risque de dissémination de la crise par effet de contagion pour toutes les autres relations conditionnelles reste relativement faible.

En supposant que CAC40 est le Ground zero de la crise, nous remarquons que le risque de contagion vers le marché DAX sachant que le CAC40 est en crise, est élevé avec une corrélation conditionnelle de 0.82. On observe également que le risque de propagation des chocs en direction du FTSE100 sachant que le DAX est atteint par la crise est significatif avec un co-mouvement de 0.73. Le constat est identique en ce qui concerne la propagation de la contagion en direction des marchés suivants 40 100 |CAC FTSE DAX SSEC→ ; et

100 & 500 | 40 ;FTSE S P CAC DAX SSEC→ ; avec des co-mouvements respectifs de 0.90 et

0.63. Par contre, le risque de contagion reste relativement faible pour le reste des relations conditionnelles des marchés.

Lorsqu’on considère le DAX comme Ground zero, on constate un risque de contagion élevé en direction du CAC40 sachant que le DAX est touché par la crise avec un co-mouvement de 0.82. Nous notons également un niveau de risque de contagion vers le FTSE100 sachant que le CAC40 est en crise avec un co-mouvement de 0.73 et aussi un niveau de contagion élevé (0.95) entre le CAC40 et le FTSE100 sachant que le DAX est en touché par la crise. La probabilité de transmission des chocs du DAX vers le

Page 28: « Prévision du Risque de Contagion de six Marchés ... · Kurowicka et Cooke (2006), et Joe (1996)) . L’analyse prédictive du comportement du processus des co-mouvements conditionnels

27

S&P500 sachant que le CAC40 est touché par la crise est évidente avec un niveau de 0.65. Le modèle met également en lumière une dissémination du risque par effet de contagion entre les marchés financiers matérialisés par les relations conditionnelles ci-dessous avec des niveaux de co-mouvements significatifs respectifs (0.51 et 0.57) pour :

40 225 | & 500 100 ;CAC NIKKEI S P SSEC FTSE DAX→ ; ; 100 & 500 | 40 ; ;FTSE S P CAC DAX SSEC→ .

Tableau 2 : Prédiction des Corrélations de Rangs Conditionnelles sachant que S&P500 est le Ground zero

Bayesian Belief Nets (Conditional) Rank Correlation Coefficient Value Probability (CPT)

DAX SSEC→ 0.12 59%

& 500S P DAX→ 0.50 98%

& 500 100S P FTSE→ 0.49 82%

& 500 225S P NIKKEI→ 0.19 22%

& 500 40 |S P CAC DAX→ 0.79 58%

100 | & 500FTSE DAX S P→ 0.80 95%

100 225 | & 500FTSE NIKKEI S P→ 0.24 56%

& 500 | ; 100S P SSEC DAX FTSE→ 0.10 42%

100 | & 500 ;FTSE SSEC S P DAX→ 0.21 59%

100 40 | ; & 500FTSE CAC DAX S P→ 0.80 80%

& 500 40 | 100 ;S P CAC FTSE SSEC→ 0.79 80%

225 | & 500 100DAX NIKKEI S P FTSE→ ; 0.30 4%

40 | ; 100 ; & 500CAC SSEC DAX FTSE S P→ 0.14 12%

40 225 | & 500 ; 100 ;CAC NIKKEI S P FTSE DAX→ 0.31 13%

225 | & 500 ; 40SSEC NIKKEI S P FTSE DAX CAC→ ; ; 0.22 58%

(CPT): conditional probability table

Page 29: « Prévision du Risque de Contagion de six Marchés ... · Kurowicka et Cooke (2006), et Joe (1996)) . L’analyse prédictive du comportement du processus des co-mouvements conditionnels

28

Figure 6 : réseau de croyance Bayésienne des marchés construit par apprentissage automatique

Page 30: « Prévision du Risque de Contagion de six Marchés ... · Kurowicka et Cooke (2006), et Joe (1996)) . L’analyse prédictive du comportement du processus des co-mouvements conditionnels

29

Tableau 3 : Prédiction des Corrélations de Rangs Conditionnelles sachant que CAC40 est le Ground zero

Bayesian Belief Nets (Conditional) Rank Correlation Coefficient Value Probability (CPT)

DAX SSEC→ 0.12 42%

40CAC DAX→ 0.82 96%

100DAX FTSE→ 0.73 47%

40 & 500CAC S P→ 0.50 42%

40 |CAC SSEC DAX→ 0.18 59%

100 |SSEC FTSE DAX→ 0.19 52%

& 500 225S P NIKKEI→ 0.19 42%

& 500 | 40DAX S P CAC→ 0.49 53%

225 | & 500SSEC NIKKEI S P→ 0.23 92%

40 100 |CAC FTSE DAX SSEC→ ; 0.90 21%

& 500 | 40 ;SSEC S P CAC DAX→ 0.17 51%

100 225 | & 500 ;FTSE NIKKEI S P SSEC→ 0.32 92%

100 & 500 | 40 ;FTSE S P CAC DAX SSEC→ ; 0.63 48%

225 | & 500 ; 100DAX NIKKEI S P SSEC FTSE→ ; 0.42 58%

40 225 | & 500 ; 100 ;CAC NIKKEI S P SSEC FTSE DAX→ ; 0.41 4%

(CPT): conditional probability table

Page 31: « Prévision du Risque de Contagion de six Marchés ... · Kurowicka et Cooke (2006), et Joe (1996)) . L’analyse prédictive du comportement du processus des co-mouvements conditionnels

30

Figure 7 : schéma du réseau de croyance Bayésienne pour l’interaction des marchés

Page 32: « Prévision du Risque de Contagion de six Marchés ... · Kurowicka et Cooke (2006), et Joe (1996)) . L’analyse prédictive du comportement du processus des co-mouvements conditionnels

31

Tableau4 : Prédiction des corrélations de Rangs Conditionnelles sachant que DAX est le Ground zero

Bayesian Belief Nets (Conditional) Rank Correlation Coefficient Value Probability (CPT)

DAX SSEC→ 0.12 42%

40DAX CAC→ 0.82 70%

100DAX FTSE→ 0.73 25%

40 & 500CAC S P→ 0.50 76%

40 |CAC SSEC DAX→ 0.20 42%

& 500 225S P NIKKEI→ 0.19 32%

40 100 |CAC FTSE DAX→ 0.95 86%

& 500 | 40DAX S P CAC→ 0.65 95%

225 | & 500SSEC NIKKEI S P→ 0.26 22%

& 500 | 40 ;SSEC S P CAC DAX→ 0.19 43%

100 | ; 40FTSE SSEC DAX CAC→ 0.24 58%

100 225 | & 500FTSE NIKKEI S P SSEC→ ; 0.39 88%

100 & 500 | 40 ; ;FTSE S P CAC DAX SSEC→ 0.57 25%

225 | & 500 100DAX NIKKEI S P SSEC FTSE→ ; ; 0.49 32%

40 225 | & 500 100 ;CAC NIKKEI S P SSEC FTSE DAX→ ; ; 0.51 81%

(CPT): conditional probability table

Page 33: « Prévision du Risque de Contagion de six Marchés ... · Kurowicka et Cooke (2006), et Joe (1996)) . L’analyse prédictive du comportement du processus des co-mouvements conditionnels

32

Figure 8 : schéma du réseau de croyance Bayésienne pour l’interaction des marchés

4. Conclusion

Dans cet article nous avons essayé d’apporter une réponse à la question de la prévision de la contagion financière en utilisant une approche nouvelle. A l’aide de ce modèle de construction de la dépendance multivariée, nous arrivons à associer la corrélation conditionnelle avec la dynamique de causalité et incertitude de propagation de la contagion par le calcul de probabilité Bayésienne. Nous arrivons à résoudre dans le même temps la question de l’analyse multivariée simultanée. La prévision est réalisée à l’aide d’un montage de Vines -copula sur un réseau de croyance Bayésienne non-paramétrique avec une technique d’apprentissage spéciale. Nous arrivons à éliciter les corrélations de rangs conditionnelles entre les marchés en prenant en compte la réflexion asymétrique et la flexibilité des dépendances de queue inférieure/supérieur. Les prévisions du modèle révèlent que si nous

Page 34: « Prévision du Risque de Contagion de six Marchés ... · Kurowicka et Cooke (2006), et Joe (1996)) . L’analyse prédictive du comportement du processus des co-mouvements conditionnels

33

approchons le niveau de co-mouvements atteint pendant la crise des subprimes, nous arrivons à faire deux constats importants. Le premier constat permet de mettre en lumière que la contagion des marchés financiers se comporte comme un système complexe lorsque les marchés commencent à interagir, les marchés interagissent les uns sur les autres. En d’autres termes, nous constatons que les co-mouvements entre les marchés financiers se modifient considérablement une fois que la structure du réseau Bayesien commence à se complexifier (lorsque les interconnexions du réseau deviennent denses). En effet, lorsque les marchés interagissent fortement, certains marchés qui avaient un faible niveau de co-mouvement commencent à présenter des signes de forte interdépendance temporaire qui diffèrent du simple comportement individuel ou même bivariée. Le deuxième constat que nous faisons est que la zone euro à travers le CAC40 et le DAX reste un nœud critique dans la stabilité du réseau financier actuel. Une fois ces deux marchés en crise, il se crée le plus grand réseau de contagion lorsque nous faisons une comparaison avec les autres. À travers le réseau de croyance Bayésienne des six indices construits par apprentissage automatique nous constatons que le S&P500 est bien le ground zero de la contagion lors de la crise financière de 2007. Nous avons pu remarquer également que les relations de dépendance du réseau se complexifient au fur et à mesure que les nœuds s’accroissent. Les arcs et le calcul de corrélation croissent à un rythme exponentiel (cf. figure10). Nous suggérons d’analyser le problème de la structure des corrélations et sa stabilité par la théorie des matrices aléatoires lorsque la structure du réseau est grande et complexe.

Références

Bedford, T.J. , and Cooke, R.M. , "Vines - a new graphical model for dependent Random Variables" in Annals of Statistics, vol. 30, No.4, August 2002.

Bedford, T.J. and Cooke, R.M. "Probability density decomposition for conditionally dependent random variables modelled by Vines, " Annals of Mathematics and Artificial Intelligence, Volume 32 pp 245-268, 2001.

Cooke, R.M. , and Goossens, L.H.J.. "Procedures Guide for Structured Expert Judgement in Accidents

Consequence Modeling", Radiation Protection Dosimetry Vol. 90 No. 3.2000, pp 303-311

Cunlu Zou1 and Jianfeng Feng ”Granger causality vs. dynamic Bayesian network inference: a comparative study”, April 2009

David Barber “Bayesian Reasoning and Machine Learning” Cambrige university press 2012

Hanea, A.M., Kurowicka, D. and Cooke, R.M. “ Hybrid Method for Quantifying and Analyzing Bayesian Belief Nets” (2006) Quality and Reliability Engineering International 22,709-729, 2006.

Page 35: « Prévision du Risque de Contagion de six Marchés ... · Kurowicka et Cooke (2006), et Joe (1996)) . L’analyse prédictive du comportement du processus des co-mouvements conditionnels

34

Hanea, A., D. Kurowicka and R. M. Cooke, 2010, “Mining and Visualising Ordinal Data with Non-Parametric Continuous BBNs”, Computational Statistics and Data Analysis 54, pp. 668–87.

Hanea, A.M., Kurowicka, D. Cooke, R.M. and Ababei, D.A.A. “Ordinal data mining with nonparametric continuous Bayesian belief nets”, Dept. of Mathematics, T.U. Delft, 2008.

Hanea, A.M. “Algorithms for non-parametric Bayesian Belief Nets”, PhD thesis, Dept. of Mathematics, Delft University of Technology, 2008. Joe, H. , Relative entropy measures of multivariate dependence, Journal of the American Statistical

Kurowicka D., and Cooke R.M., A Parametrization of Positive Definite Matrices in Terms of Partial Correlation Vines", in Linear Algebra and its Application 372, 225-251, 2003.

Kurowicka D., and Cooke R.M., Completion Problem with Partial Correlation Vines, Linear Algebra and Its Applications,, vol. 418, nr 1, pp 188-200, 2006_B.

Kurowicka, D. , and Cooke, R.M. Uncertainty Analysis and High Dimensional Dependence Modeling Wiley, New York, 2006-A.

Kurowicka, D. , Cooke, R.M. , Sampling algorithms for generating joint uniform distributions using the vine-copula method, , Comp. Stat. & Data Analysis, Volume 51 , Issue 6 March 2007.

Kurowicka D, Cooke RM. Uncertainty analysis with high dimensional dependence modelling. New York: Wiley; 2006

Lewandowski, D. Cooke, R.M. and Duintjer Tebbens, R.J. "Sample Based Estimation of Correlation Ratio with Polynomial Approximation" Transactions on Modeling and Computer Simulation, vol. 18 no.1, article 3, 2007.

Morales, O., Kurowicka, D. and Roelen, A., Eliciting Conditional and Unconditional Rank Correlations from Conditional Probabilities, Special issue on expert judgment Reliability Engineering & System Safety, 93, pp, Available online 12 March 2007.

UffeB.Kjaerulff, Anders L. Madsen “ Bayesian network and influence Diagrams” A guide to construction and Analysis, Springer 2007.

Page 36: « Prévision du Risque de Contagion de six Marchés ... · Kurowicka et Cooke (2006), et Joe (1996)) . L’analyse prédictive du comportement du processus des co-mouvements conditionnels

35

Figure 10: Graphique Cobwebs

Page 37: « Prévision du Risque de Contagion de six Marchés ... · Kurowicka et Cooke (2006), et Joe (1996)) . L’analyse prédictive du comportement du processus des co-mouvements conditionnels

Documents de Recherche parus en 2014

DR n°2014 - 01: Sophie CLOT, Fano ANDRIAMAHEFAZAFY , Gilles GROLLEAU,

Lisette IBANEZ, Philippe MÉRAL «Payments for Ecosystem Services: Can we kill two birds with one stone? Insights from a Natural Field Experiment in Madagascar »

DR n°2014 - 02: Sophie CLOT, Gilles GROLLEAU, Lisette IBANEZ

« Moral self-licensing and social dilemmas: An experimental analysis from a taking game in Madagascar »

DR n°2014 - 03: Sophie CLOT, Charlotte STANTON

« Present Bias in Payments for Ecosystem Services: Insights from a Behavioural Experiment in Uganda»

DR n°2014 - 04: Rachida HENNANI, Michel TERRAZA

« La crise des dettes souveraines : contagions ou interdépendances des principaux indices de la zone euro ? »

DR n°2014 - 05: Klarizze Anne PUZON, Marc WILLINGER

« Why my Participation Matters: Rent-seeking with Endogenous Prize Determination »

DR n°2014 - 06: Mickaël BEAUD, Thierry BLAYAC, Maïté STEPHAN « Measurements and properties of the values of time and reliability »

DR n°2014 - 07: Tristan LE COTTY, Elodie MAITRE D’HOTEL, Raphaël SOUBEYRAN, Julie SUBERVIE « Wait and Sell: Farmers’ individual preferences and crop storage in Burkina Faso »

DR n°2014 - 08: Antoine NEBOUT, Marc WILLINGER « Are Non-Expected Utility Individuals really Dynamically Inconsistent? Experimental Evidence »

DR n°2014 - 09: Edmond BARANES, Julien JACQMIN, Jean-Christophe POUDOU

« Renewable and non-renewable intermittent energy sources: friends and foes? »

DR n°2014 - 10: Klarizze PUZON, Marc WILLINGER « Do Malevolent Leaders Provoke Conflict? An Experiment on

the Paradox of the Plenty »

Page 38: « Prévision du Risque de Contagion de six Marchés ... · Kurowicka et Cooke (2006), et Joe (1996)) . L’analyse prédictive du comportement du processus des co-mouvements conditionnels

DR n°2014 - 11: Paul BELLEFLAMME, Julien JACQMIN «An Economic Appraisal of MOOC platforms: Business Models

and Impacts on Higher Education »

DR n°2014 – 12: Edmond BARANES, Thomas CORTADE, Andreea COSNITA-LANGLAIS «Merger Control on Two-Sided Markets: Is there Need for an Efficiency Defense ? »

DR n°2014 – 13: Nicolas GRAVEL, Brice MAGDALOU, Patrick MOYES « Ranking Distributions of an Ordinal Attribute »

DR n°2014 – 14: Thierry BLAYAC, Valérie CLEMENT, Grégoire MERCIER

« Hospitalisation conventionnelle vs prise en charge à domicile : analyse des préférences individuelles par une expérience

en choix discret »

DR n°2014 – 15: Abdoul Salam DIALLO, Alfred MBAIRADJIM MOUSSA « Addressing agent specific extreme price risk in the presence of heterogeneous data sources: A food safety perspective »

DR n°2014 – 16: Lazeni FOFANA, Françoise SEYTE « Prévision du Risque de Contagion de six Marchés Financiers : une analyse prédictive par l’approche des Réseaux de Croyance Bayésienne non-paramétrique continu »

Page 39: « Prévision du Risque de Contagion de six Marchés ... · Kurowicka et Cooke (2006), et Joe (1996)) . L’analyse prédictive du comportement du processus des co-mouvements conditionnels

Contact :

Stéphane MUSSARD : [email protected]

Page 40: « Prévision du Risque de Contagion de six Marchés ... · Kurowicka et Cooke (2006), et Joe (1996)) . L’analyse prédictive du comportement du processus des co-mouvements conditionnels