Modélisation de valeurs extrêmes Université de Liège : octobre 2002 Daniel Justens...

Post on 04-Apr-2015

107 views 0 download

Transcript of Modélisation de valeurs extrêmes Université de Liège : octobre 2002 Daniel Justens...

Modélisation de valeurs extrêmes

Université de Liège : octobre 2002Daniel Justens

HEFF/Cooremans Bruxelles

Positionnement

• Utilisation des modèles mathématiques en finance, en gestion et en actuariat.

• Ecarts entre les prévisions théoriques et le réel observé : non-adéquation du modèle ?

• Cas particulier des valeurs extrêmes

Exemple 1 : rendements boursiers

• Présentation du cas de l’indice DAX entre 1996 et 2000 : 902 observations journalières.

• Moyenne observée : 0,00097151• Ecart-type observé : 0,01458286

• Modélisation des rendements par une distribution normale ?

Rendements journaliers DAX entre 1996 et 2000

Fonctions de répartition observée (1) et normale (2)

0

0,2

0,4

0,6

0,8

1

-0,1 -0,05 0 0,05 0,1

Série1

Série2

Aspect des queues de courbe

Valeurs extrêmes à gauche avec en série 1 les observations et en série 2 la distribution normale

0

0,05

0,1

0,15

0,2

0,25

-0,1 -0,08 -0,06 -0,04 -0,02 0

Série1

Série2

Intervalle interquartile

0

0,2

0,4

0,6

0,8

1

-0,01 -0,005 0 0,005 0,01 0,015

Série1

Série2

Valeurs centrales

Valeurs à droite

Rendements maxima

0,88

0,92

0,96

1

0 0,01 0,02 0,03 0,04 0,05 0,06 0,07

Série1

Série2

Distributions de Pareto-Lévy

Vilfredo Pareto (1848 - 1923)

• Sociologue, qui se consacre dès 1890 à une modélisation « pure » de l’économie qui selon lui doit s’étudier comme la physique.

Paul Lévy (1886 - 1971)

• Mathématicien, qui étudie les distributions stables vers 1930.

Retour aux sources

Distributions de Pareto de base :

pour x 1 et avec a > 0

On en tire :

axxF

11)(

1)(

ax

axf

Moments de la distribution

• On vérifie que :

lorsque n < a

et que :

lorsque n a

• On en tire (a>2) :

na

aXE n

][

][ nXE

)]2()1[(][

2

aa

aXVAR

Adaptation de la distribution

• But : obtenir une fonction de répartition tendant vers 1 en + comme 1- x -a et vers 0 en - comme |x| - b (a et b > 0).

• Idée : travailler avec les fonctions réciproques. En effet, il est facile de représenter la fonction g de R0

+ dans R :

g(x) = x -1/a - x 1/b

Représentation de y = x-1 -x1/2

2 4 6 8

-2

2

4

6

8

Inversion des axes

0

1

2

3

4

5

6

7

8

9

10

-5 0 5 10

Construction de la répartition

• On a défini une fonction g(x) de manière implicite :

x = g(x) -1/a - g(x) 1/b

• Cette fonction g(x) a en - le comportement de |x|b et en + le comportement de x -a.

• Etudions la fonction : )(1

1

xg

Suite...

• Cette dernière tend vers 0 en - comme |x|-b

et vers 1 en + comme 1- x -a

Conclusion :

Forme implicite de la fonction de répartition

)(1

)(1

)(1

1

xg

xg

xg

Cas particulier : a=b

• Dans ce cas, on arrive aisément à une forme explicite. En effet, l’équation devient :

x = g(x) -1/a - g(x) 1/a

Posons g(x) 1/a = Y. L ’équation devient

x =1/Y - Y ou encore : (x + Y)Y = 1

Y2 + x Y -1 = 0

Suite ...

Y2 + x Y -1 = 0dont la solution est évidente :

On en tire :

2

42

xxY

a

xxxF

24

1

1)(

2

Ajustements

• Recherche ouverte : étude théorique de ces distributions avec une paramétrisation

• Méthodes d’ajustements autres que moindre carrés de façon à privilégier les queues de courbe

Ajustements du DAX : a = 270

0

0,2

0,4

0,6

0,8

1

-0,1 -0,05 0 0,05 0,1

distruni

distrinor

distripar

Ajustements : à gauche avec a = 220

0

0,02

0,04

0,06

0,08

0,1

0,12

-0,1 -0,08 -0,06 -0,04 -0,02 0

distruni

distrinor

distripar

Ajustements : à droite avec a = 270

0,84

0,86

0,88

0,9

0,92

0,94

0,96

0,98

1

1,02

0 0,01 0,02 0,03 0,04 0,05 0,06 0,07

Série1

Série2

Série3normale

Pareto

Exemple 2 : tarification automobile

• “A priori” clustering and bonus-malus system

• The “number of claims” distributions

• The problem of the classical models

The mixed Poisson distributionsLet X be the number of claims occurring in a unit period.Let be the risk parameter (expecting number of claims) with probability distribution U().We assume that for a given risk parameter , the random variables pk() giving the number of claims follow a Poisson distribution.

Moments of mixed Poisson distributions

• Mean :

E[X] = E[

• Variance

VAR[X] = E + VAR

The model of Lemaire (1977)

• The underlying distribution follows a Gamma distribution :

• In this case, we have :

Mixed Poisson family

Underlying distribution transition Probabilities

Negative exponential Geometrical

Erlang P-Erlang

Inverse Gaussian P-inverse gaussian

Fitting the data (1)

• The Belgian case :

son,thegeometricandtheP-Erlangdistributions,andtoÂ2;0:95=5:991fortheothers.Numb.claimsBelgianobs.PoissonNeg.Bin.Geom.P-ErlangP-Inv.Gauss.00.9065570.9038600.9066260.9081990.9060970.90657310.0863760.0913630.0862130.0833740.0871830.08635620.0065810.0046180.0066530.0076540.0062910.00652930.0004020.0001560.0004740.0007030.0004040.00049640.0000840.0000390.0000320.0000650.0000240.000040Â2336.0510.1742.3718.057.30

Underlying distributions

Distributions tails

Fitting the data (2)

• The Italian case :P-Erlang distributions, and to  =9:49 for theothers.

Accid italian obs. Poisson Neg. Bin. Geom. P-Erlang P-Inv.Gauss.0 0.863100 0.844503 0.863140 0.855427 0.850233 0.8618351 0.111161 0.142727 0.111305 0.123672 0.132499 0.1142962 0.020405 0.012061 0.020366 0.017880 0.015486 0.0185513 0.004030 0.000679 0.004093 0.002585 0.001609 0.0038904 0.000929 0.000029 0.000859 0.000374 0.000157 0.0009595 0.000246 0.000001 0.000185 0.000054 0.000015 0.0002616 0.000129 0.000000 0.000031 0.000008 0.000001 0.000075Â2 728 343 339.08 5886.5 28 532 323.47

Rational underlying distributions

• Let us work with :

• We also have :

Quadratic case

• We put :

so that we get :

• Which gives :

Cubic case

• We now put :

• And compute :

The Belgian case

Accid belgian observ. Neg. bin. quadratic cubic0 0.906557 0.906626 0.913576 0.9057471 0.086376 0.086213 0.077322 0.0874412 0.006581 0.006653 0.007275 0.0062173 0.000402 0.000474 0.001167 0.0005054 0.000084 0.000032 0.000328 0.000065

Graphically

.

Quadratic

Negative binomial cubic

observations

Distributions tails

The Italian case

Accid ital. obs. Neg. bin. quadratic cubic0 0.863100 0.863140 0.856316 0.8434441 0.111161 0.111305 0.121074 0.1380532 0.020405 0.020366 0.017101 0.0160973 0.004030 0.004093 0.003413 0.0019574 0.000929 0.000859 0.001029 0.0003195 0.000246 0.000185 0.000424 0.0000786 0.000129 0.000031 0.000214 0.000052

Comparison of the models

Cubic

Quadratic

Negative binomial

Conclusions

• Difference between theoretical and practical point of view : problem of the infinite variance

• Many other distributions possible

• Mixed geometrical distributions

• Open research