Modélisation de valeurs extrêmes Université de Liège : octobre 2002 Daniel Justens...

39
Modélisation de valeurs extrêmes Université de Liège : octobre 2002 Daniel Justens HEFF/Cooremans Bruxelles

Transcript of Modélisation de valeurs extrêmes Université de Liège : octobre 2002 Daniel Justens...

Page 1: Modélisation de valeurs extrêmes Université de Liège : octobre 2002 Daniel Justens HEFF/Cooremans Bruxelles.

Modélisation de valeurs extrêmes

Université de Liège : octobre 2002Daniel Justens

HEFF/Cooremans Bruxelles

Page 2: Modélisation de valeurs extrêmes Université de Liège : octobre 2002 Daniel Justens HEFF/Cooremans Bruxelles.

Positionnement

• Utilisation des modèles mathématiques en finance, en gestion et en actuariat.

• Ecarts entre les prévisions théoriques et le réel observé : non-adéquation du modèle ?

• Cas particulier des valeurs extrêmes

Page 3: Modélisation de valeurs extrêmes Université de Liège : octobre 2002 Daniel Justens HEFF/Cooremans Bruxelles.

Exemple 1 : rendements boursiers

• Présentation du cas de l’indice DAX entre 1996 et 2000 : 902 observations journalières.

• Moyenne observée : 0,00097151• Ecart-type observé : 0,01458286

• Modélisation des rendements par une distribution normale ?

Page 4: Modélisation de valeurs extrêmes Université de Liège : octobre 2002 Daniel Justens HEFF/Cooremans Bruxelles.

Rendements journaliers DAX entre 1996 et 2000

Fonctions de répartition observée (1) et normale (2)

0

0,2

0,4

0,6

0,8

1

-0,1 -0,05 0 0,05 0,1

Série1

Série2

Page 5: Modélisation de valeurs extrêmes Université de Liège : octobre 2002 Daniel Justens HEFF/Cooremans Bruxelles.

Aspect des queues de courbe

Valeurs extrêmes à gauche avec en série 1 les observations et en série 2 la distribution normale

0

0,05

0,1

0,15

0,2

0,25

-0,1 -0,08 -0,06 -0,04 -0,02 0

Série1

Série2

Page 6: Modélisation de valeurs extrêmes Université de Liège : octobre 2002 Daniel Justens HEFF/Cooremans Bruxelles.

Intervalle interquartile

0

0,2

0,4

0,6

0,8

1

-0,01 -0,005 0 0,005 0,01 0,015

Série1

Série2

Valeurs centrales

Page 7: Modélisation de valeurs extrêmes Université de Liège : octobre 2002 Daniel Justens HEFF/Cooremans Bruxelles.

Valeurs à droite

Rendements maxima

0,88

0,92

0,96

1

0 0,01 0,02 0,03 0,04 0,05 0,06 0,07

Série1

Série2

Page 8: Modélisation de valeurs extrêmes Université de Liège : octobre 2002 Daniel Justens HEFF/Cooremans Bruxelles.

Distributions de Pareto-Lévy

Vilfredo Pareto (1848 - 1923)

• Sociologue, qui se consacre dès 1890 à une modélisation « pure » de l’économie qui selon lui doit s’étudier comme la physique.

Paul Lévy (1886 - 1971)

• Mathématicien, qui étudie les distributions stables vers 1930.

Page 9: Modélisation de valeurs extrêmes Université de Liège : octobre 2002 Daniel Justens HEFF/Cooremans Bruxelles.

Retour aux sources

Distributions de Pareto de base :

pour x 1 et avec a > 0

On en tire :

axxF

11)(

1)(

ax

axf

Page 10: Modélisation de valeurs extrêmes Université de Liège : octobre 2002 Daniel Justens HEFF/Cooremans Bruxelles.

Moments de la distribution

• On vérifie que :

lorsque n < a

et que :

lorsque n a

• On en tire (a>2) :

na

aXE n

][

][ nXE

)]2()1[(][

2

aa

aXVAR

Page 11: Modélisation de valeurs extrêmes Université de Liège : octobre 2002 Daniel Justens HEFF/Cooremans Bruxelles.

Adaptation de la distribution

• But : obtenir une fonction de répartition tendant vers 1 en + comme 1- x -a et vers 0 en - comme |x| - b (a et b > 0).

• Idée : travailler avec les fonctions réciproques. En effet, il est facile de représenter la fonction g de R0

+ dans R :

g(x) = x -1/a - x 1/b

Page 12: Modélisation de valeurs extrêmes Université de Liège : octobre 2002 Daniel Justens HEFF/Cooremans Bruxelles.

Représentation de y = x-1 -x1/2

2 4 6 8

-2

2

4

6

8

Page 13: Modélisation de valeurs extrêmes Université de Liège : octobre 2002 Daniel Justens HEFF/Cooremans Bruxelles.

Inversion des axes

0

1

2

3

4

5

6

7

8

9

10

-5 0 5 10

Page 14: Modélisation de valeurs extrêmes Université de Liège : octobre 2002 Daniel Justens HEFF/Cooremans Bruxelles.

Construction de la répartition

• On a défini une fonction g(x) de manière implicite :

x = g(x) -1/a - g(x) 1/b

• Cette fonction g(x) a en - le comportement de |x|b et en + le comportement de x -a.

• Etudions la fonction : )(1

1

xg

Page 15: Modélisation de valeurs extrêmes Université de Liège : octobre 2002 Daniel Justens HEFF/Cooremans Bruxelles.

Suite...

• Cette dernière tend vers 0 en - comme |x|-b

et vers 1 en + comme 1- x -a

Conclusion :

Forme implicite de la fonction de répartition

)(1

)(1

)(1

1

xg

xg

xg

Page 16: Modélisation de valeurs extrêmes Université de Liège : octobre 2002 Daniel Justens HEFF/Cooremans Bruxelles.

Cas particulier : a=b

• Dans ce cas, on arrive aisément à une forme explicite. En effet, l’équation devient :

x = g(x) -1/a - g(x) 1/a

Posons g(x) 1/a = Y. L ’équation devient

x =1/Y - Y ou encore : (x + Y)Y = 1

Y2 + x Y -1 = 0

Page 17: Modélisation de valeurs extrêmes Université de Liège : octobre 2002 Daniel Justens HEFF/Cooremans Bruxelles.

Suite ...

Y2 + x Y -1 = 0dont la solution est évidente :

On en tire :

2

42

xxY

a

xxxF

24

1

1)(

2

Page 18: Modélisation de valeurs extrêmes Université de Liège : octobre 2002 Daniel Justens HEFF/Cooremans Bruxelles.

Ajustements

• Recherche ouverte : étude théorique de ces distributions avec une paramétrisation

• Méthodes d’ajustements autres que moindre carrés de façon à privilégier les queues de courbe

Page 19: Modélisation de valeurs extrêmes Université de Liège : octobre 2002 Daniel Justens HEFF/Cooremans Bruxelles.

Ajustements du DAX : a = 270

0

0,2

0,4

0,6

0,8

1

-0,1 -0,05 0 0,05 0,1

distruni

distrinor

distripar

Page 20: Modélisation de valeurs extrêmes Université de Liège : octobre 2002 Daniel Justens HEFF/Cooremans Bruxelles.

Ajustements : à gauche avec a = 220

0

0,02

0,04

0,06

0,08

0,1

0,12

-0,1 -0,08 -0,06 -0,04 -0,02 0

distruni

distrinor

distripar

Page 21: Modélisation de valeurs extrêmes Université de Liège : octobre 2002 Daniel Justens HEFF/Cooremans Bruxelles.

Ajustements : à droite avec a = 270

0,84

0,86

0,88

0,9

0,92

0,94

0,96

0,98

1

1,02

0 0,01 0,02 0,03 0,04 0,05 0,06 0,07

Série1

Série2

Série3normale

Pareto

Page 22: Modélisation de valeurs extrêmes Université de Liège : octobre 2002 Daniel Justens HEFF/Cooremans Bruxelles.

Exemple 2 : tarification automobile

• “A priori” clustering and bonus-malus system

• The “number of claims” distributions

• The problem of the classical models

Page 23: Modélisation de valeurs extrêmes Université de Liège : octobre 2002 Daniel Justens HEFF/Cooremans Bruxelles.

The mixed Poisson distributionsLet X be the number of claims occurring in a unit period.Let be the risk parameter (expecting number of claims) with probability distribution U().We assume that for a given risk parameter , the random variables pk() giving the number of claims follow a Poisson distribution.

Page 24: Modélisation de valeurs extrêmes Université de Liège : octobre 2002 Daniel Justens HEFF/Cooremans Bruxelles.

Moments of mixed Poisson distributions

• Mean :

E[X] = E[

• Variance

VAR[X] = E + VAR

Page 25: Modélisation de valeurs extrêmes Université de Liège : octobre 2002 Daniel Justens HEFF/Cooremans Bruxelles.

The model of Lemaire (1977)

• The underlying distribution follows a Gamma distribution :

• In this case, we have :

Page 26: Modélisation de valeurs extrêmes Université de Liège : octobre 2002 Daniel Justens HEFF/Cooremans Bruxelles.

Mixed Poisson family

Underlying distribution transition Probabilities

Negative exponential Geometrical

Erlang P-Erlang

Inverse Gaussian P-inverse gaussian

Page 27: Modélisation de valeurs extrêmes Université de Liège : octobre 2002 Daniel Justens HEFF/Cooremans Bruxelles.

Fitting the data (1)

• The Belgian case :

son,thegeometricandtheP-Erlangdistributions,andtoÂ2;0:95=5:991fortheothers.Numb.claimsBelgianobs.PoissonNeg.Bin.Geom.P-ErlangP-Inv.Gauss.00.9065570.9038600.9066260.9081990.9060970.90657310.0863760.0913630.0862130.0833740.0871830.08635620.0065810.0046180.0066530.0076540.0062910.00652930.0004020.0001560.0004740.0007030.0004040.00049640.0000840.0000390.0000320.0000650.0000240.000040Â2336.0510.1742.3718.057.30

Page 28: Modélisation de valeurs extrêmes Université de Liège : octobre 2002 Daniel Justens HEFF/Cooremans Bruxelles.

Underlying distributions

Page 29: Modélisation de valeurs extrêmes Université de Liège : octobre 2002 Daniel Justens HEFF/Cooremans Bruxelles.

Distributions tails

Page 30: Modélisation de valeurs extrêmes Université de Liège : octobre 2002 Daniel Justens HEFF/Cooremans Bruxelles.

Fitting the data (2)

• The Italian case :P-Erlang distributions, and to  =9:49 for theothers.

Accid italian obs. Poisson Neg. Bin. Geom. P-Erlang P-Inv.Gauss.0 0.863100 0.844503 0.863140 0.855427 0.850233 0.8618351 0.111161 0.142727 0.111305 0.123672 0.132499 0.1142962 0.020405 0.012061 0.020366 0.017880 0.015486 0.0185513 0.004030 0.000679 0.004093 0.002585 0.001609 0.0038904 0.000929 0.000029 0.000859 0.000374 0.000157 0.0009595 0.000246 0.000001 0.000185 0.000054 0.000015 0.0002616 0.000129 0.000000 0.000031 0.000008 0.000001 0.000075Â2 728 343 339.08 5886.5 28 532 323.47

Page 31: Modélisation de valeurs extrêmes Université de Liège : octobre 2002 Daniel Justens HEFF/Cooremans Bruxelles.

Rational underlying distributions

• Let us work with :

• We also have :

Page 32: Modélisation de valeurs extrêmes Université de Liège : octobre 2002 Daniel Justens HEFF/Cooremans Bruxelles.

Quadratic case

• We put :

so that we get :

• Which gives :

Page 33: Modélisation de valeurs extrêmes Université de Liège : octobre 2002 Daniel Justens HEFF/Cooremans Bruxelles.

Cubic case

• We now put :

• And compute :

Page 34: Modélisation de valeurs extrêmes Université de Liège : octobre 2002 Daniel Justens HEFF/Cooremans Bruxelles.

The Belgian case

Accid belgian observ. Neg. bin. quadratic cubic0 0.906557 0.906626 0.913576 0.9057471 0.086376 0.086213 0.077322 0.0874412 0.006581 0.006653 0.007275 0.0062173 0.000402 0.000474 0.001167 0.0005054 0.000084 0.000032 0.000328 0.000065

Page 35: Modélisation de valeurs extrêmes Université de Liège : octobre 2002 Daniel Justens HEFF/Cooremans Bruxelles.

Graphically

.

Quadratic

Negative binomial cubic

observations

Page 36: Modélisation de valeurs extrêmes Université de Liège : octobre 2002 Daniel Justens HEFF/Cooremans Bruxelles.

Distributions tails

Page 37: Modélisation de valeurs extrêmes Université de Liège : octobre 2002 Daniel Justens HEFF/Cooremans Bruxelles.

The Italian case

Accid ital. obs. Neg. bin. quadratic cubic0 0.863100 0.863140 0.856316 0.8434441 0.111161 0.111305 0.121074 0.1380532 0.020405 0.020366 0.017101 0.0160973 0.004030 0.004093 0.003413 0.0019574 0.000929 0.000859 0.001029 0.0003195 0.000246 0.000185 0.000424 0.0000786 0.000129 0.000031 0.000214 0.000052

Page 38: Modélisation de valeurs extrêmes Université de Liège : octobre 2002 Daniel Justens HEFF/Cooremans Bruxelles.

Comparison of the models

Cubic

Quadratic

Negative binomial

Page 39: Modélisation de valeurs extrêmes Université de Liège : octobre 2002 Daniel Justens HEFF/Cooremans Bruxelles.

Conclusions

• Difference between theoretical and practical point of view : problem of the infinite variance

• Many other distributions possible

• Mixed geometrical distributions

• Open research