Modélisation du risque de réserve en business Run-Off sous ...

118

Transcript of Modélisation du risque de réserve en business Run-Off sous ...

Page 1: Modélisation du risque de réserve en business Run-Off sous ...
Page 2: Modélisation du risque de réserve en business Run-Off sous ...

Mémoirepour l’obtention du Diplôme Universitaire

d’actuariat de l’ISFAet l’admission à l’Institut des Actuaires

préparée à

AXA Liabilities Managers

par

M. Mohamed Amine EL AIDOUNI

Modélisation du risque de réserve en business Run-Off

sous contrainte des données incomplètes

Mémoire présenté et soutenu le 11 juillet 2017, à Lyon, devant le jury composé de :

Mme. Anne MARION

Mme. Anne LOISEL

M. Pierre PETAUTON

M. Pierre THEROND

M. Michel BERA

M. Denis CLOT

1

Page 3: Modélisation du risque de réserve en business Run-Off sous ...

2

Page 4: Modélisation du risque de réserve en business Run-Off sous ...

Titre : Modélisation du risque de réserve en business Run-Off sous contrainte des

données incomplètes

Keywords : Données incomplètes, Random Forest , Provisionnement, Merz & Wûtrich

Résumé : L’objectif de ce mémoire d’actuariat est l’estimation des niveaux de volatilités durisque de réserve pour des branches de réassurance avec un historique incomplet. Le manque dedonnées s’apparente aux non transferts d’une partie d’historique des données liées à un porte-feuille de réassurance en Run-Off. Le présent travail s’articule autour de quatre chapitres quidétaillent le problème des données, analysent leur impact sur le provisionnement et l’estimationdu risque de réserve, puis proposent des solutions. Dans un premier temps nous avons donnéun aperçu du marché du Run-Off, son positionnement par rapport au marché assurantiel etson aspect réglementaire. Ensuite nous avons analysé comment le manque d’historique sur destriangles de liquidation peut impacter l’estimation de la charge ultime et le niveau du risquede réserve à l’horizon d’un an. Le risque de réserve est calibré en utilisant le modèle de Merz& Wûtrich. Ainsi, nous avons combiné des solutions des données incomplètes avec l’estimationde l’incertitude à l’horizon d’un an. La première solution consiste à séparer le triangle de liqui-dation de la charge sinistre (incurred) en deux sous triangles selon les années de souscription.Le choix de l’année qui sépare le triangle en deux sous triangles est justifié par une techniquede clustering. Ensuite nous allons estimer le risque de réserve sur chacun des deux sous tri-angles puis agréger les deux niveaux de volatilité. La deuxième solution consiste à reconstruirele triangle de liquidation a priori en injectant des montants simulés selon des techniques demaching learning (MissForest). Ces résultats ont été mis à l’épreuve par un backtesting quisimule ce même problème des données sur un triangle complet d’un autre portefeuille. Après,nous avons appliqué les deux approches adoptées et comparer les résultats obtenus pour lesdifférents scénarios: triangle complet, triangle incomplet et triangle reconstruit.

Page 5: Modélisation du risque de réserve en business Run-Off sous ...

Hello World

Title : Modelling of the reserving risk in business Run-Off under constraint of the

incomplete data

Keywords : Incomplete data, Random Forest, Reserving, Merz & Wûtrich

Abstract : The objective of this actuarial report is to estimate the volatility levels of the reserverisk for reinsurance branches with an incomplete history. The lack of data is due to non-transfersof part of historical data related to a reinsurance portfolio in Run-Off. This work focuses on fourchapters that detail the data file, analyzing their involvement in provisioning and estimatingthe reserve risk, then propose solutions. As a first step, we are able to get an overview of theRun-Off market, its position in relation to the insurance market and its regulatory aspect. Thenwe analyzed how the lack of history on the liquidation triangles can impact the estimate of theultimate load and the level of reserve risk over the one-year horizon. The reserve risk is spreadout using the Merz & Würtrich model. Thus, we combined incomplete data solutions with theestimation of uncertainty over a one-year horizon. The first solution consists in separating theliquidation triangle from the claims expenses into two sub-triangles according to the subscriptionyears. The choice of the year in which we split the triangle in two under triangles is justifiedby a technique of clustering. Then we will estimate the reserve risk on each of the two sub-triangles and aggregate the two levels of volatility. The second solution consists in reconstructingthe incurred triangle by injecting simulated amounts according to machin learning method(MissForest). Thus, we simulated several incurred triangles and for each triangle we estimatethe corresponding level of volatility, then we calculate the average volatility. These resultsare backtested by simulating a generic scenario of incomplete data on a complete triangle ofanother portfolio. Afterwards, we have applied the two approaches adopted and compare theresults obtained for the different scenarios: complete triangle, incomplete triangle and imputedtriangle.

Page 6: Modélisation du risque de réserve en business Run-Off sous ...

Remerciements

Qu’il me soit permis, au terme de ce travail, d’exprimer ma gratitude et vifs remerciements àmon encadrante du mémoire d’actuaire Mme. Hélène Gibello, actuaire Manager chez AXALiabilities Managers. Je souhaite lui témoigner mon estime et de ma profonde reconnaissancepour sa disponibilité, ses directives précieuses, ses conseils, la qualité de son suivi et sacompétence qu’elle a su me prodiguer tout au long de mon alternance malgré ses occupationsextrêmes.

Je remercie monsieur Alain De Lavernette, directeur de l’équipe actuariat chez AXALM pour la confiance qu’il m’a accordé pour effectuer mes travaux de rechercher sur laproblématique du Run-Off au sein de l’équipe actuariat d’AXA LM.

Je tiens également à adresser mes remerciements à monsieur Pierre Therond, actuaireassocié chez Galea & Associés et professeur à l’Institut des Science Financière et d’Assu-rances (ISFA) pour m’avoir suivi pendant toute la réalisation de ce mémoire. J’adresse éga-lement mes remerciements à monsieur Fréderic Planchet, responsable du Master actuariatà l’ISFA pour sa disponibilité et ses remarques pertinentes sur le sujet risque de réserve.

Je ne saurai terminer ces remerciements sans rendre grâce à la gentillesse des collaborateursde l’équipe actuariat chez AXA Liabilities Managers. Ma sincère reconnaissance va à tousceux qui, de près ou de loin, ont contribué à l’aboutissement et au bon déroulement de cemodeste travail.

1

Page 7: Modélisation du risque de réserve en business Run-Off sous ...

2

Page 8: Modélisation du risque de réserve en business Run-Off sous ...

Table des matières

Remerciements 1

Table des Matières 3

Table des figures 7

Liste des tableaux 11

1. Le marché de Run-off 15

1.1. Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 161.2. Positionnement du business Run-Off . . . . . . . . . . . . . . . . . . . . . . 161.3. Processus d’acquisition de portefeuille en Run-Off . . . . . . . . . . . . . . . 191.4. Le business Run-Off sous l’angle réglementaire . . . . . . . . . . . . . . . . . 201.5. Aperçu sur la réassurance . . . . . . . . . . . . . . . . . . . . . . . . . . . . 211.6. Périmètre d’étude . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 231.7. Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26

2. Problématique des données manquantes 27

2.1. Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 282.2. Aperçu sur les triangles incomplets en Run-Off . . . . . . . . . . . . . . . . . 29

2.2.1. Présentation des branches étudiées . . . . . . . . . . . . . . . . . . . 292.2.2. Agrégation des sinistres . . . . . . . . . . . . . . . . . . . . . . . . . 312.2.3. Définition des provisions et charge ultime . . . . . . . . . . . . . . . . 322.2.4. Triangles incomplets en Run-Off . . . . . . . . . . . . . . . . . . . . . 33

2.3. Méthodes de provisionnement en non-vie . . . . . . . . . . . . . . . . . . . . 352.3.1. La méthode déterministe de Chain Ladder . . . . . . . . . . . . . . . 362.3.2. Méthodes stochastiques : Mack . . . . . . . . . . . . . . . . . . . . . 382.3.3. Validation des hypothèses du modèle Chain Ladder et Mack . . . . . 39

3

Page 9: Modélisation du risque de réserve en business Run-Off sous ...

Table des matières

2.4. Impact des données incomplètes sur les techniques de provisionnement . . . . 422.4.1. Analyse de la charge encourue (incurred) . . . . . . . . . . . . . . . . 422.4.2. Allure de la charge encoure par année de souscription . . . . . . . . . 432.4.3. Analyse des facteurs de développement . . . . . . . . . . . . . . . . . 44

2.5. Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45

3. Solutions des données manquantes en provisionnement 47

3.1. Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 483.2. Solution 1 : Partition de l’écoulement du triangle en Run-Off . . . . . . . . . 48

3.2.1. Méthodes de classification . . . . . . . . . . . . . . . . . . . . . . . . 503.2.2. Algorithme de partitionnement du triangle de liquidation . . . . . . . 503.2.3. Classification hiérarchique . . . . . . . . . . . . . . . . . . . . . . . . 513.2.4. Méthode des k-means . . . . . . . . . . . . . . . . . . . . . . . . . . . 57

3.3. Solution 2 : Reconstruction du triangle en Run-Off par méthodes d’imputationdes données manquantes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 613.3.1. Choix de l’échantillon des données . . . . . . . . . . . . . . . . . . . . 623.3.2. Imputation stationnaire et échantillon d’apprentissage . . . . . . . . . 633.3.3. Utilisation des Forêts aléatoires . . . . . . . . . . . . . . . . . . . . . 68

3.4. Backtesting des solutions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 743.4.1. Backtesting de la solution 1 . . . . . . . . . . . . . . . . . . . . . . . 753.4.2. Backtesting de la solution 2 . . . . . . . . . . . . . . . . . . . . . . . 76

3.5. Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77

4. Risque de réserve 79

4.1. Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 814.2. Solvabilité II et cadre réglementaire . . . . . . . . . . . . . . . . . . . . . . . 81

4.2.1. Pilier 1 : Exigences quantitatives . . . . . . . . . . . . . . . . . . . . 834.2.2. Pilier 2 : Exigences qualitatives . . . . . . . . . . . . . . . . . . . . . 834.2.3. Pilier 3 : Communication financière . . . . . . . . . . . . . . . . . . . 84

4.3. Le risque de réserve sous l’angle Solvabilité II . . . . . . . . . . . . . . . . . 844.3.1. Modèle interne partiel . . . . . . . . . . . . . . . . . . . . . . . . . . 864.3.2. Revue de littérature des méthodes de risque de réserve . . . . . . . . 88

4.4. Modèle de Merz & Wütrich . . . . . . . . . . . . . . . . . . . . . . . . . . . 894.4.1. Vision prospective . . . . . . . . . . . . . . . . . . . . . . . . . . . . 904.4.2. Vision rétrospective . . . . . . . . . . . . . . . . . . . . . . . . . . . . 924.4.3. Agrégation sur les années de souscription . . . . . . . . . . . . . . . . 93

4.5. Mise en pratique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 944.5.1. Estimation du risque de réserve (solution 1) . . . . . . . . . . . . . . 94

4

Page 10: Modélisation du risque de réserve en business Run-Off sous ...

Table des matières

4.5.2. Estimation du risque de réserve (solution 2) . . . . . . . . . . . . . . 964.5.3. Comparaison et backtesting des résultats . . . . . . . . . . . . . . . . 98

4.6. Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 101

5. Conclusion 103

Annexes 105

A. Annexes 105

A.1. Exemple de triangle de règlements incomplet . . . . . . . . . . . . . . . . . . 106A.2. Développement de la charge encourue (incurred) par branche . . . . . . . . . 107

Bibliographie 109

5

Page 11: Modélisation du risque de réserve en business Run-Off sous ...

6

Page 12: Modélisation du risque de réserve en business Run-Off sous ...

Table des figures

1.1. Répartition du business Run-Off au niveau international en 2016 . . . . . . . 171.2. Evolution estimée des engagements non-vie en Run-Off depuis 2011 . . . . . 181.3. Processus d’acquisition des portefeuilles en Run-Off chez Axa LM . . . . . . 201.4. Schéma simplifié du principe de réassurance . . . . . . . . . . . . . . . . . . 221.5. Répartition des Réserves en suspens du portefeuille Victoria Re par type de

pertes en 2016 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 241.6. Répartition des Réserves en suspens du portefeuille Tela Re par type de perte

en 2016 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25

2.1. Exemple du triangle de liquidation des réserves en suspens du portefeuille ISAR 282.2. Exemple d’évolution du processus de paiement d’un sinistre . . . . . . . . . 312.3. Éléments de la charge ultime . . . . . . . . . . . . . . . . . . . . . . . . . . . 332.4. Allure d’un triangle de liquidation incurred du portefeuille ISAR . . . . . . 342.5. Benchmark des méthodes de provisionnment déterministe . . . . . . . . . . . 362.6. Benchmark des méthodes de provisionnment stochastique . . . . . . . . . . . 362.7. Droit de régression, points (Ci,k, Ci,k+1 pour i 2 1, ...J � 1 - Branche automobile 402.8. Test d’indépendance des années de survenance du segment Motor . . . . . . 422.9. Evolution de la charge incurred des trois branches : automobiles, responsabilité

civile général et maritime en non proportionnel pour l’année comptable 2015 432.10. Développement de la charge encourue pour la branche assurance moteur non

proportionnel par année de souscription . . . . . . . . . . . . . . . . . . . . . 442.11. Facteur de développement des branches automobiles, responsabilité civile gé-

néral et maritime . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45

3.1. Partition de l’écoulement du triangle de liquidation en Run-Off . . . . . . . . 493.2. Développement de l’incurred pour la branche automobile non proportionnel

par année de souscription et de développement . . . . . . . . . . . . . . . . . 49

7

Page 13: Modélisation du risque de réserve en business Run-Off sous ...

Table des figures

3.3. Arbre de classification hiérarchique portant sur cinq objets {a, b, c, d, e} . . . 523.4. Étude de la corrélation entre les années de souscription avec une classification

ascendante hiérarchique selon la méthode de ward . . . . . . . . . . . . . . . 543.5. Dendrogramme résultant de la classification hiérarchique par distance de Ward

appliqué aux années de souscription de la branche automobile . . . . . . . . 543.6. Décroissance de la variance interclasses selon la stratégie de Ward - Branche

automobile . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 563.7. Valeur de R2 selon la méthode d’agrégation interclasse de la branche automobile 573.8. Partitionnement d’un ensemble de points en 3 sous-ensembles . . . . . . . . 583.9. Représentation graphique des classes proposées par la méthode K-means -

Branche automobile . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 593.10. Décroissance de la variance interclasses pour la méthode K-means - Branche

automobile . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 603.11. Reconstruction d’un triangle de liquidation . . . . . . . . . . . . . . . . . . . 613.12. Montants incurred et règlements par année de développement pour l’année

comptable 2004 - Branche automobile non proportionnelle . . . . . . . . . . 623.13. Histogramme des montants de règlements totaux par année comptable - Branche

automobile . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 653.14. Évolution des montants totaux des règlements par année comptable . . . . . 663.15. Analyse des diagonales du triangle de règlements décumulés par année comp-

table - Branche automobile . . . . . . . . . . . . . . . . . . . . . . . . . . . . 673.16. Résultat de la fonction MissForest appliquée au triangle de liquidation de

règlements décumulés - Branche automobile . . . . . . . . . . . . . . . . . . 713.17. Comparaison entre la diagonale observée et la diagonale imputé par la mé-

thode MissForest - Branche automobile . . . . . . . . . . . . . . . . . . . . . 733.18. Analyse de la plausibilité des montants imputés (points rouges) avec les mon-

tants observés (points bleus) - Branche automobile . . . . . . . . . . . . . . 743.19. Construction du triangle de backtesting . . . . . . . . . . . . . . . . . . . . . 753.20. Backtesting - Classification hiérarchique des années de souscription de la

branche Maritime non proportionnelle . . . . . . . . . . . . . . . . . . . . . . 763.21. Backtesting - Comparaison entre la diagonale observée et la diagonale imputée

par la méthode MissForest . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77

4.1. Les trois piliers de la norme Solvabilité II . . . . . . . . . . . . . . . . . . . . 824.2. Structure modulaire des risques en formule standard . . . . . . . . . . . . . . 854.3. Structure modulaire des risques en formule standard . . . . . . . . . . . . . . 854.4. Crédibilité pour les branches Third-party liability, Motor vehicle liability et

Credit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 88

8

Page 14: Modélisation du risque de réserve en business Run-Off sous ...

Table des figures

4.5. Crédibilité pour les autres branches . . . . . . . . . . . . . . . . . . . . . . . 884.6. Triangle de développement aux dates t=I et t=I+1 . . . . . . . . . . . . . . 894.7. Solution 1 - Comparaison du montant ultimes et IBNR avant et après décou-

page par branche . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 954.8. Comparaison du CoV avant et après découpage par branche du triangle . . . 964.9. Solution 2 - Comparaison du montant ultimes et IBNR estimés par branche . 964.10. Comparaison du CoV par branche . . . . . . . . . . . . . . . . . . . . . . . . 974.11. Comparaison du niveau de volatilité par type de solution par rapport à la

volatilité de l’EIOPA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 984.12. Backtesting - Comparaison du montant ultimes et IBNR estimés par branche

et loi de probabilité . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 994.13. Comparaison du CoV par branche d’activité . . . . . . . . . . . . . . . . . . 100

A.1. Exemple de triangle incomplet - Branche automobile non proportionnelle . . 106A.2. Développement de la charge encourue (incurred) pour la branche responsabi-

lité civile par année de souscription . . . . . . . . . . . . . . . . . . . . . . . 107A.3. Développement de la charge encourue (incurred) pour la branche maritime

par année de souscription . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 107

9

Page 15: Modélisation du risque de réserve en business Run-Off sous ...

10

Page 16: Modélisation du risque de réserve en business Run-Off sous ...

Liste des tableaux

1.1. Types de traités de réassurance par branche d’activité du portefeuille ISAR . 25

2.1. Test de non effet calendaire pour les segments Motor, General Liability, Marine 41

3.1. Matrice de similarité entre deux années de souscription . . . . . . . . . . . . 513.2. Distances utilisées dans la classification hiérarchique . . . . . . . . . . . . . . 523.3. Méthodes d’agglomération de la classification hiérarchique . . . . . . . . . . 533.4. Comparaison de la performance de l’algorithme (NRMSE) en fonction du

nombre des sous-arbres ntree - Branche automobile . . . . . . . . . . . . . . 72

4.1. Solution 1 - Impact de l’application de la solution 1 sur les montants IBNRet Ultime . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 95

4.2. Impacte de l’application de la solution 2 sur les montants IBNR . . . . . . . 974.3. Pourcentage d’écart des montants d’IBNR par rapport au triangle original

par type de triangle et branche . . . . . . . . . . . . . . . . . . . . . . . . . 100

11

Page 17: Modélisation du risque de réserve en business Run-Off sous ...

12

Page 18: Modélisation du risque de réserve en business Run-Off sous ...

Introduction générale

L’activité du Run-Off est spécialisée dans l’acquisition et la gestion des portefeuilles cédéspar des assureurs ou réassureurs. Les acteurs clés de ce marché sont appelés les gestionnairesde passifs. Sous la nouvelle norme Solvabilité II, ces sociétés de Run-Off doivent aussi mettreen place un nouveau processus d’évaluation prudente des risques contenus dans leurs por-tefeuilles. L’obligation de gérer des portefeuilles en Run-Off sous la nouvelle réglementationimpactera significativement la façon dont opère l’industrie du Run-Off. En effet, reconsidérerle coût du capital pour les branches d’activité gérées en Run-Off influencera les décisionsstratégiques d’investissement dans ce marché.

Avec l’entrée en vigueur de Solvabilité II, les sociétés de Run-Off sont obligées d’envoyer desdemandes aux régulateurs pour valider les nouvelles acquisitions de portefeuilles. Dans cecadre, AXA Liabilities Managers (AXA LM), leader français du business Run-Off, s’apprêteà répondre aux questions du régulateur allemand (BaFin) suite à l’acquisition d’un porte-feuille en Run-Off basé en Allemagne. Ce dernier a transmis une demande au départementd’actuariat d’AXA Liabilities Managers pour estimer selon les nouvelles méthodes de Solva-bilité II le risque de réserve des différentes branches d’activité d’un de ses portefeuilles baséen Allemagne.

Le business Run-Off est axé sur le transfert des portefeuilles en Run-Off qui est toujoursaccompagné d’un prix d’acquisition proposé à la cédante. Les coûts de l’intégration informa-tique, en particulier, peuvent varier fortement en fonction de la qualité et de la disponibilitédes données. Afin de gérer les business Run-Off avec des moindres frais, les compagniesactives sont souvent amenées à faire des choix politiques. Parmi les multiples décisions stra-tégiques, les compagnies décident de ne transférer qu’une partie des données du portefeuilles,les plus récentes. Cependant, l’absence d’informations sur l’historique se répercute de façonconséquente sur les études actuarielles menées par le département actuariat. Cette problé-matique de données empêche les actuaires d’effectuer des analyses plus approfondies sur le

13

Page 19: Modélisation du risque de réserve en business Run-Off sous ...

Liste des tableaux

portefeuille et de pouvoir appliquer des techniques actuarielles plus pertinentes.

AXA LM est aussi confrontée à cette problématique des données manquantes. Plus précisé-ment, lors du transfert de deux portefeuilles du réassureur Munich Re en 2014, une partieancienne de l’historique des données n’était pas disponible. Sachant que l’historique des don-nées remonte à 1963, les triangles de liquidation liés à ses portefeuilles se retrouvent tronquésd’une importante partie de l’information. C’est dans ce cadre que s’inscrit la réflexion ac-tuarielle que nous allons mener durant le reste de ce travail.

Après une introduction générale et une mise en contexte de l’étude, le premier chapitre seraconsacré au fonctionnement du business Run-Off et son aspect réglementaire. Nous allonsaussi définir le périmètre d’étude qui s’étend à un portefeuille en Run-Off regroupant deuxportefeuilles d’AXA LM. Mais avant d’expliquer la problématique des données, nous feronsun rappel du principe de la réassurance et la nature des risques qui sont souvent cédés enRun-Off.

Le deuxième et troisième chapitres s’intéresseront à l’aspect des données manquantes et auxsolutions proposées. Dans un premier temps, nous allons faire un rappel des techniques deprovisionnement avec les tests de validation qui les accompagnent. Ensuite, nous analyseronsl’impact des données manquantes au niveau du triangle de liquidation. Dans un second temps,nous proposons deux solutions pour résoudre la problématique des données incomplètes.Ces deux solutions sont retenues après avoir testé plusieurs pistes concernant les donnéesmanquantes. La première solution consiste à séparer le triangle de liquidation en deux soustriangles en utilisant des techniques de data mining. La seconde solution est basée sur uneimputation des données manquantes par la méthode des forêts aléatoires. Ces deux solutionsseront mises à l’épreuve par un backtesting qui appliquera les deux solutions sur un trianglecomplet duquel nous avons retiré des données.

Dans le quatrième chapitre, nous ferons d’abord un rappel des principes de la directiveeuropéenne Solvabilité II. Ensuite, nous nous focaliserons sur l’estimation du risque de réserveà l’horizon un an en utilisant le modèle de Merz & Wütrich recommandé par l’EIOPA. Àchaque fois, nous allons estimer les volatilités des branches retenues pour l’étude dans le casoù le triangle est incomplet puis en introduisant implicitement les solutions proposées dansle deuxième chapitre et réestimerons de nouveau la volatilité. Un backtesting sera aussi misen place pour challenger la robustesse des résultats obtenus.

14

Page 20: Modélisation du risque de réserve en business Run-Off sous ...

Chapitre 1Le marché de Run-off

Tables des matières

1.1. Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16

1.2. Positionnement du business Run-Off . . . . . . . . . . . . . . . . 16

1.3. Processus d’acquisition de portefeuille en Run-Off . . . . . . . . 19

1.4. Le business Run-Off sous l’angle réglementaire . . . . . . . . . . 20

1.5. Aperçu sur la réassurance . . . . . . . . . . . . . . . . . . . . . . 21

1.6. Périmètre d’étude . . . . . . . . . . . . . . . . . . . . . . . . . . . 23

1.7. Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26

15

Page 21: Modélisation du risque de réserve en business Run-Off sous ...

1.1. Introduction

1.1. Introduction

Le business Run-Off est l’activité spécialisée dans la gestion de portefeuilles qui ne font plusl’objet de souscription active. Selon Eling et Schaper (2016), les entreprises d’assurances(réassurances) qui cessent volontairement ou sous certaines règles réglementaires leurs opé-rations d’assurances (réassurances) sont dites en Run-Off. En revanche, il arrive souvent aulecteur de confondre le terme Run-Off et celui du processus de liquidation. En effet, l’arrêtdes activités de souscription dans le cadre du Run-Off peut être le résultat d’une décisionstratégique de l’entreprise, alors que la liquidation est principalement due à une situation dedétresse financière subie par l’assureur (réassureur). D’un point de vue actuariel, un porte-feuille est mis en Run-Off si la compagnie d’assurance (réassurance) suspend définitivementl’activité de souscription.

Vers les années 1970, de nombreuses entreprises européennes pensaient trouver une sourced’activité complémentaire en souscrivant, de faibles parts de réassurance nord-américains.Cependant, les engagements passés devenaient très lourds à cause de la forte détérioration dela sinistralité. Les assureurs (réassureurs) n’ayant pas les moyens de contrôler ou de mesurerl’impact de ces pics de sinistralité au niveau de leurs bilans étaient contraints de gérer leursbusiness en Run-Off.

Ainsi, le démarrage du business Run-off date des années 1980 aux États-Unis quand leconcept d’une gestion spécifique des affaires en fin de vie a commencé à être pris en considé-ration par les dirigeants d’entreprise. La tendance, alors, était de mettre en place, au sein descompagnies, une unité chargée de sa gestion jusqu’à la clôture des dossiers. L’amiante et lapollution, comptent parmi les risques qui ont constitué une véritable perte pour les marchésd’assurance (réassurance). En conséquence, la gestion de ces affaires en Run-Off est devenueune industrie qui s’est développée ces dernières années au niveau international. L’Allemagneet la Suisse sont considérées comme des leaders de l’industrie du Run-Off.

1.2. Positionnement du business Run-Off

Le marché du Run-Off représente un engagement de plus de 300 milliards de dollars répartisentre le continent américain et européen d’après une étude annuelle de cabinet de conseilPWC 1. L’Allemagne et la Suisse se positionnent au premier plan avec des engagements de111 milliards de dollars suivis par l’Amérique du nord avec des engagements de 100 milliardsde dollars. La figure 1.1 retrace la répartition du business Run-Off au niveau européen.

1. www.pwc.com/gx/en/financial-services/publications

16

Page 22: Modélisation du risque de réserve en business Run-Off sous ...

1. Le marché de Run-off

Figure 1.1. – Répartition du business Run-Off au niveau européen en 2016Source : Étude PWC - A Survey of Discontinued Insurance Business in Europe : Ninth

edition /Septembre 2016

Les sociétés du Run-Off sont principalement des prestataires de services en gestion de si-nistres, audit, recouvrement de créances mais aussi et surtout des investisseurs prêts à ac-quérir des portefeuilles en Run-off. La concentration des sociétés du Run-Off dans des zonesparticulières (Bermudes en Amérique, la Suisse, . . . , etc) est motivée par les avantages fiscauxproposés par ces pays.

Le groupe Randall & Quilter (R&Q) formé en 1992 est l’un des premiers groupes à acquérirdes portefeuilles en Run-Off. Il a acquis un nombre significatif de compagnies d’assurance enRun-off et regroupe actuellement une dizaine de compagnies aux États-Unis et en Europeavec une valeur des réserves estimée à 2, 8 milliards de livres sterling en 2016. D’autresgroupes plus importants mais diversifiés interviennent sur ce marché comme Fairfax (dontfait partie la société Riverstone), Capita, ou encore Berkshire Hathaway.

La concurrence au sein du business Run-Off est de plus en plus forte, surtout entre les grandsgroupes Swiss Re et Fairfax ou les professionnels de plus petite taille comme Enstar et Cata-lina. Les acquisitions des portefeuilles (deals) dans le marché du Run-Off sont nombreuses.Parmi ces deals, la plus importante opération est la création en 1996 de la société Equitas 2

pour gérer en Run-Off les contrats souscrits entre 1930 et 1992 par le Lloyd’s of London.Le total des réserves sur encours gérés par le réassureur Equitas s’élevait à 15 milliards delivre sterling et concernait les contrats souscrits pour les branches non-vie pour les exercices1992 et antérieurs. Ces exercices étaient fortement exposés au risque amiante. Un autre cas

2. www.insuranceinsider.com/Lloyd-s-finally-says-goodbye-to-Equitas

17

Page 23: Modélisation du risque de réserve en business Run-Off sous ...

1.2. Positionnement du business Run-Off

marquant dans l’industrie du Run-Off est la mise en Run-Off du réassureur Gerling Re 3 fin2002 suites aux tempêtes "Lothar et Martin" de 1999. Ce dernier, sixième acteur mondialen réassurance s’est mis en Run-Off alors qu’il bénéficiait jusqu’en 2001 d’une excellenteappréciation de sa solidité financière par les agences de notation. Il était d’ailleurs encorenoté BBB par Standard & Poor’s au moment de sa mise en Run-off.

En France, l’industrie du Run-Off est surtout représentée par AXA Liabilities Managers(AXA LM) société internationale du groupe AXA et spécialisée dans l’acquisition et lagestion proactive de contrats d’assurance et de réassurance en Run-Off. Historiquement,AXA LM a été créé en 2001 pour gérer les portefeuilles en Run-off de la filiale de réassuranceAXA Re suite à un enchaînement de catastrophes parmi lesquelles, l’attaque terroriste surle World Trade Center en 2001. Depuis, elle a étendu son périmètre d’activité en devenantnotamment une filiale à part entière au 1er janvier 2003. Les engagements gérés par AXALM s’élèvent à 2, 5 milliards d’euros en 2016 et s’étalent sur 36 portefeuilles 4. Son passif serépartit entre 80% de réassurance et 20% d’assurances.

Actuellement, le marché du Run-Off continue toujours sa tendance croissante comme nousle montre la figure 1.2.

Figure 1.2. – Evolution estimée des engagements non-vie en Run-Off depuis 2011Source : Étude PWC - A Survey of Discontinued Insurance Business in Europe : Ninth

edition /Septembre 2016

En 2020, l’étude prévoit un montant d’engagement de 412 milliards de dollars, avec unepart de 66% pour l’Europe. Cette croissance est principalement conduite par l’expansiondu marché d’assurance, le profit généré par le business en Allemagne et en Suisse, ainsi

3. www.runoffandrestructuring.com/news.php?id=4914. www.axa-lm.com/fr/chiffres-cles

18

Page 24: Modélisation du risque de réserve en business Run-Off sous ...

1. Le marché de Run-off

que l’ouverture du marché américain aux solutions du Run-Off. L’activité fusion-acquisition(M&A) et l’apparition de nouveaux risques émergents (terrorisme et changement climatique)permettent de leur côté d’accentuer la croissance du marché de Run-Off. Aussi, la mise enplace de la directive Solvabilité II semble être un nouveau levier pour les investisseurs dumarché de Run-Off. En effet, d’après l’étude de PWC, les investisseurs prévoient qu’à courtet à moyen terme, la réforme Solvabilité II continuera à générer de nouvelles dispositionset restructurations de l’activité d’assurance (réassurance), ce qui implique la création denouvelles opportunités pour le marché du Run-Off.

1.3. Processus d’acquisition de portefeuille en Run-Off

L’acquisition d’un portefeuille en Run-Off suit un processus de négociation qui implique plu-sieurs partie prenante du marché d’assurance à savoir la cédante, les investisseurs intéresséspar le Run-Off et les régulateurs du pays où se localise le portefeuille. Le processus d’acqui-sition peut durer plusieurs mois répartis selon six phases majeures comme nous montre lafigure 1.3.

Toute acquisition du portefeuille commence par un repérage des opportunités sur le marchédu Run-Off (Origination). La première analyse se fait en fonction de la taille du portefeuille,sa location et la faisabilité du deal. Une fois que la liste des opportunités est identifiée, le res-ponsable de la stratégie d’acquisition détermine l’appétit de la cédante. Si la cédante exprimeson intérêt, le comité d’investissement donne son avis à propos de l’acquisition (Decison tobid). Après, les équipes de la finance procèdent à une estimation du montant d’acquisition(target) en utilisant des informations publiques ou privées s’il y a eu un premier accord avecla cible. Le comité d’investissement doit prendre ainsi sa décision finale et prépare une offred’acquisition (Non-binding offer) qui permet ou non d’être sélectionné pour participer à laDue diligence.

Le processus de diligence permet à la fois l’évaluation qualitative et quantitative de l’op-portunité (Due diligence). L’analyse se concentre sur les sinistres, les réserves, les outilstechniques et la partie finance. Après que le comité d’investissement valide la propositiond’acquisition, le responsable des acquisitions envoie une lettre engageante contenant une offred’acquisition (Binding offer). Si la cédante accepte la proposition, le deal est conclu, sinonles négociations reprennent de nouveau.

19

Page 25: Modélisation du risque de réserve en business Run-Off sous ...

1.4. Le business Run-Off sous l’angle réglementaire

Figure 1.3. – Processus d’acquisition des portefeuilles en Run-Off chez Axa LMSource : Run-off 2016 - The status quo and future relevance of run-off in the

German-speaking non-life insurance market

La dernière étape du processus d’acquisition est importante dans la mesure où le régulateurdu portefeuille en Run-Off doit donner son approbation du transfert. En effet, l’autorité decontrôle évalue si les intérêts des assurés seront protégés après l’acquisition et si la sociétébénéficiaire peut remplir les obligations découlant des polices d’assurance. Généralement,cette étape du processus peut durer des mois et le gestionnaire du Run-Off est tenu defournir des éléments de sa solvabilité et sa stratégie en vue du portefeuille acquis. Une foisque le transfert du portefeuille est accordé, une phase d’intégration du portefeuille est miseen place.

1.4. Le business Run-Off sous l’angle réglementaire

L’obligation de gérer des portefeuilles en Run-Off sous la nouvelle réglementation solvabilitéII impactera significativement la façon dont opère l’industrie du Run-Off. En effet, les sociétésde Run-Off doivent reconsidérer le coût du capital pour les branches d’activité risquées, lessolutions informatiques à mettre en place et la granularité du risque à prendre en compte.

20

Page 26: Modélisation du risque de réserve en business Run-Off sous ...

1. Le marché de Run-off

Si le risque de réserve domine le profil de risque des sociétés du Run-Off, l’obligation dedétenir des capitaux importants pour couvrir leurs expositions au risque impactera directe-ment leurs rentabilités. En effet, les sociétés du Run-Off ne disposant pas de lignes d’affairessuffisamment rentables pour générer du capital supplémentaire auront des difficultés de ren-tabilités. Comme conséquence, ces sociétés n’auront pas assez de fond propres et risquerontde ne pas se conformer au capital minimum requis (MCR), ce qui aboutira finalement à larévocation de leur autorisation et à leur liquidation.

Reconnaissant la situation spécifique de ces entreprises, la directive solvabilité II prévoitune exemption pour les entreprises à faible rendement conformément à l’article 308b de ladirective européenne :

Insurance and reinsurance companies that have stopped entering into new insu-rance or reinsurance contracts before 1 January 2016 and are concentrating onrunning-off their existing obligations are not subject to the Solvency II requi-rements provided they manage to terminate all their activity before 1 January2019 (1 January 2021 in case the undertaking is subject to reorganisation and anadministrator has been appointed). 5

Afin d’être éligible à l’exemption, la société ne doit pas faire partie d’un groupe ayant uneactivité d’assurance active, doit notifier à son autorité de surveillance sa demande de dispo-sition transitoire et fournir à l’autorité un rapport d’avancement annuel. Il semble donc quesolvabilité II accorde un soulagement substantiel aux sociétés du Run-Off qui ne peuvent sepermettre de se conformer à ses exigences. En dépit de l’exigence réglementaire introduitepar solvabilité II, les investisseurs et les groupes d’assurance (réassurance) prévoient que lemarché du Run-Off va se développer de plus en plus. Cette perspective se justifie par lefait que les compagnies d’assurances ou réassurances doivent renforcer leur bilan quitte àmettre en Run-Off certaines branches d’activité moins performantes ce qui générera plusd’opportunité pour le business Run-Off.

1.5. Aperçu sur la réassurance

La réassurance pourrait être définie d’une manière simplifiée comme « l’assurance de l’assu-rance », nous retiendrons néanmoins une définition plus complète suivante :

« Une opération de réassurance est un contrat sur lequel un réassureur (dit ces-sionnaire) vis-à-vis d’un assureur professionnel (dit cédant) qui répond seul et

5. DIRECTIVE 2009/138/CE DU PARLEMENT EUROPÉEN ET DU CONSEIL du 25 novembre 2009

21

Page 27: Modélisation du risque de réserve en business Run-Off sous ...

1.5. Aperçu sur la réassurance

intégralement vis- à-vis des assurés des risques par lui assurés, prend en chargemoyennant rémunération, tout ou partie des sommes dues ou versées aux assurésà titre de sinistres ». (Picard et Besson)

Le schéma simplifié 1.4 nous décrit le fonctionnement simplifié de la réassurance :

Figure 1.4. – Schéma simplifié du principe de réassurance

Certaines sociétés d’assurance doivent se protéger contre les risques qui dépassent leur proprecapacité, ou risques extrêmes tels que les catastrophes naturelles ou une sinistralité à forterécurrence. Ces phénomènes peuvent déstabiliser leurs bilans et comptes de résultats en lesentraînant vers l’insolvabilité. C’est à cette finalité qu’intervient la réassurance, en trans-férant à travers différents traités une partie des risques que l’assureur a souscrit au termede plusieurs polices d’assurance. D’autre part, les réassureurs cèdent une partie des risquesauprès d’un ou plusieurs réassureurs que nous appelons rétrocessionnaires. Dans le langagede réassurance, une part des risques cédés est appelée "cession" par les assureurs et accep-tation par les réassureurs. Il existe trois types de réassurance : la réassurance facultative, laréassurance obligatoire, et la réassurance facultative obligatoire connue sous le nom FACOB.

réassurance facultative : Historiquement cette forme de réassurance est la plus ancienne.L’accord s’établit pour chaque risque, police par police. Ainsi, la cédante est libre de proposerles risques qu’elle souhaite au réassureur, libre à lui de les accepter ou non.

La réassurance obligatoire : Elle se matérialise par un contrat de Réassurance dit (Traité)qui définit une catégorie de risques ainsi que des conditions ou des limites de souscription.Par ce Traité, l’assureur (Cédante) s’engage à céder tout risque correspondant aux conditionsdéfinies précédemment sans effectuer aucune sélection ; de son côté, le réassureur s’engage àaccepter tous ces risques sans effectuer aucune sélection.

22

Page 28: Modélisation du risque de réserve en business Run-Off sous ...

1. Le marché de Run-off

La réassurance FACOB : Dans mode de réassurance, la symétrie est brisée entre lacédante et le réassureur. Comme pour la réassurance facultative, l’assureur est libre de céderou non les risques de son portefeuille, en revanche, le réassureur est ici obligé d’accepterles risques qui lui sont proposés. Pour chaque risque déclaré par la cédante, une prime estversée au réassureur qui est calculé selon le type de réassurance adopté (proportionnelle/nonproportionnelle). L’inconvénient majeur de ce mode de réassurance est qu’il entraîne pour lecessionnaire un gros risque d’antisélection dans son portefeuille. En effet, la cédante pourraitêtre légitimement tentée de conserver ses bons risques et de ne céder que les mauvais. Chacundes modes de Réassurance précédent peut exister sous deux forme de Réassurance :

• Réassurance proportionnelle : la prime de réassurance et l’indemnisation des si-nistres de la Cédante par le réassureur se calculeront selon le même pourcentage. Lesdeux formes classiques de traités de réassurance proportionnelle sont le quote part(Quota share) et l’excédent de plein (Surplus). Les cessions facultatives se faisant risquepar risque, on ne fait pas la distinction et on parle juste de facultative proportionnelle.

• Réassurance non-proportionnelle : il n’y a pas ici de relation de proportionna-lité entre la prime cédée et la participation du réassureur dans les sinistres. Ce typede réassurance a pour but de protéger la Cédante de la survenance d’évènements ca-tastrophiques. Il existe là encore deux grands types de contrats en Réassurance nonproportionnelle : l’excédent de sinistres (excess of loss) et l’excédent de perte annuelle(stop loss).

1.6. Périmètre d’étude

Le portefeuille ISAR concerné par notre étude est un portefeuille de réassurance composéde deux sous portefeuilles Victoria Re et Tela Re. Ce portefeuille est basé en Allemagne estissu d’une acquisition en 2014 de deux portefeuilles (Victoria Re et Tela Re) du réassureurMunich Re. Le portefeuille Victoria Re, est constitué de 79% de l’attritionnel comme nousmontre la figure 1.5. Le reste du portefeuille est réparti entre le risque de l’amiante (Asbestos)19%, la pollution 1% et le risque pour la santé (Health Hazard).

23

Page 29: Modélisation du risque de réserve en business Run-Off sous ...

1.6. Périmètre d’étude

Figure 1.5. – Répartition des Réserves en suspens du portefeuille Victoria Re par type depertes en 2016

Source : Analyse interne de la société AXA LM

Nous nous focaliserons dans la suite sur les branches attritionnels seulement. Les réserves liéesau risque de l’amiante nécessitent une attention particulière à cause de leur volatilité instable,d’où l’intérêt de les séparer du reste de l’attritionnel. Malgré que les réserves en suspensde l’amiante sont beaucoup plus inférieures que l’attritionnel, le ratio (IBNR 6/reserves ensuspens) est plus important pour l’amiante.

L’amiante est un minéral fibreux utilisé dans les matériaux de construction pouvant causerune variété de maladies, y compris des cancers du poumon et mésothéliomes. D’après unarticle de Sen (2015) de l’université d’Oxford, l’amiante demeure la principale cause dedécès par cancer dans le monde. Ces maladies touchent essentiellement les travailleurs quiont été exposés au risque de l’amiante durant leurs travaux dans les mines ou la construction.Entre 2012 et 2015, les spécialistes de santé estimaient que le nombre de cas atteindra unsommet de 2500 cas par an au Royaume-uni. Actuellement, le risque de l’amiante semble êtrel’un des risques les plus importants jamais confrontés par le secteur d’assurance. Au niveaudu marché américain, l’agence de notation A.M.Best a augmenté son estimation des pertesliées à l’amiante de 75 milliards de dollars en 2011 à 100 milliards de dollars en 2016 7. Cedernier attribue cette réestimation à une vague de décisions judiciaires qui ont augmenté lacouverture d’assurance pour les victimes de l’amiante, et une augmentation des réclamationsliée au mésothéliome, un type de cancer mortel identifié avec l’exposition à l’amiante.

6. les IBNR (Incurred But Not Reported) sont les montants de sinistres survenus mais non déclarés par

les assurées

7. http://www.iii.org/issue-update/asbestos-liability

24

Page 30: Modélisation du risque de réserve en business Run-Off sous ...

1. Le marché de Run-off

L’autre portefeuille Tela Re est constitué de l’attritionnel seulement. Les réserves des sinistresen suspense sont réparties entre le risque Engineering 89%. Le reste est réparti entre d’autresbranches d’activité attritionnel comme nous montre la figure 1.6.

Figure 1.6. – Répartition des Réserves en suspens du portefeuille Tela Re par type depertes en 2016

Source : Analyse interne de la société AXA LM

Les traités de réassurances concernées par l’étude dans ce qui suit sont définis dans le tableausuivant 1.1 :

Segment Nature du traité

Aviation Quote PartCredit Quote PartEngineering Quote Part & FacultativeThird Party Liability Quote Part & FacultativePersonal Accident Quote PartHealth QPMotor Liability Quote Part & FacultativeMarine Quote Part & FacultativeFire Quote Part & FacultativeRisk-other Property Quote Part & Facultative

Table 1.1. – Types de traités de réassurance par branche d’activité du portefeuille ISAR

Les portefeuilles de Run-off sont généralement classés selon les types de passifs qu’ils peuvent

25

Page 31: Modélisation du risque de réserve en business Run-Off sous ...

1.7. Conclusion

contenir : déroulement court ou déroulement long. Les passifs à déroulement court (tels ceuxliés à des risques de dommages type incendie ou tempête) tendent à se régler sur une périodecourte. L’avantage d’avoir un historique court permet une meilleure estimation du coût ducapital à allouer. Cependant, les passifs à déroulement long comme l’amiante, la pollution,et les risques de santé peuvent nécessiter 30 ans avant d’être réglés. Ces types de risquess’avèrent complexes à gérer à cause des multiples procédures juridiques et réestimation ducoût de sinistralité.

Le risque de pollution concerne en premier lieu la contamination des biens assurés par dessources externes ou sur place. Il peut aussi atteindre les tiers en raison d’une contaminationde l’air, de l’eau ou les terres par la libération soudaine et accidentelle de matières dange-reuses du site assuré. Les actes intentionnels sont spécifiquement exclus par les assureurs.Concernant le risque Health Hazard, il peut contenir plusieurs types de sous risques notam-ment les implants mammaires qui causent le cancer du sein, les abus sexuels, ou simplementles aggravations de la santé des assurés suite à des complications et dangers imprévus. Lehazard peut aussi inclure le type de câblage utilisé dans une maison lors de la déterminationdu risque de perte due à un incendie. Le tabagisme est également un risque qui peut causerdes complication lors d’un problème de santé. Les sinistres de ces risques qui sont pris encompte par la responsabilité civile impliquent de grandes pertes aux compagnies d’assurancesou réassureurs.

1.7. Conclusion

L’activité de Run-Off compte parmi les secteurs en pleine croissance actuellement. Ce marchépeu connu dans le secteur d’assurance propose des taux rendement relativement attractiveavec une moyenne qui dépasse les 12% (Par exemple le groupe Enstar Ltd proposait un ROEentre 10% et 20% durant les 10 dernières années).

Avec la mise en place de solvabilité 2, les acteurs du marché de Run-Off sont de plus en pluschallengé par les régulateurs afin de maîtriser leurs profils de risque notamment le risquede réserve. Toutefois, avant de mener une réflexion sur les méthodes d’estimation du risquede réserve utilisés en Run-Off, il semble nécessaire d’abord de comprendre la nature et laqualité des données contenues dans le portefeuille en Run-Off étudié.

26

Page 32: Modélisation du risque de réserve en business Run-Off sous ...

Chapitre 2Problématique des données manquantes

Tables des matières

2.1. Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28

2.2. Aperçu sur les triangles incomplets en Run-Off . . . . . . . . . 29

2.2.1. Présentation des branches étudiées . . . . . . . . . . . . . . . . 29

2.2.2. Agrégation des sinistres . . . . . . . . . . . . . . . . . . . . . . 31

2.2.3. Définition des provisions et charge ultime . . . . . . . . . . . . . 32

2.2.4. Triangles incomplets en Run-Off . . . . . . . . . . . . . . . . . . 33

2.3. Méthodes de provisionnement en non-vie . . . . . . . . . . . . . 35

2.3.1. La méthode déterministe de Chain Ladder . . . . . . . . . . . . 36

2.3.2. Méthodes stochastiques : Mack . . . . . . . . . . . . . . . . . . 38

2.3.3. Validation des hypothèses du modèle Chain Ladder et Mack . . . 39

2.4. Impact des données incomplètes sur les techniques de provi-

sionnement . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42

2.4.1. Analyse de la charge encourue (incurred) . . . . . . . . . . . . . 42

2.4.2. Allure de la charge encoure par année de souscription . . . . . . . 43

2.4.3. Analyse des facteurs de développement . . . . . . . . . . . . . . 44

2.5. Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45

27

Page 33: Modélisation du risque de réserve en business Run-Off sous ...

2.1. Introduction

2.1. Introduction

La qualité des données est un sujet assez fréquent chez les gestionnaires de portefeuilles enRun-Off. Cette problématique des données est souvent liée à des migrations des donnéesdans de nouveaux systèmes d’information suite à des opérations d’acquisition.

Une partie de l’historique (sinistres et primes) du portefeuille ISAR acquis par AXA LMdepuis 2014 n’a pas été transférée sachant que l’historique des données remonte à 1963.Comme conséquence, les triangles de liquidation liés à ces portefeuilles se retrouvent tronquésd’une importante partie d’information. La figure 2.1 représente un exemple de triangle deliquidation extrait du portefeuille ISAR (Victoria Re et Tela Re) lors de la revue actuariellede 2016.

Figure 2.1. – Exemple du triangle de liquidation des réserves en suspens du portefeuilleISAR

Les portefeuilles Victoria Re et Tela Re sont mis en Run-Off durant l’année 2006, ainsi nousne disposons pas des sinistres survenus après cette année comme nous montre la figure 2.1.Dans le cas du provisionnement classique, les triangles de liquidation ont l’allure d’un triangled’où l’appellation "triangle de liquidation" ou "triangle de développement". En Run-Off, leslignes de survenance des sinistres s’arrêtent l’année ou le portefeuille est mis en Run-Off.Ainsi, l’ensemble des triangles de liquidation par branche d’activité constituant le portefeuilleISAR (Victoria Re et Tela Re) ont l’allure d’un trapèze.

La particularité de nos triangles de liquidation se manifeste dans le manque des donnéeshistoriques. En effet, les diagonales supérieures du triangle des incréments sont nulles (cf.figure 2.1). D’un point de vue actuariel, l’historique des données est d’autant plus importantque le choix de la méthode de provisionnement. L’impact des données manquantes devienttrès important en cas des branches à développement long avec des risques très volatiles (cf.l’exemple de l’amiante). Aussi, le fait que les primes ne sont pas transférées empêche de fairedes analyses sur le portefeuille en matière de loss ratio (S/P) et de pouvoir appliquer destechniques actuarielles plus pertinentes. Les triangles du portefeuille ISAR sont caractériséspar leur développement long, par exemple un sinistre qui est survenu en 1985 continue

28

Page 34: Modélisation du risque de réserve en business Run-Off sous ...

2. Problématique des données manquantes

toujours à être considéré comme un sinistre non clôturé en 2016. Cela revient au fait que lereserving en réassurance se déroule souvent sur une longue période. Le fait de ne pas avoirdes années de souscriptions après 2006 dans ce triangle de liquidation est justifié par la miseen Run-Off du portefeuille en cette date.

Si la nouvelle directive solvabilité II insiste sur la qualité des données, l’absence d’une partied’historique du portefeuille pourrait empêcher une bonne visibilité du risque management.En effet, la présence des données incomplètes augmentera l’incertitude liée aux réservesestimées même si le portefeuille est en Run-Off. Une donnée manquante représente un biaisd’information en général, et les statistiques et études actuarielles auront toujours un niveaud’incertitude beaucoup plus supérieur.

C’est dans ce cadre que s’inscrit la réflexion actuarielle que nous allons mener durant le restede ce travail. Il faut d’abord comprendre les implications des données manquantes sur lestechniques de provisionnement en réassurance. Ensuite, il faut chercher des solutions pourestimer un niveau risque de réserve reflétant le risque réellement porté par le portefeuilleISAR tout en considérant la contrainte des données. L’étude menée dans ce travail est ap-pliquée dans un cadre particulier du portefeuille ISAR, mais peut être élargie à l’ensembledu business en Run-Off de la société AXA LM.

2.2. Aperçu sur les triangles incomplets en Run-Off

2.2.1. Présentation des branches étudiées

L’étude actuarielle élaborée dans la suite de ce travail est appliquée à un portefeuille d’ac-quisition en Run-Off. Depuis l’acquisition de ces deux portefeuilles de réassurance, AXA LMs’occupe de la gestion en Run-Off de ses branches d’activité qui contiennent des risques telque l’amiante, la pollution, le Health Hazard et l’attritionnel avec un historique des donnéesremontant à 1963. L’attritionnel regroupe l’ensemble des risques facilement mutualisables,caractérisés par une perte potentiellement faible, mais avec une forte probabilité d’occur-rence. Les types de risques qui peuvent être catégorisés en attritionnel sont nombreux :

• Assurance de véhicules Automobile (Motor)

• Assurance de responsabilité civile générale (General Liability)

• Assurance incendie et autres dommages aux biens (Fire, Property)

• Assurance maritime, aérienne et transport (Marine, Aviation, )

29

Page 35: Modélisation du risque de réserve en business Run-Off sous ...

2.2. Aperçu sur les triangles incomplets en Run-Off

• Assurance Crédit et Caution (Credit)

• Assurance de Santé (Health)

Au sein du portefeuille ISAR, les trois branches les plus matérielles en terme de données sont :assurance de véhicule automobile (54, 5% des sinistres en suspens), assurance responsabilitécivile général (6, 6% des sinistres en suspenses) et assurance maritime en non proportionnelle(0, 5% des sinistres en suspens) représentent plus de 60% des sinistres en suspens (OS) duportefeuille ISAR fin 2015. Dans la suite, nous présentons une brève explication sur chacunede ces trois branches :

Branche automobile non proportionnelle : Elle comprend les traités non proportionnelsde réassurance couvrant les garanties de l’assurance automobile. La garantie de l’assuranceautomobile propose des polices d’assurance automobile pour protéger les voitures de tous lesrisques possibles. Cette assurance automobile couvre toutes les responsabilités qui peuventsurvenir en raison d’une blessure ou d’un décès d’un tiers ou d’un dommage à la propriétéde tiers. L’assurance automobile est accompagnée d’indemnités totales, en assurant unecouverture d’assurance automobile contre les émeutes, les incendies, le vol, l’explosion, lesgrèves, les activités terroristes et les actes malveillants.

Branche de responsabilité civile générale non proportionnelle : Elle comprend lestraités non proportionnels de réassurance couvrant les garanties de la responsabilité civile gé-nérale (GL). Cette assurance propose une couverture contre toute une série de réclamations,y compris les dommages matériels, les blessures corporelles et autres qui peuvent résulterdes opérations commerciales. Aussi, elle couvre les assurés commerciaux de la plupart desexpositions de responsabilité autres que la responsabilité automobile et professionnelle.

Branche maritime non proportionnelle : Elle comprend les traités non proportionnels deréassurance couvrant les garanties de l’assurance maritime. Le cadre de l’assurance maritimeest très large et comporte une catégorisation définitive de divers types d’assurance maritimeet de différents types de polices d’assurance maritime. Selon les besoins, les exigences et lesspécifications du transporteur, un type approprié ou des types d’assurance maritime peutêtre restreint et sélectionné pour être mis en service. Les garanties de l’assurance maritimesont comme suit :

• Assurance de fret (Cargo Insurance) : L’assurance de fret s’adresse spécifiquement àla cargaison du navire et concerne aussi les effets des navires.

• Assurance coque (Hull Insurance) : l’assurance coque s’adresse principalement au torseet à la coque du navire ainsi que tous les articles et les meubles du navire. Ce typed’assurance maritime est principalement acheminé par le propriétaire du navire afind’éviter toute perte pour le navire en cas de maltraitance.

30

Page 36: Modélisation du risque de réserve en business Run-Off sous ...

2. Problématique des données manquantes

• Assurance responsabilité civile : l’assurance responsabilité est un type d’assurance mari-time où une indemnité est demandée pour être fournie à toute responsabilité découlantd’un navire qui s’effondre, se heurte ou cause toute autre attaque induite.

• Assurance de fret (Freight Insurance) : l’assurance de fret offre et offre une protectionaux sociétés de navires marchands qui ont une chance de perdre de l’argent sous formede fret dans le cas où la cargaison est perdue en raison de la réunion du navire avec unaccident. Ce type d’assurance maritime résout le problème des entreprises qui perdentde l’argent en raison de quelques événements sans précédent et des accidents survenus.

2.2.2. Agrégation des sinistres

Une des difficultés intrinsèques au provisionnement est le fait qu’un sinistre peut couvrirplusieurs années. Chaque sinistre s survenu l’année i, donne lieu à un premier remboursementici supposé effectué la même année i (année d’origine ou de survenance). Bien qu’ilpuisse y avoir une discordance entre ces deux dates, cette hypothèse n’est pas restrictive. Cepremier remboursement constitue le point de départ d’un processus de paiements (Xs,i)k0

qui s’étale dans le temps (sur plusieurs années de développement k), mais dont le délaiet les montants sont inconnus à l’avance (cf. mémoire d’actuaire Ilan HABIB (2012)).

Figure 2.2. – Exemple d’évolution du processus de paiement d’un sinistre

Ce processus est particulier à chaque sinistre, et nous donne donc une idée fine de l’évolu-tion des paiements auxquels fait face la compagnie d’assurance : une vision détaillée dansle temps (dates d’indemnisation), une description des montants pour chaque date, et ceciquel que soit la branche d’assurance associée au risque souscrit (frais de santé, dommagescorporels, responsabilité civile, IARD...). Un travail ligne à ligne, qui repose sur une obser-vation individuelle des sinistres, offrira ainsi l’avantage d’informations fournies et détaillées.

31

Page 37: Modélisation du risque de réserve en business Run-Off sous ...

2.2. Aperçu sur les triangles incomplets en Run-Off

En particulier, il permet la construction d’une loi d’expérience qui repose sur la segmenta-tion de chacune des polices, et d’obtenir des intervalles de confiance pour les montants àprovisionner.

Durant l’analyse des triangles de liquidation du portefeuille ISAR, nous avons remarqué qu’ily a des années de souscriptions qui ne contiennent aucun montant de charge sinistres, ce quiest une particularité de la réassurance. En effet, les branches étudiées découlent des traitésnon proportionnels définis par une forme de réassurance appelée excèdent de sinistre (Excessof loss). La partie conservée par la cédante s’appelle la priorité. Dans ce type de traité, leréassureur ne va prendre qu’une partie du sinistre au-delà de la priorité dénommée la portée.Par exemple, si la priorité est égale à 10 Me et la portée est de 20 Me, alors il n’y a pasde réassurance dans le cas où un sinistre est évalué à 5 Me, mais la réassurance s’élève à 5Me lorsque un sinistre est évalué à 15 Me.

2.2.3. Définition des provisions et charge ultime

Les provisions techniques représentent les engagements d’un assureur vis-à-vis des assurésou des bénéficiaires des contrats (R 331- 6C. ass.). Elles constituent une part importantedu total du bilan et s’inscrivent au passif. Les provisions techniques couvrent le montantdes provisions pour les sinistres en suspens (provisions dossier/dossier ou Outstanding) etle montant des sinistres survenus non encore réglés Incurred But Not Reported (IBNR).Les sinistres en suspens sont évalués par le gestionnaire sinistre tandis que les IBNR sontévalués par les actuaires. Ainsi, la charge ultime au titre d’une année d’exercice correspondaux montants des prestations payées jusqu’à la date du calcul (Payés Cumulés) plus lesprovisions techniques (Outstanding + IBNR) à constituer à partir de cette date (voir figure2.3).

32

Page 38: Modélisation du risque de réserve en business Run-Off sous ...

2. Problématique des données manquantes

Figure 2.3. – Éléments de la charge ultime

la charge encourue (incurred) se définit comme la charge de sinistre que l’assureur (réassu-reur) a payé lors de la survenance d’un sinistre en plus des réserves en suspens. Pour chaquedossier de sinistre ouvert, la charge encourue est amené à varier à la hausse ou à la baisseselon le flux d’informations reçu par les gestionnaires de sinistres. Pour chaque année dedéveloppement du sinistre, la charge encourue est égale à la somme des réserves en suspens(Outstanding) et les montants des payés cumulés.

2.2.4. Triangles incomplets en Run-Off

Le calcul des provisions s’effectue sur un triangle de liquidation qui est un tableau avec deuxentrées, l’entrée verticale est l’année de survenance d’un sinistre, alors que l’entrée horizontaleest l’année de développement. En assurance traditionnelle, les triangles de liquidation sontconstruits sur la base des années de survenance des sinistres (AY), or en réassurance l’annéede survenance est remplacée par l’année de souscription (WY).

L’historique des données présenté sur la figure 2.4 représente les types des triangles de liquida-tion relatifs aux branches d’activités en Run-Off. Ce type de données devient problématiqueau moment des projections actuarielles des futures charges de sinistres. En effet, lors du cal-cul des coefficients de passage des dernières années de développement DYj, le coefficient fj�1

est parfois supérieur aux coefficients f1, f2. Lorsque nous calculons des coefficients de passagesur les montants faibles, nous obtiendrons des coefficients élevés, qui vont par la suite êtreappliqués pour estimer les IBNR sur des années récentes. Comme conséquence, pour projeterun montant de charge encourue à l’ultime, nous nous basons sur des coefficients de passagequi ne reflètent pas le vrai développement de la charge encourue. Ainsi, le montant ultimeprojeté est beaucoup plus supérieur par rapport à ce que nous attendions intuitivement.

33

Page 39: Modélisation du risque de réserve en business Run-Off sous ...

2.2. Aperçu sur les triangles incomplets en Run-Off

Figure 2.4. – Allure d’un triangle de liquidation incurred du portefeuille ISAR

Si la date d’occurrence d’un sinistre est i, j est le temps du développement du sinistre,alors i+ j représente la date comptable du sinistre. Dans toute la suite, Ci,j représentera lesmontants de la charge encourue. Ainsi, nous pouvons considérer plusieurs types de trianglede liquidation (triangle des paiements, triangle de nombre de sinistres, triangle de la chargeencourue, . . . ) selon le besoin de l’étude actuarielle. Mathématiquement, la charge encourued’une branche d’activité est exprimée par :

DI = {Ci,j ; i+ j I, 0 i, j I} (2.1)

En provisionnement, le développement des sinistres dépend de la nature du risque étudié.Il y a des segments où le développement est court, comme la branche incendie et d’autresnécessitant un développement long comme la responsabilité civile automobile, l’amiante oule Health Hazard. Particulièrement, les triangles de réassurance ont un déroulement plus longque les triangles d’assurance traditionnelle. Par exemple, en réassurance non proportionnelle,les réassureurs attendent que la charge du sinistre dépasse une priorité (définie dans le traitéde réassurance) avant d’inscrire un montant de sinistre dans leurs triangles de liquidation.L’historique incomplet des portefeuilles en Run-Off Victoria Re et Tela Re se répercutedirectement sur les triangles de liquidation de la charge encourue. Ainsi, en traçant untriangle de liquidation en fonction des années de souscription et années de développement dessinistres, nous retrouvons un triangle qui ressemble à la figure 2.4. La deuxième particularitédes triangles du portefeuille ISAR est liée au contexte du Run-Off. En effet, un portefeuilleen Run-Off implique que la souscription de nouveaux traités est arrêté à une date donnée(Année de souscription < Année de développement).

34

Page 40: Modélisation du risque de réserve en business Run-Off sous ...

2. Problématique des données manquantes

2.3. Méthodes de provisionnement en non-vie

L’évaluation des provisions s’effectue selon plusieurs méthodes déterministes ou stochas-tiques. La méthode de Chain Ladder est de loin la plus utilisée par les assureurs (réassureurs)du fait notamment de sa facilité de mise en œuvre. Elle s’applique aux montants cumulésCi,j et suppose que la cadence des paiements dépend de l’année de développement des si-nistres. D’autres méthodes fréquemment utilisées existent à savoir la méthode de Schmidtet Zocher (2007) ou la méthode du coût moyen. Ces méthodes sont beaucoup utilisées dansdes business actifs où nous avons plus d’informations.

D’autres méthodes basées sur Chain Ladder ont été développées par la suite pour mieuxs’adapter aux données. Nous citons la méthode de London Chain qui suppose qu’il existeune fonction affine entre les paiements cumulés de deux années de développement successives.Une autre méthode nommée De Vylder est basée sur les paiements non cumulés. Elle stipuleque les paiements effectués pour l’année de survenance i et de développement j représententune part du paiement cumulé final de l’année de survenance i.

Les méthodes déterministes ne tiennent pas compte du caractère aléatoire des variables àexpliquer qui se résume à l’évaluation de l’espérance (parfois référencée comme "moyenne"ou "Best Estimate") des provisions. Les avantages de ces modèles déterministes résident dansleurs facilités d’implémentation, et la possibilité de les affiner / corriger aisément, au moyende lissages / exclusions de points, etc. Ils présentent également l’atout de pouvoir s’appliquerà tout type de triangles : règlements, charges, primes, nombre de sinistres, etc.

Encouragées par la nouvelle directive solvabilité II, les méthodes stochastiques sont aujour-d’hui de plus en plus utilisées, notamment la méthode analytique Mack (1993) et sa dérivéeWüthrich et al. (2008) ainsi que la méthode algorithmique Bootstrap. La méthode de Mackest une version stochastique de Chain Ladder, alors que Bootstrap se base sur un principe derééchantillonnage des données sur la base d’un tirage aléatoire avec remise. L’hypothèse fon-damentale de cette dernière est de supposer que les éléments qui sont rééchantillonnés sontdes variables aléatoires indépendantes et identiquement distribuées. Le choix de la méthoded’évaluation des provisions dépend énormément du but de l’approche utilisée. En effet, desméthodes sont utilisées pour l’estimation des provisions best estimate, et d’autres méthodespour la revue des provisions. Une étude 1 effectuée à l’échelle mondiale par le groupe de tra-vail ASTIN (Actuarial Studies In Non-life insurance) de l’institut international des actuaires(IAA) a montré que la méthode Chain Ladder semble être la méthode adoptée par 90%

des assureurs (réassureurs). Les résultats de cette étude menée auprès de 42 pays au niveau

1. http://www.actuaries.org/ASTIN/Documents/ASTIN_WP_NL_Reserving_Report1.0_2016-06-15.pdf

35

Page 41: Modélisation du risque de réserve en business Run-Off sous ...

2.3. Méthodes de provisionnement en non-vie

mondial couvrant 87% du marché de l’assurance non-vie sont représentés sur la figure 2.6 :

Figure 2.5. – Benchmark des méthodes de provisionnment déterministesource : Revue mensuelle de l’institut des actuaires : L’actuariel - édition Juin 2016

Figure 2.6. – Benchmark des méthodes de provisionnment déterministe stochastiquesource : Revue mensuelle de l’institut des actuaires : L’actuariel - édition Juin 2016

Dans les méthodes déterministes la méthode de Chain Ladder apparaît comme la principaleméthode utilisée par les actuaires, suivie par la méthode de Bornhuetter-Ferguson. En ce quiconcerne les méthodes stochastiques, la méthode de Mack suivie de Bootstrap sont les plusadoptées par les assureurs (réassureurs). Un rappel des notions théoriques de Chain Ladderet Mack semble nécessaire dans la suite de notre analyse.

2.3.1. La méthode déterministe de Chain Ladder

La méthode Chain Ladder est un modèle de développement par cadence qui se base sur letriangle de liquidation cumulé 2.2. Elle repose sur deux hypothèses à savoir les années desurvenances doivent être indépendantes et que l’évolution des règlements cumulés est stable

36

Page 42: Modélisation du risque de réserve en business Run-Off sous ...

2. Problématique des données manquantes

d’une année de développement à une autre.

H1 : 8i 6= k, {Ci,0, . . . , Ci,I} et {Ck,0, . . . , Ck,I} sont indépendantsH2 : Il existe fj tel que E(Ci,j+1/Ci,1, . . . , Ci,J) = fjCi,j pour 0 i I, 0 j J

Malgré la simplicité de la méthode de Chain Ladder, ces deux hypothèses sont fortes etsouvent non vérifiées en pratique. Plus formellement, la deuxième hypothèse du modèle seréécrit comme suit :

9(fk)k=0...J�1, 8i 2 [0, I � 1]; 8j 2 [0, J � 1], Ci,k+1 = fk.Ci,k (2.2)

Les coefficients de passage ou facteurs de développement (fk)k=0...J�1 peuvent être estimés àl’aide de l’historique des données par plusieurs manières. Souvent, le calcul de ces coefficientsde passage se base sur une moyenne historique des coefficients de passage pour une année dedéveloppement considérée.

bfk =PI�k

j=0 Cj,k+1PI�k

j=0 Cj,k

Ces coefficients permettent d’estimer itérativement les règlements cumulés de la partie infé-rieur du triangle de règlements. La valeur du triangle inférieur est donnée par l’estimateur :

8i, j tels que i+ j > I dCi,j = Ci,I�i

j�1Y

k=I�i

bfk (2.3)

Une fois le triangle inférieur complété, les réserves par année d’origine et la réserve totalepeuvent être estimées par simple différence des éléments :

(Ri = Ci,J � Ci,J�i Réserve de l’année i

R =P

i=0,...,I Ri Réserve globale(2.4)

Le principal avantage de la méthode Chain Ladder est qu’elle n’est pas restrictive au niveaudes données d’entrée notamment les valeurs incrémentales négatives. Aussi, lorsqu’il y a unmanque de données dans l’historique du triangle, la méthode Chain Ladder peut être adaptée.Un autre avantage de la méthode est de pouvoir compléter le déroulement des sinistres parune queue de développement au cas où l’historique disponible ne permet d’évaluer l’ensembledes cadences.

37

Page 43: Modélisation du risque de réserve en business Run-Off sous ...

2.3. Méthodes de provisionnement en non-vie

2.3.2. Méthodes stochastiques : Mack

La version stochastique de Chain Ladder a été introduite par Mack (1993). Il s’agit d’unmodèle non paramétrique comme le modèle de Chain Ladder, c’est-à-dire qu’il ne supposeaucune distribution préalable des montants cumulés. Par son extension du modèle de ChainLadder, Mack propose une estimation de l’erreur de provisionnement à l’ultime. L’impactd’une variation du montant des provisions sur le bilan est important, il est donc essentielde pouvoir quantifier cette possible variation. Conditionnellement aux données du triangle,le modèle permet d’estimer l’erreur commise lors de l’évaluation du montant des provisions.Celui-ci repose sur trois hypothèses : les deux premières sont celles introduites par la méthodede Chain Ladder et la dernière concerne la variabilité des données du triangle. Elle reposesur trois hypothèses :

H1 : 8i 6= k, {Ci,0, . . . , Ci,I} et {Ck,0, . . . , Ck,I} sont indépendantsH2 : Il existe fj tel que E(Ci,j+1/Ci,1, . . . , Ci,J) = fjCi,j pour 0 i I, 0 j J

H3 : Il existe �j tel que V ar(Ci,j+1/Ci,1, . . . , Ci,J) = �2jCi,j pour 0 i I, 0 j J

(2.5)

Sous ces hypothèses,E(Ci,J/D) = Ci,J�ifJ�i . . . fJ�1

Les facteurs de développement de fj estimés sous l’hypothèse H1 et H2 sont sans biais etnon corrélés. Les �2

j sont estimés par la formule 2.6 :

8<

:�j

2 = 1J�j�1

PJ�j�1i=0 Ci,j(

Ci,j+1

Ci,j� fj)2, 0 j J � 2

�2J�1 = min(

�4J�2

�2J�3

,min(�2J�3, �

2J�2))

(2.6)

Nous pouvons alors calculer l’écart quadratique moyen (mean squared Error of PredictionMSEP) qui mesure l’incertitude de prédiction. Pour chaque année de survenance de sinistrela MSEP est définie par la formule 2.7.

MSEP (Ri) = E[(Ri �Ri)/DI ] (2.7)

Sous les hypothèses énoncées et si Ci,J�i = Ci,J�i un estimateur de l’incertitude est donnée

38

Page 44: Modélisation du risque de réserve en business Run-Off sous ...

2. Problématique des données manquantes

par la formule 2.8.

\MSEP (Ri) = C2i,J

J�1X

j=J�i

�2j

fj

1

Ci,j

+1

PJ�ik=1 Ci,k

!, i = 1, . . . , I (2.8)

Ainsi que l’estimation de l’incertitude totale est donnée par la formule 2.9

\MSEP (R) =IX

i=1

\MSEP (Ri) + Ci,J

IX

k=i+1

Ck,J

!J�1X

j=J�i

2�2j

fj2PI�j

u=0 Cu,j

!(2.9)

En connaissant la loi de distribution des réserves, il est facile de déterminer les mesuresde risques. Cependant, l’utilisation de cette méthode peut donner des résultats incohérents,surtout si les triangles ne sont pas adaptés (sinistres exceptionnels, données manquantes).Cette limite de la méthode de Mack est notre point de départ dans la suite de l’étudepour comprendre l’impact des données manquantes sur l’estimation du risque de réserve (cf.chapitre 3).

2.3.3. Validation des hypothèses du modèle Chain Ladder et Mack

L’hypothèse H1 implique que les facteurs de développement successifs Ci,k+1/Ci,k et Ci,k/Ci,k�1

sont non corrélés. En pratique, l’hypothèse de non-corrélation des facteurs de développementsuccessifs peut être vérifiée graphiquement en traçant les points (Ci,j, Ci,j+1). Si l’hypothèseselon laquelle il existe une relation linéaire entre les paiements cumulés d’une année de dé-roulement à l’autre est vérifiée, les points (Ci,j, Ci,j+1)i=0,...,I�j doivent être alignés sur unedroite passant par l’origine. D’après la figure 2.7, l’hypothèse paraît raisonnable car les pointssemblent alignés sur des droites issues de l’origine pour chaque année de développement.

39

Page 45: Modélisation du risque de réserve en business Run-Off sous ...

2.3. Méthodes de provisionnement en non-vie

Figure 2.7. – Droit de régression, points (Ci,k, Ci,k+1 pour i 2 1, ...J � 1 - Brancheautomobile

Le test de non corrélation des facteurs de développement successifs est vérifié pour la brancheAssurance moteur puisque les montants successifs de la charge encourue sont alignés sur unemême droite.

L’hypothèse H2 signifie qu’il n’y a pas un effet d’une année calendaire. Pour tester cettehypothèse, nous calculons tout d’abord la médiane de chaque colonne des facteurs de déve-loppement ; et comptons sur chaque diagonale j le nombre de facteurs inférieurs à la médianePj ainsi que le nombre de facteurs supérieurs à la médiane Gj. Soit Zj le minimum de Gj etPj. Nous calculons les deux premiers moments de Zj :

E(Zj) = nj

2 � (nj � 1) nj

2nj

V ar(Zj) = nj(nj�1)4 � (nj � 1)nj(nj�1)

2nj + E(Zj)� (E(Zj))2

40

Page 46: Modélisation du risque de réserve en business Run-Off sous ...

2. Problématique des données manquantes

Après nous introduisons la statistique : Z = Z2 + . . .+ Zn�1 Avec

E(Z) =P

E(Zj)

V ar(Z) =P

V ar(Zj)

On peut supposer que Z suit une distribution normale. Sur un intervalle de confiance de95% l’hypothèse est acceptée si :

E(Z)� 2p

V ar(Z) Z E(Z) + 2p

V ar(Z)

La deuxième hypothèse du test de non-effet calendaire n’est pas vérifié d’après les résultatssuivants :

Branche Stat Z moyenne var Borne inf Borne sup Décision

Motor 106 155,49 77,75 137,86 173,13 non vérifiéeGeneral Liability 99 118,99 59,499 103,56 134,42 non vérifiéeMarine 44 61,72 30,82 50,61 72,82 non vérifiée

Table 2.1. – Test de non effet calendaire pour les segments Motor, General Liability,Marine

Pour vérifier l’hypothèse H3, nous représentons graphiquement les résidus normalisés :

(Ci,k+1 � Ci,k.fk)pCi,k

Si l’on ne décèle aucune structure non aléatoire alors l’hypothèse est vérifié.

Les tests de validation des hypothèses de Chain Ladder et Mack seront utilisés pour analyserles limites de l’application de méthodes de provisionnement sur des données incomplètes.Dans la suite, nous allons étudier les branches du triangle ISAR, appliquer nos méthodes deprovisionnement puis analyser comment les données manquantes impactent les montants deprovisions.

41

Page 47: Modélisation du risque de réserve en business Run-Off sous ...

2.4. Impact des données incomplètes sur les techniques de provisionnement

Figure 2.8. – Test d’indépendance des années de survenance du segment Motor

Le test d’indépendance des résidus (hypothèse 3) semble ne pas présenter une structure nonaléatoire sur un intervalle d’années de souscription [1990 � 2000], sur les autres années desouscriptions, les résidus normalisés sont nulles 2.8.

2.4. Impact des données incomplètes sur les techniques

de provisionnement

2.4.1. Analyse de la charge encourue (incurred)

Afin de mieux comprendre l’impacte des données manquantes sur notre étude, nous com-mençons d’abord par une analyse de la charge encourue par année comptable. Intuitivement,nous devons avoir une courbe décroissante de la charge encoure en fonction des années desouscription.

En analysant la dernière diagonale des triangles incurred pour les trois segments du por-tefeuille ISAR nous avons remarqué une certaine irrégularité au niveau des montants de lacharge encourue. En effet, il y a une forte concentration des montants sur des années su-périeurs à 1990 en comparaison avec des années anciennes. La figure 2.9 montre l’allure de

42

Page 48: Modélisation du risque de réserve en business Run-Off sous ...

2. Problématique des données manquantes

l’évolution par année de souscription de la charge encourue pour l’année comptable 2015.

Figure 2.9. – Evolution de la charge incurred des trois branches : automobiles,responsabilité civile général et maritime en non proportionnel pour l’année comptable 2015

Sur la dernière diagonale du segment de l’assurance moteur, les nouvelles années de sous-cription ont des montants supérieurs à un million d’euros, alors que sur les anciennes annéesde souscription, il y a des montants de l’ordre de 100.000 e. Ce constat est le même pour lesautres segments de l’assurance de responsabilité civile général et maritime non proportionnel.

2.4.2. Allure de la charge encoure par année de souscription

La dispersion des montants de la charge encourue pour les nouvelles années comptablesest une conséquence directe du manque de l’historique des données. Pour visualiser cettehétérogénéité des montants de la charge encourue par année de souscription, nous avonstracé l’allure du développement de la charge encourue pour la branche assurance moteur(figure 2.10).

Le déroulement de la charge encourue par année de souscription montre qu’il y a deuxtendances différentes. La première tendance est représentée par des années de souscriptionrécentes avec des montants de la charge encourue d’ordre des millions. La deuxième tendancese réfère à des années de souscription anciennes avec des montants plutôt faibles ou nuls.

43

Page 49: Modélisation du risque de réserve en business Run-Off sous ...

2.4. Impact des données incomplètes sur les techniques de provisionnement

Figure 2.10. – Développement de la charge encourue pour la branche assurance moteurnon proportionnel par année de souscription

Ce décalage du développement de la charge encourue par année de souscription est dû engrande partie au manque de données sur les anciennes années comptables. En effet, la branchede l’assurance moteur non proportionnelle se caractérise par un développement long. Lemanque de données a ainsi créé un déphasage par rapport à l’ensemble des développementsde la charge des sinistres. Les autres branches du portefeuille ISAR considérées dans l’étudeprésentent tous des allures similaires (cf. annexe A).

2.4.3. Analyse des facteurs de développement

Les modèles de Chain Ladder ou Mack sont utilisés dans le provisionnement pour estimerles provisions futures non encore déclarées (IBNR) à travers des facteurs de développement.L’idée est de calculer un facteur de développement sur la base de l’historique connu pourprojeter les montants futurs du triangle de liquidation. Dans la pratique, on s’attend tou-jours à ce que les facteurs de développement se stabilisent après un certain rang d’année dedéveloppement.

La figure 2.11 représente les facteurs de développement estimés par Chain Ladder pour lestrois branches d’assurance étudiées.

44

Page 50: Modélisation du risque de réserve en business Run-Off sous ...

2. Problématique des données manquantes

Figure 2.11. – Facteur de développement des branches automobiles, responsabilité civilegénéral et maritime

Les facteurs de développement estimés sont relativement instables. Sur le segment GeneralLiability, la figure 2.11 montre qu’à partir 20ème année de développement (année 1984) fi-gure un pic au niveau des facteurs de développement. En analysant de près le triangle deliquidation, nous remarquerons qu’à partir de l’année 1985, il y a un saut dans la tendancedu développement de la charge encourue du segment General Liability. L’une des explica-tions est le manque d’historique qui crée un biais d’information sur les anciennes années desouscription.

2.5. Conclusion

L’occurrence des données manquantes est une question très fréquente dans l’activité duRun-Off. En provisionnement, le manque de données au sein des triangles de liquidations’avère pénalisant. Ainsi les données manquantes ne peuvent être simplement ignorées lorsd’une analyse statistique. Ignorer les données manquantes peut entraîner, outre une perte de

45

Page 51: Modélisation du risque de réserve en business Run-Off sous ...

2.5. Conclusion

précision, de forts biais dans le modèle d’analyse. Selon la proportion et le type des donnéesmanquantes, différentes solutions peuvent être choisies.

46

Page 52: Modélisation du risque de réserve en business Run-Off sous ...

Chapitre 3Solutions des données manquantes enprovisionnementTables des matières

3.1. Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48

3.2. Solution 1 : Partition de l’écoulement du triangle en Run-Off . 48

3.2.1. Méthodes de classification . . . . . . . . . . . . . . . . . . . . . 50

3.2.2. Algorithme de partitionnement du triangle de liquidation . . . . . 50

3.2.3. Classification hiérarchique . . . . . . . . . . . . . . . . . . . . . 51

3.2.4. Méthode des k-means . . . . . . . . . . . . . . . . . . . . . . . 57

3.3. Solution 2 : Reconstruction du triangle en Run-Off par mé-

thodes d’imputation des données manquantes . . . . . . . . . . 61

3.3.1. Choix de l’échantillon des données . . . . . . . . . . . . . . . . . 62

3.3.2. Imputation stationnaire et échantillon d’apprentissage . . . . . . 63

3.3.3. Utilisation des Forêts aléatoires . . . . . . . . . . . . . . . . . . 68

3.4. Backtesting des solutions . . . . . . . . . . . . . . . . . . . . . . 74

3.4.1. Backtesting de la solution 1 . . . . . . . . . . . . . . . . . . . . 75

3.4.2. Backtesting de la solution 2 . . . . . . . . . . . . . . . . . . . . 76

3.5. Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77

47

Page 53: Modélisation du risque de réserve en business Run-Off sous ...

3.1. Introduction

3.1. Introduction

Les techniques de traitement des données manquantes sont particulièrement difficiles àmettre en pratique. La méthode la plus évidente consiste à retirer les variables ou les indi-vidus présentant des données manquantes. D’autres méthodes nécessitent plus de technicitéconsistent à imputer des valeurs aux données manquantes ou encore développer des méthodes(ou algorithmes) qui permettent de mener les analyses en présence de données manquantes.

Afin de résoudre cette problématique, nous avons exploré plusieurs pistes. La première pisteconsiste à analyser l’écoulement de la charge encourue pour distinguer les différentes phasesd’écoulement. Puis, à séparer selon les années de souscription les phases d’écoulement dutriangle en utilisant des techniques de classifications.

La deuxième solution consiste à reconstruire la partie supérieure du triangle en Run-Offavec des méthodes d’imputation des données manquantes. Il existe une littérature abondantesur les méthodes d’imputation des données manquantes ; les plus classiques : LOCF (LastObservation Carried Forward), imputation par la médiane, la moyenne..., de même quecelles par modélisation ou apprentissage statistique : régression et régression locale, KNN,régression PLS, SVD, Random Forest ou encore par imputation multiple.

3.2. Solution 1 : Partition de l’écoulement du triangle

en Run-Off

Le découpage du triangle de liquidation par année de souscription est motivé par la naturede l’écoulement de l’incurred. En effet, d’après l’analyse des données, nous avons constatéque l’écoulement de l’incurred se fait selon deux tendances différentes.

L’objectif de la solution 1 serait la réduction de l’impact des données manquantes en séparantla tendance des années de souscription récentes de celles des années anciennes. Une fois lapartition de l’écoulement de l’incurred est effectuée, nous allons appliquer les techniques deprovisionnement classiques pour chaque sous-triangle. La figure 3.1 illustre graphiquementoù le découpage du triangle en Run-Off devra être effectué.

48

Page 54: Modélisation du risque de réserve en business Run-Off sous ...

3. Solutions des données manquantes en provisionnement

Figure 3.1. – Partition de l’écoulement du triangle de liquidation en Run-Off

En observant le graphique 3.2 ci-dessous, l’identification de l’année de partition pour l’écou-lement de l’incurred semble intuitive. Toutefois, nous avons essayé de trouver une techniquestatistique pour démontrer la nécessite du découpage.

Figure 3.2. – Développement de l’incurred pour la branche automobile non proportionnelpar année de souscription et de développement

Afin de répondre à cette question, nous allons considérer les années de souscription commeun ensemble de points qu’il faut séparer en utilisant des techniques de classification.

49

Page 55: Modélisation du risque de réserve en business Run-Off sous ...

3.2. Solution 1 : Partition de l’écoulement du triangle en Run-Off

3.2.1. Méthodes de classification

La classification désigne un corpus de méthodes ayant pour objectif de dresser ou de re-trouver une typologie existante caractérisant un ensemble de n observations, à partir de pcaractéristiques mesurées sur chacune des observations. Ces méthodes de classification oupartitionnement font partie des méthodes dites exploratoires, qui ne font appel à aucunemodélisation statistique.

Il existe une littérature abondante à propos des méthodes de classification. Gordon (1999)a proposé plusieurs et nouvelles méthodologies pour traiter l’exploration des données. Il aainsi regroupé des méthodes graphiques et techniques de classification les plus récentes enproposant les méthodes d’analyse les plus adaptées à un ensemble de données particulières.Aussi, Tufféry (2010) a récemment publié un recueil en datamining et analyse décisionnelledans lequel il explicite les différentes techniques de classification et leurs méthodes de vali-dation. Dans ce qui suit nous nous intéressons aux méthodes de classification hiérarchiqueet k-means dites non supervisées.

3.2.2. Algorithme de partitionnement du triangle de liquidation

Afin de séparer les différentes tendances dans l’écoulement de l’incurred, nous allons propo-ser un algorithme qui intègre les techniques exploratoires de classification. L’algorithme estcomposé de 4 étapes pour réaliser la partition du triangle de liquidation. L’idée de l’algo-rithme est de considérer les années de souscription comme un ensemble de points qu’il fautséparer en deux catégories (années anciennes et années récentes) selon le développement dumontant de l’incurred. Chaque année de souscription WYi sera caractérisée par le vecteursuivant :

WYi = (Ci,1, . . . , Ci,J) (3.1)

Pour la distance de similarité entre deux années de souscription nous avons retenu la distanceeuclidienne définie par l’équation suivante.

dist(WYi,WYj) =� IX

k=1

(Ci,k � Cj,k)2� 1

2 (3.2)

Il existe plusieurs types de distance comme le suggère le tableau 3.2. Nous avons choisi dansun premier temps la distance Euclidienne. Une fois la matrice des distances de similarité

50

Page 56: Modélisation du risque de réserve en business Run-Off sous ...

3. Solutions des données manquantes en provisionnement

(3.1) est définie nous appliquerons les méthodes de classification selon une stratégie donnée(Ward, Mediane, . . . ).

WY1 . . . WYj . . . WYI

WY1...

......

WYi . . . . . . dist(WYi,WYj) . . . . . ....

...

WYI...

Table 3.1. – Matrice de similarité entre deux années de souscription

Algorithm 1 Partitionnement de l’incurredÉtape 1 : Considérer chaque ligne du triangle de liquidation comme un vecteur de montantd’incurred correspondant.Étape 2 : Définir la distance de similarité entre les années de souscription du triangle deliquidation (distance euclidienne).Étape 3 : Appliquer une stratégie de partitionnement (classification hiérarchique, K-means) sur la matrice de similarité établie (cf. 3.1).Étape 4 : Estimer la qualité de partition du triangle de liquidation

3.2.3. Classification hiérarchique

La classification hiérarchique cherche à répartir un échantillon en groupes d’observationshomogènes, chaque groupe étant bien différencié des autres. Le plus souvent, on veut obtenirdes sections à l’intérieur des groupes principaux, puis des subdivisions plus petites de cessections, et ainsi de suite. On appelle ce mécanisme une classification hiérarchique ou unesuite de partitions emboîtées, de plus en plus fines sur l’ensemble d’observations initiales. Lafigure 3.3 représente la forme que peut prendre un échantillon de données en appliquant laclassification hiérarchique :

51

Page 57: Modélisation du risque de réserve en business Run-Off sous ...

3.2. Solution 1 : Partition de l’écoulement du triangle en Run-Off

Figure 3.3. – Arbre de classification hiérarchique portant sur cinq objets {a, b, c, d, e}

Les types de classification hiérarchique peuvent être divisées en deux types. D’abord, les al-gorithmes construisent une hiérarchie par agrégations successives d’objets, puis de groupes,en fonction des distances entre objets ou groupes. On les appelle "Classification HiérarchiqueAscendante" ou bottom up. Á l’inverse, le deuxième type est la "Classification HiérarchiqueDescendante" ou top down, elle procède par dichotomies successives. Dans celles-ci, l’en-semble tout entier est d’abord scindé en deux, puis chacune de ses parties est subdivisée, etainsi de suite.La classification hiérarchique requiert la définition d’une mesure de dissimilarité ou distanceainsi qu’un critère d’agglomération. En général, il y a beaucoup de mesures de dissimilarité.On en cite quelques-unes dans le tableau 3.2.

Euclidean d(x, y) =�Pd

j=1 (xj � yj)2� 1

2

Maximum d(x, y) = sup1jd

|xj � yj|

Manhattan d(x, y) =Pd

j=1 |xj � yj|

Canberra d(x, y) =Pd

j=1|xj�yj ||xj |+|yj |

Table 3.2. – Distances utilisées dans la classification hiérarchique

Le tableau 3.3 présente quelques méthodes d’agglomération utilisées dans la classificationhiérarchique.

52

Page 58: Modélisation du risque de réserve en business Run-Off sous ...

3. Solutions des données manquantes en provisionnement

Ward.D2 Ward (1963), Murtagh et Legendre (2014)

Complete Sørensen (1948) Dij = maxx2Cli,y2Clj

d(x, y)

Centroid Sokal (1958) Dij =P

x2Cli,y2Cljd(x,y)ni⇥nj

Median Gower (1967) Dij =(Dik+Dil)

2 � Dkl4

Table 3.3. – Méthodes d’agglomération de la classification hiérarchique

Si Cli, Clj représentent deux clusters distincts, alors la distance entre ces deux clusters estdéfinie par Dij. En ce qui concerne la méthode de Ward, elle se base sur l’optimisation del’inertie intra-classe (minimum local) ou inter-classe (maximum). L’indice de dissimilaritéentre deux classes (ou niveau d’agrégation de ces deux classes) est alors égal à la perted’inertie inter-classe résultant de leur regroupement.

Résultats de la classification hiérarchique

L’algorithme de séparation des années de souscription développé dans la première solutiona été appliqué sur les trois segments retenus du portefeuille ISAR :

• La branche automobile non proportionnelle

• La branche responsabilité civile générale non proportionnelle

• La branche maritime non proportionnelle

Intuitivement, l’algorithme de classification devra proposer des ensembles d’années de sous-cription disjoints. Les années de souscription qui ne contiennent aucun montant d’incurreddurant toutes les années de développement sont supprimées. Ces années ne rapporterontaucune information supplémentaire à notre classification d’où l’idée de les supprimer.

Pour justifier le besoin d’appliquer une classification entre les années de souscription, nousavons établi une matrice de corrélation entre les différentes années de souscription.

53

Page 59: Modélisation du risque de réserve en business Run-Off sous ...

3.2. Solution 1 : Partition de l’écoulement du triangle en Run-Off

Figure 3.4. – Étude de la corrélation entre les années de souscription avec uneclassification ascendante hiérarchique selon la méthode de ward

D’après la figure 3.4 nous remarquons qu’il y a deux sous-groupes des années de souscriptiondisjoints qui justifient l’indépendance entre les années de souscription anciennes et les annéesnouvelles. Cette solution a été implémenté sous le logiciel R en utilisant le package Smythet al. (2017).

Figure 3.5. – Dendrogramme résultant de la classification hiérarchique par distance deWard appliqué aux années de souscription de la branche automobile

54

Page 60: Modélisation du risque de réserve en business Run-Off sous ...

3. Solutions des données manquantes en provisionnement

Le dendrogramme (figure 3.5) est la représentation graphique du résultat de la classificationhiérarchique ascendante effectuée avec la stratégie de ward. Le graphique regroupe les annéesde souscription qui se rapprochent le plus en terme d’écoulement de la charge sinistre. Nousnous restreindrons au premier niveau de la classification qui donne deux grands sous-groupes.Après avoir classé dans un ordre croissant les années de souscription de chaque sous-groupede la branche automobile nous remarquons que l’algorithme de classification appliqué séparedisjointement les années de souscriptions selon les différentes phases d’écoulement.

• Ensemble 1 : {1977, . . . , 1985 ou 1986}

• Ensemble 2 : {1987, . . . , 2003}

Ainsi, il faut prendre l’année qui sépare les deux ensembles comme année de référence. Dansnotre cas, l’année 1985 est l’année de souscription où il est préférable de séparer le trianglede liquidation en deux pour les trois branches.

Mesure de la qualité de partition

Afin de challenger les résultats obtenus lors de la classification hiérarchique, nous allonsmesurer la qualité de partition. Initialement, nous avons fixé la stratégie d’agglomérationà Ward seulement. Le but de cette section serait de varier les différentes stratégies (Ward,Completion, Centroid et Mediane) puis d’analayser la variation de la qualité de partition.Les deux critères utilisés sont le critère du coude et le coefficient de corrélation multiple.

Critère de coude : La difficulté de toute méthode de classification non supervisée résultedans le choix du nombre de classes k. Une approche simple consiste à tracer la courbe del’inertie intra-classes en fonction de nombres de classes K. On cherche alors à identifier lesétapes où l’on observe une rupture dans cette courbe, synonyme d’une forte dégradationde l’inertie intra-classe. Cette dégradation résulte de la forte hétérogénéité des deux classesréunies lors de l’étape considérée, il est alors naturel de considérer un nombre de classessupérieur à celui pour lequel la rupture a lieu. Cette stratégie, parfois dénommée "critèredu coude", donne des résultats satisfaisants lorsqu’elle est appliquée à l’algorithme CAH(Classification Ascendante Hiérarchique) où les partitions successives sont emboîtées.

55

Page 61: Modélisation du risque de réserve en business Run-Off sous ...

3.2. Solution 1 : Partition de l’écoulement du triangle en Run-Off

Figure 3.6. – Décroissance de la variance interclasses selon la stratégie de Ward - Brancheautomobile

D’après la figure 3.6 nous remarquons que les quatres méthodes d’agglomération intra-classesproposent une rupture dès le deuxième niveau de partition. Toutefois, le coude est plus visiblechez la stratégie de Ward et Centroid.

Coefficient de corrélation multiple R2:

Le ratio de l’inertie interclasse sur l’inertie totale juge aussi de la qualité d’une partition.Cette grandeur devrait être idéalement proche de 1 tout en correspondant à une partitionmoins fine que la partition discrète. Dans le cas d’une hiérarchie découlant d’un dendro-gramme, il est possible de calculer le R2 pour chaque partition et de s’aider du graphiquede ces valeurs pour faire un choix équilibré entre la part d’inertie expliquée par les classes etun petit nombre de classes. Le R2, souvent noté RSQ, peut être estimé, pour une partitionP données de K classes, par :

R2 = 1�P

k

Px2Ck

kx� gkk2Px2CE

kx� gEk2

56

Page 62: Modélisation du risque de réserve en business Run-Off sous ...

3. Solutions des données manquantes en provisionnement

Figure 3.7. – Valeur de R2 selon la méthode d’agrégation interclasse de la brancheautomobile

D’après la figure 3.7 nous avons pour les stratégies Ward, Completion et Centroid un R2

de 20% et pour la stratégie de la Mediane un R2 de 2%. En combinant les deux critères deselection, nous pouvons conclure que la stratégie de Ward est la mieux adaptée à notre typede données.

3.2.4. Méthode des k-means

les K-means est un algorithme de minimisation alternée qui, étant donné un entier k, vachercher à séparer un ensemble de points en k classes (cf. figure 3.8). Il a été initié parMacQueen et al. (1967) puis Hartigan et Wong (1979).

57

Page 63: Modélisation du risque de réserve en business Run-Off sous ...

3.2. Solution 1 : Partition de l’écoulement du triangle en Run-Off

Figure 3.8. – Partitionnement d’un ensemble de points en 3 sous-ensembles

Cet algorithme fut longtemps utilisé sur les grands jeux de données en raison de sa rapidité.Le principe de l’algorithme est comme suit :

Soit xi 2 Ep, i 2 {1, ..., n}, les points à séparer. Les zki sont des variables indicatrices associéesaux xi telles que zki = 1 si xi appartient au cluster k, zki = 0 sinon. Z est la matrice des zki .µ est le vecteur des µk 2 Ep, où µk est le centre du cluster k. La mesure de distorsion estdéfinie par :

J(µ, Z) =nX

i=1

nX

k=1

zki ||xi � µk||2. (3.3)

La norme (||.||) peut être une des distances citées dans le tableau 3.2. Le but de l’algorithmeest de minimiser J(µ, z). La méthode des k-means se présente sous la forme d’un algorithmede minimisation alternée :

Algorithm 2 L’algorithme de la méthode des k-meansÉtape 0 : Choisir le vecteur µ.Étape 1 : On minimise J par rapport à z : zki = 1 pour k 2 arg min||xi � µk||, c’est àdire, on associe à xi le centre µk le plus proche.Étape 2 : On minimise J par rapport à µ : µk =

Pi zki xiPi zki

.Étape 3 : Retour à l’étape 1 jusqu’à convergence.

L’algorithme s’arrête suivant un critère d’arrêt fixé par l’utilisateur qui peut être choisi parmiles suivants : soit le nombre limite d’itérations est atteint, soit l’algorithme a convergé, c’est-à-dire qu’entre deux itérations les classes formées restent les mêmes, soit l’algorithme a"presque" convergé, c’est-à-dire que l’inertie intra-classe ne s’améliore quasiment plus entredeux itérations.

58

Page 64: Modélisation du risque de réserve en business Run-Off sous ...

3. Solutions des données manquantes en provisionnement

Résultats de la classification K-means

Afin d’adapter l’algorithme des K-means à notre cas, nous avons supposé qu’il existe 2classes distinctes d’années de souscription. En effet, le choix du nombre de classes est motivépar notre exploration préalable des données. Toutefois, cette hypothèse sera vérifiée dans lasection "stabilité des classes construites". Les données utilisées pour la classification sont ceuxde la même nature que la classification hiérarchique. La variante utilisée pour la classificationest Llyod.

Figure 3.9. – Représentation graphique des classes proposées par la méthode K-means -Branche automobile

En effet, la fonction kmeans() signée par le package R Maechler et al. (2016) propose 4versions classiques de la méthode des K-means : la version de Lloyd puis celle de Forgy quidiffèrent sur le choix des centres initiaux, puis les versions de Mac Queen et de Hartigan &Wong qui permettent de garantir la production de K classes.

D’après la figure 3.9, nous remarquons que l’algorithme de classification k-means proposeune séparation disjointes des années de souscription à l’année 1987. Les deux dimensions decette classification représentent 86% de la variabilité. Ainsi, ce résultat confirme les premiersrésultats obtenus lors de la classification hiérarchique. Toutefois, il est nécessaire de validerla stabilité des classes obtenues par cette méthode.

Stabilité des classes construites

Pour vérifier que le nombre des classes optimales dans notre application est de l’ordre de2, nous avons appliqué le critère de coude. Ce test permet d’identifier une rupture brutale

59

Page 65: Modélisation du risque de réserve en business Run-Off sous ...

3.2. Solution 1 : Partition de l’écoulement du triangle en Run-Off

dans la représentation de variance inter-classe en fonction de nombre de classes. Aussi, nousavons changé la variante de la méthode des K-means (Hartigan-Wong, Lloyd, MacQueen)afin de tester la stabilité des résultats construits.

Figure 3.10. – Décroissance de la variance interclasses pour la méthode K-means -Branche automobile

La méthode de Lloyd présente le risque de construire des classes vides. De ce point de vue, lesméthodes de Mac Queen et Hartigan & Wong sont meilleures. Elles présentent la particularitéde recalculer le centre de classes dès qu’une classe est modifiée. Dans notre cas, d’après lafigure 3.10 les trois variantes coïncident sur la même pente de la fonction décroissante de lavariance. Ainsi les classes construites sont stables par variante de K-means. Aussi, le nombrede classe 2 semble être le meilleur choix pour nombre de classe.

La partition de l’écoulement du triangle en Run-Off présenté selon les deux différentes mé-thodes (classification hiérarchique et k-means) propose une alternative à la problématiquedes données. Toutefois, cette solution ne résout pas complètement le sujet des données man-quantes lui même. Dans la suite, nous allons essayer de creuser les différentes possibilités dutraitement des données manquantes.

60

Page 66: Modélisation du risque de réserve en business Run-Off sous ...

3. Solutions des données manquantes en provisionnement

3.3. Solution 2 : Reconstruction du triangle en Run-Off

par méthodes d’imputation des données

manquantes

Il existe plusieurs méthodes d’imputation des données manquantes selon les types de don-nées qui ont été étudiées. Les méthodes les plus courantes sont la complétion stationnaireGrzymala-Busse et al. (2001), et la complétion par une combinaison linéaire des observations.D’autres méthodes nécessitent une analyse statistique plus fine à savoir la méthode des Kplus proches voisins (KNN), la méthode de la régression locale Cleveland et Devlin (1988),L’algorithme NIPALS (Nonlinear Iterative Partial Least Squares) de Preda et al. (2010).D’autres techniques d’imputation existent aussi à savoir la méthode de décomposition envaleurs singulières (SVD) Hastie et al. (1999) et la méthode de Forêt aléatoires Stekhovenet Bühlmann (2012).

Malgré qu’il y a une littérature abondante sur les traitements des données incomplètes, lessolutions de provisionnement avec données incomplètes sont réduites. En effet, la naturedes données en provisionnement (triangles de liquidation) complexifie la mise en place desolutions à ce problème de données incomplètes. Le triangle de liquidation à deux dimensionsdifférentes (figure 3.11) avec une partie inférieure vide se distingue des bases de donnéesusuelles.

Figure 3.11. – Reconstruction d’un triangle de liquidation

En effet, les différentes méthodes d’imputation exigent comme input des données sous formatmatriciel avec des variables en colonnes. Dans notre cas, nous allons supposer que chaqueligne de souscription est un vecteur unique indépendant. Aussi, nous supposons que la partieinférieure du triangle de liquidation (IBNR) est nulle dans un premier temps.

61

Page 67: Modélisation du risque de réserve en business Run-Off sous ...

3.3. Solution 2 : Reconstruction du triangle en Run-Off par méthodes d’imputation desdonnées manquantes

Avant d’appliquer n’importe quelle méthode d’imputation des données manquantes, il estd’abord nécessaire de comprendre la nature des données incomplètes. Les auteurs Littleet Rubin (1989) distinguent trois types de données manquantes : Missing Completely atRandom 1 (MCAR), Missing at random 2 (MAR) et Missing not at random 3 (MNAR).

3.3.1. Choix de l’échantillon des données

Nous avons trois types de triangle auxquels nous pouvons appliquer les méthodes d’impu-tation des données. Le triangle de la charge encourue (incurred), le triangle des règlementsdécumulés et le triangle des réserves en suspens (Outstanding). Sachant que le triangle incur-red est la somme des triangles des règlements cumulés et le triangle de réserve en suspense,il semble judicieux d’utiliser les triangles de règlements décumulés ou le triangle de réservesen suspenses comme échantillon de départ.

Pour bien illustrer le choix de l’échantillon des données, nous comparons une diagonale dutriangle incurred avec la même diagonale du triangle de règlements décumulés (figure 3.12).

Figure 3.12. – Montants incurred et règlements par année de développement pour l’annéecomptable 2004 - Branche automobile non proportionnelle

1. Une donnée est MCAR, c’est à dire manquante de façon complètement aléatoire si la probabilité

d’absence est la même pour toutes les observations

2. Le cas des données MCAR est tout de même peu courant. Il arrive souvent que les données ne manquent

pas de façon complètement aléatoire.

3. La donnée est manquante de façon non aléatoire (MNAR) si la probabilité d’absence dépend de la

variable en question.

62

Page 68: Modélisation du risque de réserve en business Run-Off sous ...

3. Solutions des données manquantes en provisionnement

En effet, la figure 3.12 compare les montants de l’incurred et les règlements décumulés de lapremière diagonale (2004) non nulle du triangle. On remarque que la diagonale de l’incurredest instable par rapport à la diagonale du triangle de règlement. Le graphe illustre bien ledéphasage des montants de l’incurred entre les années récentes et les années de souscriptionanciennes pour le cas de la branche automobile non proportionnelle.

Dans un premier temps, nous considérons le triangle initial 3.11 comme une matrice dedonnées qui a subi une troncature de données au niveau de la partie diagonale supérieure.Nous remarquons qu’il y a seulement 12 diagonales non vides qui correspondent aux annéescomptables (2004 - 2015).

3.3.2. Imputation stationnaire et échantillon d’apprentissage

Il existe plusieurs possibilités pour effectuer une imputation des données manquantes : im-putation se basant sur la moyenne, la médiane ou une combinaison linéaire. Ces méthodesde complétion stationnaire sont souvent utilisées comme une base de comparaison entreméthodes de complétion. Toutefois, compte tenu du contexte de l’étude, la méthode d’im-putation des données peut varier. Dans notre cas, il est nécessaire d’effectuer une étudeapprofondie des données du triangle avant la construction d’un échantillon d’apprentissage.Le but est de définir certaines hypothèses qui contraignent le modèle d’imputation des don-nées manquantes. Pour construire notre échantillon d’apprentissage (triangle complet) nousprocédons en trois étapes :

1. Formulation de la problématique des données manquantes

2. Estimation d’un montant de règlements total pour chaque diagonale incomplète

3. Répartition uniforme du montant total estimé sur sa diagonale correspondante

Formulation de la problématique des données manquantes

Afin de mieux assimiler la problématique des données manquantes, nous avons opté pour uneformulation mathématique simple des données. Dans un premier temps, nous supposons quenous avons M diagonales incomplètes dans notre triangle de liquidation. Chaque diagonaleincomplète est caractérisée par la définition suivante :

Diagmissm = (Xmiss

1,m , Xmiss2,m , . . . , Xmiss

I�m+1,m, . . . , XmissK,m ) avec m 2 {1, . . . ,M}

K correspond au nombre des années de souscription où les montants sont manquants ; il

63

Page 69: Modélisation du risque de réserve en business Run-Off sous ...

3.3. Solution 2 : Reconstruction du triangle en Run-Off par méthodes d’imputation desdonnées manquantes

varie d’une diagonale à une autre. M est le nombre des années de développement du trianglede liquidation où nous avons des diagonales incomplètes (M << K). Pour chaque diagonalem, les montants manquants du triangle de liquidation sont notés Xmiss

k,m et définis sommesuit :

Xmissk,m = Xi,j | Xi,j = 0, 1 m M, 1 i K}

Pour la partie des diagonales completes nous attribuons la notation suivante :

Diagcompletj = (X1,j, X2,j, . . . , Xk,j, . . . , XI�j+1,j) avec j 2 {M + 1, . . . , J}

Dans ce qui suit, nous allons détailler la construction d’un premier échantillon d’apprentis-sage des données du triangle de liquidation en trois étapes.

Estimation d’un montant de règlement total pour chaque diagonale incomplète

Le but de cette étape est d’estimer un montant total par diagonale incomplète en se basantsur l’information disponible dans les autres diagonales complètes. Dans un premier temps,nous étudions la distribution des montants des règlements totaux par année comptable.L’histogramme 3.13 compare la distribution des règlements par année comptable et la loinormale calibrée avec les mêmes paramètres de la distribution des règlements.

64

Page 70: Modélisation du risque de réserve en business Run-Off sous ...

3. Solutions des données manquantes en provisionnement

Figure 3.13. – Histogramme des montants de règlements totaux par année comptable -Branche automobile

D’après la figure, il semble que les montants totaux des règlements par année comptablesuivent une distribution normale. Pour confirmer l’hypothèse de normalité de cette distribu-tion, nous utilisons le test de Shapiro-Wilk. L’hypothèse nulle suppose que l’échantillon suitune loi normale. Par conséquent si la p-value du test est significative, l’hypothèse H0 n’estpas rejetée.

Résultat du test Shapiro-Wilk : w= 0.96827, p-value = 0.8918

La p-value du test est significatif (>5%) ce qui nous mènent à ne pas rejeter la normalitéde la distribution des montants de règlements. Nous retennons pour ceux-là une distributionnormale de moyenne 2.3 Me et un écart type de 0.88 Me.

En se basant sur ce premier résultat, nous pouvons simuler un montant de règlement total pardiagonale qui suit la loi normale. Ce montant sera par la suite réparti sur toute la diagonaleincomplète en suivant des hypothèses bien définies.

Si nous n’arrivons pas à calibrer la distribution des règlements totaux par année comptable,il existe d’autres possibilités afin d’estimer ces derniers montants. En effet, nous estimonsune tendance linéaire sur la base de l’évolution des règlements totaux par année comptable3.14.

65

Page 71: Modélisation du risque de réserve en business Run-Off sous ...

3.3. Solution 2 : Reconstruction du triangle en Run-Off par méthodes d’imputation desdonnées manquantes

Figure 3.14. – Évolution des montants totaux des règlements par année comptable

L’équation de régression est comme suit :

ReglementTotal = Constante+ b ⇤ Annees+ Erreur

Où la variable ReglementTotal correspond au vecteur des règlements totaux pour les dia-gonales complètes du triangle de liquidation. La variable Annees correspond aux annéescomptables des diagonales complètes.

La tendance linéaire établie nous permet de prédire des montants de règlements totaux pourles années comptables antérieures. Intuitivement, la tendance de règlements décumulés doitêtre baissière, expliquée par le recul de la l’activité de souscription. En ce qui concernel’impact de l’inflation, il est vrai que les montants des règlements augmentent d’une année àl’autre à cause de l’inflation monétaire, cependant, cette évolution est faible en comparantavec l’impact de disparition des affaires nouvelles qui impactent à la baisse le volume duportefeuille.

Répartition du montant global sur toute la diagonale

Une fois nous avons estimé le montant de règlements total pour une diagonale donnée, lamanière dont ce montant sera affecter aux différentes années de souscription doit aussi êtreanalyser. Le montant total de règlement estimé peut être réparti au niveau de la diagonale

66

Page 72: Modélisation du risque de réserve en business Run-Off sous ...

3. Solutions des données manquantes en provisionnement

incomplète selon différentes méthodes. Dans un premier lieu, nous comparons la dispersiondes montants des règlements par année comptable complète.

Figure 3.15. – Analyse des diagonales du triangle de règlements décumulés par annéecomptable - Branche automobile

Afin de comprendre la répartition des montants des règlements nous utilisons une présenta-tion sous format de boîte à moustache 4.

Nous remarquons que plus de 80% des observations des diagonales se trouvent à l’intérieurdes boites à moustaches 3.15. Ainsi, il n’y a pas une grande dispersion des montants autourde la médiane. En effet, pour chaque diagonale, il y a au plus 5 observations sur 34 quin’appartiennent pas à la boite à moustache.

Pour obtenir le triangle de liquidation complet, nous avons choisi de répartir uniformémentle montant total de règlement estimé correspondant à chaque diagonale incomplète.

Soit le ratio :

Ratiom =Règlement total estimém

#Nombre années de souscriptionm 2 {1, . . . ,M}

Le montant Règlement total estimé correspond au montant de règlement total affecté à la

4. La boîte à moustache (Boxplot) permet de résumer une variable de manière simple et vi-

suel, d’identifier les valeurs extrêmes et de comprendre la répartition des observations. La valeur cen-

trale de la boite à moustache correspond à la médiane. Voir https://www.stat4decision.com/fr/le-box-plot-ou-la-fameuse-boite-a-moustache/

67

Page 73: Modélisation du risque de réserve en business Run-Off sous ...

3.3. Solution 2 : Reconstruction du triangle en Run-Off par méthodes d’imputation desdonnées manquantes

diagonale incomplète étudiée. Le Nombre année de souscription correspond au nombre desannées de souscription contenues dans la diagonale incomplète.

3.3.3. Utilisation des Forêts aléatoires

Littérature

Les forêts aléatoires ont été inventées par Breiman en 2001 (Breiman (2001)). Une forêtaléatoire est un ensemble d’arbres de décision binaire dans lequel a été introduit de l’aléa.Autrement dit, soit O1, . . . , OM des variables i.i.d., une forêt aléatoire correspond à un en-semble de classifieurs di(x, oi), i,2 1 . . . ,M où les classifieurs di sont construits sur le mêmemodèle que les arbres binaires.

De nombreux modèles de forêts aléatoires ont été créés et correspondent à autant de ma-nière d’incorporer de l’aléatoire dans les arbres. Parmi ces modèles nous trouvons l’algorithmeRandom Forest (RF). Cet algorithme généralise un ensemble d’arbres de décision (L. Brei-man (2008)) à travers un Bootstrap qui combine plusieurs prédicteurs aléatoires (Brence etBrown (2006). Le RF peut être utilisé à la fois pour la régression et la classification, et a étéutilisé avec succès dans le contexte des données manquantes (Qi et al. (2005)). L’algorithmeRandom Forests a été appliqué dans plusieurs domaines (Biau et al. (2008).

Algorithm 3 Algorithme Random ForestÉtape 1 : Si le nombre de cas dans l’ensemble de formation est N, il faut échantillonnerN cas au hasard ; mais avec remplacement, à partir des données d’origine. Cet échantillonsera l’ensemble de formation pour la croissance de l’arbre.Étape 2 : Si il y a M variables d’entrées, un nombre m << M est spécifié tel que, à chaquenoeud, m variables sont sélectionnées au hasard hors de M et la meilleure division sur cesm est utilisée pour diviser le noeud. La valeur de m est maintenue constante pendant lacroissance de la forêt.Étape 3 : Chaque arbre est cultivé dans la plus grande mesure possible. Il n’y a pasd’élagage 5.

L’application de l’algorithme (RF) dans l’imputation des données manquantes est fréquente.Stekhoven et Bühlmann (2011) ont proposé une méthode de complétion basée sur les forêtsaléatoires appelée MissForest. Cette méthode nécessite une première imputation “naïve”,par défaut une complétion par la moyenne, afin d’obtenir un échantillon d’apprentissagecomplet. Puis une série de forêts aléatoires sont ajustées jusqu’à la première dégradation dumodèle. Cette méthode a été largement utilisée dans des sujets de nature statistique surtouten biologie. Pantanowitz et Marwala (2008) ont évalué l’impact d’imputation des données

68

Page 74: Modélisation du risque de réserve en business Run-Off sous ...

3. Solutions des données manquantes en provisionnement

manquantes avec l’algorithme RF sur une étude clinique prénatale réalisée en 2001. D’autresauteurs comme Tang et Ishwaran (2017) ont étudié l’efficacité des différents algorithmesd’imputation RF à l’aide d’une large collection de jeux de données.

Cadre théorique : Imputation par MissForest

Nous décomposons le jeu de données initial en quatre parties. Pour chaque variable Y s, s =

1, . . . , S dont les valeurs manquantes sont indexées par ismiss 2 1, . . . , n, on définit

A) ysobs les valeurs observées dans Y s

B) ysmis les valeurs manquantes dans Y s

C) Xs = Y Y s l’ensemble des régresseurs de Y s parmi lesquels on considère

1. xsobs les régresseurs observés pour isobs = {i, . . . , n}ismiss

2. xsmiss les régresseurs manquants pour xs

miss

La méthode MissForest suit alors l’algorithme suivant :

Algorithm 4 Algorithme MissForestÉtape 1 : Première complétion "naïve" des valeurs manquantes.Étape 2 : Soit k le vecteur des indices de colonnes de Y triées par quantité croissante devaleurs manquantes ;Étape 3 : Tant que � n’est pas atteint faire

- Y oldimp = matrice précédemment imputée

- Pour s dans k fairea) Ajuster y(s)obs � x(s)

obs

b) Prédire y(s)miss avec les régresseurs x(s)miss

c) Y newimp est la nouvelle matrice complétée par les valeurs prédites y(s)miss

- mettre à jour le critère �

Avec un critère d’arrêt � atteint dès que la différence entre la matrice de données nouvelle-ment imputée et la précédente augmente pour la première fois. La différence de l’ensembledes variables continues est définie par :

�N =

Pj2N(Y

newimp � Y old

imp)2

Pj2N(Y

newimp )

2(3.4)

En cas de variables qualitatives on définit la différence par :

69

Page 75: Modélisation du risque de réserve en business Run-Off sous ...

3.3. Solution 2 : Reconstruction du triangle en Run-Off par méthodes d’imputation desdonnées manquantes

�F =

Pj2FPn

i=1 1Y newimp 6=Y old

imp

#NA(3.5)

#NA est le nombre de des valeurs incomplètes pour les variables quantitatives.

Après l’imputation des valeurs manquantes, la performance est évaluée en utilisant l’erreurquadratique moyenne normalisée (NRMSE) Oba et al. (2003) définie par :

NRMSE =

smean((X true �X imp)2)

var(X true)

Avec :X true : Jeu de données completX imp : Jeu de données imputé

Application de l’algorithme MissForest

Afin de mettre en oeuvre la méthode d’imputation avec forêts aléatoires, nous avons uti-lisé le package R développé par Stekhoven et Buehlmann (2012). La fonction missForest()

implémentée sous R fonctionne de façon itérative en mettant continuellement à jour la ma-trice imputée et évaluant sa performance après chaque itération. L’évaluation de l’algorithmeest faite en considérant la différence entre le résultat d’imputation précédent et le nouveaurésultat d’imputation. Aussitôt que cette différence augmente, l’algorithme s’arrête.

Pour avoir de meilleurs résultats, l’algorithme d’imputation doit disposer d’un échantillond’apprentissage. Dans notre cas, nous avons estimé un triangle de liquidation initial defaçon déterministe (voir section imputation stationnaire et échantillon d’apprentissage). Ilexiste aussi plusieurs paramètres pouvant impacter l’imputation des données manquantes enutilisant la méthode MissForest :

• ntree : le nombre de sous-arbres générés par l’algorithme MissForest ;

• maixter : Le nombre maximal d’itération de l’algorithme ;

• mtry : Nombre de variables aléatoirement échantillonnées à chaque rupture égale àsqrt(p), où p est le nombre de variables dans la matrice en input.

70

Page 76: Modélisation du risque de réserve en business Run-Off sous ...

3. Solutions des données manquantes en provisionnement

Figure 3.16. – Résultat de la fonction MissForest appliquée au triangle de liquidation derèglements décumulés - Branche automobile

Nous avons appliqué l’algorithme de MissForest en prenant comme input les triangles deliquidation des règlements décumulés. Ainsi, les variables à imputer sont assimilés aux lignesde souscription. La figure 3.16 présente les sorties R des différentes itérations de l’algorithmeMissForest appliqué à la branche automobile. Le nombre de sous-arbres utilisé dans ce casest de 100 qui représente la valeur par défaut de l’algorithme. D’après les résultats (figure3.17), l’algorithme MissForest s’est arrêté après la cinquième itération, car la différence d’im-putation avec le résultat précédent a augmenté. Finalement, l’erreur d’imputation NRMSEest égale à 1.3748

Stabilité de la méthode

Pour analyser la stabilité de l’imputation des diagonales manquantes, nous avons procédéen deux étapes :

• Modifier les paramètres de l’algorithme d’imputation et comparer la performance NRMSE

• Mise à l’épreuve de l’algorithme avec un backtesting d’une diagonale complète.

Dans un premier temps, nous allons varier les paramètres de l’algorithme et évaluer à chaquefois la performance de l’imputation (NRMSE). Les paramètres qui ont le plus d’impact sur

71

Page 77: Modélisation du risque de réserve en business Run-Off sous ...

3.3. Solution 2 : Reconstruction du triangle en Run-Off par méthodes d’imputation desdonnées manquantes

l’algorithme sont l’échantillon d’apprentissage initial et le nombre de sous-arbres aléatoiresà générer (ntree). En variant le paramètre ntree entre 100 et 1000 nous avons constaté quel’erreur NRMSE reste stable autour de 1.36 avec une variation relative de 0.30% (tableau 3.4).L’avantage d’avoir un ntree faible permet de réduire le temps de compilation de l’algorithme.

ntree 100 200 300 400 500 1000

NRMSR 1.368 1.380 1.364 1.373 1.364 1.379

Table 3.4. – Comparaison de la performance de l’algorithme (NRMSE) en fonction dunombre des sous-arbres ntree - Branche automobile

En ce qui concerne le nombre maximal d’itérations (maixter), il a été fixé à 10 itérationssachant que l’algorithme d’imputation converge au bout de 5 itérations. Quant aux nombrede variables aléatoirement échantillonnées à chaque rupture, il n’a pas changé.

Pour s’assurer de la performance de la méthode d’imputation MissForest, nous allons appli-quer un backtesting sur le triangle en question. En effet, la deuxième étape consiste à retirerune diagonale complète du triangle de liquidation puis appliquer de nouveau l’algorithmed’imputation. Par exemple, nous supposons que la diagonale de l’année comptable 2006 dutriangle de liquidation (branche automobile) est incomplète. Après avoir lancé l’algorithmed’imputation, nous constatons que la convergence de l’algorithme est atteinte en 5 itérationsavec un NRMSE de 1.37 soit une augmentation de 0.10% par rapport au cas initial.

72

Page 78: Modélisation du risque de réserve en business Run-Off sous ...

3. Solutions des données manquantes en provisionnement

Figure 3.17. – Comparaison entre la diagonale observée et la diagonale imputé par laméthode MissForest - Branche automobile

Suite au backtesting de l’algorithme, nous avons comparé la diagonale observée du triangle deliquidation avec celle imputée par l’algorithme MissForest (figure 3.17). Ainsi, les montantsde règlements imputés par l’algorithme MissForest réussissent à prédire l’allure des montantsréellement observés. Cependant, la méthode MissForest a du mal à prédire les pics observésdans les règlements, d’où le besoin d’appliquer un traitement spécifique.

Diagnostic des imputations

Le diagnostic effectué consiste à comparer les montants des règlements imputés dans letriangle de liquidation avec les données observées. Sachant que l’algorithme MissForest simuleles montants à travers les données observés dans dans l’input ; intuitivement, les donnéesimputées doivent avoir le même ordre de grandeur. La figure 3.18 présente une comparaisondes montants imputés avec les données réelles à chaque itération.

73

Page 79: Modélisation du risque de réserve en business Run-Off sous ...

3.4. Backtesting des solutions

Figure 3.18. – Analyse de la plausibilité des montants imputés (points rouges) avec lesmontants observés (points bleus) - Branche automobile

La figure indique que la distribution des données imputées et les données observées sontsimilaires. Toutefois, les valeurs extrêmes ne suivent pas la même logique de distribution.Ainsi, nous pouvons conclure que les données imputées respectent bien la distribution desdonnées observées sur les triangles de liquidation de règlements décumulés. Ceci étant dit,des comparaisons avec d’autres méthodes d’imputation des données manquantes peuvent êtreeffectuées. Par exemple, Shah et al. (2014) ont effectué une comparaison entre la méthodeMissForest et la méthode d’imputation multivariée par des équations chaînées (MICE). Cetteméthode est implémentée sous le logiciel R par Buuren et Groothuis-Oudshoorn (2011).

3.4. Backtesting des solutions

Afin de tester la robustesse des solutions proposées, nous effectuons un backtesting pourchaque solution. L’idée du backtesting repose sur le fait de prendre un triangle completauquel nous retirons des diagonales supérieures puis appliquer les deux solutions. La figure

74

Page 80: Modélisation du risque de réserve en business Run-Off sous ...

3. Solutions des données manquantes en provisionnement

3.19 présente brièvement la manière dont sera construit l’échantillon de backtesting.

Figure 3.19. – Construction du triangle de backtesting

En pratique, nous avons pris un portefeuille du groupe AXA géré en Run-Off. L’avantage dece portefeuille est qu’il n’est pas issu d’une acquisition, en plus de cela, on dispose de tout sonhistorique de données. La branche du triangle choisie est la branche qui contient les traitésde la réassurance maritime non proportionnelle. La première année de souscription de cettebranche remonte à 1985 et a été mise en Run-Off en 2005. Pour créer volontairement le biaisd’information dans le triangle de règlements décumulés, nous supprimons les 10 premièresdiagonales (Année 1985 - 1998).

3.4.1. Backtesting de la solution 1

La solution 1 exige de faire un découpage de l’écoulement de la charge encourue (incurred).Après avoir introduit volontairement le biais de données dans le triangle de liquidation desrèglements décumulés, par implication le triangle de la charge encourue devra être impacté.Intuitivement, nous attendons d’avoir deux phases d’écoulement différentes dans le trianglede liquidation. La figure 3.20 présente le résultat de la classification hiérarchique au niveaudes années de souscription.

75

Page 81: Modélisation du risque de réserve en business Run-Off sous ...

3.4. Backtesting des solutions

Figure 3.20. – Backtesting - Classification hiérarchique des années de souscription de labranche Maritime non proportionnelle

Sachant que l’application de la classification hiérarchique ou les K-means donne les mêmesconclusions (voir section "Méthode des K-means") nous avons préféré le choix de la clas-sification hiérarchique. D’après le résultat obtenu, l’algorithme de classification propose derépartir les années de souscription en deux sous-ensembles disjoints selon l’année de référence1994 :

• Ensemble 1 : {1985, . . . , 1993}

• Ensemble 2 : {1994, . . . , 2005}

3.4.2. Backtesting de la solution 2

La solution 2 propose d’appliquer une imputation des données manquantes à travers l’algo-rithme des forêts aléatoires. De la même manière que la section précédente "Utilisation desforêts aléatoires" nous appliquons les différentes étapes suivantes :

• Estimation d’un échantillon d’apprentissage

• Choix des paramètres de l’algorithme MissForest

• Diagnostic des montants des règlements imputés

Avec un nombre de sous-arbres (ntree) de 500 et un nombre maximal d’itérations égal à 20

l’algorithme MissForest converge au bout de 8 itérations. La performance de l’algorithme

76

Page 82: Modélisation du risque de réserve en business Run-Off sous ...

3. Solutions des données manquantes en provisionnement

est évalué à 0, 441. Afin de tester l’adéquation des montants imputés et les montants derèglements observés nous comparons une diagonale imputée avec celle observée la mêmeannée comptable (figure 4.12).

Figure 3.21. – Backtesting - Comparaison entre la diagonale observée et la diagonaleimputée par la méthode MissForest

D’après le graphe obtenu, il semble que l’algorithme des forêts aléatoires prédit bien lesmontants des règlements observés du triangle de règlements décumulés Marine non propor-tionnelle.

3.5. Conclusion

Les solutions apportées à la problématique des données manquantes reposent sur un mélangede modèles statistiques et techniques de machines learning. Ainsi, nous avons proposé deuxsolutions différentes pour contourner le manque de données dans les triangles de liquidationdu portefeuille ISAR. La première solution consiste à découper l’écoulement de la charge

77

Page 83: Modélisation du risque de réserve en business Run-Off sous ...

3.5. Conclusion

encours selon deux phases différentes en utilisant des techniques de classification hiérarchiqueet K-means. La deuxième solution utilise les modèles d’imputation des données manquantesqui se basent sur des techniques d’apprentissage statistique. Après nous avons effectué unbacktesting des deux solutions proposées pour mettre à l’épreuve leurs performances. Dansla suite nous allons essayer d’estimer les volatilités du risque de réserve des branches étudiéesen combinant les solutions proposées pour les données incomplètes.

78

Page 84: Modélisation du risque de réserve en business Run-Off sous ...

Chapitre 4Risque de réserve

Tables des matières

4.1. Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81

4.2. Solvabilité II et cadre réglementaire . . . . . . . . . . . . . . . . 81

4.2.1. Pilier 1 : Exigences quantitatives . . . . . . . . . . . . . . . . . 83

4.2.2. Pilier 2 : Exigences qualitatives . . . . . . . . . . . . . . . . . . 83

4.2.3. Pilier 3 : Communication financière . . . . . . . . . . . . . . . . 84

4.3. Le risque de réserve sous l’angle Solvabilité II . . . . . . . . . . 84

4.3.1. Modèle interne partiel . . . . . . . . . . . . . . . . . . . . . . . 86

4.3.2. Revue de littérature des méthodes de risque de réserve . . . . . . 88

4.4. Modèle de Merz & Wütrich . . . . . . . . . . . . . . . . . . . . . 89

4.4.1. Vision prospective . . . . . . . . . . . . . . . . . . . . . . . . . 90

4.4.2. Vision rétrospective . . . . . . . . . . . . . . . . . . . . . . . . 92

4.4.3. Agrégation sur les années de souscription . . . . . . . . . . . . . 93

4.5. Mise en pratique . . . . . . . . . . . . . . . . . . . . . . . . . . . 94

4.5.1. Estimation du risque de réserve (solution 1) . . . . . . . . . . . . 94

4.5.2. Estimation du risque de réserve (solution 2) . . . . . . . . . . . . 96

4.5.3. Comparaison et backtesting des résultats . . . . . . . . . . . . . 98

4.6. Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 101

79

Page 85: Modélisation du risque de réserve en business Run-Off sous ...

80

Page 86: Modélisation du risque de réserve en business Run-Off sous ...

4. Risque de réserve

4.1. Introduction

Le présent chapitre s’intéresse à l’évaluation du risque de réserve sous la contrainte des don-nées incomplètes. En effet, sous la nouvelle norme Solvabilité II, les sociétés en Run-Offdoivent mettre en place un nouveau processus d’évaluation prudente des risques contenusdans leurs portefeuilles. Parmi l’ensemble des risques cartographié par la directive euro-péenne, le risque de réserve est le principal risque que les gestionnaires du Run-Off doiventmaîtriser. Sachant que les triangles de liquidation sont incomplets, l’estimation du risque deréserve prendra en compte les solutions des données manquantes proposées dans le chapitreprécédent.

4.2. Solvabilité II et cadre réglementaire

La norme européenne Solvabilité II a fixé comme objectif la modernisation et harmonisationdes règles de solvabilité applicables à l’ensemble des entreprises d’assurances et réassuranceseuropéennes. Pour maintenir un haut niveau de protection des assurés, et évaluer le risquesupporté par les assureurs, la norme solvabilité II a adapté les exigences réglementaires àl’ensemble des risques inhérents à l’activité d’assurance (risques techniques, risques de place-ment, risque catastrophe....). Le but est de consacrer suffisamment de capital pour se couvrir.Ce cadre de référence se traduit par des exigences en matière d’identification, quantification,maîtrise et suivi des risques. D’une part en intégrant l’ensemble des risques liés aux différentesactivités à un réel cadre prudentiel. D’autre part, en incitant les entreprises d’assurances etde réassurance à piloter et à gérer leurs risques, de communication d’informations au marché.Aussi, permettant aux autorités de tutelle d’apprécier la situation de l’entreprise d’assurancetant d’un point de vue de la solvabilité et de la solidité financière, que d’un point de vuerobustesse du système de gestion des risques.

La réforme solvabilité II s’est basée sur le processus législatif Lamfalussy, déjà opération-nel dans la conception des réglementations du secteur financier. Ce système porte le nomd’Alexandre Lam-falussy, le président du comité consultatif qui le mis au point en 2001, et apour objectif d’assurer un dialogue entre les acteurs du marché et le législateur. Ce processusest composé de 4 niveaux :

• Niveau 1 : L’élaboration de la législation.

• Niveau 2 : L’élaboration des mesures d’exécution.

• Niveau 3 : Coordination des travaux entre les différents régulateurs.

81

Page 87: Modélisation du risque de réserve en business Run-Off sous ...

4.2. Solvabilité II et cadre réglementaire

• Niveau 4 : Contrôle de l’application.

Différents acteurs sont engagés dans le projet de réforme solvabilité II à savoir la Commis-sion Européenne, l’EIOPA, les Autorités de Contrôles et les Professionels de l’assurance.La Commission Européenne a un rôle législatif de rédaction et pilotage de la directiveen collaboration avec les états membres ; L’EIOPA (European Insurance and OccupationalPensions Authority), anciennement le CEIOPS (Committee of European Insurance and Oc-cupentional Pensions) est un comité regroupant les autorités de contrôle des états-membres.L’EIOPA a mené des études d’impact afin de mesurer les conséquences des nouvelles régle-mentations sur le marché assurantiel, sa dernière étude quantitative est le QIS 5. L’Autoritéde Contrôle Prudentiel a pour objectif de vérifier l’application des nouvelles réglemen-tations par les organismes d’assurance en France. Elle a le pouvoir de sanction en cas denon-respect de ces règles. Les Professionnels de l’assurance ont un rôle important dansl’élaboration de la directive en effectuant des retours sur les « Consultation Papers », ce quipermet de voir les points d’amélioration et les difficultés dans l’application de la réforme.Les professionnels de l’assurance participent également aux études quantitatives QIS. LaCommission a opté pour une structure à trois piliers largement inspirées des principes envigueur dans le secteur bancaire 4.5.

Figure 4.1. – Les trois piliers de la norme Solvabilité II

82

Page 88: Modélisation du risque de réserve en business Run-Off sous ...

4. Risque de réserve

4.2.1. Pilier 1 : Exigences quantitatives

Le pilier 1 concerne les exigences quantitatives en capital, il s’attache à vérifier que la com-pagnie d’assurance puisse faire face à ses engagements sur un horizon d’un an. Il définitdes règles quantitatives de calcul pour les provisions techniques et les fonds propres. Lesindicateurs à mettre en place pour surveiller la variation des fonds propres sont le MCR(Minimum Capital requirement) et le SCR (Solvency Capital requirement). Le MCR repré-sente le niveau minimum des fonds propres en dessous duquel l’intervention du régulateurest automatique et pourra entraîner le retrait d’agrément de l’entreprise. Alors que le SCRreprésente le capital nécessaire pour absorber le choc provoqué par une sinistralité excep-tionnelle, une chute des marchés financiers, ou n’importe quels autres chocs imprévisibles. Lecalcul de ces deux indicateurs fait l’objet de recherches de plusieurs praticiens et théoriciensde du domaine d’assurance et finance.

4.2.2. Pilier 2 : Exigences qualitatives

Le pilier 2 fixe les normes qualitatives de suivi des risques en interne. Ainsi, les assuranceset réassurances doivent mettre en place un système de gouvernance efficace pour garantirune gestion prudente de leurs activité. Les assureurs doivent également vérifier s’ils sontsolvables selon leur propre vision des risques. Ils doivent mettre en place un processus ERM(Entreprise Risk Management), qui définit la discipline utilisée par toutes les entreprises(non seulement les entreprises d’assurance) pour assurer une maîtrise de leurs risques. Ladémarche ERM s’effectue en plusieurs étapes :

• Un système de gouvernance et une organisation qui tient compte de la gestion desrisques pour la mise en œuvre de la stratégie de l’entreprise.

• La définition d’une tolérance aux risques.

• Une évaluation interne du risque (Own Risk and Solvency Assessment) afin de validerqu’on est à l’intérieur des limites fixées et de vérifier que le système de contrôle desrisques est opérationnel et efficace.

• Un réseau d’information et reporting avec un système de « feedback » et une organi-sation qui garantit que le dispositif de gestion des risques reste efficace en cas de crise,d’émergence de nouveaux risques, de déviation par rapport aux limites.

83

Page 89: Modélisation du risque de réserve en business Run-Off sous ...

4.3. Le risque de réserve sous l’angle Solvabilité II

4.2.3. Pilier 3 : Communication financière

Le pilier 3 vise à améliorer la communication aux régulateurs et au public ainsi qu’à harmoni-ser l’information. Il concerne la communication de solvabilité des compagnies pour permettreau public (actionnaires et analystes) et aux autorités de contrôles de juger la qualité de l’in-formation publiée. Un certain nombre d’informations ayant servi à déterminer le capital desolvabilité seront donc livrées aux différents acteurs. Les assureurs doivent produire troisrapports de communication à savoir :

• Le SFCR (Solvency and Financial Conditions Report), qui est un rapport annuel ayantpour objectif de présenter la situation financière des entreprises au public.

• Le RSR (Regular Supervisory Reporting), autre rapport annuel servant de base àl’autorité de contrôle prudentiel dans le cadre d’un contrôle.

• Le QRT (Quantitative Reporting Templates), dont la fréquence dépend du template(trimestrielle ou annuelle)

4.3. Le risque de réserve sous l’angle Solvabilité II

La nouvelle norme européenne a introduit une nouvelle manière d’évaluer le bilan d’unecompagnie d’assurance. En effet, les actifs et les passifs doivent être estimés à leurs valeursde marché qui est une vision économique 4.3. Ainsi, les provisions techniques qui s’inscriventdans le passif d’assurance sont définis comme la somme du Best Estimate (BE) et la RiskMargin (RM). Le BE correspond à la meilleure valeur actuelle probable des flux de tréso-rerie futur. La Risk Margin garantie que le montant global des provisions techniques seraéquivalent à la somme que les entreprises d’assurances et réassurance s’attendraient à devoirpayer aujourd’hui si elles transféreraient sur le champ leurs droits et obligations contractuelsà une autre entreprise. Le risque de réserve qui est un sous module du risque de souscription(figure 4.2) en non-vie provient de l’estimation du BE qui est susceptible de varier d’uneannée à une autre selon la survenance de nouvelles informations sur la sinistralité.

84

Page 90: Modélisation du risque de réserve en business Run-Off sous ...

4. Risque de réserve

Figure 4.2. – Structure modulaire des risques en formule standard

La directive Solvabilité II met particulièrement l’accent sur le risque de réserve, et inciteles acteurs du marché de l’assurance non-vie notamment à réduire l’incertitude sur leursprévisions. Par conséquent, il faut choisir la méthode de provisionnement qui permettra deprédire au mieux les paiements futurs, et avec une moindre incertitude.

Figure 4.3. – Structure modulaire des risques en formule standard

85

Page 91: Modélisation du risque de réserve en business Run-Off sous ...

4.3. Le risque de réserve sous l’angle Solvabilité II

Le passage d’un Bilan comptable sous solvabilité I à un bilan économique sous solvabilitéII (figure 4.3) a beaucoup impacté les techniques de calcul déployées par les assureurs etréassureurs pour estimer l’exigence en capital. La réforme solvabilité II vise à garantir leversement au client des engagements des assureurs et des réassureurs à un horizon 1 an, etce même en cas de situation très défavorable. D’où la nécessité des compagnies d’assurance decalculer un SCR qui correspond à une exigence de fonds propres pour faire face à un scénariode crise qui arriverait une fois tous les 200 ans. L’EIOPA a proposé quatre méthodes pourdéterminer le SCR :

• La formule standard

• La formule standard et un modèle interne partiel

• La formule standard avec l’utilisation des Undertaking Specific Parameters

• Un modèle interne

Le choix de méthode de calcul du SCR dépend des objectifs de la compagnie d’assuranceou de réassurance ainsi que leurs capacités d’investissement. En effet, mettre en place unmodèle interne est très coûteux en terme financiers et nécessite des années de développement.Les compagnies qui ont choisi de mettre en place la formule standard ont la possibilitéd’introduire leurs propres paramètres (Undertaking Specific Parameteres) lors du calcul dela formule standard. Si la compagnie estime qu’il est nécessaire de mettre en place son propremodèle interne, le SCR calculé ne doit pas être largement différent des résultats obtenus parla formule standard. En cas de difficulté d’estimer un modèle interne global, les compagniesont aussi la possibilité d’estimer un modèle interne partiel spécifique à un module de risque.

4.3.1. Modèle interne partiel

Dans le cadre de Solvabilité II, AXA LM doit se tenir prête pour répondre aux différentesquestions des régulateurs sur sa solvabilité. Mais, devant la complexité de concevoir un mo-dèle interne pour son business Run-Off, AXA LM a privilégié l’utilisation des volatilités QISfournis par l’EIOPA. Ces niveaux de volatilités ont été calibré sur un panier de portefeuilleshétérogènes. Par conséquent, estimé un capital réglementaire basé sur ces volatilités pourraêtre coûteux pour une société de Run-Off, surtout qu’il ne reflète pas son propre risque deréserve. Afin d’avoir une meilleure connaissance du risque lié aux portefeuilles gérés par AXALM, l’équipe actuariat a initié des travaux de recherche sur l’utilisation des undertaking spé-cifique parameteres (USP). Ainsi, il faut estimer un niveau de capital réglementaire cohérentavec le risque de réserve porté par les portefeuilles d’AXA LM. Dans le long terme, AXALM prévoit la mise en place d’un modèle interne pour son business en Run-Off.

86

Page 92: Modélisation du risque de réserve en business Run-Off sous ...

4. Risque de réserve

En effet, l’estimation des paramètres propres à l’entreprise (Undertaking Specific Parameters)est une alternative aux sociétés n’ayant pas la possibilité de construire un modèle interne. Lesentreprises possédant un historique suffisant de données sur leurs primes et leur sinistralitépassées peuvent appliquer les USP pour que leurs besoins de fonds propres soient calculésavec leurs propres hypothèses et non celles du marché.

Lors du QIS 5, l’EIOPA a proposé des méthodes pour que les compagnies puissent calculerleurs propres volatilités des réserves et des primes. En fonction de son nombre d’années d’his-toriques, la compagnie devra appliquer une méthode de crédibilité pour pouvoir appliquerles USP. Le SCR du risque de prime et de réserve est noté NLpr dans le QIS 5 TechnicalSpecifications et se calcule avec la formule suivante :

NLpr = ⇢(�).V

Avec

V : Volume du portefeuille� : Une estimation de l’écart type du portefeuille non-vie⇢() : Fonction de cet écart typeLa distribution des pertes est supposée Lognormale, La fonction ⇢(�) est définie par :

⇢(�) =exp(N0,995.

p(log(�2 + 1)))p

(�2 + 1)� 1

Où : N0,995 = Le quantile à 99, 5% de la loi normale centrée réduite Le volume et l’écarttype sont calculés pour chaque LoB et pour chaque risque (prime et réserve), puis ils sontagrégés pour obtenir un volume et un écart type global. Dans un portefeuille

� = c.�A + (1� c).�M

Avec c un facteur de crédibilité c = Facteur de crédibilité�A : Volatilité estimée par la compagnie�M : Volatilité estimée par le marché

Soit NLoB le nombre d’années d’historiques que possède l’assureur.

87

Page 93: Modélisation du risque de réserve en business Run-Off sous ...

4.3. Le risque de réserve sous l’angle Solvabilité II

Figure 4.4. – Crédibilité pour les branches Third-party liability, Motor vehicle liability etCredit

Figure 4.5. – Crédibilité pour les autres branches

Dans la suite des travaux, nous allons estimer le risque de réserve des branches : assurance devéhicule automobile, assurance de responsabilité civile générale, assurance maritime. L’as-pect des données manquantes dans le triangle de liquidation sera pris en compte à traversles solutions approtées dans le chapitre 3. Le calcul du coefficient de variation (CoV) desbranches étudiées sera effectué par des méthodes d’estimation du risque de réserve. Les por-tefeuilles d’acquisition d’AXA LM sont caractérisés par un historique de données supérieur à15 ans. Ainsi, nous n’allons pas avoir besoin d’introduire un coefficient de crédibilité commementionnée dans la méthode de l’EIOPA.

4.3.2. Revue de littérature des méthodes de risque de réserve

Le risque de réserve est lié à la nature aléatoire de l’évaluation des sinistres et à leur mau-vaise estimation. Jusqu’à 2007, les méthodes de risque de réserves traitent dans leur majoritéque de l’estimation de la volatilité ultime (calculée par la méthode de Thomas Mack). Ce-pendant avec le cadre de Solvency II est apparu la nécessité d’estimer le boni-mali établientre l’estimation des pertes ultimes sur l’année comptable I et l’estimation faite sur l’annéecomptable I + 1. Ces bonis-malis correspondent à la volatilité à horizon d’un an calculé parla méthode de Merz et Wüthrich.

Ce modèle a été introduit en 2008 par les mathématiciens Mario V.Wüthrich, Michael Merzet Natalia Lysenko dans un article intitulé Uncertainty of the Claims Development Result inthe Chain Ladder Method. Leur papier développe une formule fermée qui permet d’estimerle risque de réserve à un horizon un an. Dans le souci de s’adapter à la réforme solvabilitéII, les mêmes mathématiciens ont proposé dans l’article Wüthrich et al. (2008) une versionsimplifiée de cette formule, plus facile à implémenter. le papier a été adopté par l’EIOPAcomme modèle de référence.

88

Page 94: Modélisation du risque de réserve en business Run-Off sous ...

4. Risque de réserve

4.4. Modèle de Merz & Wütrich

Il existe deux approches concernant la mesure de l’incertitude suite au calcul du provisionne-ment : l’incertitude à l’ultime introduite par Mack (1993), et l’incertitude à un an introduitepar Wüthrich et al. (2008). Dans la première approche, nous cherchons à prédire la varia-bilité de la charge totale en se basant simplement sur sa valeur à l’ultime. En revanche,dans la vision à un an (vision nécessaire dans le cadre du nouveau référentiel solvabilité II),la prédiction de la variabilité se fait en se basant sur la valeur de la charge totale estiméedurant l’année calendaire suivante. Autrement dit, la variation de la charge ultime à un anest définie comme la différence entre la valeur de la charge ultime calculée en date t + 1 etsa valeur calculée en date t. Cette vision court terme peut s’avérer pertinente pour l’aide àla décision prise dans le cadre de la gestion des risques, notamment pour le régulateur, lesinvestisseurs, le calcul de l’allocation actif-passif...

Avant de présenter les différentes mesures d’incertitude, nous introduisons deux ensemblesd’informations qui nous serons utiles tout au long de cette partie :

Soit les paiements disponibles à la date I et I + 1 respectivement :

DI = {Ci,j ; i+ j I, 0 i, j I}DI+1 = {Ci,j ; i+ j I, 0 i, j I + 1}

(4.1)

Ces deux ensembles peuvent être représentés par la figure suivante :

Figure 4.6. – Triangle de développement aux dates t=I et t=I+1

L’incertitude à un an repose quant à elle sur une vision court terme (d’une année sur l’autre).En effet, selon la nouvelle réglementation, l’horizon temporel n’est plus la fin de la vie dessinistres déjà survenus, mais simplement la situation comptable dans un an. Cette méthodede calcul de l’incertitude est d’ailleurs préconisée par l’EIOPA comme applicable dans lecadre des USP. Pour déterminer cette incertitude, la méthode officielle dans le QIS 5 estcelle de Merz et Wüthrich, qui se base sur le modèle de Mack.

En pratique, chaque année les actuaires mettent à jour leur prédiction de coûts de sinistres àpayer. Si l’estimation de la charge ultime est revue à la hausse, l’assureur annonce des "mali"

89

Page 95: Modélisation du risque de réserve en business Run-Off sous ...

4.4. Modèle de Merz & Wütrich

(les provisions initialement constituées se sont avérées insuffisantes) tandis qu’il annoncerades "boni" si l’estimation est revue à la baisse. C’est justement cette incertitude (associéeau montant de "boni" ou "mali") que l’on se propose de mesurer, et qu’il faudra couvrir.Finalement, il ne s’agit pas de l’incertitude de la prédiction des paiements qui seront effectuésl’an prochain, mais bien l’incertitude associée à la révision d’un estimateur.

Plus concrètement, la différence des estimations faites entre l’année calendaire I et l’annéecalendaire I + 1, appelée Claim Development Result (CDR), est la quantité :

CDRi(I + 1) = E[Ci,J/DI ]� E[Ci,J/DI+1] (4.2)

dite "CDR réel", estimé par la "CDR observable" :

\CDRi(I + 1) = CIi,J � CI+1

i,J (4.3)

où CIi,J et CI+1

i,J correspondent respectivement à l’estimation du règlement cumulé final faiteen fin d’année calendaire I et celle faite en fin d’année I + 1, c’est à dire :

CIi,J = Ci,I�1.f I

I�i...fIJ�1

CI+1i,J = Ci,I�i+1.f I

I�i+1...fII�i+1

(4.4)

Où f (i) désigne le facteur de Chain Ladder évalué avec l’information disponible à l’année i,avec i 2 I, I + 1.

Soit l’absence de l’information en t = I+1, Merz & Wütrich se plaçe dans le cadre du modèlede Mack et propose deux visions pour quantifier et estimer cette mesure d’incertitude. Lapremière vision est prospective, la deuxième est rétrospective.

4.4.1. Vision prospective

Tout d’abord, par définition du CDRi(I + 1), et du fait que la variable aléatoire Mi définiepar Mi = E[Ci,J/DI ] est une martingale, nous pouvons en déduire que, conditionnellementà l’information DI , le CDRi(I + 1) est centré, i.e :

E[CDRi(I + 1)/DI ] = 0

Par conséquent, en date t = I, la meilleure estimation du CDRi(I+1) est simplement 0. C’esten général la prédiction du CDR qui est faite pour l’année calendaire (I, I + 1). Il est alors

90

Page 96: Modélisation du risque de réserve en business Run-Off sous ...

4. Risque de réserve

important de déterminer et mesurer de combien la réalisation des CDR à la fin de l’annéecalendaire aura dévié de 0. On rappelle que la marge de solvabilité requise dans SolvabilitéII doit contenir le capital nécessaire pour faire face à de possibles déviations du CDR autourde 0 (l’exigence en fonds propres doit en fait permettre de couvrir les "réalisations" du CDR

dans 99, 5% des cas). Une mesure de cette déviation est donnée par la grandeur suivante :

MSECDRi(I+1)|DI(0) = E[(CDRi(I + 1)� 0)2|DI ]

= V ar(CDRi(I + 1)|DI)

= V ar(E[Ci,J |DI ]� E[Ci,J |DI+1] |DI)

= V ar(E[Ci,J |DI+1]|DI)

= V ar(Ci,I�i+1|DI)QJ�1

j=I�i+1 f2j

= Ci,I�i�2I�i

QJ�1j=I�i+1 f

2j

= E[(Ci,J |DI ]2�2I�i/f

2I�i

Ci,I�i

(4.5)

Cette quantité correspond en fait à la variance du CDR car ce dernier est centré condition-nellement à l’information DI . Elle peut être estimée de la manière suivante :

dV ar(CDRi(I + 1)|DI) = (Ci,J)2 �I�i/(Fi,I�i)2

Ci,I�i

On définit une version observable de cette quantité à l’aide du CDR observable notée\CDRi(I + 1)|DI , c’est-à-dire que l’on obtient sa variance autour du meilleur estimateurqui est 0 :

V ar(\CDRi(I + 1)|DI) = MSE\CDRi(I+1)|DI(0) = E[(\CDRi(I + 1)� 0)2|DI ] (4.6)

Cette quantité donne une vision prospective de l’incertitude à un an, en mesurant la qualitéde la prédiction de CDRi(I + 1) par 0. Elle est estimée par :

\MSE\CDRi(I+1)|DI(0) = C2

i,J(�Ii,J + �I

i,J)

�Ii,J =

�2I�i/(FI�i)2Pi�1

l=0 Cl,I�i

+J�1X

j=I�i+1

CI�j,jPI�jl=0 Cl,j

!2�2j/(Fj)2

PI�j�1l=0 Cl,j

�Ii, J =

"1 +

�2I�i/(Fi,I�i)2

Cl,I�i

#J�1Y

j=I�i+1

1 +

�2j/(Fj)2

(PI�j

l=0 Cl,j)2CI�j,j

!� 1

91

Page 97: Modélisation du risque de réserve en business Run-Off sous ...

4.4. Modèle de Merz & Wütrich

Remarque : Notons qu’il est possible, pour simplifier les calculs, de donner une approxi-mation de �Ii, J . En effet, nous avons la propriété suivante :

Y

i

(1 + ai) ⇡ 1 +X

i

ai ai << 1

Or l’hypothèse est vérifiée si l’on a :

�2j /(Fj)2

(PI�j

l=0 Cl,j)2CI�j,j << 1

, �2j /(Fj)2

(CI�j,j

⇣CI�j,jPI�jl=0 Cl,j

⌘2

, �2j /(Fj)2

(CI�j,j<< 1

Car⇣

CI�j,jPI�jl=0 Cl,j

⌘< 1

Ainsi, l’approximation de �Ii, J est :

�Ii, J ⇡�2I�i/(FI�i)2

(Ci,I�i+

J�1X

j=I�i+1

CI�j,jPI�jl=0 Cl,j

!2�2j/(Fj)2

(CI�j,j

4.4.2. Vision rétrospective

Merz et Wüthrich considèrent une seconde approche "rétrospective", qui consiste cette foisà se positionner en l’année calendaire I +1. On obtient ainsi une observation pour les CDR

et il est alors possible d’analyser si cette dernière est dans un intervalle raisonnable autourdu CDR réel. On rappelle que la formule du CDR observable est la suivante :

\CDRi(I + 1) = CIi,J � C i+1

i,J

où CIi,J (resp. C i+1

i,J )) est l’estimation de E[Ci,J |DI ] faite en I (resp. E[Ci,J |DI+1]).

On peut alors définir une mesure de la distance entre le CDR observable et le CDR réel dela manière suivante :

\MSE\CDRi(I+1)|DI(\CDRi(I + 1)) = E[CDRi(I + 1)� \CDRi(I + 1)2|DI ]

92

Page 98: Modélisation du risque de réserve en business Run-Off sous ...

4. Risque de réserve

Cette dernière peut alors être estimée par :

\MSE\CDRi(I+1)|DI(\CDRi(I + 1)) = Ci,j

2(�I

i,J + �Ii,J)

où�2

i,J =h1 +

�2I�i/(FI�i)2

(Ci,I�i

i✓QJ�1I�i+1

✓1 +

�2j /(Fj)2

(PI�j

l=0 Cl,j)2CI�j,j

◆� 1

⇡PJ�1

j=I�i+1

⇣CI�j,jPI�jl=0 Cl,j

⌘2 �2j /(Fj)2

CI�j,j

Sous les mêmes hypothèses qu’au paragraphe précédent.

4.4.3. Agrégation sur les années de souscription

Lorsque l’on agrège les CDRi(I + 1) sur l’ensemble des années de survenance i 2 1, . . . , I,il faut prendre en compte les corrélations qui existent entre ses différentes années. En effet,les mêmes observations sont utilisées pour estimer les coefficients de Chain-Ladder et sontensuite appliquées à différentes années de survenance. Compte tenu de cette remarque, nousobtenons l’estimateur suivant pour la MSE des CDR réels agrégés :

\MSEPIi=1

\CDRi(I+1)|DI(PI

i=1\CDRi(I + 1)) =

PIi=1

\MSE\CDRi(I+1)|DI(\CDRi(I + 1))

+2P

0<i<k Ci,JˆCk,J(�I

i,J + ⇤Ii,J)

avec �Ii,J défini comme précédemment et ⇤I

i,J donné par la formule suivante :

⇤Ii,J =

Ci,I�iPik=0 Ck,I�i

�2I�i/(FI�i)2Pi�1k=0 Ck,I�i

+J�1X

j=I�i+1

CI�j,jPI�jl=0 Cl,j

!2�2j/(Fj)2

PI�j1l=0 CI�j,j

De même, nous obtenons un estimateur pour la MSE des CDR observables agrégés :

\MSEPIi=1

\CDRi(I+1)|DI(0) =

PIi=1

\MSE\CDRi(I+1)|DI(0)

+2P

0<i<k Ci,JˆCk,J(⌅I

i,J + ⇤Ii,J)

avec ⇤Ii,J défini comme ci-dessus et ⌅I

i,J défini par :

⌅Ii,J = �I

i,J +�2I�i/(FI�i)2Pik=0 Ck,I�i

93

Page 99: Modélisation du risque de réserve en business Run-Off sous ...

4.5. Mise en pratique

Enfin, comme les sinistres des différentes années de survenance sont indépendants, on peutestimer la variance des CDR réels agrégés simplement par la somme des estimations desvariances des CDR réels :

dV ar

IX

i=1

CDRi(I + 1)|DI

!=

IX

i=1

dV arCDRi(I + 1)|DI)

4.5. Mise en pratique

Dans la suite, nous nous intéresserons à l’application du modèle de Merz & Wütrich (M&W)pour estimer la volatilité des trois branches étudiées du portefeuille ISAR. Nous allons appli-quer M&W sur nos triangles de liquidation de la charge encourue en combinant à chaque foisles traitements des données manquantes (voir chapitre 3). L’idée est de quantifier l’impactdes données manquantes sur le niveau de volatilité estimé, ainsi que mesurer l’impact dessolutions apportées aux données manquantes. par la suite, nous effectuons une comparaisonentre les résultats obtenus, puis faire un Backtesting des solutions proposées.

4.5.1. Estimation du risque de réserve (solution 1)

L’objectif est d’estimer et comparer le coefficient de variation (CoV) pour les trois branchesde notre portefeuille avant et après découpage de l’écoulement du triangle de liquidation. LeCoV se définit par :

CoV =

p(MSEP)IBNR

La MSEP (Mean Square Error of Prediction) correspond à l’estimateur de la MSE des CDR

(Claim Development Result) observables défini dans la section précédente et qui agrègetoutes les années de survenance.

En appliquant la première méthode du traitement des données manquantes par partitionne-ment de la charge encourue, nous avons remarqué qu’il faut séparer les triangles de liquidationselon l’année de souscription 1985. Ainsi, nous avons estimé un CoV pour nos triangles deliquidation incomplets avant et après séparation des années de souscription. Il faut noterque les trois hypothèses de Merz & Wûtrich (identiques à celle de Mack) ne sont pas toutesvérifiées comme mentionné dans le deuxième chapitre. En pratique, il est souvent difficile devérifier les trois hypothèses de Mack surtout dans le cas où les données sont incomplètes.

94

Page 100: Modélisation du risque de réserve en business Run-Off sous ...

4. Risque de réserve

Figure 4.7. – Solution 1 - Comparaison du montant ultimes et IBNR avant et aprèsdécoupage par branche

Avant d’analyser le niveau de volatilité estimée sur nos trois branches, il est important d’ana-lyser l’impact de la solution 1 sur les montants des IBNR projetés à l’ultime. Effectivement,comme nous indique la figure 4.7, le montant des IBNR à l’ultime est faible en comparaisonavec le triangle original pour les trois branches. Les IBNR selon la solution 1 sont obtenusen faisant la somme du montant IBNR de chaque sous-triangle.

Branche Automobile Responsabilité Civile Maritime% de réduction des IBNR 58% 55% 95%

% de réduction de l’Ultime 32% 25% 88%

Table 4.1. – Solution 1 - Impact de l’application de la solution 1 sur les montants IBNRet Ultime

Le fait de découper le triangle de liquidation a beaucoup impacté les montants des IBNRprojetés comme nous indique le tableau 4.1. En effet, pour la branche automobile et respon-sabilité civile, les montants des IBNR sont réduits à moitié. Par contre, la branche maritimea subi un impact beaucoup plus supérieur que les deux autres branches. Ce constat est ex-pliqué par le faible pourcentage de la branche maritime par rapport au portefeuille total(moins de 10%). Ce qui peut présenter une limite de la solution du moment qu’elle n’est pasapplicable sur le triangle de liquidation avec des faibles montants de réserves.

Le CoV de la solution 1 à l’horizon d’un an est estimé par une moyenne de CoV de chaquetriangle pondérée par les IBNR comme suit :

CoVSolution 1 =IBNR1.CoV1 + IBNR2.CoV2

IBNR1 + IBNR2

AvecCoVi et IBNRi : CoV et IBNR respectivement liés au sous-triangle supérieur ou inférieur

95

Page 101: Modélisation du risque de réserve en business Run-Off sous ...

4.5. Mise en pratique

Figure 4.8. – Comparaison du CoV avant et après découpage par branche du triangle

D’après la figure 4.8, le niveau de volatilité des branches automobile, responsabilité civile etMarine est assez élevé (supérieur à 15%) estimé sur le triangle incomplet. Cependant, le CoV

calculé selon la solution 1 propose un niveau de volatilité presque similaire ou supérieur qu’au cas incomplet. En effet, le fait de découper le triangle de liquidation selon une année desouscription donnée peut impacter à la hausse le niveau de volatilité à l’horizon 1 an commenous remarquons au niveau de la branche responsabilité civile où le CoV a passé de 15%

avant découpage de la charge encourue du triangle à 25% après découpage.

4.5.2. Estimation du risque de réserve (solution 2)

L’estimation de la volatilité en combinant la solution 2 consiste à reconstruire le triangle deliquidation par méthode d’imputation des forêts aléatoires. Dans la figure 4.9 nous analysonsl’impact de la solution 2 sur la projection du montant des IBNR du triangle de liquidationincomplet.

Figure 4.9. – Solution 2 - Comparaison du montant ultimes et IBNR estimés par branche

96

Page 102: Modélisation du risque de réserve en business Run-Off sous ...

4. Risque de réserve

La solution 2 nous a permis de réduire l’estimation des IBNR de plus de 50% pour les troisbranches d’activité. Par contre les montants à l’utlime estimé par la solution 2 peuvent êtreparfois supérieurs à ceux du triangle incomplet comme nous indique la branche automobilece qui est cohérent du moment qu’on injecte de nouveaux montants dans le triangle derèglements décumulés.

Il faut noté qu’un triangle incomplet projette des montants de IBNR beaucoup plus im-portants, ce qui est logique. En effet, un triangle incomplet contient par construction desmontants d’incurred plus faible, du coup la méthode de Chain Ladder appliquée pour estimerles IBNR suppose que le business n’est pas encore mature, et qu’il faut provisionner plusde montant de réserve. Notre approche de reconstruction du triangle a priori confirme ceconstat, du moment que nous réduisions les réserves estimés au plus de la moitié.

Branche Automobile Responsabilité Civile Maritime% de réduction des IBNR 69, 32% 76, 79% 88, 57%

Table 4.2. – Impacte de l’application de la solution 2 sur les montants IBNR

D’après le tableau 4.2 les montants IBNR de la branche automobile ont été réduit de 69%.En ce qui concerne les branches responsabilité civile et maritime les réserves estimés sontréduit de plus 75%.

Figure 4.10. – Comparaison du CoV par branche

En ce qui concerne les CoV par branche, la solution 2 estime un niveau de volatilité faibleen comparaison avec la volatilité estimée pour le triangle incomplet. En effet, la brancheautomobile a un CoV de 7% contre 21% en cas de triangle incomplet. Pour la brancheresponsabilité civile, le CoV estimé par la solution 2 est de 8% contre 13% en cas de triangleincomplet. Ainsi, nous avons réduit le niveau de volatilité de 5% au niveau de la branche.

97

Page 103: Modélisation du risque de réserve en business Run-Off sous ...

4.5. Mise en pratique

Un point d’attention est relevé au niveau de la branche marine qui semble être très volatiledans le cas où le triangle de liquidation est incomplet avec un CoV de 40%. Or, la solution2 propose un CoV de 7, 1% dans le cas d’imputation du triangle.

4.5.3. Comparaison et backtesting des résultats

Comparaison des résultats

Les solutions 1 et 2 ont été proposées dans une perspective de comprendre si l’aspect desdonnées incomplètes a un impact majeur sur le niveau de volatilité estimé. La solution 1 quidécoupe selon une année de souscription donnée le triangle de liquidation en deux trianglesavec des tendances homogènes estime un niveau de volatilité équivalant ou supérieur à celuidu triangle incomplet. Cependant, la solution 2 propose un niveau de volatilité assez faibleen comparaison avec le triangle incomplet ou la solution 1 (la figure 4.11).

Figure 4.11. – Comparaison du niveau de volatilité par type de solution par rapport à lavolatilité de l’EIOPA

Afin de mieux comprendre les résultats proposés selon le triangle incomplet, la solution 1 etla solution 2, nous avons comparé ces résultats avec les niveaux de volatilité proposés parl’EIOPA dans le cadre de l’utilisation des USP. En effet, la branche automobile et responsabi-lité civile font partie de la ligne d’activité "Réassurance accident non proportionnelle" définipar l’EIOPA dans la directive Réglementaire Solvabilité II. La branche maritime fait partiede la branche "Réassurance maritime, aérienne et transport non proportionnel". L’EIOPApropose un niveau de volatilité de 20% pour les trois branches qui reste assez élevé dans lecas d’un business en Run-Off.

98

Page 104: Modélisation du risque de réserve en business Run-Off sous ...

4. Risque de réserve

Le fait de calculer un capital réglementaire pour le portefeuille ISAR basé sur un niveaude volatilité de 20% obligera la compagnie qui détient le business en Run-Off d’allouerplus de capital pour des branches d’activité moins risquées. En combinant l’approche dereconstruction du triangle de liquidation et la méthode de Merz & Wütrich nous avons réussià estimer un niveau de volatilité assez cohérent avec les types d’activité dans le portefeuille.

Backtesting des résultats

Afin de vérifier la validité des résultats obtenus il est nécessaire d’effectuer un backtestingdes résultats. L’idée du backtesting consiste à prendre un triangle de liquidation d’un por-tefeuille complet, puis supprimer des diagonales supérieures du triangle afin de simuler laproblématique des données incomplètes.

Une fois le biais d’information est créé au niveau du triangle, la deuxième étape consiste àreconstruire le triangle avec la méthode d’imputation définie (chapitre 3). Pour comprendrel’impact de la solution 2 sur les montants IBNR estimés, nous avons comparé les IBNR etles CoV dans le cas du triangle complet, incomplet et reconstruit. Pour ce faire, nous avonschoisi trois triangles de liquidation (Branche 1, Branche 2, Branche 3) du portefeuille AXARe géré en Run-Off.

Figure 4.12. – Backtesting - Comparaison du montant ultimes et IBNR estimés parbranche et loi de probabilité

Dans la figure 4.12, nous remarquons que les montants IBNR estimés dans le cas du triangleincomplet sont parfois supérieurs à ceux du triangle original (Branche 3) et dans d’autres casinférieurs (Branche 1 et 2). Ceci montre qu’en cas de triangle de liquidation avec donnéesincomplètes, les réserves estimées peuvent être sousestimées et sur-estimées. En introdui-sant la solution de reconstruction du triangle de liquidation, les montants IBNR estimés denouveau s’approchent du cas du triangle original.

99

Page 105: Modélisation du risque de réserve en business Run-Off sous ...

4.5. Mise en pratique

Triangle Branche 1 Branche 2 Branche 3Incomplet �57% �40% 643%

Reconstruit 26% 30% 156%

Table 4.3. – Pourcentage d’écart des montants d’IBNR par rapport au triangle originalpar type de triangle et branche

L’introduction d’un biais d’information dans le triangle de liquidation peut induire des grandsécarts au niveau d’estimation des montants IBNR. Cette hypothèse est confirmée par lesrésultats du tableau 4.3. Par exemple au niveau de la branche 3, le montant d’IBNR estpassé de 5.75 Me à 42.20 Me avec une variation de plus de 600%. Par contre les montantsIBNR des branches 1 et 2 ont subi une baisse de plus de 50%. En appliquant la solutionde reconstruction probabiliste du triangle de liquidation, l’écart sur les montants IBNRest largement réduit pour les quatre branches. En plus de cela, la méthode est prudentepuisqu’elle projette plus d’IBNR par rapport au cas du triangle original comme montre legraphe 4.12.

Figure 4.13. – Comparaison du CoV par branche d’activité

Le graphe 4.13 nous permet de comparer le niveau de volatilité estimé pour le triangle initialavec le cas incomplet et celui estimé par la solution 2. Il semble que le fait d’introduire unbiais d’information dans le triangle de liquidation impactera beaucoup le niveau de volatilitéestimée à l’horizon d’un an. En effet, pour la branche 1 nous estimerons un CoV de 8, 7%

pour notre triangle initial contre 50% en cas du triangle incomplet. Pareil pour les deuxautres branches 2 et 3 nous estimerons un CoV élevé pour le cas incomplet. L’imputationdu triangle (Solution 2) nous a permis de se rapprocher du niveau de volatilité estimé dutriangle original.

100

Page 106: Modélisation du risque de réserve en business Run-Off sous ...

4. Risque de réserve

4.6. Conclusion

L’estimation des volatilités du risque de réserve exige en premier lieu des données plus fiablesavec un historique de données complet. En combinant le modèle de Merz & Wûtrich et lessolutions apportées aux données incomplètes, nous avons pu estimer des niveaux de volatilitéscohérentes. L’utilisation de techniques de maching learning et d’apprentissage statistiquepeuvent en d’autres termes pallier les problèmes de données manquantes. Ainsi, les solutionsproposés ont minimisé l’erreur due au biais de données incomplètes en approchant davantagela réalité des scénarios, surtout la solution d’imputation des données manquantes.

101

Page 107: Modélisation du risque de réserve en business Run-Off sous ...

102

Page 108: Modélisation du risque de réserve en business Run-Off sous ...

Chapitre 5Conclusion

Le présent travail propose une approche d’estimation du risque de réserve en tenant encompte de la problématique des données incomplètes dans un contexte de Run-Off. Durantles différentes étapes d’analyse nous avons essayé de comprendre l’impact des données man-quantes sur les techniques de provisionnement en Run-Off (méthode de Chain Ladder etMack). Il s’est avéré que le manque des données sur des triangles de charge sinistre a desrépercussions importantes lors de l’estimation de la charge ultime. Particulièrement, lorsqueles branches d’activité ont un développement long comme notre cas en réassurance, le capitalde réserve alloué peut être très important.

L’aspect des données incomplètes représente une contrainte devant l’estimation du risque deréserve. Néanmoins, nous avons mené une réflexion sur la manière d’adapter le modèle deMerz & Wütrich qui estime le risque de réserve à l’horizon d’un an avec des données incom-plètes. En combinant le modèle de Merz & Wûtrich et les solutions apportées aux donnéesincomplètes, nous avons pu estimer des niveaux de volatilités cohérentes. L’utilisation detechniques de maching learning et d’apprentissage statistique peuvent en d’autres termespallier les problèmes de données manquantes. Ainsi, les solutions proposés ont minimisé l’er-reur due au biais de données incomplètes en approchant davantage la réalité des scénarios,surtout la solution d’imputation des données manquantes.

Les résultats obtenus ont été confirmé par un backtesting appliqué sur un portefeuille dugroupe Axa géré en Run-Off et ne présentant pas le problème des données manquantes. Lebacktesting, nous a permis de simuler la problématique des données incomplètes et suivreanalytiquement les implications sur l’allure du développement de la charge encourue, l’esti-mation de la charge à l’ultime et l’estimation de la volatilité.

103

Page 109: Modélisation du risque de réserve en business Run-Off sous ...

104

Page 110: Modélisation du risque de réserve en business Run-Off sous ...

A.1. Exemple de triangle de règlements incomplet

Annexes

A.1. Exemple de triangle de règlements incomplet

Figure A.1. – Exemple de triangle incomplet - Branche automobile non proportionnelle106

Page 111: Modélisation du risque de réserve en business Run-Off sous ...

A.2. Développement de la charge encourue (incurred)

par branche

Figure A.2. – Développement de la charge encourue (incurred) pour la brancheresponsabilité civile par année de souscription

Figure A.3. – Développement de la charge encourue (incurred) pour la branche maritimepar année de souscription

Page 112: Modélisation du risque de réserve en business Run-Off sous ...

108

Page 113: Modélisation du risque de réserve en business Run-Off sous ...

Bibliographie

Biau, G., Devroye, L. et Lugosi, G. (2008). Consistency of random forests and otheraveraging classifiers. Journal of Machine Learning Research, 9(Sep):2015–2033. (cite p.68)

Breiman, L. (2001). Random forests. Machine learning, 45(1):5–32. (cite p. 68)

Brence, M. J. R. et Brown, D. E. (2006). Improving the robust random forest regres-sion algorithm. Systems and Information Engineering Technical Papers, Department ofSystems and Information Engineering, University of Virginia. (cite p. 68)

Buuren, S. et Groothuis-Oudshoorn, K. (2011). mice : Multivariate imputation bychained equations in r. Journal of statistical software, 45(3). (cite p. 74)

Cleveland, W. S. et Devlin, S. J. (1988). Locally weighted regression : an approachto regression analysis by local fitting. Journal of the American Statistical Association,83(403):596–610. (cite p. 61)

Eling, M. et Schaper, P. (2016). Run-off 2016 : The status quo and future relevance ofrun-off in the german-speaking non-life insurance market. (cite p. 16)

Gordon, A. D. (1999). Classification, (chapman & hall/crc monographs on statistics &applied probability). (cite p. 50)

Gower, J. C. (1967). A comparison of some methods of cluster analysis. Biometrics, pages623–637. (cite p. 53)

Grzymala-Busse, J. W., Grzymala-Busse, W. J. et Goodwin, L. K. (2001). Copingwith missing attribute values based on closest fit in preterm birth data : A rough setapproach. Computational Intelligence, 17(3):425–434. (cite p. 61)

Harrell Jr, F. E., with contributions from Charles Dupont et many others. (2017).Hmisc : Harrell Miscellaneous. R package version 4.0-3. (cite p. 54)

109

Page 114: Modélisation du risque de réserve en business Run-Off sous ...

Hartigan, J. A. et Wong, M. A. (1979). Algorithm as 136 : A k-means clustering algorithm.Applied statistics, pages 100–108. (cite p. 57)

Hastie, T., Tibshirani, R., Sherlock, G., Eisen, M., Brown, P. et Botstein, D.(1999). Imputing missing data for gene expression arrays. (cite p. 61)

Ilan HABIB, S. R. (2012). Quelle méthode de provisionnement pour des engagementsnon-vie dans Solvabilité 2. Mémoire d’actuaire. (cite p. 31)

L. Breiman, A. C. (2008). Random forests. University of California Berkeley. (cite p. 68)

Little, R. J. et Rubin, D. B. (1989). The analysis of social science data with missingvalues. Sociological Methods & Research, 18(2-3):292–326. (cite p. 62)

Mack, T. (1993). Distribution-free calculation of the standard error of chain ladder reserveestimates. Astin bulletin, 23(02):213–225. (cite p. 35, 38 et 89)

MacQueen, J. et al. (1967). Some methods for classification and analysis of multivariateobservations. In Proceedings of the fifth Berkeley symposium on mathematical statisticsand probability, volume 1, pages 281–297. Oakland, CA, USA. (cite p. 57)

Maechler, M., Rousseeuw, P., Struyf, A., Hubert, M. et Hornik, K. (2016). cluster :Cluster Analysis Basics and Extensions. R package version 2.0.5 — For new features, seethe ’Changelog’ file (in the package source). (cite p. 59)

Murtagh, F. et Legendre, P. (2014). Ward’s hierarchical agglomerative clustering me-thod : Which algorithms implement ward’s criterion ? Journal of Classification, 31(3):274–295. (cite p. 53)

Oba, S., Sato, M.-a., Takemasa, I., Monden, M., Matsubara, K.-i. et Ishii, S. (2003). Abayesian missing value estimation method for gene expression profile data. Bioinformatics,19(16):2088–2096. (cite p. 70)

Pantanowitz, A. et Marwala, T. (2008). Evaluating the impact of missing data impu-tation through the use of the random forest algorithm. arXiv preprint arXiv :0812.2412.(cite p. 68)

Preda, C., Saporta, G. et MBAREK, M. H. B. H. (2010). The nipals algorithm formissing functional data. REV. ROUMAINE MATH. PURES APPL, 55(4):315–326. (citep. 61)

Qi, Y., Klein-Seetharaman, J. et Bar-Joseph, Z. (2005). Random forest similarity forprotein-protein interaction prediction from multiple sources. In Pacific Symposium onBiocomputing. Pacific Symposium on Biocomputing, pages 531–542. (cite p. 68)

Page 115: Modélisation du risque de réserve en business Run-Off sous ...

Schmidt, K. D. et Zocher, M. (2007). The bornhuetter-ferguson principle. Techn. Univ.,Inst. für Mathematische Stochastik. (cite p. 35)

Sen, D. (2015). Working with asbestos and the possible health risks. Occupational Medicine,65(1):6–14. (cite p. 24)

Shah, A. D., Bartlett, J. W., Carpenter, J., Nicholas, O. et Hemingway, H. (2014).Comparison of random forest and parametric imputation models for imputing missing datausing mice : a caliber study. American journal of epidemiology, 179(6):764–774. (cite p.74)

Smyth, G., Hu, Y., Dunn, P., Phipson, B. et Chen, Y. (2016). statmod : StatisticalModeling. R package version 1.4.24. (cite p. 54)

Sokal, R. R. (1958). A statistical method for evaluating systematic relationships. UnivKans Sci Bull, 38:1409–1438. (cite p. 53)

Sørensen, T. (1948). {A method of establishing groups of equal amplitude in plant sociologybased on similarity of species and its application to analyses of the vegetation on Danishcommons}. Biol. Skr., 5:1–34. (cite p. 53)

Stekhoven, D. J. et Buehlmann, P. (2012). Missforest - non-parametric missing valueimputation for mixed-type data. Bioinformatics, 28(1):112–118. (cite p. 70)

Stekhoven, D. J. et Bühlmann, P. (2011). Missforest—non-parametric missing valueimputation for mixed-type data. Bioinformatics, 28(1):112–118. (cite p. 68)

Stekhoven, D. J. et Bühlmann, P. (2012). Missforest—non-parametric missing valueimputation for mixed-type data. Bioinformatics, 28(1):112–118. (cite p. 61)

Tang, F. et Ishwaran, H. (2017). Random forest missing data algorithms. StatisticalAnalysis and Data Mining : The ASA Data Science Journal. (cite p. 69)

Tufféry, S. (2010). Data mining et statistique décisionnelle : l’intelligence des données.Editions Technip. (cite p. 50)

Ward, J. (1963). Hierarchical grouping to optimize an objective function j am stat assoc58 : 236–244. Find this article online. (cite p. 53)

Wüthrich, M., Merz, M., Bühlmann, H., De Felice, M., Gisler, A. et Moriconi,F. (2008). Modelling the claims development result for solvency purposes. In CasualtyActuarial Society E-Forum, pages 542–568. (cite p. 35, 88 et 89)

Page 116: Modélisation du risque de réserve en business Run-Off sous ...

112

Page 117: Modélisation du risque de réserve en business Run-Off sous ...
Page 118: Modélisation du risque de réserve en business Run-Off sous ...

Titre : Modélisation du risque de réserve en business Run-Off sous contrainte des données incomplètes

Mots clefs : Données incomplètes, Random Forest , Provisionnement, Merz & Wûtrich

Résumé : L’objectif de ce mémoire d’actuariat est

l’estimation des niveaux de volatilités du risque de

réserve pour des branches de réassurance avec un his-

torique incomplet. Le manque de données s’apparente

aux non transferts d’une partie d’historique des don-

nées liées à un portefeuille de réassurance en Run-Off.

Le présent travail s’articule autour de quatre cha-

pitres qui détaillent le problème des données, ana-

lysent leur impact sur le provisionnement et l’estima-

tion du risque de réserve, puis proposent des solu-

tions. Dans un premier temps nous avons donné un

aperçu du marché du Run-Off, son positionnement

par rapport au marché assurantiel et son aspect ré-

glementaire. Ensuite nous avons analysé comment le

manque d’historique sur des triangles de liquidation

peut impacter l’estimation de la charge ultime et le

niveau du risque de réserve à l’horizon d’un an. Le

risque de réserve est calibré en utilisant le modèle de

Merz & Wûtrich. Ainsi, nous avons combiné des so-

lutions des données incomplètes avec l’estimation de

l’incertitude à l’horizon d’un an. La première solu-

tion consiste à séparer le triangle de liquidation de la

charge sinistre (incurred) en deux sous triangles selon

les années de souscription. Le choix de l’année qui sé-

pare le triangle en deux sous triangles est justifié par

une technique de clustering. Ensuite nous allons esti-

mer le risque de réserve sur chacun des deux sous tri-

angles puis agréger les deux niveaux de volatilité. La

deuxième solution consiste à reconstruire le triangle

de liquidation a priori en injectant des montants si-

mulés selon des techniques de maching learning (Miss-

Forest). Ces résultats ont été mis à l’épreuve par un

backtesting qui simule ce même problème des don-

nées sur un triangle complet d’un autre portefeuille.

Après, nous avons appliqué les deux approches adop-

tées et comparer les résultats obtenus pour les diffé-

rents scénarios: triangle complet, triangle incomplet

et triangle reconstruit.

Title : Modelling of the reserving risk in business Run-Off under constraint of the incomplete data

Keywords : Incomplete data, Random Forest, Reserving, Merz & Wûtrich

Abstract : The objective of this actuarial report is

to estimate the volatility levels of the reserve risk for

reinsurance branches with an incomplete history. The

lack of data is due to non-transfers of part of histo-

rical data related to a reinsurance portfolio in Run-

Off. This work focuses on four chapters that detail

the data file, analyzing their involvement in provi-

sioning and estimating the reserve risk, then propose

solutions. As a first step, we are able to get an over-

view of the Run-Off market, its position in relation to

the insurance market and its regulatory aspect. Then

we analyzed how the lack of history on the liquidation

triangles can impact the estimate of the ultimate load

and the level of reserve risk over the one-year horizon.

The reserve risk is spread out using the Merz & Wür-

trich model. Thus, we combined incomplete data so-

lutions with the estimation of uncertainty over a one-

year horizon. The first solution consists in separating

the liquidation triangle from the claims expenses into

two sub-triangles according to the subscription years.

The choice of the year in which we split the triangle in

two under triangles is justified by a technique of clus-

tering. Then we will estimate the reserve risk on each

of the two sub-triangles and aggregate the two levels

of volatility. The second solution consists in recons-

tructing the incurred triangle by injecting simulated

amounts according to machin learning method (Miss-

Forest). Thus, we simulated several incurred triangles

and for each triangle we estimate the corresponding

level of volatility, then we calculate the average vo-

latility. These results are backtested by simulating a

generic scenario of incomplete data on a complete tri-

angle of another portfolio. Afterwards, we have ap-

plied the two approaches adopted and compare the

results obtained for the different scenarios: complete

triangle, incomplete triangle and imputed triangle.