Nouveaux modèles de mutualisation (Olivier Lopez) - SGT2 BigData - Institut des Actuaires

20
B IG DATA SGT2 NOUVEAUX MOD ` ELES DE MUTUALISATION Olivier Lopez Ensae Paris-Tech & Crest-Ensae, Laboratoire de Finance et d’Assurance, Centre d’Etudes Actuarielles Maison des actuaires, 11 mars 2014 O. LOPEZ (CREST ENSAE) BIG DATA SGT2 11 MARS 2014 1 / 18

description

www.actuaires-bigdata.fr

Transcript of Nouveaux modèles de mutualisation (Olivier Lopez) - SGT2 BigData - Institut des Actuaires

Page 1: Nouveaux modèles de mutualisation (Olivier Lopez) - SGT2 BigData - Institut des Actuaires

BIG DATA SGT2NOUVEAUX MODELES DE MUTUALISATION

Olivier Lopez

Ensae Paris-Tech & Crest-Ensae, Laboratoire de Finance et d’Assurance,Centre d’Etudes Actuarielles

Maison des actuaires, 11 mars 2014

O. LOPEZ (CREST ENSAE) BIG DATA SGT2 11 MARS 2014 1 / 18

Page 2: Nouveaux modèles de mutualisation (Olivier Lopez) - SGT2 BigData - Institut des Actuaires

INTRODUCTION

Modele economique de l’assurance : repose sur la mutualisation,la solidarite.La population etant constituee de profils de risques heterogenes,les modeles de tarification reposent sur un equilibre entre uneprevision la plus fine possible du risque individuel, et uneexperience collective du risque.Cette prediction du risque est effectuee a partir decaracteristiques mesurees sur l’individu (sinistres passes, age,categorie socio-professionnelle...)Big Data : opportunite d’acceder a un nombre gigantesque devariables qui permettraient d’acceder a une meilleureconnaissance du risque.

O. LOPEZ (CREST ENSAE) BIG DATA SGT2 11 MARS 2014 2 / 18

Page 3: Nouveaux modèles de mutualisation (Olivier Lopez) - SGT2 BigData - Institut des Actuaires

OBSTACLES, QUESTIONS POSEES

Cette utopie (connaissance ”parfaite” du risque de chaqueindividu) est-elle realisable, et si oui, en quelle mesure, de quellemaniere ?Le modele sur lequel elle deboucherait est-il viable ?Le principe de mutualisation sera-t-il toujours respecte ?

O. LOPEZ (CREST ENSAE) BIG DATA SGT2 11 MARS 2014 3 / 18

Page 4: Nouveaux modèles de mutualisation (Olivier Lopez) - SGT2 BigData - Institut des Actuaires

REPONSE DIFFERENCIEE

Le ”Big Data” recouvre des situations variees et cesproblematiques peuvent trouver des reponses differentes suivantles differents contextes.Differents contextes auxquels on peut penser (liste nonexhaustive) :

Assurance auto (”pay as you drive”)Assurance sante (”pay as you live”)Assurance habitation (”pay as you own”)Souscription en ligne (frontiere avec le marketing ?)

O. LOPEZ (CREST ENSAE) BIG DATA SGT2 11 MARS 2014 4 / 18

Page 5: Nouveaux modèles de mutualisation (Olivier Lopez) - SGT2 BigData - Institut des Actuaires

PLAN DE LA PRESENTATION

1 DIFFICULTES METHODOLOGIQUES ET NOUVEAUX OUTILS

2 VIABILITE DU SYSTEME

3 DERIVES EVENTUELLES

O. LOPEZ (CREST ENSAE) BIG DATA SGT2 11 MARS 2014 5 / 18

Page 6: Nouveaux modèles de mutualisation (Olivier Lopez) - SGT2 BigData - Institut des Actuaires

DIFFICULTES METHODOLOGIQUES ET NOUVEAUX OUTILS

PLAN DE LA PRESENTATION

1 DIFFICULTES METHODOLOGIQUES ET NOUVEAUX OUTILS

2 VIABILITE DU SYSTEME

3 DERIVES EVENTUELLES

O. LOPEZ (CREST ENSAE) BIG DATA SGT2 11 MARS 2014 6 / 18

Page 7: Nouveaux modèles de mutualisation (Olivier Lopez) - SGT2 BigData - Institut des Actuaires

DIFFICULTES METHODOLOGIQUES ET NOUVEAUX OUTILS

DONNEES DE GRANDE DIMENSION

Incorporer plus de variables permet d’avoir un modele en theorieplus proche de la realite.Mais si le nombre de parametres est trop important, leurestimation sera tres mauvaise et l’approche se trouveracontre-productive.Necessite de prendre en compte des methodes statistiquesrecentes basees sur la reduction de dimension, la parcimonie etc.Methodes de machine learning: permettre d’envisager desmodeles moins lineaires que les modeles classiques.

O. LOPEZ (CREST ENSAE) BIG DATA SGT2 11 MARS 2014 7 / 18

Page 8: Nouveaux modèles de mutualisation (Olivier Lopez) - SGT2 BigData - Institut des Actuaires

DIFFICULTES METHODOLOGIQUES ET NOUVEAUX OUTILS

PLUSIEURS FACONS D’ETRE ”BIG”

Formalisation mathematique sommaire :Y = ce qu’on veut predire (generalement cout de l’assure)X = caracteristiques d’un individu (contient toute l’informationdisponible), X ∈ Rd .

But : estimer E [Y |X ] (i.e. prediction de la valeur de Y a partir del’information donnee par X .

Pour l’estimer on dispose d’observations (Y1,X1, ...,Yn,Xn).

Big data version 1 : n est raisonnable, d est enorme.Big data version 2 : n est egalement enorme.

O. LOPEZ (CREST ENSAE) BIG DATA SGT2 11 MARS 2014 8 / 18

Page 9: Nouveaux modèles de mutualisation (Olivier Lopez) - SGT2 BigData - Institut des Actuaires

DIFFICULTES METHODOLOGIQUES ET NOUVEAUX OUTILS

DIFFERENCES DE PROBLEMATIQUES (EXEMPLES)

Premier cas : (n raisonnable, d >> 1) les donnees proviennentd’un portefeuille d’assures comportant n individus, sur lesquels ona recupere des caracteristiques diverses et nombreuses.Dans ce cas, la quantite d’information disponible sur un individuest ”superieure” a la quantite d’information dont on dispose pourcalibrer et/ou valider le modele.Necessite de faire le tri entre information pertinente et moinspertinente.Deuxieme cas : (n >> 1, d >> 1) on peut s’autoriser desmodeles plus compliques, car on dispose de plus d’observationspour les valider. Mais on peut buter sur des problematiques detemps de calcul.

O. LOPEZ (CREST ENSAE) BIG DATA SGT2 11 MARS 2014 9 / 18

Page 10: Nouveaux modèles de mutualisation (Olivier Lopez) - SGT2 BigData - Institut des Actuaires

DIFFICULTES METHODOLOGIQUES ET NOUVEAUX OUTILS

DIFFERENCES DE PROBLEMATIQUES (EXEMPLES)

Premier cas : (n raisonnable, d >> 1) les donnees proviennentd’un portefeuille d’assures comportant n individus, sur lesquels ona recupere des caracteristiques diverses et nombreuses.Dans ce cas, la quantite d’information disponible sur un individuest ”superieure” a la quantite d’information dont on dispose pourcalibrer et/ou valider le modele.Necessite de faire le tri entre information pertinente et moinspertinente.Deuxieme cas : (n >> 1, d >> 1) on peut s’autoriser desmodeles plus compliques, car on dispose de plus d’observationspour les valider. Mais on peut buter sur des problematiques detemps de calcul.

O. LOPEZ (CREST ENSAE) BIG DATA SGT2 11 MARS 2014 9 / 18

Page 11: Nouveaux modèles de mutualisation (Olivier Lopez) - SGT2 BigData - Institut des Actuaires

DIFFICULTES METHODOLOGIQUES ET NOUVEAUX OUTILS

DIFFERENCES DE PROBLEMATIQUES (EXEMPLES)

Premier cas : (n raisonnable, d >> 1) les donnees proviennentd’un portefeuille d’assures comportant n individus, sur lesquels ona recupere des caracteristiques diverses et nombreuses.Dans ce cas, la quantite d’information disponible sur un individuest ”superieure” a la quantite d’information dont on dispose pourcalibrer et/ou valider le modele.Necessite de faire le tri entre information pertinente et moinspertinente.Deuxieme cas : (n >> 1, d >> 1) on peut s’autoriser desmodeles plus compliques, car on dispose de plus d’observationspour les valider. Mais on peut buter sur des problematiques detemps de calcul.

O. LOPEZ (CREST ENSAE) BIG DATA SGT2 11 MARS 2014 9 / 18

Page 12: Nouveaux modèles de mutualisation (Olivier Lopez) - SGT2 BigData - Institut des Actuaires

DIFFICULTES METHODOLOGIQUES ET NOUVEAUX OUTILS

MANIPULATION DES MODELES OBTENUS

Le contexte Big Data offre la possibilite de produire des modelesavec un grand degre de complexite.Adequation des modeles ?Comment trouver un compromis entre cette volonte de produireun modele suffisamment proche d’une realite complexe, etsuffisamment proche pour permettre un pilotage, une analyse etc.Attitude des souscripteurs ? (hors question de la souscription enligne)Une piste : construction d’indicateurs synthetiques etcomprehensibles a partir de donnees riches.

O. LOPEZ (CREST ENSAE) BIG DATA SGT2 11 MARS 2014 10 / 18

Page 13: Nouveaux modèles de mutualisation (Olivier Lopez) - SGT2 BigData - Institut des Actuaires

VIABILITE DU SYSTEME

PLAN DE LA PRESENTATION

1 DIFFICULTES METHODOLOGIQUES ET NOUVEAUX OUTILS

2 VIABILITE DU SYSTEME

3 DERIVES EVENTUELLES

O. LOPEZ (CREST ENSAE) BIG DATA SGT2 11 MARS 2014 11 / 18

Page 14: Nouveaux modèles de mutualisation (Olivier Lopez) - SGT2 BigData - Institut des Actuaires

VIABILITE DU SYSTEME

EFFET HIRSHLEIFER

Dans un monde ou la connaissance du risque de chaque individuest parfaite, les bons risques quittent le navire (depart vers uneconcurrence qui aurait une longueur d’avance).Asymetrie d’information : on peut imaginer que seul l’assureurpossede la connaissance du risque, l’assure n’ayant qu’une visionplus vague de son propre risque.Risque de desequilibre : l’assure va vite apprendre a connaıtreson propre risque en utilisant les memes outils que l’assureur(quitte a passer par un intermediaire).Dans un tel contexte, la recherche d’une meilleure connaissancedu risque individuel aboutit a une position plus dangereuse del’assureur en deteriorant son resultat suite au depart des bonsrisques.

O. LOPEZ (CREST ENSAE) BIG DATA SGT2 11 MARS 2014 12 / 18

Page 15: Nouveaux modèles de mutualisation (Olivier Lopez) - SGT2 BigData - Institut des Actuaires

VIABILITE DU SYSTEME

PERTINENCE DES MODELES

Comment ”backtester” la pertinence des variables retenues pourpredire le risque ?Sante : l’utilisation d’objet connectes permet de mesurer desconstantes que les medecins peuvent interpreter.Pay as you drive : on peut sans doute trouver un lien entre lesvariables rendant compte du comportement du conducteur et lerisque qu’il ait un accident.Souscription en ligne : sans doute plus problematique car

1 les variables collectees sur l’assure eclairent-elles le risque ?2 probleme d’un risque qui peut se produire sur un temps long,

evalue a partir de variables qui peuvent evoluer en un temps court.

O. LOPEZ (CREST ENSAE) BIG DATA SGT2 11 MARS 2014 13 / 18

Page 16: Nouveaux modèles de mutualisation (Olivier Lopez) - SGT2 BigData - Institut des Actuaires

VIABILITE DU SYSTEME

ASSURANCE PARAMETRIQUE

Principe : l’assurance porte sur un parametre dont on estime qu’ila un lien avec un element contre lequel l’assure souhaite seproteger.Exemple : si la quantite de pluie tombant dans une zone depasseun certain seuil, on verse un capital a une collectivite locale pourindemniser les eventuels sinistres.Dans l’exemple precedent, l’indemnisation ne tient pas comptedes degats reels lies a un episode de pluies torrentielles.Avantage : l’assureur maıtrise mieux son risque, puisqu’il peut lefaire porter sur un parametre sur lequel il a une meilleure maıtrise.Inconvenient : sous quelles conditions l’assure est-il pret a jouerle jeu ? Que se passe-t-il si le parametre est trop loin despreoccupations de l’assure ?

O. LOPEZ (CREST ENSAE) BIG DATA SGT2 11 MARS 2014 14 / 18

Page 17: Nouveaux modèles de mutualisation (Olivier Lopez) - SGT2 BigData - Institut des Actuaires

DERIVES EVENTUELLES

PLAN DE LA PRESENTATION

1 DIFFICULTES METHODOLOGIQUES ET NOUVEAUX OUTILS

2 VIABILITE DU SYSTEME

3 DERIVES EVENTUELLES

O. LOPEZ (CREST ENSAE) BIG DATA SGT2 11 MARS 2014 15 / 18

Page 18: Nouveaux modèles de mutualisation (Olivier Lopez) - SGT2 BigData - Institut des Actuaires

DERIVES EVENTUELLES

UTILISATION DU BIG DATA POUR CONTOURNER LA

LEGISLATION

Le legislateur interdit l’utilisation de certaines variablesdiscriminantes.Une tentation est d’essayer de reconstruire, via l’informationdisponible sur l’individu, des caracteristiques auxquelles on n’apas le droit d’acceder, pour ensuite etre a meme de les utiliser.Peut porter atteinte au principe de mutualisation et de solidariteen excluant des categories de population de l’assurance, ou enmajorant leur prime sur des criteres qui ne sont pas souhaitables.Attitude face a de telles pratiques ? Detection de telscomportements ? Consequences pour l’ensemble du marche ?

O. LOPEZ (CREST ENSAE) BIG DATA SGT2 11 MARS 2014 16 / 18

Page 19: Nouveaux modèles de mutualisation (Olivier Lopez) - SGT2 BigData - Institut des Actuaires

DERIVES EVENTUELLES

EXCES DE CONFIANCE

Aussi precise que peuvent etre les methodes utilisees, lasurvenance d’un sinistre reste un element aleatoire.La variabilite du resultat est d’autant plus grandes que les classesde risque obtenues sont petites.On peut imaginer que les resultats dans chacune de ces pochesfinissent par se compenser, mais ceci est loin d’etre evident(notamment si on imagine des classes de risques petites ou lesentrees-sorties peuvent etre importantes vis-a-vis de l’effectifgeneral).Si l’assureur possede une confiance excessive en ses modeles dufait de la quantite d’information qu’il aura utilisee pour lesconstruire, il ne se couvrira pas suffisamment contre des mauvaisresultats.

O. LOPEZ (CREST ENSAE) BIG DATA SGT2 11 MARS 2014 17 / 18

Page 20: Nouveaux modèles de mutualisation (Olivier Lopez) - SGT2 BigData - Institut des Actuaires

DERIVES EVENTUELLES

OBJECTIFS DU SGT2

Identifier les outils pertinents pour :1 saisir l’opportunite du Big Data et ameliorer la connaissance et le

suivi de son risque par l’assureur;2 tenir compte des contraintes qui permettent d’aboutir a un systeme

de mutualisation viable.

Formaliser scientifiquement aussi precisement que possible lesattentes des acteurs de l’assurance face au Big Data pourproposer des pistes de resolution de leurs problematiques.Anticiper l’impact des evolutions techniques sur le marche etreciproquement.

O. LOPEZ (CREST ENSAE) BIG DATA SGT2 11 MARS 2014 18 / 18