Rapport

79
ROYAUME DU MAROC *-*-*-*-* PREMIER MINISTRE *-*-* HAUT COMMISSARIAT AU PLAN *-*-*-*-*-*-*-* INSTITUT NATIONAL DE STATISTIQUE ET D’ECONOMIE APPLIQUEE RAPPORT STAGE D’APPLICATION ***** Préparé par : Mouhammed MARIANE Omar MZIOUD Sous la direction de : Mr Abderrahim CHAFFAI (XXXX) Détermination des facteurs tarifaires RC Automobile au sein d’une compagnie d’assurance et mise en question des termes de la réglementation.

description

Analyse factorielle discriminante (AFD), Analyse en composantes principales (ACP), Analyse des correspondances multiples (ACM), Arbres de decision et classification . Mariane Mouhammed , INSEA

Transcript of Rapport

ROYAUME DU MAROC *-*-*-*-* PREMIER MINISTRE *-*-* HAUT COMMISSARIAT AU PLAN *-*-*-*-*-*-*-*

INSTITUT NATIONAL DE STATISTIQUE ET DECONOMIE APPLIQUEE

RAPPORT STAGE DAPPLICATION*****Dtermination des facteurs tarifaires RC Automobile au sein dune compagnie dassurance et mise en question des termes de la rglementation.

Prpar par : Mouhammed MARIANESous la direction de : Mr Abderrahim CHAFFAI (XXXX)

Omar MZIOUD

Anne universitaire

2005/2006

DEDICACE

2

PlanI. Introduction gnrale II.Phase de prsentation : II.PhaseII-1- Prsentation de Xxxx compagnie Marocaine Dassurance : II-1-1 Historique II-1-2 Organigramme II-1-3 Rsultats et performances : Rsultats du Groupe Xxxx Financial Services Rsultats de Xxxx Compagnie Marocaine dAssurances : Les charges Les produits de placements La marge de solvabilit Les rsultats II-2- Prsentation du sujet et problmatique

III.Phase pratique : III.Phase

III-1- Prsentation de la base de donnes III-2- Analyse facteurs fixes et validation III-2-1 Analyse individuelle des facteurs : - Logique de larbre de dcision - Analyse sur le facteur Permis - Analyse sur le facteur Age - Analyse sur le facteur Mise en circulation (Mec) - Analyse sur le facteur Carburant - Analyse sur le facteur Sexe - Analyse sur le facteur Puissance fiscale (P.F) - Analyse sur le facteur Rgion III-2-2Analyse factorielle discriminante (AFD) - Introduction - Analyse des correspondances multiples (ACM) sur les variables qualitatives - Analyse Factorielle discriminante (AFD): a- Validit de ltude b- Dtermination des fonctions de classement c- Jugement de la qualit de reprsentation du modle III-3- Analyse facteurs multiples : III-3-1 Analyse en composantes principales (ACP) III-3-2 Analyse des correspondances multiples (ACM) III-3-3 Analyse globale des facteurs

IV.Conclusion IV.Conclusion V.Annexe V.Annexe3

VI.Bibliographie. VI.Bibliographie.

I . Introduction gnrale

4

Louverture du march marocain de lassurance constitue un important dfi quil faudra relever. Il sagit l dune opportunit quil faut saisir pour la modernisation et le renforcement de ce march. Cette ouverture sinscrit non seulement dans le cadre du renforcement dune conomie nationale ouverte et efficiente, mais aussi dans celui de louverture du Maroc sur le march international, conformment ses engagements au niveau multilatral, rgional et bilatral. Ainsi, par l'approbation de nouveaux textes, le secteur des assurances sera dot d'un dispositif lgal et rglementaire moderne et totalement rnov, apte faire face aux dfis relevs. Cet effort de mise niveau du cadre lgal de lindustrie de lassurance au Maroc, resterait cependant, inachev s'il n'est pas scrupuleusement respect aussi bien par les oprateurs que par l'autorit charge d'exercer le contrle. Pour la question des tarifs dassurances, il y a lieu de rappeler que leur libralisation intgrale aura lieu en juillet 2006 tout en imposant des critres de tarification bien dtermins, une telle libralisation nest quune phase transitoire vers une libralisation totale du march des assurances. Et cest dans cette perspective que notre travail a vu le jour pour mieux apprhender les variables tarifaires, et voir si les critres dicts par la rglementation ne constituent pas une sorte dinjustice envers les assurs et les compagnies dassurances. Le prsent travail contient deux grandes parties. La premire partie consiste en une prsentation de lorganisme accueillant ainsi quune prsentation du sujet et de la problmatique. Quant la deuxime partie, est dcompose en deux sous parties, la premire consiste en une analyse facteurs fixes en utilisant les deux outils statistiques : la classification individuelle des facteurs via le logiciel Answer tree, et lanalyse factorielle discriminante via la Macro XlStat Pro ; tandis que la deuxime consiste en une analyse facteurs multiples en utilisant les trois outils statistiques : lanalyse en composantes principales et lanalyse des correspondances multiples via la Macro XlStat Pro et enfin la classification globale des facteurs via le logiciel Answer tree.5

II. Phase de prsentation

6

II.1 Prsentation de Xxxx Compagnie Marocaine dAssurances (ZCMA)La prsentation de Xxxx Compagnie Marocaine dAssurances constitue une tape indispensable dans le prsent rapport pour plusieurs motifs, notamment, comprendre lorganisation du personnel au sein de la compagnie et apprhender la situation de la compagnie en termes de rsultats et de performances. Ainsi, on commencera tout dabord avec un petit historique, puis on prsentera lorganigramme de la compagnie, pour ensuite enchaner avec les diffrents rsultats et du Groupe Xxxx Financial Services (dont ZCMA fait partie) et de Xxxx Compagnie Marocaine dAssurances pour lexercice 2004.

II.1.1 HistoriqueCest travers sa succursale, Xxxx Dlgation, quoprait le Groupe Xxxx sur le march Marocain et ceci depuis 1951 ; ce nest quen 1975 et avec lavnement de la loi sur la Marocanisation que le Groupe Xxxx cra sa filiale Marocaine : la Garantie Gnral Marocaine (GGM), qui sest vue changer de nom pour sappeler Xxxx Compagnie Marocaine dAssurances partir de 1997.

II.1.2 OrganigrammeLa filiale Xxxx Maroc est considre comme un centre dactivit (CA) du Groupe Xxxx Financial Services et est compose de deux Strategic Business Units (SBU) savoir : la SBU Agences. la SBU Courtage. En fait, la compagnie est divise en fonction de ces deux principaux rseaux de distribution qui grent toutes les branches dassurances. Lorganigramme de Xxxx Compagnie Marocaine dAssurances se prsente comme suit :

7

Pr sident Directeur Gn ral

Audit interne

Service juridique

Secrtariat DG Communication / Logistique

Ressources Humaines

SBU Particuliers (Agences)

SBU Commercial / Entreprises (Courtiers)

Informatique

Technique / Actuariat / Sinistres / Groupe / Transport

Comptabilit / Finances / Placements

Et les diffrents dpartements de la compagnie sont :8

CEO / Direction Gnrale

Communication / Logistique

Ressources Humaines Comptabilit / Finances / Placements

Informatique SBU Personnel

SBU Commercial / Small Business.

Prsident Directeur Gnral. Contrle de Gestion / Risk Management. Juridique / Compliance. Gestion Administrative Logistique Gestion des achats et approvisionnement. Standard. Courrier. Coursiers / Chauffeurs. Photocopie. Scurit et Rception. DRH. Adjoint Responsable RH. Comptabilit Gnrale / Analytique. Comptabilit technique. Gestion budgtaire / Reporting. Placements / Trsorerie. Rassurance : Gestion comptable. Recouvrement / Contentieux Primes : Agences et Courtage. Etudes et Dveloppement. Exploitation. Rseaux et Systmes Marketing /support /communication. Dlgus Rgionaux. Production AT et RD. Production Automobile. Production Incendie et RT. Bureau Direct. Administration Clientle. Archives. Chargs de compte. Production Incendie, RT et RD. Production Automobile. Production AT. Production Transport. Production Groupe. Archives.

9

Technical Center

Statistiques / Actuariat. Prvention / Ingnierie des risques. Mdecin conseil. Sinistres Groupe. Sinistres Transport. Sinistres IARD. Accidents de travail. Automobile Corporels Contentieux. Automobile Corporels Transactions. Automobile Matriel. Incendie et RD. Cellule administrative. Archives.

II.1.3 Rsultats et performances Rsultats du Groupe Xxxx Financial ServicesAvant dentamer la prsentation des rsultats raliss par la Xxxx Maroc durant lexercice 2004, on commencera par donner quelques informations sur les rsultats du Groupe. Ainsi, lanne 2004 a connue une augmentation du bnfice net de lordre de 29% pour atteindre 2,6 milliards de Dollars. Lanne 2004 a constitu la fin dune priode de deux ans sans prcdent, marque par labsence de catastrophes majeures. En effet, les mois daot et de septembre ont connues quatre ouragans frappants les USA et les Carabes, et juste avant la fin de lanne un puissant Tsunami a dtruit de vastes zones ctires allant de lIndonsie lest de lAfrique. Face ces vnements dune ampleur jamais atteinte auparavant, Xxxx a enregistr des paiements de sinistres hauteur de 585 millions de Dollars nets de rassurance et dimpts. La notation de solidit financire permet dvaluer la scurit financire dune compagnie dassurance, en fait, elle se base essentiellement sur sa capacit dhonorer ses engagements envers sa clientle. Ainsi, le 19 fvrier 2004, le Groupe Xxxx avait reu les notations suivantes :10

Agence de notation A.M. Best Fitch Ratings Moody's A2 Standard & Poors

Notation de solidit financire A (excellent) A (solide) A2 (bien) A+ (solide)

Actuellement, le Groupe Xxxx Financial Services est : Le 2me assureur dommages aux Etats-Unis ; Le 3me assureur dommages au Royaume-Uni ; Le 5me assureur dommages et vie en Europe continentale ; Le 2me assureur dommages pour les grandes entreprises en Europe continentale.

Rsultats de Xxxx Compagnie Marocaine dAssurancesLexercice 2004 sest cltur avec un montant de primes mises de lordre de 464,514 millions de dirhams soit une hausse de presque 13% par rapport lexercice 2003 qui avait enregistr un montant de 411,097 millions de dirhams. La ventilation des primes mises pour lexercice 2004, stablit comme suit : Assurance non-vie : 97,18% Assurance vie : 2,82%.

La part de lassurance-vie poursuit sa diminution amorce en 2003 enregistrant une baisse de 58,4%. En revanche, lassurance non-vie termine lexercice 2004 avec une progression de 18,9% et continue tre le vecteur principal de lamlioration des rsultats de la compagnie.

Les chargesLa Charge de Sinistres toutes branches confondues sest leve en volume brut 337,9 millions de dirhams contre 348 millions de dirhams en 2003, soit une lgre baisse de (-) 2,9%.11

Quand aux Rsultats Techniques vie et non-vie, ils font apparatre un bnfice de 116 millions de dirhams en montant brut de rassurance et un bnfice de 75,9 millions de dirhams net de rassurance. Et enfin, les Charges Techniques dExploitation se sont leves 126,7 millions de dirhams reprsentant 27,3% des primes mises.

Les produits de placementsLes revenus des placements (hors plus-values ralises) ont atteint 96,031 millions de dirhams contre 84,476 millions de dirhams en 2003, soit une progression de 13,7%. Par ailleurs, et conformment aux directives du Groupe Xxxx Financial Services en matire dallocation dactifs selon le Xxxx risk policy , la compagnie a poursuivi en 2004 son orientation vers la rduction des investissements en actions, au profit du compartiment obligataire. Le but tant de rduire lexposition de la compagnie aux risques de dprciation dactifs. Cest ainsi que la compagnie a cd au cours de cet exercice, un certain nombre de Lots dactions ralisant ainsi des plus-values latentes pour un montant de 50,319 millions de dirhams.

La marge de solvabilitLa marge de solvabilit calcule suivant les dispositions rglementaires introduites par linstruction du Ministre des Finances n 18 du 29 mars 1996, stablit 86,123 millions de dirhams.

Les rsultatsLe bnfice net pour lexercice 2004 aprs dotations aux provisions et impts slve 38.648.373,98 dirhams. Ce montant se dcompose comme suit :Rsultats techniques vie Rsultats techniques non-vie - 4.473.330,76 DH 80.329.501.70 DH 12

Rsultats non techniques Rsultats avant impts Impt sur le rsultat Rsultat Net

- 25.162.518,96 DH 50.693.651,98 DH 12.045.278,00 DH 38.618.373,98 DH

Compte tenu de la dotation la rserve lgale dune somme de 142.813,35 dirhams, le montant du bnfice disponible est de 38.505.560,63 dirhams qui va tre affect comme suit :Dotation la Rserve Gnrale Dividendes aux actionnaires Total 16.005.560,63 DH 22.500.000,00 DH 38.505.560,63 DH

II.2 Prsentation du sujet et problmatiqueLe secteur des assurances au Maroc vit une poque de concurrence acharne et de refonte de son paysage lgislative et rglementaire. Si lanne 2003 a t marque par la promulgation fin 2002 du code des Assurances, lanne 2004 a quant elle t marque par la promulgation du Dcret dapplication dudit Code parut dans le bulletin Officiel du 4 novembre 2004. Ce Dcret a permis aux professionnels de lassurance davoir une meilleure visibilit concernant lapplication de certaines dispositions du Code des Assurances. Lanne 2004 a galement t marque par lexamen et la discussion des textes des projets darrts relatifs aux diffrents livres contenus dans le Code des Assurances. Ainsi on se limitera larticle 59 de larrt du livre 3 du Code des Assurances et plus particulirement la partie concernant la responsabilit civile automobile lusage tourisme. Larticle stipule que : Les critres de dtermination des primes pures de la catgorie dassurance responsabilit civile automobile vise larticle 120 de la loi numro 17-99 prcite sont : 1) lusage :13

tourisme ; transport public de voyageur (TPV) ; transport de marchandises (TM) ; vhicules deux ou trois roues ; garagistes et divers ; la puissance fiscale et le type de combustion pour les vhicules de essence : jusqu 6 cv, 7 et 8 cv, 9 et 10 cv, 11 cv et plus ; diesel : jusqu 6 cv, 7 et 8 cv, 9 et 10 cv, 11 cv et plus ;

2)

tourisme :

Signalons que lentre en vigueur de ces dispositions prendra effet partir du mois de juillet 2006. La prsente rglementation reprsente une phase transitoire vers une libralisation totale du secteur des assurances au Maroc, dans la mesure o elle laisse le libre choix aux compagnies dassurances en terme de tarification tout en limitant le champ des facteurs tarifaire (la puissance fiscale et le type de combustion). Ce quon peut reprocher cette rglementation cest que les critres de tarification ne reposent sur aucune tude statistique, et donc menaceraient priori lquit envers les assurs lors de la tarification. Ainsi lobjectif de notre travail au sein de la ZCMA est de dterminer, partir des donnes disponibles, les critres les plus dterminants pour la tarification, et les comparer avec ceux prvus par la rglementation ; ceci en utilisant diverses mthodes statistique : analyse discriminante, analyse en composantes principales et analyse des correspondances multiples

14

III. Phase pratique

15

III.1 Prsentation de la base de donnesPour raliser notre tude on se base sur les donnes relatives lexercice 2004 pour la responsabilit civile automobile, composes de 45097 observations et qui donnent pour chaque police plusieurs informations, dont on retient uniquement les variables qui pourraient expliquer la sinistralit : Le type de carburant (Diesel, Essence) ; La puissance fiscale ; La date de la mise en circulation du vhicule ; Lanne dobtention du permis ; La date de naissance ; Le sexe ; La ville.

III.2 Analyse facteurs fixes et validationIII.2.1 Analyse individuelle des facteurs

16

Aprs avoir prsent les variables sur lesquelles porte notre tude, nous allons maintenant examiner leffet individuel de chacun des facteurs sur la variable Sinistre. Notre objectif est de dtecter pour chaque variable les sous groupes qui prsentent une attitude analogue vis--vis de la sinistralit. Pour les variables non catgorielles, on va les regrouper en classes les plus homognes lintrieur (en terme de comportement de sinistralit) et par consquent les plus htrognes lextrieur. Concernant les variables catgorielles, les sous groupes tant construits de manire naturelle, on va essayer de regrouper les modalits prsentant des similarits en terme de sinistralit. Pour ce faire, on fera appel aux arbres de dcisions fournis par le logiciel Answer Tree.

Logique de larbre de dcisionLes arbres de dcision sont utilises pour expliquer un ou plusieurs champs en fonction dun ou plusieurs autres. Ce sont des outils trs puissants principalement utiliss pour la classification, la description ou lestimation. Le principe de fonctionnement est le suivant: pour expliquer une variable, le systme recherche le critre le plus dterminant et dcoupe la population en sous populations possdants la mme entit de ce critre. Chaque sous population est ensuite analyse comme la population initiale. Un arbre de dcision est donc compos: Dun noeud racine par lequel les enregistrements entrent, De questions (facteurs), De rponses (modalits ou variantes) qui conditionnent la question suivante, De noeuds feuilles qui correspondent un classement.

1

noeud racine

2

noeud fils

3

noeud feuille 17

4

noeuds feuilles

5

Le logiciel de segmentation Answer Tree permet dobtenir un arbre de dcision via plusieurs algorithmes, on y retiendra uniquement les deux algorithmes les plus utiliss en la matire savoir Quest et Chaid. Lalgorithme Chaid a t publi en 1975 par J.A. Hartigan. Son processus consiste utiliser le test du khi-deux pour choisir les bifurcations. La meilleure partition est obtenue en construisant des groupes homognes tels que la variance intergroupes soit maximale et la variance intragroupe soit minimale. Et enfin, contrairement aux autres algorithmes, il ne dveloppe pas larbre complet, mais tente ds le premier passage de limiter sa croissance. Lalgorithme Quest a t publi en 1984 par L. Briemen. contrairement lalgorithme prcdent, il utilise le test de Fisher pour choisir les bifurcations. Cest une mthode rapide, qui sapplique uniquement aux variables dpendantes de type nominal, et dont les bifurcations sont constitues seulement de deux noeuds.

Analyse sur le facteur PermisPour le facteur Permis (Facteur prdicteur) on a opt pour lalgorithme Chaid et on a pris la variable Sinistre comme variable dpendante. Avec un signification = 5% pour le test de khi-deux on a obtenu larbre suivant: niveau de

18

On constate que la p-value est infrieur au seuil prcit et donc les classes obtenues correspondent au critre dhomognit des groupes exig par la mthode. Les classes quon retient pour notre analyse sont: Permis 1 : [0 ; 23], compose de 15985 assurs (15580 non sinistrs et 405 sinistrs), soit 67,46 % de la population ayant dclar la date dobtention de leur Permis. Permis 2 : [24 ; 27], compose de 2540 assurs (2500 non sinistrs et 40 sinistrs), soit 10,72 % de la population ayant dclar la date dobtention de leur Permis. Permis 3 : [28 ; 84], compose de 5172 assurs (5045 non sinistrs et 127 sinistrs), soit 21,83 % de la population ayant dclar la date dobtention de leur Permis. En terme de frquences de sinistralit, il savre que la classe2 est celle qui cause le moins de sinistres avec une frquence de 1,57%, ensuite vient la classe1 avec une frquence de 2,46% et enfin la classe3 qui semble tre la plus dangereuse en terme de sinistralit avec une frquence de 2,53%.

Analyse sur le facteur Age19

Pour le facteur Naissance (Facteur prdicteur) on a opt pour lalgorithme Chaid, et on a pris la variable Sinistre comme variable dpendante. Avec un niveau de signification = 5% pour le test de khi-deux on a obtenu larbre suivant:

On constate que la p-value est infrieur au seuil prcit et donc les classes obtenues correspondent au critre dhomognit des groupes exig par la mthode. Les classes quon retient pour notre analyse sont: Age 1 : [17 ; 27], compose de 1895 assurs (1824 non sinistrs et 71 sinistrs), soit 6,53 % de la population ayant dclar la date de leur naissance. Age 2 : [28 ; 36], compose de 6091 assurs (5930 non sinistrs et 161 sinistrs), soit 21,00 % de la population ayant dclar la date de leur naissance. Age 3 : [37 ; 94], compose de 21016 assurs (20578 non sinistrs et 438 sinistrs), soit 72,46 % de la population ayant dclar la date de leur naissance. En terme de frquence de sinistralit, il savre que la troisime classe (Age 3) est celle qui cause le moins de sinistres avec une frquence de 2,08%, ensuite vient la deuxime classe (Age 2) avec une frquence de 2,46% et enfin la premire classe (Age 1) qui semble tre la plus dangereuse en terme de sinistralit avec une frquence de 3,75%.

Analyse sur le facteur Mise en circulation (Mec)20

Pour le facteur Mec (Facteur prdicteur) on a opt pour lalgorithme Chaid, et on a pris la variable Sinistre comme variable dpendante. Avec un signification = 5% pour le test de khi-deux on a obtenu larbre suivant: niveau de

On constate que la p-value est infrieur au seuil prcit et donc les classes obtenues correspondent au critre dhomognit des groupes exig par la mthode. Les classes quon retient pour notre analyse sont: Mec 1 : [0 ; 5], compose de 5264 assurs (5099 non sinistrs et 165 sinistrs), soit 23,34 % de la population ayant dclar la date de la mise en circulation. Mec2 : [6 ; 15], compose de 8194 assurs (8015 non sinistrs et 179 sinistrs), soit 36,33 % de la population ayant dclar la date de la mise en circulation. Mec 3 : [16 ; 21], compose de 6170 assurs (6000 non sinistrs et 171 sinistrs), soit 27,35 % de la population ayant dclar la date de la mise en circulation. Mec 4 : [22 ; 82], compose de 2929 assurs (2880 non sinistrs et 49 sinistrs), soit 12,98 % de la population ayant dclar la date de la mise en circulation.

En terme de frquences de sinistralit, il savre que la classe4 (Mec 4) est celle qui cause le moins de sinistres avec une frquence de 1,67%, ensuite vient la classe221

(Mec 2) avec une frquence de 2,18% puis on trouve la classe3 (Mec 3) qui cause des sinistres un pourcentage de 2,76%, enfin vient la classe1 (Mec1) qui semble tre la plus dangereuse en terme de sinistralit avec une frquence de 3,13%.

Analyse sur le facteur CarburantPour le facteur carburant (Facteur prdicteur) on a opt pour lalgorithme Chaid, et on a pris la variable Sinistre comme variable dpendante. Avec un niveau de signification = 5% pour le test de khi-deux on a obtenu larbre suivant:

On constate que la population retenue pour faire cette analyse concide avec la population totale des assurs du fait que la dclaration de la nature du carburant est exige lors de la souscription dun contrat dassurance. Les classes quon retient pour notre analyse sont naturellement Diesel et Essence mais lintrt de lemploi de Answer Tree pour atteindre ce rsultat est de justifier leffet discriminatoire du facteur Carburant sur la sinistralit car dans le cas contraire, le logiciel naffiche aucune bifurcation. En terme de frquences de sinistralit, il savre que la classe1 compose des vhicules de type Essence, cause des sinistres avec une frquence de 1,79%. Elle est donc nettement mois dangereuse que la classe2 compose des vhicules de type Diesel et qui cause des sinistres dans lordre de 2,46 %

Analyse sur le facteur Sexe22

Pour le facteur sexe (Facteur prdicteur) on a opt pour lalgorithme Chaid, et on a pris la variable Sinistre comme variable dpendante. Avec un signification = 5% pour le test de khi-deux on a obtenu larbre suivant: niveau de

Les classes quon retient pour notre analyse sont formes de manire naturelle (Masculin et Fminin) mais tout comme pour la variable carburant lintrt de lemploi de Answer Tree pour atteindre ce rsultat est de justifier leffet discriminatoire du facteur Sexe sur la sinistralit car dans le cas contraire, le logiciel naffiche aucune bifurcation. En terme de frquences de sinistralit, il savre que la classe1 des assurs Fminins cause beaucoup plus de sinistre que la classe2 compose des assurs Masculins. En effet, la frquence de sinistralit nest que de 2,06% pour les hommes alors quelle atteint le seuil de 2,70% pour les femmes.

Analyse sur le facteur Puissance fiscale (P.F)Pour le facteur P.F (Facteur prdicteur) on a opt pour lalgorithme Quest, et on a pris la variable Sinistre comme variable dpendante. Avec un niveau de signification = 5% pour le test de Fisher utilis dans cette mthode .Larbre obtenue est la suivante:23

On constate que la population retenue pour faire cette analyse concide avec la population totale des assurs du fait que la dclaration de la nature de la puissance fiscale est exige lors de la souscription dun contrat dassurance. En plus, la p-value est infrieur au seuil prcit et donc les classes obtenues correspondent au critre dhomognit des groupes exig par la mthode. Les classes quon retient pour notre analyse sont: P.F 1 : [1 ; 6], compose de 11289 assurs (11063non sinistrs et 226 sinistrs), soit 25,03 % des assurs. P.F 2 : se restreint la puissance fiscale 7, elle est compose de 14067 assurs (13742 non sinistrs et 325 sinistrs), 31,19 % des assurs. P.F 3 : [8 ; 9], compose de 13508 assurs (13217 non sinistrs et 1291 sinistrs), soit 29,95 % des assurs. P.F 4 : [1999 ; 2004], compose de 5264 assurs (5099 non sinistrs et 165 sinistrs), soit 23,34 % des assurs. En terme de frquences de sinistralit, il savre que la classe1 est celle qui cause le moins de sinistres avec une frquence de 2,00%, ensuite vient la classe3 avec24

une frquence de 2,15% puis on trouve la classe2 qui cause des sinistres un pourcentage de 2,31%, enfin vient la classe4 qui semble tre la plus dangereuse en terme de sinistralit avec une frquence de 2,44%.

Analyse sur le facteur Rgion:Pour le facteur Rgion (Facteur prdicteur) on a opt pour lalgorithme Chaid, et on a pris la variable Sinistre comme variable dpendante. Avec un niveau de signification = 5% pour le test de khi-deux utilis dans cette mthode. Larbre obtenu est la suivante:

25

26

On constate que la p-value est infrieur au seuil prcit et donc les classes obtenues correspondent au critre dhomognit des groupes exig par la mthode. Les classes quon retient pour notre analyse sont: Rgion 1 :Souss-Massa-Draa, Guelmim Es-Semra, laayoune-Boujdour-Sakia El-Hamra, Etranger, Tanger-Ttouan, compose de 14934 assurs (14793 non sinistrs et 141 sinistrs), soit 33,12 % des assurs. Rgion 2 :Rabat-Sal-Zemmour-Zaer, marrakech-Tensift El-haouz, DoukkalaAbda, Gharb-Chrarda-Beni Hssen, compose de 7650 assurs (7461 non sinistrs et 189 sinistrs), 16,96% des asurs. Rgion 3 : Oued-Eddahab-lagouira, Mnes-Tafilalt, Taza-Al HoceimaTaounate; Fs-Boulmane, Tadla-Azilal, Grand Casablanca, compose de 17556 assurs (16974 non sinistrs et 582 sinistrs), soit 38,93 % des assurs. Rgion 4 :Oriental, Chaouia-Ouerdigha; compose de 4957 assurs (4875 non sinistrs et 82 sinistrs), soit 10,99 % des assurs. En terme de frquences de sinistralit, il savre que la Rgion 1est celle qui cause le moins de sinistres avec une frquence de 0,94%, ensuite vient la Rgion 4avec une frquence de 1,65% puis on trouve la Rgion 2qui cause des sinistres un pourcentage de 2,47%, enfin vient la Rgion 3qui semble tre la plus dangereuse en terme de sinistralit avec une frquence de 3,32%.

III.2.2 Analyse factorielle discriminante IntroductionLanalyse factorielle discriminante est une mthode statistique trs puissante de description et de prvision. Son but est dtudier les relations entre une variable qualitative et un ensemble de variables quantitatives. On remarque quil existe une analogie entre lanalyse discriminante et la rgression. En fait, la rgression permet destimer une variable quantitative partir dautres variables observes, alors que lanalyse discriminante peut tre perue comme une mthode de rgression des27

variables qualitatives. Cest une mthode danalyse banques et les assurances pour le scoring. Trois discriminante:

utilise notamment par les tre assigns lanalyse

objectifs

principaux

peuvent

Dterminer les variables explicatives les plus discriminantes vis Dterminer quel groupe appartient un individu partir de ses Mais surtout valider une classification ou faire un choix entre

vis des classes dtermines. caractristiques. plusieurs classifications pour savoir laquelle est la plus pertinente. Lanalyse discriminante intervient donc a posteriori dune classification. Dans notre analyse, on a opt pour la mthode dintroduction simultane des variables au dtriment de la mthode dintroduction pas--pas du fait que la premire mthode permet datteindre les deux derniers objectifs prcits alors que la deuxime mthode qui servait normalement dterminer les variables les plus discriminantes na pas permis daboutir des rsultats satisfaisants (les variables qualitatives sont toutes substitues par des axes factoriels qui sont retenus par lanalyse pas--pas comme variables discriminantes, chose qui rend linterprtation des rsultats dlicate). -Les observations utilises pour cette analyse sont les 13773 observations compltes dont on dispose. -Les variables retenues pour cette analyse sont: Variable dpendante: Variables explicatives: Variables quantitatives: Mec, Permis, Age, P.F. Variables qualitatives: Carburant, Sexe, Rgion. Sinistre

Les variables Sexe, Carburant et Rgion tant de type qualitatif, on est amen raliser une analyse des correspondances multiples sur ces variables.

Analyse des correspondances multiples (ACM) sur les variables qualitatives28

Dans cette analyse par lACM, les seules variables introduites sont les variables qualitatives (ne comportant pas la variable Sinistre explique). Lobjectif de cette analyse est de rsumer ces variables en un petit nombre de variables quantitatives. Les variables obtenues ne sont dautres que les axes factoriels qui rsultent de lapplication de lACM. En utilisant la Macro XL-Stat-Pro, version 7.5.2, on obtient le rsultat suivant:

On constate que ces variables qualitatives qui se composent de huit modalits peuvent se rsumer en cinq variables quantitatives.

Analyse Factorielle discriminante (AFD)Aprs cette transformation de variables qualitatives en variables quantitatives, les variables explicatives de la sinistralit dans lAFD deviennent: Mec, Permis, Age, P.F, Facteur1, Facteur2, Facteur3, Facteur4 et Facteur5 qui sont toutes quantitatives conformment aux exigences de cette mthode. Avant deffectuer cette analyse, on a procd un chantillonnage alatoire simple qui consiste prendre le mme effectif des sinistrs et des non sinistrs pour viter linfluence du poids de chaque modalit sur la qualit des rsultats. Le nombre dindividus retenu pour cette analyse est de 600 individus, rpartis de manire gale entre sinistrs et non sinistrs.

Une analyse discriminante se droule en trois tapes: vrification des diffrences entre les groupes et validation de ltude, dtermination des fonctions de classement, jugement de la qualit de reprsentation du modle.29

a- Validit de ltude En utilisant la Macro XL-Stat-Pro, version 7.5.2, on obtient les rsultats suivants:

Conclusion

Dans ces deux tests, on trouve quau seuil de signification Alpha=0,050 on peut rejeter l'hypothse nulle d'galit des matrices de covariance intra classes. Autrement dit, la diffrence entre les matrices de covariance intra classes est significative. Ces deux tests de Box permettent de confirmer que lon ne peut pas faire lhypothse que les matrices de covariance sont identiques pour les deux groupes Sinistrs et non Sinistrs.

30

Conclusion

Au seuil de signification Alpha=0,050 on peut rejeter l'hypothse nulle d'galit des vecteurs des esprances des 2 groupes (sinistrs, non sinistrs). Autrement dit, la diffrence entre les barycentres des groupes est significative. A partir de ces deux tests, on peut affirmer la validit du modle.b- Dtermination des fonctions de classement

Une fois le modle valid, les fonctions de classement permettent de reclasser les individus. La rgle fonde sur ces fonctions est telle que l'on attribue un individu au groupe dont la fonction de classement donne la valeur la plus leve. Dans le tableau ci-dessous, on trouve les paramtres des fonctions discriminantes linaires:

c- Jugement de la qualit de reprsentation du modle

Pour juger de la qualit de reprsentation, on utilise la matrice de confusion qui rsume l'information concernant les reclassements d'individus, et on peut en dduire le taux apparent des individus correctement classs, qui correspond au ratio du nombre d'individus correctement classs, sur le nombre total d' individus.

31

On constate que parmi les 300 individus non sinistrs, 158 des individus sont classs correctement. Contre 142 qui sont mal classs. En ce qui concerne les 300 individus sinistrs, 204 des individus sont classs correctement contre 96 qui sont mal classs. On constate aussi quavec ces fonctions de classement, on a tendance classer les individus dans le groupe des sinistrs; 57,67% des individus sont classs sinistrs contre 42,33% classs non sinistrs. Enfin, le taux apparent des individus correctement classs vaut 60,33%. Ceci veut dire que les fonctions de classement permettent de classer les individus de manire satisfaisante et par consquent les nouvelles variables explicatives issues de la classification facteurs fixes permettent de regrouper les individus en classes se comportant de manires analogues vis--vis de la sinistralit. Pour bien appuyer ce rsultat, on propose dappliquer les fonctions de classement sur un chantillon de 66 individus diffrents de ceux quon a utilis lors de lestimation des paramtres. Les rsultats obtenus sont les suivants :

32

On constate une autre fois que le taux apparent des individus correctement classs est acceptable puisque sa valeur est dans lordre de 58%. Ainsi lanalyse discriminante faite au dessus confirme la classification propose par Answer-Tree, cette dernire sera donc retenue pour les analyses qui suivront.

III.3 Analyse facteurs multiplesAvant de procder lanalyse globale des facteurs travers Answer tree on va essayer dans cette partie, de reprer dventuelles corrlations et correspondances entre les variables, en faisant appel lACP et lACM.

III.3.1 Analyse en composantes principales (ACP)Lanalyse en Composante Principale (ACP) fait partie des analyses descriptives multivaries. Le but de cette analyse est de rsumer le maximum dinformations possibles en en perdant le minimum possible pour : Faciliter linterprtation dun grand nombre de donnes initiales Donner plus de sens aux donnes rduites LACP permet donc de rduire des tableaux de grandes tailles en un petit nombre de variables (deux gnralement) tout en conservant un maximum dinformation. Les variables de dpart sont des variables quantitatives (continues ou discrtes) dites aussi variables mtriques. A partir des variables dont on dispose, on ne peut retenir que quatre variables pour cette analyse savoir: Permis, Age, Mec et P.F Le premier rsultat intressant analyser concerne les valeurs propres qui correspondent aux quantits dinformations extraites par chacun des facteurs. La rgle gnrale est de conserver tout facteur qui extrait une quantit dinformation (valeur propre) suprieure 1. Ceci se comprend dans la mesure o une variable prise isolment est porteuse dune quantit dinformation gale 1. Un facteur qui extrait une quantit dinformation infrieure 1 est donc moins porteur dinformation quune variable prise isolment et par consquence na en gnral pas grand intrt. Par contre sil porte une information suprieure 1, il est plus informatif quune variable prise33

isolment, et donc peut avoir de lintrt. Ci-dessous, le tableau des valeurs propres et le graphique associ :

Valeurs propres2 F1

F2 1 F3

F4

0

On voit que la premire valeur propre vaut 1,719 et reprsente 42,98% de la variabilit totale. Cela signifie que si l'on reprsente les donnes sur un seul axe, alors on aura toujours 42,98% de la variabilit totale qui sera prserve.

Idalement, on devrait retenir uniquement les deux premiers axes. Cependant, on en retiendra en fait trois car cela apporte un peu plus dinformation sans pour autant rendre linterprtation beaucoup plus complexe. Lanalyse suivante concerne les cercles de corrlation qui sont utiles pour interprter les corrlations qui existent entre les variables.

34

Variables (axes F1 et F2 : 69,45 %)1 M ec

0,5

Age 0 P ermis

-0,5 P .F.

-1 -1 -0,5 0 0,5 1 -- axe F1 (42,98 %) -->

On peut dduire du graphique de corrlation ci-dessus que les variables Age et Permis sont fortement corrles positivement (68,9%) et que la Mec et la P.F sont fortement corrles ngativement, alors qu'elles ne le sont pas (-5,5%). Ceci est du aux limites de l'ACP qui est une mthode de projection, et que la perte d'information induite par la projection peut entraner des interprtations errones. La partie suivante est une extension de ltude de corrlation en englobant un domaine plus vaste de variables.

III.3.2 Analyse des correspondances multiples (ACM)Lanalyse des correspondances multiples nest rien dautre que lapplication de lanalyse factorielle des correspondances ltude des tableaux disjonctifs complets.35

Lappellation Analyse des correspondances multiples se justifie ainsi : Alors que lanalyse des correspondances simples tudie la relation entre deux caractres observs sur une population donne, lanalyse des correspondances multiples tudie les relations entre un nombre quelconque de caractres. Cette mthode est applicable aussi bien pour les variables qualitatives que pour les variables quantitatives. Mais pour les variables quantitatives continues, il est ncessaire de les transformer en variables qualitatives ordinales possdants un nombre fini de modalits. -Les observations utilises pour cette analyse sont les 45097 observations dont on dispose. -Les valeurs manquantes sont remplaces par le mode. -Les variables retenues pour cette analyse sont : Sinistre, Mec, Permis, Age, P.F, Carburant, Sexe et Rgion. Les variables Permis, Mec, Age tant quantitatives continues, on est amen les dcouper en classes. Ces dernires sont issues de la classification propose par Answer Tree et valide dans lanalyse discriminante. Les donnes utilises peuvent se rsumer dans le graphique de contingence de Burt ci-dessous :

36

Tableau de contingence de Burt

45000 40000 35000 30000 25000 20000 15000 10000 5000 Permis - 2 Mec - 2 0 Mec - 2 Permis - 2 Carbur - 1 Carbur - 1 PF - 4 PF - 1 PF - 4

PF - 1

Region - 2

Tout comme LACP, le premier rsultat interprter est celui des valeurs propres qui donnent la part de chaque axe dans lexplication de la dispersion totale.

Sinistr - 0 Sinistr - 0

Region - 2

Age - 2

Age - 2

37

Valeurs propres0,300 F1 F2

0,200

F3 F4 F5 F6 F7 F8 F9 F1 0

0,1 00

F1 F1 1 2

F1 3 F1 4

0,000

On constate partir du tableau et de lhistogramme des valeurs propres que les treize premiers axes rsument la quasi-totalit de linertie totale, ils sont donc assez suffisants pour faire une tude complte sur les rsultats de lACM. Le deuxime rsultat traiter est celui des cartes factorielles :*la carte factorielle des axes F1 et F2 superposant modalits et individus :Graphique symtrique (axes F1 et F2 : 25,12 %)5 4 3 2 1 0 -1 -2 -3 -4 -5 -5 -4 -3 -2 -1 0 1 2 3 4 5 -- axe F1 (1 2,60 %) --> P ermis - 2 Age - 2 AgePec3-2-12 P PRegion--13 ermis --414 1 PFec - 1 -2 M Sinistr Carbur M F4 -Region3-01 Carbur MFec 22 Sinistr Sexe Region P --ec F3 Region MSexe Individus actifs M odalits actives P ermis - 1 Age - 1

Ce graphique permet de valider les rsultats de lACP concernant la forte corrlation entre lAge et le Permis. En effet, les individus ayant lAge1 ont souvent le Permis1, de mme pour le Permis2, Age2 et pour le Permis3, Age3. Ainsi dans lanalyse globale des facteurs on va se contenter dintroduire lune de ces deux38

variables, pour viter la redondance de linformation utilise lors de lanalyse. Le choix de la variable Permis serait plus judicieux dans la mesure o la collecte de linformation sur lge est souvent entache derreurs denregistrement lies ltat civil.* la carte factorielle des axes F1 et F3 superposant modalits et individus :Graphique symtrique (axes F1 et F3 : 21,68 %)

3

2

M ec - 4

1

Region - 4 C arbur - 2 PF -1

PF -3 P ermis - 3 0 Age - 3 Region - 1 M ec - 3 Sexe - 2 Sinistr - 0 Region - 2 M ec - 2 Sexe - 1 PF -4 Region - 3 Carbur - 1 Sinistr - 1 P ermis - 2 Age - 2 P ermis - 1 A ge - 1 Individus actifs M odalits actives

PF -2 -1

M ec - 1

-2

-3 -3 -2 -1 0 -- axe F1 (1 2,60 %) --> 1 2 3

On constate que la forte sinistralit est caractristique aux modalits suivantes : Rgion3, P.F2, P.F4, Mec1, Diesel. La faible sinistralit quant elle, est caractristique aux modalits suivantes : Rgion1, Rgion2, Mec2, Mec3, P.F3.

39

Jusqu prsent, avec ces deux cartes factorielles, on ne voit pas leffet discriminant du Sexe sur la sinistralit. Nanmoins, lutilisation de la table des valeurs tests des modalits (ci-joint en annexe1) montre quen croisant les deux axes F1 et F4, on peut mieux visualiser leffet Sexe.* la carte factorielle des axes F1et F4 superposant modalits et individus :

A partir du graphique, on peut affirmer que les femmes causent plus de sinistres en comparaison avec les hommes.

III.3.3 Analyse globale des facteursContrairement lanalyse facteurs fixes qui consiste tudier les facteurs sparment, et qui ne permet pas de croiser les effets de plusieurs facteurs, la prsente analyse tudie la sinistralit dans sa globalit en combinant plusieurs facteurs explicatifs. Lanalyse de la segmentation subdivise chaque niveau la population suivant le facteur qui diffrencie le plus la variable explique sinistre, et chaque population est ensuite analyse comme la population initiale. Ci-joint en annexe larbre complte donnant cette segmentation (annexe2).*composition des segments de larbre completNiveau 1 2 2 3 3 3 Groupe 1 1 2 1 2 3 Dcomposition Rgion 2,3 Rgion 1,4 Rgion 2,3. Rgion 3. Rgion 2,3. Rgion 2 Rgion 1,4. Region4

40

3 4 4 4 4 4 4 4 4 5 5 5 5 5 5 5 5 5 5 5 5 5 5 5 5 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6

4 1 2 3 4 5 6 7 8 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29

Rgion 1,4. Region1 Rgion 2,3. Rgion 3. Carbur Diesel Rgion 2,3. Rgion 3. Carbur Essence Rgion 2,3. Rgion 2. PF 7 Rgion 1,4. Region4. Carbur2 Rgion 1,4. Region4. Carbur1 Rgion 1,4. Region1. Permis 23 Rgion 2,3. Rgion 3. Carbur Diesel.Permis 23 Rgion 2,3. Rgion 3 .Carbur Essence.Sexe Masculin Rgion 2,3. Rgion 3 .Carbur Essence.Sexe Fminin Rgion 2,3. Rgion 2. PF