DoYouBuzz · Web viewPeu de revues littéraires abordent le sujet d’un profil type « européen...
Transcript of DoYouBuzz · Web viewPeu de revues littéraires abordent le sujet d’un profil type « européen...
Master deuxième année
Mention : Marketing direct et digital
Peut-on parler d’un consommateur européen ?Le cas du groupe PABO.
Valentin Maes
Tuteur entreprise: Monsieur Arpad Tosaki
Tuteur universitaire: Madame Sophie Jeanpert
Année : 2013-2014
Peut-on parler d’un consommateur européen ? Le cas du groupe PABO
Remerciements
Pour commencer ce mémoire professionnel et achever par la même occasion mon cursus
universitaire, je tiens à remercier Francis Salerno directeur de l’IAE, madame Oliviane Brodin
responsable de notre formation ainsi que madame Sophie Jeanpert, ma tutrice universitaire à
l’IAE, pour ses bons conseils et aiguillages fort utiles lors de la réalisation de ce mémoire.
Je remercie également Arpad Tosaki, mon tuteur chez Adam et Eve, pour le temps qu'il m'a
consacré, pour ses conseils et plus généralement pour toutes les choses qu’il m’aura apprises
durant les trois ans passés en tant qu’apprenti au sein du groupe PABO.
Je remercie aussi mes autres collègues du service marketing qui ont contribué à la réussite des
ces trois années passées dans le groupe.
Pour finir, je remercie l’ensemble du groupe Pabo qui m’a fait confiance et a mis à disposition
tout ce dont j’avais besoin.
2 | P a g e
Peut-on parler d’un consommateur européen ? Le cas du groupe PABO
Résumé
Ce mémoire professionnel a pour objectif d’analyser et de comprendre les convergences
ou divergences de comportement entre les clients des différents pays européens. Nous
expliquerons ainsi les différences et les ressemblances principales entre les clients selon leur
nationalité ainsi que l’impact que cela peut avoir pour une entreprise de vente à distance.
Pour ce faire, nous analyserons d’abord les données propres à chaque pays grâce aux bases de
données d’une entreprise européenne de vente à distance, puis nous comparerons les résultats de
ces pays entre eux. Pour finir nous apporterons des préconisations pour cette entreprise pour
l’avenir.
Summary
The aim of this professional report is to analyze and to understand convergences and divergences
of behavior between the customers of the different European countries. We will explain the main
differences and similarities according to the nationality of customers and the effect on a telemar-
keting company.
In this goal, our first part will use the own data of each country thanks to European telemarketing
company databases. Then, we will compare the results of these countries. To conclude, we will
give recommendations for the future of this company.
3 | P a g e
Peut-on parler d’un consommateur européen ? Le cas du groupe PABO
SOMMAIRE
Résumé............................................................................................................................................3
Introduction....................................................................................................................................5
1. Présentation...................................................................................................................7
1.1. Le groupe PABO...............................................................................................................7
1.2. Le contexte........................................................................................................................8
1.3. Les données.......................................................................................................................8
2. Un sujet très discuté........................................................................................................9
3. Analyse statistique.........................................................................................................11
3.1. Profil clients.....................................................................................................................11
3.2. Comportement d'achat dans les différents pays...............................................................19
3.3. Évolution des commandes internet..................................................................................29
3.4. Analyse du canal d’achat.................................................................................................33
4. Impact des différences entre les pays...........................................................................46
4.1. Explication et préparation du scoring..............................................................................46
4.2. Analyse de la régression logistique ................................................................................48
4.3. Test de concordance........................................................................................................51
4.4. Matrice de confusion, courbe de roc, courbe de lift........................................................52
4.5. Analyse des différences ..................................................................................................56
5. Préconisations pour le groupe Pabo.............................................................................57
6. Conclusion de ce mémoire professionnel.....................................................................59
Bibliographie.................................................................................................................................62
4 | P a g e
Peut-on parler d’un consommateur européen ? Le cas du groupe PABO
Introduction
En 1983, Levitt avance l’idée selon laquelle les avancées technologiques de la
communication et des transports amèneraient une homogénéisation des désirs et des besoins des
consommateurs. Plusieurs études ont essayé d’affirmer ou de contredire cette idée. En 2013 le
débat est toujours ouvert.
A quelques mois des élections européennes ainsi qu’à un moment où l’on débat de plus
en plus à propos de l’Europe, il me semble intéressant de voir si l’on peut réellement parler d’un
consommateur européen ou de consommateurs européens. En d’autres termes existe-t-il des
différences significatives (de comportement d’achat, de profil, d’appétence à un type de
produit… ) entre les divers pays européens ?
Ce mémoire professionnel de fin d’étude du Master 2 Marketing Direct et E-commerce de l’IAE
de Lille permettra de répondre au sujet suivant :
Peut-on parler d’un consommateur européen ? Le cas du groupe PABO
Carte du continent européen
Dans le cadre de ma deuxième année de Master marketing direct et digital (MMD), j'ai eu
l'opportunité de continuer ma mission au sein du service marketing de l’entreprise Adam et Eve.
Les activités majeures de cette dernière se concentrent autour de la statistique et du datamining,
ce qui permet de mieux comprendre ses clients et de leur envoyer des offres plus ciblées.5 | P a g e
Peut-on parler d’un consommateur européen ? Le cas du groupe PABO
Dans un environnement de plus en plus concurrentiel, les entreprises sont obligées, aujourd’hui,
de se concentrer sur leurs clients et de différencier leurs actions marketing. Offrir l’offre au bon
moment et sur le bon support permet aux entreprises d’améliorer la rentabilité de leurs actions
marketing. Dans cette optique, la technologie du datamining constitue un atout précieux.
Le datamining est de nos jours une priorité dans les entreprises .
Cette activité consiste à extraire et à analyser un large volume d’informations stockées
dans les entrepôts de données, en vue de découvrir des tendances ou des règles. Le déploiement
d'un outil de scoring, comme il en existe beaucoup dans les entreprises de VAD, est alors
indispensable pour segmenter ses clients, pour l’envoie d’un catalogue papier ou encore pour le
multi-canal.
Aujourd’hui beaucoup d’entreprises européennes comme le groupe Pabo différencient à
tort ou à raison leurs scoring et segmentation dans les différents pays.
Peu de revues littéraires abordent le sujet d’un profil type « européen ». Est-ce qu’une
segmentation faite pour l’ensemble du groupe est aussi efficace qu’une segmentation faite pour 6 | P a g e
Peut-on parler d’un consommateur européen ? Le cas du groupe PABO
chaque pays ou pour des pays similaires ? Le travail qui m’a été confié pour cette deuxième
année de master est d’identifier les ressemblances et différences des clients pour chaque pays du
groupe PABO et suite à ces analyses, faire des préconisations pour le groupe PABO dans
l’analyse de sa clientèle. Dans la première partie de mon mémoire, je vous présenterai le groupe
PABO et le contexte de mon sujet. Suite à cela, je vous présenterai les informations présentes
dans la littérature. Puis je vous montrerai les méthodes statistiques pour identifier les différences
ou ressemblances entre les pays. Enfin, la dernière partie sera consacrée aux recommandations
pour l’entreprise et ce que celle-ci peut en tirer suite à ce genre d’analyses.
1. Prés entation
1.1. Le groupe PABO
Voici quelques éléments du contexte de l’entreprise Adam et Eve située à Tourcoing :
Adam et Eve est une entreprise de vente à distance dans le domaine du charme. C'est une filiale
française du groupe néerlandais PABO lui-même étant une partie du groupe allemand Beate
Uhse. Beate Uhse est le numéro 1 du charme et de l’érotisme en Europe. Il est implanté aux
Pays-Bas, en Belgique, France, Autriche, Angleterre, Allemagne, République Tchèque et
Slovaquie. Adam et Eve a elle vu le jour en 1995.
De nos jours, Adam et Eve vend ses articles grâce à ses catalogues mais aussi grâce à son site
internet: http://www.adameteve.fr.
L’entreprise a son siège social implanté au sein de l’hôtel d’entreprise Jean Renoir situé au 23
boulevard Descat à Tourcoing. Celui-ci comporte le service client et le service marketing. Dans
l'entreprise Adam et Eve, la part consacrée au datamining et aux statistiques est de plus en plus
importante.
7 | P a g e
Peut-on parler d’un consommateur européen ? Le cas du groupe PABO
1.
1.1.
1.2. Le contexte
Depuis décembre 2012, le service marketing français a accès à l’ensemble de la base de
données du groupe PABO. Cette mise à disposition de la base va nous permettre d’avoir une
vision globale de l’entreprise. Le groupe PABO est en perpétuelle évolution et l’année 2014 est
celle du changement avec un nouveau logo, un nouveau site, une nouvelle communication. Cette
mise à disposition des données ne fait que confirmer cette envie de changement et de nouveauté.
Nous avons accès au logiciel SAS afin de traiter les données et réaliser nos différentes études.
1.3. Les données
Nous avons plusieurs niveaux d’informations sur nos clients :
Graphique de la représentation des données
Les données reporting ce sont des données créées par l’entreprise. Elles sont utilisées
pour être présentées sur un tableau de bord par exemple. Ces données sont issues des
8 | P a g e
Peut-on parler d’un consommateur européen ? Le cas du groupe PABO
données transactional, master, reference et metadata. Elles permettent de représenter
facilement des informations présentes dans des bases (par exemple : le pourcentage de
commandes retournées en 2013).
Les données transactionnelles : ce sont les données de transactions de nos clients, ces
données représentent une grande quantité d’informations et elles sont la base du CRM.
(exemple de données transactionnelles: le moyen de paiement d’un client)
Les données Master : ce sont les données qui décrivent nos produits, nos clients …
(exemple de données de master: la taille d’un vêtement )
Les données référence : ce sont les données qui décrivent des étapes, des passages...
(exemple de données de référence : une commande peut être en cours, livrée ou en
attente.)
Les données Metadata : il s'agit de la description des structures et des données
présentées ci-dessus.
Nous avons ces informations clients du 1er janvier 2011 au 30 mars 2014.
2. Un sujet très discuté
Le consommateur européen est un phénomène dont la littérature du marketing direct et du e-
commerce fait de plus en plus écho.
Nous avons ceux qui défendent l’idée de l’existence d’un type de client européen Leeflang et
Van Raaij en 1995, Ganesh en 1998, Halliburton et Hûnerberg en 2004 en affirmant que le
vieillissement de la population, les préoccupations en termes de santé, d’environnement
entraînent de fortes tendances à la convergence.
D’autres comme Hofstede en 2002 et De Mooij en 2003 affirment que les données ne sont pas
suffisantes pour conclure à une convergence et que l’utilisation des produits est elle très
divergente entre les pays européens.
Dans le texte “Cross-channel consumer behavior a comparaison between french, german, italian
and british consumers” monsieur Sebastian Rittinger nous explique les différents points de vue
sur l’homogénéité des désirs et des besoins des consommateurs (nous nous appuierons sur sa 9 | P a g e
Peut-on parler d’un consommateur européen ? Le cas du groupe PABO
théorie un peu plus loin dans ce mémoire). Pour rappel Levit avance l’idée «d’une
homogénéisation des désirs et des besoins des consommateurs ». Son étude se base sur la
rationalité du consommateur, hors beaucoup d’études dans le marketing direct ont montré que les
consommateurs ne sont pas forcément rationnels et que les achats se font souvent par plaisir. Par
exemple dans les produits high-tech l’acheteur est souvent non rationnel. De plus Bree (The
consummers' motives : Are we rational ? Auteur: BREE, J. Source: Sciences humaines (Auxerre)
[Sci. hum. (Auxerre)], 1996, Issue 66 p18-22 ) affirme que le consommateur peut se procurer un
bien pour le vécu d'une expérience. Ou encore Sûerdem en 1994 affirme lui que l’utilité n’est
pas le seul critère lors d’un achat. Etant donné que la rationalité du consommateur n’est pas
automatique il existe deux tendances autour du comportement d’achat dans les différents pays
européens : la convergence et la divergence.
Les auteurs soutenant la thèse de la convergence affirment pour le cas des pays européens
que le fait d’avoir une monnaie unique, une libre circulation entre les pays, que la population
européenne vieillisse ainsi que le fait d'avoir des préoccupations communes entraînent une
convergence de la demande du consommateur européen. Ces auteurs parlent de
«l'Euromarketing» (Leeflang, van Raaij, 1995) et recommandent donc une stratégie commune
dans les différents pays européens.
D'autres contredisent « L’euromarketing » comme Hofstede (2002) et De Mooij (2003).
Ils parlent certes d’une convergence au niveau macroéconomique (nombre de téléphones par
habitant, nombre de motos …) mais avancent qu’aucune étude ne parle de l’utilisation de ces
produits. De plus, ils affirment que la convergence ne concerne que quelques types de produits
et que pour d'autres, il existe des différences significatives. Leur plus grand argument à la
divergence est la culture des peuples qui diffère d'un pays à l'autre. Cette culture entraîne
logiquement des divergences dans le comportement d’achat, l’utilisation des produits, la
réactivité aux offres commerciales et la préférence pour un type de canal.
Messieurs Sebastian Rittinger et Joachim Zentes ont réalisé une étude sur les consommateurs
européens vis-à-vis de leur comportement cross canal et ils soulignent des différences
10 | P a g e
Peut-on parler d’un consommateur européen ? Le cas du groupe PABO
significatives entre les pays. « Par exemple, 40,5% de l'échantillon des consommateurs
allemands indiquent qu'ils lisent les publicités et prospectus imprimés des magasins avant un
achat en ligne. En revanche, seulement 17,1% de leurs homologues italiens et seulement 15,5%
des britanniques disent faire cela. ». Dans leurs études ils montrent aussi que les consommateurs
français apprécient en particulier l'opportunité d'économiser les frais de livraison à domicile.
Nous voyons donc que la littérature est assez partagée sur ce sujet mais surtout qu’il
existe très peu de textes autour de la conséquence d’une homogénéité ou non pour une entreprise.
Notre étude sur le cas Adam et Eve permettra de connaître les points de convergences et de
divergences de ses clients européens et aussi de proposer des outils de datamining en
conséquence.
3. Analyse statistique.
Pour réaliser cette étude, nous allons réaliser plusieurs analyses. Ces analyses seront faites la
plupart du temps pays par pays. Dans ce document nous vous développerons l’étude pour un
pays puis nous afficherons les résultats pour les autres pays. Chaque analyse a été approuvée par
le responsable fichier d’Adam et Eve monsieur Arpad Tosaki et elles sont réalisées uniquement
pour la mission du client européen. De telles analyses n’existaient pas auparavant.
1.
2.
3.
3.1. Profil clients
Nous allons dans un premiers temps vous présenter les profils clients des différents pays.
Nous avons fait le choix de ne travailler que sur les pays les plus important pour le groupe c'est-
à-dire la France, l’Allemagne, les Pays-Bas, l’Autriche et la Belgique. Les autres pays tels que la
Pologne ou l’Angleterre ont un poids trop faible dans le groupe pour être pris en compte dans
11 | P a g e
Peut-on parler d’un consommateur européen ? Le cas du groupe PABO
nos analyses. De plus dans ces deux pays, aucun catalogue papier n'est envoyé au client ce qui
par la force des choses biaiserai les résultats obtenus. Pour le profil client, nous disposons de peu
d’informations sur le client.
Répartition des clients par sexe selon les pays.
Pays Hommes Femmes Sexe inconnu TotalFrance 45% 47% 8% 100%Allemagne 43% 48% 9% 100%Autriche 51% 42% 6% 100%Belgique 49% 46% 5% 100%PAYS BAS 44% 51% 5% 100%Total 45% 48% 7% 100%
Nous voyons que sur l’ensemble des clients nous avons 48% de femmes, 45 % d’hommes
et 7 % de clients dont le sexe n’est pas renseigné. Selon les pays la répartition homme/femme
est quelque peu différente : plus de 50 % des clients autrichiens sont des hommes, alors qu'aux
Pays-Bas ce sont les femmes qui représentent la majorité. Ces différences sont assez faibles mais
surtout biaisées par les clients dont nous ne connaissons pas le sexe. Cependant la plus grande
différence se situe entre l’Autriche et les Pays-Bas
Répartition des clients par email/optin/téléphone selon le pays.
Pays Email OPTIN TELEPHONEFrance 89,56% 53,17% 48,84%Allemagne 89,58% 37,43% 30,47%Autriche 74,53% 31,23% 43,30%Belgique 87,27% 45,90% 49,51%PAYS BAS 94,59% 43,30% 49,47%Total 89,69% 44,56% 42,56%
12 | P a g e
Peut-on parler d’un consommateur européen ? Le cas du groupe PABO
Nous avons pratiquement 90% de nos actifs de ss11 à ss14 qui ont fourni un émail, ce
pourcentage est variable selon le pays. Nous voyons qu’aux Pays-Bas 94.59% ont une adresse
émail renseignée alors qu’en Autriche ils ne sont que 74.53%.
L’Allemagne et l’Autriche ont des lois plus «stricts» pour rendre optin les clients, ce qui explique
que dans ces deux pays le pourcentage d’optin est faible (31.23% pour l’Autriche et 37.43%
pour l’Allemagne). En France, plus de la moitié des actifs acceptent de recevoir des newsletters
Adam et Eve. Cette différence est très importante, en effet nous savons qu’une offre commerciale
faite sur des newsletters en France aura plus de répercutions qu’en Allemagne. Pour le téléphone
tous les pays hors l’Allemagne sont similaires.
Courbe cumulé croissantes des âges par pays .
Cette courbe permet de comprendre facilement la situation dans les différents pays. Nous
voyons que 75% de nos clients ont un âge inférieur à 59 ans. La répartition des clients selon leur
13 | P a g e
Peut-on parler d’un consommateur européen ? Le cas du groupe PABO
âge est quasiment identique selon le pays. Notons juste que la France (courbe rose) semble être
le pays le plus jeune et l’Autriche (courbe verte) semble être le plus vieux.
Pour confirmer cette ressemblance entre les pays nous avons décidé de supprimer les clients sans
âges (Nr) et de regarder les boîtes à moustache de la variable âge par pays.
Boîtes à moustache de la variable âge par pays.
14 | P a g e
Peut-on parler d’un consommateur européen ? Le cas du groupe PABO
Une boîte à moustache est, en statistiques, une représentation graphique permettant de re-
présenter la médiane, les quartiles et la moyenne d’une variable. Ce graphique nous confirme la
ressemblance entre les pays. Les boîtes à moustache sont pratiquement identiques pour tous les
pays. De plus nous confirmons le fait que la France est le pays le plus jeune puisque la moyenne
d’âge(+) est la plus basse alors que pour l’Autriche la moyenne d’âge est la plus haute.
Nous n’avons pas plus d’informations propres aux clients. Nous allons donc maintenant étudier
si ces quelques informations sont dépendantes ou non du pays et si avec ces informations, il est
possible de « prédire » le pays du client.
V de Cramer
En statistique, pour savoir si des variables sont dépendantes entre elles, il existe le test du
khi-deux. Ce test est sensible à la fois à l’effectif total et aux nombres de lignes et de colonnes.
Les résultats de ce test ne peuvent en général pas être comparés d’un tableau à l’autre. C’est jus-
tement pour remédier à ce problème que monsieur Cramer a mis au point une statistique connue
sous le nom de V de Cramer..
Cette statistique a un avantage, elle permet de comparer des variables entre elles, c'est-à-dire de
trouver les variables les plus dépendantes à une autre variable. De plus, elle a une interprétation
simple : quand le V est égal à 0 les variables sont indépendantes, quand le V est égal à 1 les va -
riables sont parfaitement dépendantes.
Nous allons donc analyser le V de cramer entre la variable pays et les variables analysées précé-
demment.
15 | P a g e
Peut-on parler d’un consommateur européen ? Le cas du groupe PABO
V de cramer entre la variables pays et les autres variables.
Nous voyons que la variable la plus dépendante à la variable pays est phoneid mais
0.1727 reste une valeur assez faible. Nous pouvons remarquer que les variables Age et genderid
sont très peu dépendantes à la variable pays.
En prenant les variables une par une, nous voyons qu’il y a très peu d’influence entre le pays du
client et les autres variables. Nous allons maintenant réaliser une analyse discriminante afin de
voir si la combinaison de ces variables permet une meilleure « déduction » du pays.
L’analyse discriminante Bayesienne
Nous allons calculer les probabilités d’appartenance des différents pays pour chaque client:
pj(x)=Prob(Y=j/X1=x1,...,Xp=xp).
Nous pourrons ensuite affecter le client x=(x1,x2,...,xp) au pays le plus probable.
Les fonctions fi(x) s’appellent les fonctions discriminantes. Nous allons donc réaliser cette ana-
lyse discriminante sur les clients avec comme variable cible le pays et comme variables explica-
tives les 5 variables étudiées précédemment.
Tableau de présentation de la variable cible analyse discriminante
16 | P a g e
Peut-on parler d’un consommateur européen ? Le cas du groupe PABO
Class Level Information
pays
Nom de
variable
Fréquen
ce Poids Proportion
Probabilité
a priori
Allemagn Allemagne 681385 681385 0.336084 0.200000
Autriche Autriche 73946 73946 0.036473 0.200000
Belgique Belgique 211040 211040 0.104093 0.200000
France France 718447 718447 0.354364 0.200000
Paysbas Paysbas 342606 342606 0.168986 0.200000
Ce tableau permet de connaître la répartition des clients par pays pour l’analyse discriminante.
Dans l’ordre nous avons la France qui représente 35,43% de la base, puis l’Allemagne avec
33.60% suivi des Pays-Bas avec 16.89%, puis la Belgique et l’Autriche avec respectivement
10.40% et 3.6 %. Nous avons 5 pays, l’analyse discriminante nous créera donc cinq fonctions.
Tableau des fonctions discriminantes
17 | P a g e
Peut-on parler d’un consommateur européen ? Le cas du groupe PABO
Fonction discriminante linéaire pour pays
Variable Allemagn Autriche Belgique France Paysbas
Constant -13.07766 -11.83237 -12.91955 -12.75718 -14.02817
phoneID 0.98513 1.48010 1.76151 1.75059 1.78987
EmailID 11.40440 9.83777 10.93412 10.99033 11.91840
otpin -0.16969 0.08085 0.23727 0.68448 -0.04310
sexe 4.75797 4.69981 4.75502 4.65553 4.90001
age 2.71719 2.67362 2.65755 2.57345 2.69094
Ce tableau nous permet de connaitre la fonction de répartition pour chaque pays par exemple
pour la Belgique nous avons :f(Belgique)=-12.91955+ 1.76151*phoneID+ 10.93412*EmailID+
0.23727*optin+ 4.75502*Sexe+ 2.65755*age.
Pour chaque client nous allons réaliser les 5 fonctions de répartition. Puis nous allons calculer la
proportion qu’un client soit allemand puis autrichien puis français etc …. Le client sera classé
dans le pays où il y a la plus grande proportion.
Résultats de l’analyse discriminante.
Error Count Estimates for pays
Allemagn Autriche Belgique France Paysbas Total
Rate 0.5441 0.7453 1.0000 0.5330 0.7244 0.7093
Priors 0.2000 0.2000 0.2000 0.2000 0.2000
Nous avons un taux d’erreur égale à 70.93 % en d’autres termes 70.93 % des clients sont classés
dans un pays qui n’est pas le leur. Nous avons un taux d’erreur sur la Belgique de 100%.
18 | P a g e
Peut-on parler d’un consommateur européen ? Le cas du groupe PABO
Cela nous permet de conclure que malgré quelques différences de profil entre les pays, ces diffé-
rences ne sont pas suffisamment importantes pour dire qu’un client avec ce profil correspond à
tel ou tel pays.
1.
2.
3.
3.1.
Conclusion
Nous notons quelques différences sur le profil client selon le pays, ses petites différences
sont souvent dûes à des caractéristiques propres au pays. Par exemple, il y a moins de clients
optin en Allemagne et en Autriche dû à une réglementation plus stricte sur le sujet dans ces deux
pays.
Mais en règle générale il n’y a pas de différences significatives sur le profil client selon le pays.
Les principales données de la base se situent au niveau du comportement d’achat. Nous allons
justement étudier ce comportement d’achat. Au vu des résultats sur le profil client nous pouvons
émettre l’hypothèse qu’il n’y aura pas de différences significatives sur le comportement d’achat
entre les pays.
2.
3.
3.1.
3.2. Comportement d'achat dans les différents pays
Après avoir vu le profil client dans les différents pays du groupe PABO nous allons maintenant
nous intéresser à l’assortiment produits. Cette étude aura pour but de savoir si les clients achètent
les mêmes assortiments selon le pays .
1.
19 | P a g e
Peut-on parler d’un consommateur européen ? Le cas du groupe PABO
2.
3.
4.
4.1.
Classification des variables assortiments
Le groupe a une gamme de produits très diversifiée. Voici les 13 assortiments principaux du
groupe :
Assortiment Aideaccessoires Exemple bracelets , colliers etc…
home Produits pour la maison ( housses de couette ...)lingsoft Lingerie placée dans la catégorie softappsoft Vêtements( robe , jupe,..) placés dans la catégorie soft
body Produits pour le corps ( crèmes ..)toysoft Sextoys placés dans la catégorie des produits soft
drugsoft Drugstore ( pilule ,nettoyant …) placé dans la catégorie des produits softtoyshard Sextoys placés dans la catégorie des produits hard drughard Drugstore ( pilule ,nettoyant …) placé dans la catégorie des produits hardincentive Les cadeaux
dvd Les dvdlinghard Lingerie placée dans la catégorie hardapphard Vêtements ( robe , jupe,..) placés dans la catégorie hard
20 | P a g e
Peut-on parler d’un consommateur européen ? Le cas du groupe PABO
Nous avons décidé de réaliser une classification automatique des assortiments dans
chacun des pays afin d’avoir des groupes homogènes c'est-à-dire que des assortiments seront
dans le même groupe si ils ont une corrélation positive et seront dans des groupes différents si les
produits sont très peu corrélés entre eux.
Pour réaliser cette classification, nous allons utiliser une proc Varclus sous sas. Elle réa-
lise une classification de variables numériques selon une méthode descendante. L'objectif est
d'obtenir une partition des assortiments en groupes homogènes, regroupant les assortiments for-
tement corrélés entre eux et telle que deux assortiments de classes différentes soient faiblement
corrélés. Au départ tous les assortiments se trouvent dans une classe unique, puis on divise cette
classe en deux. Si l'une des classes n'est pas suffisamment homogène, au sens d'un certain critère,
cette classe est à son tour divisée en deux classes homogènes. Nous répétons cet algorithme et il
s'arrête lorsque plus aucune classe ne peut être divisée. On obtient ainsi la répartition la plus fine
des assortiments en K classes distinctes. Pour construire les classes, l’algorithme réalise une ana-
lyse en composantes principales (ACP) sur les assortiments, puis il réalise une rotation sur cette
ACP afin d'obtenir deux nouvelles composantes plus facilement interprétables en fonction des
variables initiales, car mieux corrélées avec certaines de ces variables et donc moins bien corré-
lées avec les autres variables.
Représentation d’une rotation orthogonale
Nous allons vous détailler l’analyse pour la France, puis après nous étudierons les différences
avec les autres pays.
Analyse sur la France
21 | P a g e
Peut-on parler d’un consommateur européen ? Le cas du groupe PABO
Tableau de la première répartition.
Cluster Summary for 1 Cluster
Cluster Members
Cluster
Variation
Variation
Explained
Proportion
Explained
Second
Eigenvalue
1 13 13 1.774289 0.1365 1.3892
La première partition est constituée d'une seule classe, contenant les 13 variables (les
assortiments présentés dans le tableau de la page précédente). La variance de cette classe est
égale à 13 puisque nous avons réduit les variables.
La variance expliquée par cette classe, est égale à la variance de sa composante, donc ici sa
première composante principale, vaut λ1=1.774289. Elle explique 13.65 % de la variance
La seconde valeur propre est égale à 1.3892. Cette valeur étant supérieure à 1, la classe va être
divisée.
Tableau de la première itération
Phase Itération
Variance
Accounted
For Accesoire body home Incentive dvd toyssoft Drugsoft lingsoft appsoft toyshard
Split 0 1.774289 1 1 1 1 1 1 1 1 1 1
NCS 1 3.127454 1 2 1 2 2 2 2 1 1 2
NCS 2 3.127454 1 2 1 2 2 2 2 1 1 2
22 | P a g e
Peut-on parler d’un consommateur européen ? Le cas du groupe PABO
Ce tableau indique les différentes étapes de l'algorithme de construction des deux pre-
mières classes, à partir de l'ACP oblique et des phases de réaffectation. Dans le tableau ci-dessus,
seules 10 variables sur les 13 sont présentées pour faciliter la lecture et la compréhension.
Sur la 1ère ligne (Split), on trouve la composition de la partition de la 1ère étape. Toutes les
variables sont regroupées dans une seule classe et nous retrouvons notre valeur propre égale à
1.774289.
Les deux lignes suivantes concernent la deuxième étape de l’algorithme. Sur la 1ère ligne
on lit
l'affectation des variables à la classe 1 (variables accessoire, home, lingsoft, appsoft), les autres
variables sont classées dans la classe 2. La variance expliquée par cette partition en 2 classes
vaut 3.127454. Sur la 2ème ligne (Iteration 2), on observe que les variables n'ont pas changé de
classe, et que la variance expliquée par la partition est inchangée, cela signifie que l'algorithme a
convergé.
Tableau de la deuxième répartition
Cluster Summary for 2 Clusters
Cluster Members
Cluster
Variation
Variation
Explained
Proportion
Explained
Second
Eigenvalue
1 6 6 1.596345 0.2661 1.0932
2 7 7 1.531109 0.2187 1.1835
Total variation explained = 3.127454 Proportion = 0.2406
La classe 1 contient 6 variables, sa variance vaut 6. La variance de sa composante vaut
1.596345, qui explique 26.61% de la variance de la classe. La seconde valeur propre vaut
1.0932. La classe 2 contient 7 variables, sa variance vaut 7. La variance de sa composante vaut
1.531109, qui explique 21.87% de la variance de la classe. La seconde valeur propre vaut
1.18358
23 | P a g e
Peut-on parler d’un consommateur européen ? Le cas du groupe PABO
La variance expliquée par la partition (Total variation explained), égale à la somme des variances
des composantes de chaque classe, vaut 3.127454, ce qui représente une part (Proportion) de la
variance totale égale à 24.06%. La classe 2 est celle qui a la plus grande seconde valeur propre et
qui est supérieure à 1. Cette classe va donc être divisée à l'étape suivante.
Nous répétons ensuite cet algorithme, et nous l’arrêtons quand nous ne pouvons plus diviser les
classes c'est-à-dire quand λ2<1.
Tableau de la répartition à la fin de la classification.
Cluster Summary for 5 Clusters
Cluster Members
Cluster
Variation
Variation
Explained
Proportion
Explained
Second
Eigenvalue
1 4 4 1.483052 0.3708 0.9521
2 3 3 1.289861 0.4300 0.9471
3 2 2 1.259856 0.6299 0.7401
4 2 2 1.194046 0.5970 0.8060
5 2 2 1.131821 0.5659 0.8682
Total variation explained = 6.358636 Proportion = 0.4891
24 | P a g e
Peut-on parler d’un consommateur européen ? Le cas du groupe PABO
A la fin de l’algorithme nous avons une répartition en 5 classes. Cette répartition explique
48.91% de la variance. Lors de la première ACP nous avions une part de la variance expliquée
égale à 13.65%. Cette méthode de classification des variables nous a permis d’augmenter consi-
dérablement la part d’informations expliquées.
Nous remarquons que toutes les deuxièmes valeurs propres sont inférieures à 1 ce qui explique la
fin de l’algorithme, c'est-à-dire qu’en recommençant l’algorithme nous ne trouverons plus
d’autres groupes homogènes.
Cette répartition en 5 groupes est donc la meilleure possible.
Nous allons maintenant analyser la composition de chaque groupe afin de savoir quels sont les
assortiments corrélés entre eux et quels sont les assortiments qui s’opposent.
Tableau de la composition des groupes.
5 Clusters R-squared with
1-R**2
RatioCluster Variable
Own
Cluster
Next
Closest
Cluster 1 Accesoire 0.2176 0.0053 0.7866
home 0.1802 0.0093 0.8275
lingsoft 0.5187 0.0160 0.4891
appsoft 0.5666 0.0159 0.4404
Cluster 2 body 0.2182 0.0136 0.7926
25 | P a g e
Peut-on parler d’un consommateur européen ? Le cas du groupe PABO
5 Clusters R-squared with
1-R**2
RatioCluster Variable
Own
Cluster
Next
Closest
Drugsoft 0.5672 0.0244 0.4436
Drughard 0.5045 0.0076 0.4994
Cluster 3 Incentive 0.6299 0.0109 0.3742
dvd 0.6299 0.0038 0.3715
Cluster 4 linghard 0.5970 0.0087 0.4065
apphard 0.5970 0.0227 0.4123
Cluster 5 toyssoft 0.5659 0.0084 0.4378
toyshard 0.5659 0.0199 0.4429
Pour information le R² owncluster est le coefficient de corrélation entre la variable et la
composante de sa classe. Alors que le R² nextclosest est le coefficient de corrélation entre la va-
riable et la composante de la classe “la plus proche" autre que sa propre classe, au sens de la cor-
rélation au carré.
On lit par exemple que la variable DVD est bien représentative de la classe 3, puisqu'elle est très
corrélée (r2=0.6299) avec la composante de cette classe, et faiblement corrélée (r2=0.038) à la
classe dont elle est le plus proche. En d’autres termes, nos acheteurs dvd en France semblent être
des acheteurs très atypiques par rapport au reste de la bdd.
Nous pouvons résumer les groupes de cette façon :
le groupe 1 correspond à nos clients achetant des produits très soft.
Notre groupe 2 regroupe les clients qui sont appétant au produit de type crèmes, produits
d’entretiens, pilules
Notre groupe 3 est le plus atypique, il concerne les acheteurs de DVD et de cadeaux
payants.
26 | P a g e
Peut-on parler d’un consommateur européen ? Le cas du groupe PABO
Le groupe 4 est composé de clients aimant les vêtements et sous-vêtements de type latex.
Notre dernier groupe est constitué de nos clients « Toys ».
Tableau inter-cluster.
Inter-Cluster Correlations
Cluster 1 2 3 4 5
1 1.00000 0.10443 0.06861 0.15773 0.03743
2 0.10443 1.00000 0.10275 0.02969 0.15452
3 0.06861 0.10275 1.00000 0.02457 0.08584
4 0.15773 0.02969 0.02457 1.00000 0.05432
5 0.03743 0.15452 0.08584 0.05432 1.00000
Le tableau ci-dessus exprime la corrélation entre chaque clusters et nous remarquons qu’aucune
corrélation n'est supérieure à 0.16, ce qui signifie que les groupes sont homogènes.
Number
of
Clusters
Total
Variation
Explained
by Clusters
Proportion
of Variation
Explained
by Clusters
Minimum
Proportion
Explained
by a Cluster
Maximum
Second
Eigenvalue
in a Cluster
Minimum
R-squared
for a
Variable
Maximum
1-R**2 Ratio
for a
Variable
1 1.774289 0.1365 0.1365 1.389220 0.0363
2 3.127454 0.2406 0.2187 1.183451 0.0909 0.9099
3 4.273348 0.3287 0.2661 1.093211 0.1266 0.8813
4 5.354101 0.4119 0.2834 1.026221 0.1331 0.8788
5 6.358636 0.4891 0.3708 0.952119 0.1802 0.8275
Quelques commentaires
Ce tableau montre bien que les partitions contiennent des classes de plus en plus homogènes :
27 | P a g e
Peut-on parler d’un consommateur européen ? Le cas du groupe PABO
la part de variance expliquée par la partition augmente(Total Variation Explained) .
les composantes des classes expliquent une part croissante des variances des classes (Pro-
portionof Variation Explained);
les variances des deuxièmes composantes principales des classes diminuent (Maximum
Second Eigenvalue);
les variables sont de plus en plus corrélées avec les composantes de leur propre
classe(Minimum R-squared), et de moins en moins corrélées avec les composantes des
autres classes (Maximum 1-R**2 Ratio for a Variable).
Analyse de tous les pays :
Après avoir fait l’analyse sur la France, nous allons réaliser cette classification pour
chaque pays afin de voir si les groupes dans les autres pays sont identiques à ceux trouvés pour la
France ou au contraire si selon le pays les corrélations entre les assortiments changent.
Ttableau des classifications dans les différents pays.
accesoire accesoire Accesoire Accesoire Accesoirehome body home Lingsoft home
lingsoft home lingsoft appsoft lingsoftappsoft lingsoft appsoft toyssoft appsoftbody appsoft body drugsoft toyssoft
toysoft toyssoft Drugsoft toyshard toysharddrugsoft drugsoft drughard drughard incentive toyshard toyshard incentive incentive dvddrughard drughard dvd dvd linghardincentive incentive linghard linghard apphard
dvd dvd apphard apphard bodylinghard linghard toyssoft body drugsoftapphard apphard toyshard home drughardCluster 4
cluster 1
cluster2
cluster3
cluster4
Cluster 1
Cluster 2
Cluster 3
Cluster 4
Cluster 1
Cluster 2
Cluster 3
ATSFRSNLSDES
Cluster 5
Cluster 1
Cluster 2
Cluster 3
Cluster 4
Cluster 5
Cluster 1
BES
Cluster 5
Cluster 4
Cluster 3
Cluster 2
28 | P a g e
Peut-on parler d’un consommateur européen ? Le cas du groupe PABO
Nous pouvons voir que le nombre de clusters changent selon les pays étudiés. En France,
en Autriche et en Belgique les assortiments sont répartis en 5 groupes alors qu’en Allemagne et
au Pays-Bas il n'y en a que 4.
Cependant il existe des similitudes dans tous les pays :
Les assortiments incentive et dvd sont regroupés dans un seul groupe pour chaque pays, de
même pour les assortiments linghard et apphard. Ce sont des clients atypiques dans tous les pays
du groupe. Il existe aussi des différences: en France et en Belgique ce sont les seuls pays où les
drugstore et les Toys ne sont pas dans le même groupe c'est-à-dire que ces assortiments ne sont
pas suffisamment corrélés entre eux pour ne former qu’un seul groupe. Dans ces pays, les ache-
teurs toys sont des clients assez atypiques au même titre que nos clients dvd. En effet dans tout
les pays le groupe qui comporte les clients dvd et incentive est le groupe ou les variables sont le
plus corrélées avec la composante de sa propre classe et la moins corrélées avec la composante
de la classe la plus proche
Toutes nos recommandations pour le groupe PABO se trouveront dans la dernière partie de ce
mémoire.
Après avoir analysé les différents assortiments nous allons maintenant nous intéresser à l'impact
d’internet dans les différents pays.
3.3. Évolution des commandes internet.
Le développement d’internet à modifier beaucoup de choses dans le monde de la vente à
distance :
Concurrence plus agressive
Guerre des prix
Clients moins fidèles
Impact des catalogues diminué
Aujourd’hui nous savons que pour l’entreprise Adam et Eve la plus grande partie des
commandes est réalisée sur internet. De ce fait, en France, les coûts destinés au « Offline » sont 29 | P a g e
Peut-on parler d’un consommateur européen ? Le cas du groupe PABO
de plus en plus faibles ( baisse du nombre de catalogues, aucune acquisition offline, baisse de la
qualité du papier …). Mais cette évolution d’internet est-elle la même dans tous les pays du
groupe ?
Nous avons décidé de présenter l’évolution du pourcentage des commandes online et offline
pendant 40 mois du 01/01/2011 au 04/04/2014. Pour information en France, en Allemagne et au
Pays-Bas il y a la même pression commerciale en offline. Les autres pays reçoivent moins de
catalogues.
Nous allons seulement vous montrer les graphiques où il y a des différences significatives.
Graphique pour la France
30 | P a g e
Peut-on parler d’un consommateur européen ? Le cas du groupe PABO
En France par exemple nous avons une constante évolution du pourcentage online. En
janvier 2011 plus de la moitié des commandes ne sont pas faites sur internet, à partir du mois de
mai 2011 plus de la moitié des commandes se font sur internet et au mois de mars 2014 les
commandes online représentent 76% des commandes. Cette évolution est quasi identique pour
les autres pays , hormis pour les Pays-Bas et l’Autriche où l’évolution d’internet n’est pas tout à
fait identique.
31 | P a g e
Peut-on parler d’un consommateur européen ? Le cas du groupe PABO
Graphique pour les Pays-Bas
Pour les Pays-bas la tendance est la même que pour la France ou pour l’Allemagne mais
elle est beaucoup plus marquée, c'est-à-dire que l’évolution est beaucoup plus rapide. En effet les
Pays-Bas est le pays où l’écart entre le online et le offline est le plus grande. Dans ce pays, la
part des commandes offline est égale à 10 % en mars 2014.
Cette analyse nous explique mieux pour quelles raisons les catalogues marchent moins bien au
Pays-Bas que dans les autres pays. L’envoie d’un catalogue aux Pays-Bas génère cependant des
commandes sur internet mais la question que l'on peut se poser dans ce pays est : doit-on changer
le format et la communication des offres commerciales papiers ?
32 | P a g e
Peut-on parler d’un consommateur européen ? Le cas du groupe PABO
Graphique pour l’Autriche
Pour l’Autriche, l’évolution d’internet est beaucoup plus lente et beaucoup moins
marquée.
Tout d’abord l’écart entre le offline et le online est beaucoup moins important que dans les autres
pays. En février 2011, le offline représente 80 % des commandes. De plus, en novembre 2012
(mois 22), 60 % des commandes étaient effectuées via le offline. Le online devient vraiment
important à partir de janvier 2013. De nos jours, le online représente seulement 70 % des
commandes alors que dans d’autres pays il approche ou dépasse les 80 %. Dans un pays comme
l’Autriche les catalogues papiers ont encore de l’impact.
Au vu des graphiques ci-dessus, nous arrivons facilement à voir que l’évolution des commandes
online n’est pas la même dans tous les pays.
33 | P a g e
Peut-on parler d’un consommateur européen ? Le cas du groupe PABO
Cette différence entre les pays entraîne forcement des prises de décisions que nous verrons dans
la dernière partie de ce mémoire.
3.4. Analyse du canal d’achat.
Nous avons observé dans l’analyse précédente que le groupe PABO a connu une évolution très
importante de ses commandes online. Mais que ce soit pour les commandes online ou les
commandes offline, il existe des sous-canaux d’achat :
Canaux online DescriptionNewsletter Achat dû à une newsletterShop Achat sur le site internetGoogle Achat acquis grâce à une requête GoogleAffiliate partner Achat acquis grâce à l'affiliationSEO Achat acquis grâce au référencement gratuitComparison Achat acquis grâce à un site de comparaison de prix SEM Achat acquis grâce au référencement payant autre que Google Social Media Achat acquis grâce aux réseaux sociaux.Autres Autres canaux online
Canaux offline DescriptionManuelle Commande réalisée directement sur bon de commandeFax Commande réalisée sur faxTéléphone Commande réalisée par téléphoneEchange Echange de commandeCadeau Commande cadeauAbonnement DVD Commande dû à un abonnement DVD
34 | P a g e
Peut-on parler d’un consommateur européen ? Le cas du groupe PABO
Cette méthode nous permettra de créer nos groupes de clients et nous analyserons ces groupes et
les possibles regroupements grâce à une classification ascendante hiérarchique (CAH).
CAH
Cette méthode est utilisable dès que l’on dispose d’une distance entre des individus sur des
variables. Cette méthode peut être elle aussi décrite en 4 étapes :
1. Les classes initiales sont les observations
2. On calcule les distances entre classes
3. Les 2 classes les plus proches sont fusionnées et remplacées par une seule
4. On reprend en 2) jusqu’à n’avoir plus qu’une seule classe, qui contient toutes les
observations
35 | P a g e
Peut-on parler d’un consommateur européen ? Le cas du groupe PABO
Analyse pour tous les pays :
Nous allons donc travailler sur l’ensemble des pays (France, Allemagne, Pays-Bas,
Autriche, Belgique). Le but de cette analyse est de créer une classification et ensuite d'analyser
cette classification pour chaque pays afin de voir si la répartition change selon le pays. Nous
allons dans un premier temps réaliser une ACP afin de visualiser nos données sur les deux
premiers axes et avoir un premier aperçu de nos données.
36 | P a g e
Peut-on parler d’un consommateur européen ? Le cas du groupe PABO
Dans le graphique ci-dessus, nous représentons la répartition des variables sur les deux
premiers axes factoriels. Nous voyons qu’il y a des variables qui s’opposent et d’autres qui sont
plutôt corrélées entre elles. Nous pouvons donc représenter 4 groupes. Les personnes achetant
principalement via Google, les personnes achetant sur les canaux offline ( fax, manuelle,
téléphone …), les personnes achetant principalement via le shop et les newsletters puis nous
avons les autres clients.
37 | P a g e
Peut-on parler d’un consommateur européen ? Le cas du groupe PABO
La répartition des clients dans les deux premiers axes factoriels. Suite à cette ACP nous allons
réaliser la première partie de notre classification avec les centres mobiles.
38 | P a g e
Peut-on parler d’un consommateur européen ? Le cas du groupe PABO
Les résultats de nos classifications sont assez bons. En effet il existe deux critères principaux à
vérifier pour avoir une bonne classification : il faut que le CCC soit supérieur à 2, ici nous avons
2280 et il faut que le R² soit supérieur à 0 et ici nous avons 0.380. Nous avons donc réparti les
clients en 11 groupes distincts.
Nous avons le groupe 3 qui comporte 82.69 % de notre population, ce groupe risque d’être notre
population « normal » sans comportement atypique pour l’ensemble du groupe. Puis nous avons
10 autres groupes beaucoup plus atypiques. Nous allons vous représenter ces groupes sur les
deux axes principaux de l’ACP faite précédemment.
.
39 | P a g e
Peut-on parler d’un consommateur européen ? Le cas du groupe PABO
.
Les 11 groupes sur les deux premiers axes ont l’air assez homogènes. Nous voyons que le groupe
11 (jaune) et le groupe 6 (rose) semblent tout de même quelque peu sortir du lot.
Nous allons maintenant essayer de réduire ce nombre de groupe via une CAH puis nous allons
vous expliquer à quoi correspondent les groupes et pour finir nous allons faire le plus important
de cette analyse c'est-à-dire regarder la répartition par pays.
40 | P a g e
Peut-on parler d’un consommateur européen ? Le cas du groupe PABO
La CAH nous permet de passer de 11 groupes à 9 groupes sans perdre trop d’informations. Nous
allons regrouper les clients qui étaient dans les groupes 3 et 4 ainsi que les clients qui étaient
dans les groupes 8 et 11.
41 | P a g e
Peut-on parler d’un consommateur européen ? Le cas du groupe PABO
Le Cluster 1 est composé de 9022 clients
(soit 11,56%) achetant beaucoup plus que
la moyenne sur le canal « manuelle », en
effet ils ont une moyenne de 286.4 €
contre 9.3 € dans l’ensemble de la
population. Ce groupe correspond plutôt à
nos clients « offline » car ils
commandent beaucoup sur le canal
d'achat manuelle, abodvd, fax téléphone
et ils dépensent moins que la population
en shop, google, et newsletters. groupe
est composé de 9 022 clients.
Le cluster 2 correspond à notre
population « normal ». En effet ce
groupe est composé de 645 000 clients
(soit 82.6%) qui n'ont pas vraiment de
caractéristiques très différentes de
l’ensemble de la population. Ils ont une
moyenne un petit plus haute en google,
affliation et newsletters que la
population, par contre ils ont une
moyenne inférieure en shop
principalement.
42 | P a g e
Variable
Moyenne
dans la classe
Moyenne générale
Effectif dans la classe
Valeur
test ---------manuelle 286,4 9,3 9.022 563,4 |****abodvd 16,9 0,2 9.022 250,6 |****fax 16,6 0,3 9.022 225,4 |****telephone 37,6 2,5 9.022 125,7 |****cadeau 0,0 0,0 9.022 1,6 |*echange 1,1 1,2 9.022 1,2- |SEM - 0,1 9.022 2,4- ***|Comparison - 0,4 9.022 6,4- ****|SEO 0,2 1,6 9.022 10,6- ****|affliation 0,3 3,9 9.022 16,6- ****|Newsletters 1,5 13,7 9.022 28,1- ****|google 0,5 10,1 9.022 30,4- ****|Shop 2,2 24,0 9.022 38,9- ****|
CLUSTER=1
Variable
Moyenne
dans la classe
Moyenne générale
Effectif dans la classe
Valeur
test ---------manuelle 286,4 9,3 9.022 563,4 |****
abodvd 16,9 0,2 9.022 250,6 |****
fax 16,6 0,3 9.022 225,4 |****
telephone 37,6 2,5 9.022 125,7 |****
cadeau 0,0 0,0 9.022 1,6 |*
echange 1,1 1,2 9.022 1,2- |
SEM - 0,1 9.022 2,4- ***|
Comparison - 0,4 9.022 6,4- ****|
SEO 0,2 1,6 9.022 10,6- ****|
affliation 0,3 3,9 9.022 16,6- ****|
Newsletters 1,5 13,7 9.022 28,1- ****|
google 0,5 10,1 9.022 30,4- ****|
Shop 2,2 24,0 9.022 38,9- ****|
CLUSTER=1
Variable
Moyenne
dans la classe
Moyenne générale
Effectif dans la classe
Valeur
test ---------google 11,3 10,1 645.000 74,7 |****
affliation 4,4 3,9 645.000 42,1 |****
Newsletters 14,2 13,7 645.000 21,1 |****
cadeau 0,0 0,0 645.000 9,4 |****
email_order 0,0 0,0 645.000 4,7- ***|
Social 0,0 0,0 645.000 9,6- ****|
telephone 2,4 2,5 645.000 10,1- ****|
SEM 0,0 0,1 645.000 39,7- ****|
fax 0,1 0,3 645.000 52,1- ****|
abodvd 0,1 0,2 645.000 57,4- ****|
Comparison 0,1 0,4 645.000 99,9- ****|
manuelle 6,8 9,3 645.000 100,2- ****|
SEO 0,4 1,6 645.000 180,7- ****|
echange 0,3 1,2 645.000 197,7- ****|
Shop 8,9 24,0 645.000 546,4- ****|
CLUSTER=2
Peut-on parler d’un consommateur européen ? Le cas du groupe PABO
Notre groupe 3 est composé de 99 339
clients ( soit 12.73 %) très appètent au
canal shop. En effet les clients de ce
groupe dépensent en moyenne 124.9 €
contre 24 € pour la population. Ce
groupe dépense moins que la
population sur tous les autres canaux.
Ces clients seront très réactifs à la
home page du site et au contenu du site
web.
Le groupe 4 est composé seulement de 9
clients aucune explication n’est
nécessaire.
.
43 | P a g e
Variable
Moyenne
dans la classe
Moyenne générale
Effectif dans la classe
Valeur
test ---------email_order 96,5 0,0 9 695,6 |****
telephone 29,5 2,5 9 3,0 |***
CLUSTER=4
Variable
Moyenne
dans la classe
Moyenne générale
Effectif dans la classe
Valeur
test ---------Shop 124,9 24,0 99.339 636,6 |****email_order - 0,0 99.339 1,4- *|
Social - 0,0 99.339 1,8- **|
SEM 0,0 0,1 99.339 7,9- ****|
cadeau 0,0 0,0 99.339 10,7- ****|
fax 0,0 0,3 99.339 10,8- ****|
abodvd 0,0 0,2 99.339 12,1- ****|
Comparison 0,0 0,4 99.339 21,5- ****|
telephone 0,5 2,5 99.339 25,9- ****|Newsletters 10,0 13,7 99.339 30,2- ****|
echange 0,3 1,2 99.339 33,6- ****|
SEO 0,1 1,6 99.339 37,9- ****|
affliation 1,2 3,9 99.339 43,4- ****|
manuelle 1,3 9,3 99.339 57,1- ****|
google 3,0 10,1 99.339 79,4- ****|
CLUSTER=3
Variable
Moyenne
dans la classe
Moyenne générale
Effectif dans la classe
Valeur
test ---------email_order 96,5 0,0 9 695,6 |****telephone 29,5 2,5 9 3,0 |***
CLUSTER=4
Peut-on parler d’un consommateur européen ? Le cas du groupe PABO
Notre groupe 5 est composé de 11 952 clients
(soit 1.53%) qui commandent plus que les
autres clients sur les canaux « échange »,
« newsletters », « Google », « affiliation » et
« shop ». Ces clients ne sont pas du tout
offline, en effet nous retrouvons les
principaux canaux offline en bas du tableau.
Ce groupe composé de 3 435 clients( soit
0.44%) est très intéressant. Il s’agit de
clients qui dépensent beaucoup via les sites
de comparaison. Ces clients ont donc
tendance à aller chercher l’information sur
ce genre de site plutôt que de venir
directement sur le site adameteve.fr. Ces
clients risquent d’être très sensibles au prix.
De plus un effort doit être fait pour garder
une bonne visibilité sur ce genre de site afin
de garder et de fidéliser ce genre de clients.
44 | P a g e
Variable
Moyenne
dans la classe
Moyenne générale
Effectif dans la classe
Valeur
test ---------echange 56,3 1,2 11.952 706,9 |****
Newsletters 34,2 13,7 11.952 54,2 |****
google 18,1 10,1 11.952 29,2 |****affliation 7,5 3,9 11.952 18,5 |****
Shop 31,7 24,0 11.952 15,9 |****
cadeau 0,0 0,0 11.952 2,4 |***telephone 2,9 2,5 11.952 1,5 |*
SEM 0,0 0,1 11.952 2,5- ***|
fax 0,1 0,3 11.952 2,7- ***|SEO 1,2 1,6 11.952 2,9- ***|
abodvd 0,0 0,2 11.952 3,6- ***|
Comparison 0,1 0,4 11.952 5,5- ****|manuelle 6,4 9,3 11.952 6,8- ****|
CLUSTER=5
Variable
Moyenne
dans la classe
Moyenne générale
Effectif dans la classe
Valeur
test ---------Comparison 67,1 0,4 3.435 711,1 |****SEM - 0,1 3.435 1,5- *|
fax - 0,3 3.435 2,2- **|cadeau 0,0 0,0 3.435 2,2- **|abodvd - 0,2 3.435 2,3- **|Newsletters 11,8 13,7 3.435 2,7- ***|
telephone 0,4 2,5 3.435 4,7- ***|SEO 0,5 1,6 3.435 4,8- ***|
affliation 1,5 3,9 3.435 6,9- ****|manuelle 1,4 9,3 3.435 9,9- ****|google 2,9 10,1 3.435 14,0- ****|Shop 10,8 24,0 3.435 14,5- ****|
CLUSTER=6
Peut-on parler d’un consommateur européen ? Le cas du groupe PABO
Le groupe 7 est composé de 10574
clients (soit 1.35%) qui passent leurs
commandes via un référencement non
payant dit naturel. Ces clients ont une
moyenne sur le SEO de 89.5 € contre
1.6 € pour les autres clients. Ils
dépensent moins sur tous les autres
canaux. Pour ces clients, il faut que
l’on continue à se positionner haut sur
les pages Google et que le SEO du
nouveau site permette de trouver
facilement le site web sinon ce type de
clients ne viendra peut être plus.
Ce groupe est composé de 512 clients.
Ce sont des clients qui achètent via du
SEM autre que Google. Le groupe est
surtout visible sur google ce qui peut
expliquer le peu de clients se trouvant
sur ce cluster mais ils s’agit bien d’un
groupe atypique.
Ce dernier groupe sont nos clients qui
achètent via les réseaux sociaux. Cette
technologie est encore peu prise en
compte dans l'entreprise.
45 | P a g e
Variable
Moyenne
dans la classe
Moyenne générale
Effectif dans la classe
Valeur
test ---------Social 55,5 0,0 21 835,9 |****
google 45,2 10,1 21 5,3 |****echange 4,3 1,2 21 1,7 |**
CLUSTER=9
Variable
Moyenne
dans la classe
Moyenne générale
Effectif dans la classe
Valeur
test ---------SEO 89,5 1,6 10.574 716,2 |****
SEM 0,0 0,1 10.574 2,5- ***|
cadeau 0,0 0,0 10.574 2,6- ***|
fax 0,1 0,3 10.574 2,9- ***|
abodvd 0,0 0,2 10.574 3,6- ***|
echange 0,6 1,2 10.574 6,3- ****|
Comparison 0,0 0,4 10.574 6,4- ****|
telephone 0,7 2,5 10.574 7,1- ****|
google 7,3 10,1 10.574 9,6- ****|Newsletters 9,1 13,7 10.574 11,4- ****|
affliation 1,4 3,9 10.574 12,2- ****|
manuelle 2,3 9,3 10.574 15,2- ****|
Shop 13,3 24,0 10.574 20,6- ****|
CLUSTER=7
Variable
Moyenne
dans la classe
Moyenne générale
Effectif dans la classe
Valeur
test ---------SEO 89,5 1,6 10.574 716,2 |****
SEM 0,0 0,1 10.574 2,5- ***|cadeau 0,0 0,0 10.574 2,6- ***|
fax 0,1 0,3 10.574 2,9- ***|
abodvd 0,0 0,2 10.574 3,6- ***|
echange 0,6 1,2 10.574 6,3- ****|
Comparison 0,0 0,4 10.574 6,4- ****|
telephone 0,7 2,5 10.574 7,1- ****|
google 7,3 10,1 10.574 9,6- ****|Newsletters 9,1 13,7 10.574 11,4- ****|
affliation 1,4 3,9 10.574 12,2- ****|
manuelle 2,3 9,3 10.574 15,2- ****|
Shop 13,3 24,0 10.574 20,6- ****|
CLUSTER=7
Variable
Moyenne
dans la classe
Moyenne générale
Effectif dans la classe
Valeur
test ---------SEM 77,4 0,1 512 725,8 |****
echange 1,9 1,2 512 1,9 |**
Comparison 0,1 0,4 512 1,3- |
SEO 0,7 1,6 512 1,5- *|
telephone 0,2 2,5 512 1,9- **|
Shop 19,3 24,0 512 2,0- **|
Newsletters 9,5 13,7 512 2,3- ***|
affliation 1,2 3,9 512 2,9- ***|
manuelle 1,1 9,3 512 4,0- ***|
google 4,5 10,1 512 4,2- ***|
CLUSTER=8
Peut-on parler d’un consommateur européen ? Le cas du groupe PABO
Cluster/pays Allemagne Autriche Belgique France Pays-bas Total0,5% 0,1% 0,2% 0,3% 0,1% 1,2%
38,7% 8,7% 18,0% 23,4% 11,3% 100,0%1,4% 3,1% 1,9% 0,8% 0,7%
25,4% 2,4% 9,8% 30,2% 14,8% 82,7%30,8% 2,9% 11,9% 36,5% 17,9% 100,0%78,3% 74,6% 88,6% 86,2% 81,8%
5,7% 0,6% 0,8% 3,1% 2,5% 12,7%44,6% 4,7% 6,4% 24,5% 19,8% 100,0%17,5% 18,5% 7,3% 8,9% 13,9%
0,0% 0,0% 0,0% 0,0% 0,0% 0,0%0,0% 0,0% 33,3% 0,0% 66,7% 100,0%0,0% 0,0% 0,0% 0,0% 0,0%0,3% 0,0% 0,2% 0,9% 0,2% 1,5%
17,5% 2,5% 10,7% 56,6% 12,8% 100,0%0,8% 1,2% 1,5% 2,5% 1,1%0,2% 0,0% 0,0% 0,1% 0,1% 0,4%
45,3% 0,0% 3,4% 25,9% 25,4% 100,0%0,6% 0,0% 0,1% 0,3% 0,6%0,4% 0,1% 0,1% 0,4% 0,3% 1,4%
32,8% 6,4% 4,6% 32,4% 23,9% 100,0%1,4% 2,7% 0,6% 1,3% 1,8% 0,0%0,0% 0,0% 0,0% 0,0% 0,0% 0,1%
45,3% 0,0% 0,0% 31,5% 23,2% 100,0%0,1% 0,0% 0,0% 0,1% 0,1% 0,0%0,0% 0,0% 0,0% 0,0% 0,0% 0,0%0,0% 0,0% 0,0% 85,7% 14,3% 100,0%0,0% 0,0% 0,0% 0,0% 0,0% 0,0%33% 3% 11% 35% 18% 100,0%
0% 0% 0% 0% 0% 0,0%100% 100% 100% 100% 100% 0,0%
9
total
1
2
3
4
5
6
7
8
Le tableau ci-dessus nous montre la répartition des clients selon leur pays et selon la
nouvelle classification. En vert ce sont les classes où le pays est surreprésenté. Par exemple les
clients allemands représentent 44.6 % des clients dans le cluster 3 alors que dans l’ensemble de
la base les clients allemands représentent seulement 33 %.
Nous voyons que les deux pays les moins atypiques c'est-à-dire où la masse de clients dans le
cluster 2 « population normal » est la plus importante sont la France et la Belgique. L’Autriche
est le pays le plus atypique en effet seulement 74.6 % de ses clients sont dans le cluster 2 quand
la Belgique en a 88.6 % par exemple.46 | P a g e
Peut-on parler d’un consommateur européen ? Le cas du groupe PABO
L’Autriche est surtout surreprésenté dans le cluster 1 ,qui correspond à nos clients « offline », ce
qui est sûrement dû à une évolution vers internet moins rapide.
La France elle est surreprésentée dans notre cluster 5 qui représente les clients utilisant
principalement les canaux « échange », « newsletters », « Google », « affiliation » et « shop ».
La Belgique et la France dans une moindre mesure ont tendance à acheter beaucoup moins
directement sur le shop et passe plutôt par Google et les liens d’affiliation. De plus 68.5 % des
acheteurs venant de sites de comparaison sont soit allemand soit hollandais .
Nous pouvons conclure cette analyse par le fait que la différence entre les pays sur le choix des
canaux est assez prononcée.
4. Impact des différences entre les pays
Dans la dernière partie des analyses statistiques pour le groupe Pabo, nous avons décidé de
réaliser quatre scoring avec la même variable cible. Le premier sur des clients français, allemand
et hollandais, le deuxième uniquement sur des clients français, le troisième sur des clients
allemand et le dernier sur des clients hollandais. A la fin de la réalisation, nous analyserons les
quatre scores et nous les classerons du meilleur score au moins bon.
Nous allons vous présenter l’intégralité des résultats du scoring pour celui qui concerne
l’ensemble des trois pays, ensuite nous vous présenterons seulement la comparaison entre les
scoring.
4.
4.1. Explication et préparation du scoring.
Pour réaliser notre score, nous allons utiliser une technique inductive, c’est à dire que nous
allons commencer par une phase d’apprentissage pour élaborer un score, qui résume les relations
entre les variables, ensuite nous appliquerons ce score à d’autres données. Dans la suite de
l’analyse nous appellerons donc « Apprentissage » l’échantillon sur lequel nous allons construire 47 | P a g e
Peut-on parler d’un consommateur européen ? Le cas du groupe PABO
notre score et dont nous connaissons la répartition de la variable cible, et nous appellerons
« Validation » le deuxième échantillon pour lequel on connait la valeur de la variable cible, que
l’on compare à la valeur prédite par le modèle.
Pour réaliser notre score, nous allons utiliser une régression logistique pour plusieurs raisons :
Elle permet d’utiliser trois types de variable explicatives (discrètes, qualitatives ou
continues).
Elle permet d’utiliser deux types de variable cible (ordinale ou nominale).
Cette régression est facilement interprétable.
Elle peut prendre en compte les interactions entre variables
Elle modélise directement une probabilité
On obtient des intervalles de confiance sur les résultats
Ils existe de nombreux tests statistiques disponibles
Sélection des données
Ce score aura pour but de probabiliser le fait qu’un client commande de nouveau la saison
suivante. Nous utiliserons comme variables explicatives les informations sur le client et son
comportement d’achat durant les saisons aw12 et ss13 et nous essayerons donc de probabiliser
un achat lors de la saison aw13.
48 | P a g e
Peut-on parler d’un consommateur européen ? Le cas du groupe PABO
4.2. Analyse de la régression logistique .
Informations sur le modèle
Data Set WORK.APPRENTISSAGE
Response Variable cible
Number of Response Levels 2
Number of Observations 476891
Model binary logit
Optimization Technique Fisher's scoring
Le score sur l’ensemble des clients des 3 pays sera donc réalisé sur la table apprentissage qui
contient plus ou moins 70 % de la population totale de ces pays soit 477 691 clients. Notre
variable cible est binaire ( a recommandé en aw13 ou n’a pas recommandé en aw13).
Profil de réponse
Valeur
ordonnée cible
Fréquence
totale
1 0 385976
2 1 91069
Dans la table apprentissage nous avons un pourcentage de cibles égal à 19.06%. Nous allons
maintenant nous intéresser à la composition de cette régression. Nous avons décidé de réaliser ce
score avec une méthode de sélection pas à pas de style mixte (stepwise) c’est à dire qu’ il n'y a
aucune variable au départ, on ajoute une à une celles qui contribuent le plus au modèle et on peut
retrancher une
variable à chaque étape si son pouvoir discriminant diminue avec l’entrée des nouvelles
variables.
49 | P a g e
Peut-on parler d’un consommateur européen ? Le cas du groupe PABO
Nombre Khi 2
EntréSupprimé dans des scores
1 nb_commande
1 1 25355,1324 <,0001
2 net 1 2 5819,7679 <,0001
3 SALESID
1 3 2633,3856 <,0001
4 dvd 1 4 1976,545 <,0001
5 lingsoft 1 5 817,9397 <,0001
6 EmailID 1 6 491,9982 <,0001
7 sexe 1 7 383,4255 <,0001
8 Incentive
1 8 259,6477 <,0001
9 Apparel 1 9 204,513 <,0001
10 Drugstore
1 10 71,5933 <,0001
11 body 1 11 55,3029 <,0001
12 age 1 12 40,8467 <,0001
13 toyssoft 1 13 33,7591 <,0001
14 toyshard 1 14 19,1082 <,0001
15 Service 1 15 14,4195 0,0001
16 phoneID 1 16 11,0709 0,0009
17 Drughard
1 17 4,721 0,0298
18 Accesoire
1 18 4,7042 0,0301
Récapitulatif sur la sélection progressive
Step
Effet
DDL Pr > Khi 2
Dans ce score, il y a 18 variables qui rentrent dans la formule. Nous remarquons qu’aucun PR
n'est supérieur à 0.05 ce qui signifie que toutes ces variables sont significatives. L’ordre n'est pas
anodin, la variable qui a le plus d’influence sur la cible est la variable nb_commande (nombre de
commandes réalisées depuis l’arrivée dans la bdd).
Le tableau qui suit nous permettra de comprendre le rôle de chaque variable, son influence sur la
variable cible et de connaître aussi l’équation mathématique du scoring. Cette formule est
composée du nom de la variable* l’estimation.
50 | P a g e
Peut-on parler d’un consommateur européen ? Le cas du groupe PABO
Erreur Khi 2type de Wald
Intercept
1 -3,9618 0,0642 3804,1008 <,0001
SALESID
1 0,1584 0,00344 2121,2493 <,0001
nb_commande
1 0,2722 0,00405 4517,169 <,0001
net 1 0,104 0,00406 655,6015 <,0001
Accesoire
1 0,0427 0,0197 4,7025 0,0301
Apparel 1 0,0834 0,0058 206,6309 <,0001
body 1 0,0982 0,0137 51,2251 <,0001
Drugstore
1 0,0227 0,00346 43,1284 <,0001
Incentive
1 0,1599 0,0105 233,5749 <,0001
dvd 1 0,2316 0,00659 1235,231 <,0001
Service 1 0,0124 0,00314 15,5937 <,0001
toyssoft 1 -0,0202 0,00356 32,1445 <,0001
lingsoft 1 0,1142 0,00375 927,471 <,0001
toyshard 1 0,0145 0,00333 18,9259 <,0001
Drughard
1 0,0207 0,00955 4,7104 0,03
phoneID 1 -0,0267 0,0079 11,3987 0,0007
EmailID 1 -0,2383 0,0134 315,9459 <,0001
sexe 1 -0,1248 0,00686 330,581 <,0001
age 1 0,00186 0,000283 43,0711 <,0001
Analyse des estimations du maximum de vraisemblanceParamètre DDL
Estimation
Pr > Khi 2
Nous allons dans un premier temps analyser le khi2 de wald. Cette valeur est très importante, elle
permet de tester la significativité de chaque coefficient. On compare le score sans le coefficient
de cette variable avec le score contenant tous les coefficients. Pour que le coefficient soit
significatif, il faut que le khi² soit supérieur à 4. En jaune, nous avons les deux plus petits khi2 et
nous voyons qu’ils sont supérieurs à 4 donc tous les coefficients sont significatifs.
51 | P a g e
Peut-on parler d’un consommateur européen ? Le cas du groupe PABO
Maintenant intéressons nous au coefficient, nous voyons que 4 coefficients sont négatifs
( toyssosft, phoneid, emailid et sexe). Cela signifie que ces valeurs influencent négativement la
variable cible, en d’autres termes pour le mail par exemple les personnes n’ayant pas de mail
renseigné ont un pourcentage de commander de nouveau en Aw13 supérieur aux clients avec
email.
Notre score sera égale à score= 3,9618+ 0,1584*SALESID +0,2722*nb_commande +……+
0,00186*age.
4.3. Test de concordance.
Percent Concordant
68,7 Somers' D
0,38
Percent Discordant
30,7 Gamma 0,383
Percent Tied
0,6 Tau-a 0,117
Pairs 35150448344 c 0,69
Association des probabilités prédites et des réponses observées
Nous avons ci-dessus le test de concordance. Ce test est facile à comprendre dans notre
échantillon nous avons des clients qui ont une valeur de cible = 1 et d’autres qui ont cible=0 .
En créant notre score, nous avons aussi crée deux nouvelles variables qui sont la probabilité
(d’après le score) de correspondre à cible=1 et une autre probabilité de correspondre à cible=0.
On a concordance si la probabilité estimée que cible = 1 est plus grande quand cible = 1 que
quand cible = 0. Notre pourcentage de concordance ici est de 68.7 %. Les discordantes sont
celles qui ont une probabilité plus grande pour cible =0 alors qu’elles correspondent à cible =1 et
inversement. Nous avons dans notre échantillon un pourcentage de discordantes égal à 30.7 %.
52 | P a g e
Peut-on parler d’un consommateur européen ? Le cas du groupe PABO
Puis nous avons des clients qui ont la même probabilité d’appartenir à cible=0 qu’a cible=1 ce
sont nos « Tied » ils représentent 0.6%.
Le C correspond à l’aire sous la courbe de ROC nous reviendrons dessus plus tard. Les autres
indices ne sont pas importants dans notre exemple.
4.4. Matrice de confusion, courbe de roc, courbe de lift.
Niveau de
prob, Non- Non- Sensi- Spéci- POS NEGévéneme
ntévénem
ent bilité ficité fausse fausse0,02 91.069 - 386.000 - 19% 100% 0% 81% ,
0,04 91.061 42 386.000 8 19% 100% 0% 81% 16%
0,06 90.843 2.040 384.000 226 20% 100% 1% 81% 10%
0,08 88.364 30.698 355.000 2.705 25% 97% 8% 80% 8%
0,1 80.664 101.000 285.000 10.405 38% 89% 26% 78% 9%
0,12 73.533 155.000 231.000 17.536 48% 81% 40% 76% 10%
0,14 67.547 195.000 191.000 23.522 55% 74% 50% 74% 11%
0,16 62.392 225.000 161.000 28.677 60% 69% 58% 72% 11%
0,18 57.623 249.000 137.000 33.446 64% 63% 65% 70% 12%
0,2 53.054 271.000 115.000 38.015 68% 58% 70% 69% 12%
0,22 48.444 289.000 96.822 42.625 71% 53% 75% 67% 13%
0,24 44.336 305.000 81.439 46.733 73% 49% 79% 65% 13%
0,26 40.396 318.000 68.346 50.673 75% 44% 82% 63% 14%
Table de classification
Correct Incorrect Pourcentages
Événement Événement Correct
Après avoir réalisé notre score nous devons décidé à partir de quelle valeur de Y nous
considérons que le client correspond à la cible. Nous avons décidé de prendre le 0.22 comme
valeur de seuil c'est-à-dire que quand la probabilité est supérieure à 0.22 ( couleur jaune) nous
considérons que le client correspond à notre cible. Pour vous expliquer notre choix, nous allons
vous montrer quels auraient été les résultats si nous avions pris 0.02 ( couleur verte ) comme
valeur seuil.
53 | P a g e
Peut-on parler d’un consommateur européen ? Le cas du groupe PABO
En prenant la valeur minimum de probabilité ( 0.02) nous considérons donc que tous les clients
correspondent à notre cible. En effet aucun client n'a une probabilité inférieure à 0.02. Etant
donné que 19% de notre échantillon correspond réellement à notre cible nous avons un
pourcentage de correct égal à 19 %. La sensibilité correspond au pourcentage de clients qui sont
réellement cible égal 1 et que le score a classé dans cible=1. Dans notre exemple sur la ligne
verte le pourcentage de sensibilité est égale à 100 % car tous nos clients sont prédits dans cible
égal 1 donc l’ensemble des clients réellement 1 sont bien classés. La spécificité est la même
chose que la sensibilité sauf qu’il s’agit des clients correspondant à cible=0 que nous avons bien
classés. Nous avons 0 % ici car aucun des clients n’est classé dans cible=0 donc forcément tous
les clients réellement cible=0 sont mal classés. Les «pos fausse» sont les clients qui sont
réellement cible=0 et que nous avons classés en cible=1. Et pour finir les «neg fausse» sont les
clients qui sont réellement cible=1 et que nous avons classés en cible=0.
Nous allons maintenant nous attarder sur notre choix de proba = 0.22
0 1 total0 289.000 96.822 385.822 1 42.625 48.444 91.069
Total 331.625 145.266 476.891
predit
Observé
En prenant une probabilité de 0.22 comme valeur seuil nous avons :
Correct = (289.000 + 48.444) / 476.891 = 70,75 %Sensibilite = 48.444/ 91.069= 53,19 %Specificite = 289.000 / 385.822 = 74,90 %POS fausse = 98.822/ 145.266 = 68,02 %NEG fausse = 42.625 / 331.625 = 12,85 %
Courbe de Roc
Nous allons vous présenter la courbe de Roc du score sur les 3 pays. L’avantage de cette courbe
est que l’aire sous la courbe est facilement comparable d’un score à un autre. Plus l’aire est
54 | P a g e
Peut-on parler d’un consommateur européen ? Le cas du groupe PABO
grande sous la courbe, plus le score est « bon ». C’est le critère que nous utiliserons pour
comparer le score tout pays au score fait dans chaque pays.
Sensitivity
0.0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1.0
1 - Specificity
0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8
Cette courbe permet de représenter la proportion y de «vrais positifs» en fonction de la
proportion x de «faux positifs», lorsque l'on fait varier le seuil s du score.
Exemple : si la courbe ROC passe par le point (0,2;0,43), ce point correspond à un seuil S qui est
tel que : si on considère ≪risqués≫ tous les individus dont le score est ≥ s, on a détecté :
20% de faux positifs ont un score ≥ s , et 43 % de vrais positifs ont un score ≥ s.
L’aire sous la courbe de Roc est égale à 0.69.
Courbe de lift :
La courbe de lift représente la proportion y de vrais positifs en fonction des individus. Il s'agit de
la même ordonnée que la courbe ROC, mais l'abscisse est généralement plus grande. La courbe
55 | P a g e
Peut-on parler d’un consommateur européen ? Le cas du groupe PABO
de lift est généralement sous la courbe ROC. Elle est très utilisée en marketing
Ce graphique nous montre l’impact du score par rapport à une sélection aléatoire. Avec
une sélection aléatoire en prenant 10 % de la population nous devrions avoir 10 % des personnes
correspondant à la cible. Alors qu’avec le score, en sélectionnant 10 % de l’échantillon nous
sélectionnons 27 % de notre cible.
Le but étant de comparer les scores entre tout pays et par pays nous ne vous présenterons pas
l’analyse sur la table validation mais les résultats sont similaires. Ce qui confirme la robustesse
du score.
56 | P a g e
Peut-on parler d’un consommateur européen ? Le cas du groupe PABO
4.5. Analyse des différences .
Score Air sous la courbe de ROCFrance 0,724Allemagne 0,722NLS 0,698Tout pays 0,69
Nous allons comparer l’aire sous la courbe de Roc des trois scores. Nous voyons que le score fait
dans tous les pays est celui avec l’aire la plus petite. Ce qui signifie que le score fait pour les 3
pays en même temps est moins performant que le score fait pays par pays.
Nous allons maintenant vous montrer les différences sur les variables que le score a finalement
sélectionnées pour chaque pays et leurs coefficients afin de voir la différence avec le score étudié
ci-dessus.
Grâce au tableau ci-dessous nous pouvons facilement voir les différences entre les pays et ainsi
comprendre pourquoi les résultats sont différents. Nous voyons que les Pays-Bas par exemple est
le seul pays où le fait de dépenser beaucoup d’argent en service est négatif alors que pour tous
les autres pays c’est l’inverse. Nous voyons aussi que la variable linghard est prise en compte
uniquement pour l’Allemagne. La variable âge est elle un facteur négatif seulement pour les
Pays-Bas
Il y a certes des choses similaires mais il y a beaucoup trop de choses différentes pour pouvoir
généraliser des scores à l’ensemble des pays.
57 | P a g e
Peut-on parler d’un consommateur européen ? Le cas du groupe PABO
Variable Tout pays NLS DES FRSintercept 3,96 - 3,80 - 3,92 - 3,84 - SALESID 0,16 0,18 0,14 0,18 nb_commande 0,27 0,31 0,24 0,28 net 0,10 0,15 0,16 0,07 LINETURNOVER 0,04 - 0,03 - Accesoire 0,04 Apparel 0,08 0,08 body 0,10 0,10 0,09 0,11 Drugstore 0,02 0,03 homeIncentive 0,16 0,17 0,14 0,17 Printeddvd 0,23 0,18 0,24 0,23 Service 0,01 0,02 - 0,05 Toystoyssoft 0,02 - 0,03 - 0,02 - 0,02 - Drugsoft 0,02 lingsoft 0,11 0,10 0,13 0,10 appsoft 0,06 0,10 toyshard 0,01 0,02 0,02 Drughard 0,02 0,06 linghard 0,06 phoneID 0,03 - 0,06 - emailid 0,24 - 0,21 - 0,23 - 0,28 - SEXE 0,12 - 0,08 - 0,17 - 0,11 - AGE 0,00 0,00 - 0,00 0,00
Coefficient
58 | P a g e
Peut-on parler d’un consommateur européen ? Le cas du groupe PABO
1.
2.
3.
4.
5. Préconisations pour le groupe Pabo
Dans la première partie de l’analyse nous avons pu voir que le type de clients variait très peu
selon le pays. Les quelques différences qui existent sont dû à une particularité dans le pays par
exemple la réglementation sur le optin en Allemagne. Le groupe Pabo peut se permettre de cibler
le même type de clients en termes d’âge, de sexe etc lors d’opérations d’acquisition. Cependant
un effort doit être fait par le groupe pour récupérer tous les âges et le genre de ses clients. Les
préconisations principales pour le groupe PABO se trouvent surtout sur le comportement d’achat
des clients qui est différent selon le pays. En effet pour la classification par type de produits
achetés nous voyons certe des similarités mais aussi beaucoup de différences.
Dans tous les pays, le DVD et les incentives ainsi que linghard et apphard sont regroupés
ensemble, ce sont des anciens assortiments qui sont généralement achetés par nos anciens clients
et sur du offline.
Pour les autres assortiments achetés principalement sur internet il existe là de réelles
différences. Par exemple en Allemagne, aux Pays-Bas et en Autriche si un client achète un
produit de type « toys », il a beaucoup de chance d’acheter aussi un produit de type
« drugstore ». Donc dans ces pays, il faut proposer directement en produit complémentaire d’un
toys un drugstore ou alors après l’achat d’un toys lui envoyer une « publicité » pour des
drugstores.
Pour la France et la Belgique les acheteurs toys sont assez isolés et ne sont pas autant
corrélés avec les drugstores. Le push d’un produit drugstore suite à un achat toys est beaucoup
moins pertinent dans ces pays là. Par contre en France et en Belgique ceux qui achètent des
« drugstores » sont associés aux clients « home ».
59 | P a g e
Peut-on parler d’un consommateur européen ? Le cas du groupe PABO
Il y a quelques mois nous avons reçu une segmentation produit propre pour tout le groupe.
Cette segmentation donne des résultats très différents dans chaque pays. En voyant les résultats
de l’analyse je conseille au groupe Pabo de différencier cette segmentation produit par pays.
De plus pour le multi-canal, il existe aussi des différences significatives entre les pays.
L’évolution également n’est pas identique dans tous les pays. Nous avons pu remarquer qu’aux
Pays-Bas toutes les commandes sont passées sur internet alors que dans un pays comme
l’Autriche, l’évolution d’internet est beaucoup plus lente.
Cette différence joue sur la communication à avoir par le groupe. En effet, lors d’un envoi d’un
catalogue aux Pays-Bas, beaucoup de personnes risquent de recevoir ce catalogue et de passer la
commande non pas sur le bon de commande du catalogue mais sur internet. Alors qu’en Autriche
le catalogue risque de créer plus de commandes « manuelles ». Du coup pour le groupe, il faut
comprendre que dans chaque pays le catalogue ne doit pas avoir le même but. Aux Pays-Bas le
catalogue doit surtout pousser les gens à aller sur internet, (est-il encore utile alors même de
mettre un bon de commande à l’intérieur de ce catalogue ?). Le catalogue doit surtout être
qualitatif et explicatif, créer une expérience pour le client. Alors qu’en Autriche le catalogue doit
pousser le client à acheter directement dessus et créer une sensation de précipitation, il faut que
j’achète tout de suite via le bon de commande pour profiter de telle ou telle offre.
Nous pouvons voir que même la manière de faire venir le client sur le site web doit être
différenciée par pays. En effet en Allemagne, les clients se rendent plus facilement sur le site
directement en marquant le site sur la barre du navigateur web sans passer par Google ou
d’autres sources externes alors que les français et les belges vont arriver sur notre site en cliquant
sur une bannière publicitaire ou encore en faisant une recherche sur Google. De ce fait je pense
que la priorité en terme de ressources pour l’affiliation doit être consacrée à la France et la
Belgique.
Par contre pour l’Allemagne et les Pays-Bas, une présence sur les sites de comparaison
est primordiale car il permet d’attirer des clients sur notre site. En effet 68.5 % des acheteurs
venant de sites de comparaison sont soit allemand soit hollandais .
60 | P a g e
Peut-on parler d’un consommateur européen ? Le cas du groupe PABO
1.
2.
3.
4.
5.
6. Conclusion de ce mémoire professionnel
Nous avons remis la question « du client européen » au goût du jour grâce notamment aux
analyses faites sur le groupe PABO. La capacité d’une marque à se différencier d’une autre est
de proposer la bonne offre au bon moment et sur le bon support. Le meilleur moyen de réaliser
cela est de connaître au mieux ses clients. Le temps où l’entreprise envoyat une seule offre à
toute la base de données est révolu. L’analyse des différences entre les pays permet d’être au
plus proche de ses clients.
Nous voyons que le groupe PABO attire des clients avec des caractéristiques plutôt homogène.
Nous voyons aussi que le comportement d’achat des clients achetant des produits sur des canaux
offline est sensiblement identique pour tout le groupe. Donc pour ce type d’analyse, oui je pense
que nous pouvons parler d’un client européen.
Par contre l’évolution d’internet, la corrélation entre produits, le choix du canal d’achat, l’argent
dépensé ainsi que les retours sont très différents selon les pays. Pour ce type d’analyse nous ne
pouvons pas généraliser à l’ensemble du groupe.
La communication doit être différenciée pour les allemands et les français par exemple.
Dans cette optique, je pense qu’avoir un service marketing dans chaque pays qui gère l’ensemble
des tâches de son pays est plutôt une bonne idée.
Ce mémoire m’aura permis d’avoir une vision globale de l’entreprise et de comprendre
plus facilement les faiblesses et les forces d’une entreprise européenne. Ce mémoire retrace un
travail de deux années consécutives qui permettra au groupe Pabo de mieux connaître ses clients
et peut être de mieux ajuster sa communication et ses actions marketing dans les différents pays.61 | P a g e
Peut-on parler d’un consommateur européen ? Le cas du groupe PABO
Le sujet du client européen est un sujet sur lequel les entreprises devraient s’attarder car il
peut être déterminant dans la réussite à long terme d’une entreprise européenne. Savoir les
caractéristiques et la façon de communiquer avec tel ou tel pays permet de savoir si il est
intéressant d’ouvrir une filiale dans ce type de pays. Même si cet exemple se passe hors de
l’Europe, le cas de Carrefour est assez intéressant : ils se sont implantés en chine en faisant le
même marketing et la même chose que dans les différents pays européens, ce fut un échec pour
le groupe Carrefour.
Quand le groupe PABO commencera à analyser les données sur le parcours client sur
internet ou encore les données des réseaux sociaux, on pourra voir d’autres différences entre les
pays. En analysant les commentaires sur la marque dans les différents pays, nous serons capables
de comprendre quelles sont les attentes principales pour un allemand quand il commande chez
nous et si ces attentes sont les mêmes dans les différents pays.
On pourra alors se demander si le big data permettra de rentrer dans une nouvelle ère du
datamining et donc si on pourra anticiper les demandes de chaque client, peu importe son origine
son pays et sa culture..
62 | P a g e
Peut-on parler d’un consommateur européen ? Le cas du groupe PABO
Bibliographie
Articles académiques :
Schmid S., Kotulla T. (2010) - 50 years of Research on International Standardization and
Adaptation - From a Systematic Literature Analysis to a theoretical Framework, International
Business Review, Vol. 20, n°5, p.491
Mitry D., Smith D. (2009) - Convergence in Global Markets and Consumer Behavior,
International Journal of Consumer Studies Vol 33 n°3, p.316-321.
Rittinger S. , Zentes J.(2012) – Cross-channel consumer behavior-A comparison between
frenche, german, italian and british consumers. Revue française du marketing - - N° 237/238 - 2-
3/5
The consummers' motives : Are we rational ? Auteur: BREE, J. Source: Sciences humaines
(Auxerre) [Sci. hum. (Auxerre)], 1996, Issue 66 p18-22
Süerdem A. (1994) - Social de(re)construction of mass culture : niaking (non)sense of consumer
behavior. International Journal of Research
63 | P a g e
Peut-on parler d’un consommateur européen ? Le cas du groupe PABO
in Marketing, Vol. 11, n°4, p.423-443.
64 | P a g e