(French) Le scoring au marketing à Orange France - by Claude Riwan - PAPIs Connect

18
le scoring au marketing Orange France conférence PAPI’s Connect Claude Riwan 21 mai 2015

Transcript of (French) Le scoring au marketing à Orange France - by Claude Riwan - PAPIs Connect

le scoring au marketing Orange France

conférence PAPI’s Connect

Claude Riwan21 mai 2015

vous avez dit « score » ?

les usages du scoring au marketing Orange France

un peu de méthodologie

et demain ?

sommaire

vous avez dit « score » ?

un score, à quoi ça sert ?

à prédire l’occurrence d’événements, tels que la souscription d’une offre par un client ou son degré de fragilité.

à estimer des informations manquantes dans le SI pour le client, comme l’âge, la composition familiale, la CSP, la détention d’équipements concurrents ou les centres d’intérêt… notamment pour adresser des messages personnalisés aux clients.

afin d’augmenter l’efficacité des actions tout en réduisant les coûts

un score, comment ça fonctionne ?

détection et combinaison des variables statistiquement explicatives du phénomène étudié (modélisation de la formule de score).

attribution de notes individuelles de score selon la probabilité d’occurrence du phénomène (calcul des notes mensuelles de scores des clients par application des données clients récentes à la formule de score)

le score sert à classer le fichier par probabilité décroissante d’occurrence du phénomène

client score A score B score C score D score E00001 00002 00013 00066 00085 0005600002 00008 00056 00013 00066 0008500003 00007 00034 00009 00024 0005700004 00021 00056 00013 00066 0008500005 00038 00001 00004 00015 0003600006 00020 00056 00013 00066 0008500007 00038 00002 00039 00035 0002800008 00020 00056 00013 00066 0008500009 00038 00010 00003 00003 0000700010 00024 00056 00013 00066 0008500011 00040 00010 00004 00013 0001300012 00025 00056 00013 00066 0008500013 00040 00010 00010 00006 0000400014 00025 00056 00013 00066 0008500015 00040 00011 00010 00007 0000900016 00026 00056 00013 00066 0008500017 00041 00011 00011 00010 0000800018 00026 00056 00013 00066 0008500019 00041 00011 00011 00011 0000800020 00026 00056 00013 00066 0008500021 00041 00011 00011 00011 00010

les usages

les scores au marketing Orange France

413 séries de notes de scores sont produites mensuellement (environ 1,6 milliard de notes).

Ces scores couvrent 7 univers (internet, fibre, 4-play, mobile, fixe, foyers, prospects)

exemples : . score d’appétence à une offre concurrente . score de fragilité des clients fibre

500 autres séries de notes de scores de qualification ou d’intérêt sont également calculées semestriellement.

exemples : . estimation de la détention d’équipement concurrent. intérêt estimé pour la chaîne TV Eurosport

les usages

exemples de scores Broad Band utilisés lors des campagnes 2014 :

fragilité, appétence aux bouquets TV, appétence aux videos on demand, appétence au parrainage, appétence à la montée en gamme 4-play

70 scores ont été utilisés en proactif (10% des campagnes appuyées sur des scores)

les usages

push pour clients mobile en services clients, en point de vente,sur l’espace client, aux USSD et SVI (serveur vocal interactif)

push pour clients 4-play sur device mobile push pour clients Broad Band en service client, en point de vente, sur la TV,

sur le portail et la boutique online

marquage pour réactifpush d’offres

connaissance client

qualification des bases détention de mobile concurrent, descriptif foyer, intérêts thématiques

scores exploratoires (sans autre vocation qu’analytique)

clients injoignables, utilisateurs du service Cineday

inputs pour les autres scores les notes des scores du mois m-1 sont candidates aux modèles du mois m

intérêt estimé pour le sport appétence à une chaîne Sport

un peu de méthodologie

1 On s’appuie sur les données d’avant-hier pour construire une formule de score qui aurait prédit au mieux le churn d’hier

données d’apprentissagechurn observé

modélisation

notes de fragilité

formule

1

un score, ça vit comment ? exemple d’un score prédictif du churn

données d’apprentissagechurn observé

modélisation

notes de fragilité

données de recalcul des notes

application

formule

formule prévision du churn2

2 On applique les données d’aujourd’hui pour prédire demain

un score, ça vit comment ? exemple d’un score prédictif du churn

données d’apprentissagechurn observé

modélisation

notes de fragilité

données de recalcul des notes

application

formule prévision du churn

churn observé

suivi

3

3 On rapproche la prévision faite avant–hier pour la période d’hier avec le churn effectif d’hier

formule

un score, ça vit comment ? exemple d’un score prédictif du churn

application

données de recalcul des notes

application

formule prévision du churn

churn observé

suivi

données de recalcul des notes

application

formule prévision du churn

churn observé

suivi

4

5

données d’apprentissagechurn observé

modélisation

notes de fragilité

formule

4Chaque mois,on recalcule les noteset on suit les performances5

un score, ça vit comment ? exemple d’un score prédictif du churn

pour aller un peu plus loin… sous-profils des top scores

Dans la très grande majorité des cas, les clients top scorés ne présentent pas le profil moyen du modèle, mais sont regroupés en trois ou quatre sous-profils différenciés. Par clusterisation des top scores, on met en évidence ces familles et on peut ainsi adopter une posture commerciale différenciée.

scoring de l’uplift

Les clients ciblés par un score d’appétence souscrivent plus que les autres lors d’une campagne, mais le groupe témoin (les appétents non adressés) a souvent également un taux de prise significatif. Pour concentrer les moyens sur les clients appétents qui ne prendraient pas sans la campagne on construit un modèle uplift qui combine un modèle d’apprentissage de la campagne (qui a pris lors de la campagne?) et un modèle d’apprentissage de l’appétence naturelle (qui a pris hors campagne?)

fast learning

Actuellement, nos datamarts sont alimentés mensuellement. Nous modélisons donc sur des données froides et recalculons les notes de scores mensuellement. Les évolutions de notre CRM pourront nous permettre d’utiliser des données chaudes (données de contexte) et de recalculer de façon dynamique les messages adressés aux clients.

et demain ?

perspectives… Big Data

Généralement quelques dizaines de variables sont candidates en standard pour un modèle (small data)

Actuellement nous testons 20 000 agrégats lors d’une modélisation (serveur en mono-cœur) : du Big Data en architecture Small Data

Big Data phase 2 (avec PredicSis) : 320 000 agrégats testés (modèle en mode distribué serveur 32

cœurs). tuning en cours avec objectif de réduire la durée de modélisation

Big Data phase 3 (avec PredicSis) : plusieurs millions d’agrégats multi-tables de type [1 | n] seront testés à la volée pour chaque score.

un environnement parallélisé permet d’augmenter efficacement

l’espace de recherche : le Big data, consiste à aller

dénicher la valeur prédictive des nouveaux gisements de données.

merci de votre attention