Mai 2007 1 Comparaison des données de ventes : Données internes, GERS, IMS/SDM- XPONENT.
-
Upload
galehot-ragot -
Category
Documents
-
view
113 -
download
4
Transcript of Mai 2007 1 Comparaison des données de ventes : Données internes, GERS, IMS/SDM- XPONENT.
Mai 2007 1
Comparaison des données de ventes : Données internes, GERS, IMS/SDM-
XPONENT
Mai 2007
Données étudiées
On a étudié les données de vente provenant de 3 sources : Données Internes / GERS et SDM-XPONENT.
Les laboratoires qui ont bien voulu participer à cette phase d’analyse sont : ASTRAZENECA, BAYER, CEPHALON, JANSSEN, LILLY, PIERRE FABRE, SCHERING, UCB
Les données couvraient les périodes 2004/2005/2006, dans la suite du travail on s’est concentré sur 2005 et 2006 (tout en faisant intervenir les données 2004).
On a éliminé les produits dont on n’avait pas les 3 séries, ou bien dont l’une des séries semblait être complètement différente des 2 autres.
62 produits ou formes galéniques ont été utilisés dans les calculs (50 formes galéniques et 18 produits (certains n’étant présents que sous une forme)).
Mai 2007
Approches utilisées
• 2 approches ont été utilisées : une classique avec des moyennes mobiles (sur 3 mois) et une plus originale basée sur des régressions.
Mai 2007
Moyennes mobiles Trimestres calendaires
Trimestre LABO GERS XPONENT
1er T 2005 58 076 57 193 58 024
2ème T 2005 55 164 57 405 57 861
3ème T 2005 53 002 52 465 53 938
4ème T 2005 55 082 55 300 54 759
1er T 2006 55 025 54 730 55 049
2ème T 2006 51 709 52 098 53 952
3ème T 2006 50 873 49 726 53 359
4ème T 2006 51 620 52 234 53 578
1er T 2007 48 014 49 655 52 165
Voici les moyennes (Formes galéniques) des ventes sur les 3 séries (Uniquement trimestres calendaires) :
On voit un phénomène de surestimation qui a tendance à s’atténuer au 4ème trimestre 2006, mais persiste en 2007.
45 000
47 000
49 000
51 000
53 000
55 000
57 000
59 000
61 000
63 000
65 000
1er T2005
2ème T2005
3ème T2005
4ème T2005
1er T2006
2ème T2006
3ème T2006
4ème T2006
1er T2007
LABO
GERS
XPONENT
Mai 2007
Moyennes mobiles Mois par mois
Voici les moyennes (Formes galéniques) des ventes sur les 3 séries (mois par mois, moyenne mobile sur 3 mois) :
On voit un phénomène de surestimation qui commence en mai 2006 puis disparaît en octobre 2006, puis réapparaît en décembre 2006 jusqu’en avril 2007.
MM (sur 3 mois) LABO GERS XPONENT
mars-05 58 076 57 193 58 024
avr-05 60 185 59 040 58 541
mai-05 59 316 59 696 59 326
juin-05 55 164 57 405 57 861
juil-05 52 720 55 278 56 829
août-05 52 173 51 534 54 703
sept-05 53 002 52 465 53 938
oct-05 54 398 53 306 53 298
nov-05 55 983 56 730 54 484
déc-05 55 082 55 300 54 759
janv-06 53 491 54 325 55 409
févr-06 52 924 52 827 54 335
mars-06 55 025 54 730 55 049
avr-06 53 047 53 106 53 654
mai-06 53 117 53 437 54 740
juin-06 51 709 52 098 53 952
juil-06 53 341 52 635 54 959
août-06 50 336 49 895 53 870
sept-06 50 873 49 726 53 359
oct-06 52 891 51 330 53 527
nov-06 54 370 53 992 53 997
déc-06 51 620 52 234 53 578
janv-07 49 276 50 969 53 430
févr-07 48 481 49 404 52 146
mars-07 48 014 49 655 52 165
avr-07 47 289 48 174 49 764
Mai 2007
Moyennes mobiles Mois par mois
45 00047 00049 00051 00053 00055 00057 00059 00061 00063 00065 000
m
ars-
05
av
r-05
m
ai-0
5
ju
in-0
5
ju
il-05
ao
ût-0
5
se
pt-0
5
oc
t-05
no
v-05
dé
c-05
ja
nv-0
6
fé
vr-0
6
m
ars-
06
av
r-06
m
ai-0
6
ju
in-0
6
ju
il-06
ao
ût-0
6
se
pt-0
6
oc
t-06
no
v-06
dé
c-06
ja
nv-0
7
fé
vr-0
7
m
ars-
07
av
r-07
LABO
GERS
XPONENT
Mai 2007
Approche par régression
• L’approche par régression suppose que la donnée mesurée (Gers ou Xponent) est très corrélée avec les données de ventes labos. (c’est le cas comme on va le voir).
• Si l’estimation de manière générale est très bonne, et si des phénomènes particuliers se produisent, les données mesurées devraient s’écarter des données prédites pendant une certaine période.
• L’intérêt est que l’on travaille au niveau de chaque individu, que l’on détermine la meilleure période à prendre en compte et enfin que l’on puisse analyser finement les différences (résidus de la régression).
• On cherche (sans prétention de vouloir découvrir un modèle de prévision) une régression entre la donnée mensuelle GERS ou XPONENT et les données internes laboratoires. Concrètement on va mettre, pour 1 mois donné n du prestataire, comme variables candidates les mois n, n-1, …, n-5 du labo (soit un période de 6 mois).
• On effectue une régression pas à pas qui introduit une à une les variables et s’arrête lorsque la variable suivante n’apporte plus d’information supplémentaire à la régression.
• Concernant les données fournies, on a en fait 1488 (62 produits ou formes sur 24 mois) données mensuelles GERS (idem XPONENT) avec les 6 mois historiques labos.
Mai 2007
Qualité des régressions
La qualité des régressions est excellente pour chacune des 2 mesures comme on peut le voir ci dessous :
Estimation Gers Estimation XponentNb de mois retenus (a) 3 4Qualité de la régression (b) 99,6% 99,5%Importance des variables dans la prédiction LABO Mois n 70% 45%LABO Mois n-1 21% 25%LABO Mois n-2 9% 20%LABO Mois n-3 - 10%Equation de régression(constante) 337,40 35,01LABO Mois n 0,70 0,46LABO Mois n-1 0,20 0,25LABO Mois n-2 0,09 0,21LABO Mois n-3 - 0,10
(a) suite à la régression pas à pas(b) R2 : part de l'information expliquée par la régression(c) Calculée à partir des coefficients beta standardisés
Mai 2007
Comparaison données mesurées et estimées
Comme on peut le voir la donnée estimée suit de très prêt la donnée mesurée.
Et cependant il y a un problème….
45 000
50 000
55 000
60 000
65 000
ja
nv-0
5
fé
vr-0
5
m
ars-
05
av
r-05
m
ai-0
5
ju
in-0
5
ju
il-05
ao
ût-0
5
se
pt-0
5
oc
t-05
no
v-05
dé
c-05
ja
nv-0
6
fé
vr-0
6
m
ars-
06
av
r-06
m
ai-0
6
ju
in-0
6
ju
il-06
ao
ût-0
6
se
pt-0
6
oc
t-06
no
v-06
dé
c-06
ja
nv-0
7
fé
vr-0
7
m
ars-
07
av
r-07
GERS Mois nGERS EstiméXPONENT Mois nXPONENT Estimé
Mai 2007
Analyse des résidus en volume
Les résidus sont la différence entre la donnée mesurée et la donnée estimée
1) On voit qu’il y a des mois qui suivent mal la règle générale : exemple Août 2005 suivi d’une correction en Sept 2005. Mais d’une manière générale les résidus (qui par construction ont une somme nulle) se répartissent aléatoirement de part et d’autre de l’axe 0.
2) Par contre de mai à septembre 2006, on a une série de 5 points pour Xponent qui sont tous du même côté (+) de l’axe : donnée mesurée plus importante qu’attendue selon l’estimation.
3) Ce phénomène est transitoire, il disparaît en novembre 2006 et a l’air de repartir un peu en décembre 2006. A compter du mois de janvier 2007, on a toujours une tendance à la surestimation mais de manière irrégulière.
-6000
-5000
-4000
-3000
-2000
-1000
0
1000
2000
3000
4000
5000
janv-0
5
févr-
05
m
ars
-05
a
vr-
05
m
ai-05
juin
-05
juil-
05
a
oût-05
s
ept-05
o
ct-05
n
ov-0
5
d
éc-0
5
janv-0
6
févr-
06
m
ars
-06
a
vr-
06
m
ai-06
juin
-06
juil-
06
a
oût-06
s
ept-06
o
ct-06
n
ov-0
6
d
éc-0
6
janv-0
7
févr-
07
m
ars
-07
a
vr-
07
Résidus Gers (Mesuré - Estimé)
Résidus Xponent (Mesuré - Estimé)
Mai 2007
Analyse des résidus en nb de produits
Les volumes peuvent masquer d’autres phénomènes : par exemple 2-3 produits à fort volume surestimés peuvent masquer un grand nombre de produits sous-estimés (ou vice-versa), d’ou une analyse des résidus en nb de produits estimés vs nb de produits mesurés..
1) On voit que les volumes masquent certaines choses : pour le GERS, en moyenne 16 produits sur 50 ont une mesure > au calcul de la régression et donc 34 ont une mesure < à l’estimation. on a donc tendance à surestimer par calcul beaucoup de produits (donc le volume de quelques produits masque ce phénomène). Pour Xponent, c’est beaucoup plus équilibré sur l’ensemble de la période on a en moyenne 26 produits mesurés / 50 supérieur à leur estimation.
2) Le problème est que pour le Gers ce phénomène reste toujours autour de 16 / 50 au cours des 24 mois avec de fortes amplitudes sur certains mois, alors que pour Xponent, la proportion de produit surestimés augmente dans le 2ème semestre 2006, mais à tendance à bien se rétablir courant 2007.
-25
-20
-15
-10
-5
0
5
10
15
janv-05
févr-05
m
ars-05
a
vr-05
m
ai-05
juin
-05
juil-05
a
oût-05
s
ept-05
o
ct-05
n
ov-05
d
éc-05
janv-06
févr-06
m
ars-06
a
vr-06
m
ai-06
juin
-06
juil-06
a
oût-06
s
ept-06
o
ct-06
n
ov-06
d
éc-06
janv-07
févr-07
m
ars-07
a
vr-07
Gers mesuré > Gers estimé
Xponent mesuré > Xponent estimé
Mai 2007
Conclusions
-Quelque soit la méthode, il semble bien qu’il y ait eu une surestimation systématique des données Xponent par rapport aux données internes des labos (pour les éléments fournis en tout cas) de Mai à Septembre 2006. (et encore plus par rapport au GERS qui a décroché négativement pendant 2 mois à ce moment là).
- Ce phénomène semble transitoire et se serait résorbé en Novembre 2006, mais est relancé au cours du 1er trimestre 2007.