Post on 03-Apr-2015
Analyse des proximités, des préférences et typologie
Étude des classifications spontanées des marques de cigarettes par les fumeurs
Michel Tenenhaus
2
1. Le problème
Obtenir une classification-type des marques de cigarettes les plus vendues en France en fonction des perceptions des fumeurs.
3
2. Les données
• Chaque personne interrogée construit une typologie des 56 marques de cigarettes et donne des commentaires sur chaque groupe :
100 typologies avecdes commentaires
• Chaque personne construit sa typologie sur les marques qu’elle déclare connaître.
4
3. La méthodologie
a) Construire un indice de proximité entre les marques.
b) Faire une représentation graphique du tableau des proximités.
c) Faire une classification ascendante hiérarchique des 56 marques.
d) Interpréter les groupes en fonction des commentaires.
5
4. Construction d’un indice de proximité entre les marques
• N1(i , j) = Nombre de personnes connaissant les marques i et j
• N2(i , j) = Nombre de personnes connaissant les marques i et j et les mettant dans le même groupe
• p(i , j) = N2(i , j)/N1(i , j)
= Indice de similarité entre les marques i et j
6
Tableau des proximités (extrait)
7
5. Analyse d’un tableau de proximités
…
...p(i,j)i
j
• i
• k
• j
Visualisation paranalyse des proximités
a b c d e f• • • • • •
Classification ascendante hiérarchique
8
6. Analyse des proximités
Au tableau de proximités {p(i , j)} on veut associer
56 points x1,…, x56 d’un plan tels que :
' '( , ) ( ', ') ( , ) ( , )i j i jp i j p i j d x x d x x
Air France
Camel
6Benson& Hedges
Black& White
67
• B&H
• Air France
• B&W• Camel
9
Qualité de l’ajustement : le STRESS
2
1 2
ˆ( )ij iji j
iji j
d d
STRESSd
où : ( , )ij i jd d x x
1M-D-SCAL recherche la configuration de points ,...,
minimisant lenx x
ˆ quantité aussi proche que possible des
et vérifiant les contraintes
ij i jd d
' 'ˆ ˆ( , ) ( ', ') ij i jp i j p i j d d
10
Validation
Dimension
54321
Str
ess
.6
.5
.4
.3
.2
.1
0.0
Nombre d'objets
12
18
26
36
48
Figure 9.5 : STRESS1 moyen pour un tableau de proximités aléatoires entre n objets
en fonction de la dimension choisie (Source : Borg & Groenen, 1997)
11
Carte des marques de cigarettes
Stress1 = .147Cor(dist. , disp.) = .95
12
Kool 34 Reyno 46 Ariel 2 Royale menthol 52 Craven A menthol 15 Peter Stuyvesant menthol 40 Française menthol 22 Ariel 100 3 Royale extra longue menthol 51 Royale club 49 Royale extra-longue 50 Royale 48 Balto 4 Flash 18 Bastos légère 5 Marigny 36 Flint 19 Rallye 45 Week-end 53 Camel 9 Camel filtre 10 Benson & Hedges 6 Black & White 7 Dunhill international 17 Craven A 12 Players navycut 44 Craven A export 13 Craven A filtre 14 Rothmans king size 47 Players gold leafe 43 Marlboro 35 Winston rigide souple 55 Peter Stuyvesant 39 Kent rigide souple 32 Kent 100 mm de luxe 33 Winston 100 mm 54 Peter Stuyvesant luxury 41 Pall Mall 100 mm 37 Philips Morris 100 mm 42 Pall Mall king size 38 Fontenoy 20 Française 21 Boyard maïs 8 Boyard blanc 56 Celtique 11 Gitane blanc 29 Gitane filtre blanc 30 Disque bleu 16 Gauloise filtre 26 Gauloise 24 Gauloise grand format 27 Gitane maïs 31 Gauloise doux 25 Gauloise Maryland 28 Gallia 23 Air France 1
7. Classificationascendante hiérarchique(Critère de la moyenne)
Etape 1 :On regroupe les 2 marquesi et j les plus proches.
Etape 2 :Nouvelle marque [i , j].Proximité entre k et [i , j] :
( , ) ( , )( ,[ , ])
2
p k i p k jp k i j
On regroupe les deux « marques » les plus proches.
Et ainsi de suite…
13
Agglomeration Schedule
34 46 94.000
35 55 90.000
16 26 89.000
2 34 86.000
15 40 84.000
16 24 84.000
2 52 82.333
9 10 82.000
8 56 81.000
29 30 81.000
3 51 79.000
2 15 77.375
33 54 75.000
2 22 74.333
2 3 73.429
25 28 73.000
16 27 73.000
33 41 71.000
37 42 70.000
16 29 68.625
6 7 67.000
8 11 64.500
12 44 64.000
35 39 64.000
13 14 62.000
6 17 60.500
32 35 60.333
16 31 60.333
49 50 57.000
Stage1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
Cluster 1 Cluster 2
Cluster Combined
Coefficients
16 31 60.333
49 50 57.000
4 18 56.000
13 47 54.000
19 45 54.000
33 37 52.167
48 49 50.500
13 43 49.333
20 21 48.000
12 13 46.625
33 38 45.000
8 16 43.571
4 5 43.500
6 12 42.278
23 25 41.500
32 33 41.417
4 36 39.333
19 53 39.000
8 20 37.350
4 19 36.167
1 23 35.667
6 32 31.589
1 8 30.750
4 48 29.714
6 9 24.105
4 6 19.771
2 4 7.011
1 2 5.767
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
14
Kool 34 Reyno 46 Ariel 2 Royale menthol 52 Craven A menthol 15 Peter Stuyvesant menthol 40 Française menthol 22 Ariel 100 3 Royale extra longue menthol 51 Royale club 49 Royale extra-longue 50 Royale 48 Balto 4 Flash 18 Bastos légère 5 Marigny 36 Flint 19 Rallye 45 Week-end 53 Camel 9 Camel filtre 10 Benson & Hedges 6 Black & White 7 Dunhill international 17 Craven A 12 Players navycut 44 Craven A export 13 Craven A filtre 14 Rothmans king size 47 Players gold leafe 43 Marlboro 35 Winston rigide souple 55 Peter Stuyvesant 39 Kent rigide souple 32 Kent 100 mm de luxe 33 Winston 100 mm 54 Peter Stuyvesant luxury 41 Pall Mall 100 mm 37 Philips Morris 100 mm 42 Pall Mall king size 38 Fontenoy 20 Française 21 Boyard maïs 8 Boyard blanc 56 Celtique 11 Gitane blanc 29 Gitane filtre blanc 30 Disque bleu 16 Gauloise filtre 26 Gauloise 24 Gauloise grand format 27 Gitane maïs 31 Gauloise doux 25 Gauloise Maryland 28 Gallia 23 Air France 1
Groupe 1
Groupe 5
Groupe 3
Groupe 4.1
Groupe 4.2
Groupe 4
Groupe 2
Kool 34 Reyno 46 Ariel 2 Royale menthol 52 Craven A menthol 15 Peter Stuyvesant menthol 40 Française menthol 22 Ariel 100 3 Royale extra longue menthol 51 Royale club 49 Royale extra-longue 50 Royale 48 Balto 4 Flash 18 Bastos légère 5 Marigny 36 Flint 19 Rallye 45 Week-end 53 Camel 9 Camel filtre 10 Benson & Hedges 6 Black & White 7 Dunhill international 17 Craven A 12 Players navycut 44 Craven A export 13 Craven A filtre 14 Rothmans king size 47 Players gold leafe 43 Marlboro 35 Winston rigide souple 55 Peter Stuyvesant 39 Kent rigide souple 32 Kent 100 mm de luxe 33 Winston 100 mm 54 Peter Stuyvesant luxury 41 Pall Mall 100 mm 37 Philips Morris 100 mm 42 Pall Mall king size 38 Fontenoy 20 Française 21 Boyard maïs 8 Boyard blanc 56 Celtique 11 Gitane blanc 29 Gitane filtre blanc 30 Disque bleu 16 Gauloise filtre 26 Gauloise 24 Gauloise grand format 27 Gitane maïs 31 Gauloise doux 25 Gauloise Maryland 28 Gallia 23 Air France 1
Groupe 1Groupe 1
Groupe 5
Groupe 3Groupe 3
Groupe 4.1
Groupe 4.2
Groupe 4
Groupe 2Groupe 2
Classificationchoisie
15
Visualisation de la typologie
Groupe 1
Groupe 2
Groupe 3
Groupe 4Groupe 5
16
8. Analyse des préférences avec PREFMAP
Tableau des fréquences d’association entre les critères et les groupes
17
Axe 2
Groupe 1
Groupe 3
Groupe 4
Groupe 2
Groupe 5
Positionnement des commentaires
La corrélationentre [Homme]et les projectionsest maximum
.78*3
.63*3
18
Utilisation de PREFMAP
Centre de gravitédes groupes
19
Axe 2
Groupe 1
Groupe 3
Groupe 4
Groupe 2
Groupe 5
Conclusion de l’étude