Post on 22-Nov-2014
description
ANALYSE EN COMPOSANTES PRINCIPALES
Mehdi AMAN
Royaume Du Maroc
Université Ibn Zohr
Ecole Nationale de Commerce et de Gestion d’Agadir
Décembre 2012
PRÉSENTATION DE LA MÉTHODE
ANALYSE EN COMPOSANTES
PRINCIPALES
L’Analyse en Composantes Principales (ACP)
L’analyse en composantes principales est une méthode
d’analyse multidimensionnelle des données.
Les variables sujettes à cette analyse sont des variables
quantitatives.
L’analyse en composantes principales repose sur l’analyse des
relations entre un nombre important de variables
Utilité de l’ACP
Cette méthode est utilisée pour identifier:
1. Les dimensions ou les facteurs fondamentaux qui expliquent
les corrélations entre plusieurs variables;
2. Un nouvel et plus petit ensemble de variables non corrélées;
3. Un ensemble plus petit des variables les plus déterminantes;
GARDER LE MAXIMUM
D’INFORMATION POSSIBLE
Avec la condition de…
L’ ACP appliquée en Marketing
Cette méthode trouve de nombreuses applications dans le
domaine des études marketing:
1. Segmentation du marché;
2. Etudes de positionnement;
3. En recherche produit;
4. Etudes publicitaires;
5. Etudes prix…
Le Modèle d’ACP Le modèle d’ACP : Le score Factoriel
𝐹𝑖𝑗 = 𝑋𝑖1𝐴1 + 𝑋𝑖2𝐴2 +⋯+ 𝑋𝑖𝑗𝐴𝑗
Où:
𝑭𝒊𝒋 : est le score de l’individu i sur le
facteur j
𝑿𝒊𝒋: est la valeur centrée réduite de
l’individu i sur la variable j
𝑨𝒋: Coefficients Factoriels*
* Extraits des vecteurs propres
Nous avons autant de facteurs que de
variables
Analyse des facteurs en commun ou ACP?
Communautés
Unités
𝑋1
𝑋2
𝑋3
𝑋1 𝑋2 𝑋3
𝑋1 <1
𝑋2 <1
𝑋3 <1
𝑋1 𝑋2 𝑋3
𝑋1 1
𝑋2 1
𝑋3 1
AF
ACP
Glossaire ACP
Tableau de données: Tableau croisant les individus i et les variables j;
Matrice des corrélations: Corrélations entre l’ensemble des couples de variables;
Matrice des corrélations reconstituée: A partir des composantes sélectionnées;
Résidus: L’écart entre la matrice des corrélations et celle des corrélations reconstituée;
Valeur propre: Représente la variance totale expliquée par chaque facteur, axe, composante;
Vecteur propre: Représente les coefficients factoriels;
Matrice des loadings: Corrélations entre les variables et les facteurs;
Rotation: Technique qui consiste à pivoter les facteurs avec un angle θ;
Glossaire ACP
Contribution: Contribution de chaque variable/individu dans la formation de les axes;
Représentation: A quel degré les variables/individus sont bien représentés sur les axes;
Score factoriel: Pour chaque i, ce sont les nouvelles coordonnées sur les facteurs principaux;
Test de coude ou Scree Test: Graphique des valeurs propres, pris dans leur ordre
d’importance;
Test de Sphéricité de Bartlett: Compare la matrice des corrélation à une matrice identité.
Test Kaiser Mayer Olkin (KMO): Utilisé pour mesurer l’adéquation de l’ACP ou l’AF, il doit
être compris en 0,5 et 1;
Pourcentage de variance (inertie): Part de la variance totale attribuée à chaque facteur;
PRE-REQUIS
ANALYSE EN COMPOSANTES
PRINCIPALES
Notions sur les vecteurs
221
22
Supposons les deux vecteur V1 et V2 :
V1 = V2 =
Graphiquement les deux vecteurs se présentent comme suit:
V1
Y
X
V2
Y
X
Notions sur les vecteurs
Trois informations:
1- La direction
2- Le sens
3- La norme (longueur)
Soit le vecteur V =
𝑥1𝑥2.𝑥𝑛
𝑽 = 𝑥12 + 𝑥2
2 +⋯+ 𝑥𝑛2
vα
vβ
ProjVα Vβ = (𝒗𝜶 .𝒗𝜷
𝒗𝜶 . 𝒗𝜶 )𝒗𝒂
Rappel sur les statistiques descriptives
𝒙 = 𝒙𝟏 + 𝒙𝟐 +⋯+ 𝒙𝒏𝒏𝒊=𝟏
𝒏 𝝈𝒙² =
(𝒙𝒊 − 𝒙 )²𝒏𝒊=𝟏
𝒏 𝝈𝒙 =
𝒙𝒊 − 𝒙 𝟐
𝒏
𝒏
𝒊=𝟏
𝒓𝒙𝒚 = (𝒙𝒊 − 𝒙 )(𝒚𝒊 − 𝒚 𝒏𝒊=𝟏 )
𝝈𝒙𝝈𝒚
PRINCIPE
ANALYSE EN COMPOSANTES
PRINCIPALES
Principe de base dans l’estimation des facteurs
Nuage d’individus
ACP Normée: menée sur des données centrées et réduites
Principe de base dans l’estimation des facteurs
Nuage de variables
Le cosinus de l’angle formé par les deux vecteurs est égal au coefficient de corrélation
entre ces deux vecteurs
Principe de base dans l’estimation des facteurs
Ajustement du nuage d’individus: Projection des i
Principe de base dans l’estimation des facteurs
Ajustement du nuage des individus: Projection des d²(i , l)
Principe de base dans l’estimation des facteurs
Ajustement du nuage des variables
ANALYSE EN COMPOSANTES PRINCIPALES
Mener une ACP sur SPSS
Mener une ACP sur SPSS
Estimer l’adéquation du modèle
Calculer les scores
factoriels
Interpréter les facteurs
Extraire les facteurs
Calculer la matrice des corrélations
Formuler le problème
I- Formuler le problème
Objectif(s) de l’étude;
Variables d’études;
Echelle;
Taille de l’échantillon;
Etude de cas Les avantages fondamentaux recherchés
par les consommateurs lors de l’achat d’un dentifrice
• Le sondage est réalisé sur un échantillon de 30 personnes dans un centre commercial, ces dernières ont donné leur avis sur les affirmations suivantes, sur une échelle de 1 à 7 (1: En total désaccord; 7: entièrement d’accord):
V1: Il est important d’utiliser un dentifrice qui prévient la formation des caries;
V2: Un dentifrice doit rendre les dents brillante;
V3: Un dentifrice doit renforcer les gencives;
V4: Un dentifrice doit rafraîchir l’haleine;
V5: La prévention ces caries n’est pas un avantages important du dentifrice
V6: Un dentifrice doit, avant tout, donner de belles dents;
I- Formuler le problème
I- Formuler le problème
Répondant V1 V2 V3 V4 V5 V6
1 7 3 6 4 4 2
2 1 3 2 4 5 4
3 6 2 7 4 1 3
4 4 5 4 6 2 5
…
30 2 3 2 4 7 2
Saisie des données sur SPSS
I- Formuler le problème
Saisie des données sur SPSS
Lancer l’ACP sur SPSS
Lancer l’ACP sur SPSS
Bouton Descriptives
Lancer l’ACP sur SPSS
Bouton Extraction
Lancer l’ACP sur SPSS
Bouton Rotation
Lancer l’ACP sur SPSS
Bouton Facteurs
II- Calculer la matrice des corrélation
II- Calculer la matrice des corrélation
III- Extraire les facteurs et déterminer leur nombre
Détermination a priori ou considérations théoriques;
Détermination fondée sur les valeurs propres;
Scree-Test;
Pourcentage de la variance;
Test de fiabilité de deux sous-échantillons;
Signification statistiques des valeurs propres;
III- Extraire les facteurs et déterminer leur nombre
IV- Interpréter les facteurs
IV- Interpréter les facteurs
IV- Interpréter les facteurs
Facteur 1 Facteur 2
V1 34,407 0,019
V2 0,146 31,815
V3 32,490 0,868
V4 0,400 32,238
V5 32,332 0,358
V6 0,225 34,702
Contribution des variables en %
Facteur 1 Facteur 2
V1 0,926 0,000
V2 0,004 0,719
V3 0,874 0,020
V4 0,011 0,728
V5 0,870 0,008
V6 0,006 0,784
Représentation des variables
V1: Il est important d’utiliser un dentifrice qui prévient la formation des caries;
V2: Un dentifrice doit rendre les dents brillante;
V3: Un dentifrice doit renforcer les gencives;
V4: Un dentifrice doit rafraîchir l’haleine;
V5: La prévention ces caries n’est pas un avantages important du dentifrice
V6: Un dentifrice doit, avant tout, donner de belles dents;
Après rotation
IV- Interpréter les facteurs
V1: Prévention de la formation des caries;
V2: Dents brillantes;
V3: Renforce les gencives;
V4: Rafraîchit l’haleine;
V5: La prévention des caries (NI)
V6: De belles dents;
Hygiène & santé des dents
Bien
faits so
ciau
x
V- Calcul des scores factoriels
V- Calcul des scores factoriels
VI- Déterminer l’ajustement du modèle
Une comparaison entre la matrice des
corrélations initiale et la matrice des
corrélations reconstituée à partir des
facteurs
Evaluation de la significativité des
résidus
VI- Déterminer l’ajustement du modèle
Quelques références