Cours acp mehdi_aman

Post on 22-Nov-2014

2.890 views 19 download

description

Une présentation aussi simplifiée que possible de l'Analyse en Composantes Principales avec une application en Marketing.

Transcript of Cours acp mehdi_aman

ANALYSE EN COMPOSANTES PRINCIPALES

Mehdi AMAN

Royaume Du Maroc

Université Ibn Zohr

Ecole Nationale de Commerce et de Gestion d’Agadir

Décembre 2012

PRÉSENTATION DE LA MÉTHODE

ANALYSE EN COMPOSANTES

PRINCIPALES

L’Analyse en Composantes Principales (ACP)

L’analyse en composantes principales est une méthode

d’analyse multidimensionnelle des données.

Les variables sujettes à cette analyse sont des variables

quantitatives.

L’analyse en composantes principales repose sur l’analyse des

relations entre un nombre important de variables

Utilité de l’ACP

Cette méthode est utilisée pour identifier:

1. Les dimensions ou les facteurs fondamentaux qui expliquent

les corrélations entre plusieurs variables;

2. Un nouvel et plus petit ensemble de variables non corrélées;

3. Un ensemble plus petit des variables les plus déterminantes;

GARDER LE MAXIMUM

D’INFORMATION POSSIBLE

Avec la condition de…

L’ ACP appliquée en Marketing

Cette méthode trouve de nombreuses applications dans le

domaine des études marketing:

1. Segmentation du marché;

2. Etudes de positionnement;

3. En recherche produit;

4. Etudes publicitaires;

5. Etudes prix…

Le Modèle d’ACP Le modèle d’ACP : Le score Factoriel

𝐹𝑖𝑗 = 𝑋𝑖1𝐴1 + 𝑋𝑖2𝐴2 +⋯+ 𝑋𝑖𝑗𝐴𝑗

Où:

𝑭𝒊𝒋 : est le score de l’individu i sur le

facteur j

𝑿𝒊𝒋: est la valeur centrée réduite de

l’individu i sur la variable j

𝑨𝒋: Coefficients Factoriels*

* Extraits des vecteurs propres

Nous avons autant de facteurs que de

variables

Analyse des facteurs en commun ou ACP?

Communautés

Unités

𝑋1

𝑋2

𝑋3

𝑋1 𝑋2 𝑋3

𝑋1 <1

𝑋2 <1

𝑋3 <1

𝑋1 𝑋2 𝑋3

𝑋1 1

𝑋2 1

𝑋3 1

AF

ACP

Glossaire ACP

Tableau de données: Tableau croisant les individus i et les variables j;

Matrice des corrélations: Corrélations entre l’ensemble des couples de variables;

Matrice des corrélations reconstituée: A partir des composantes sélectionnées;

Résidus: L’écart entre la matrice des corrélations et celle des corrélations reconstituée;

Valeur propre: Représente la variance totale expliquée par chaque facteur, axe, composante;

Vecteur propre: Représente les coefficients factoriels;

Matrice des loadings: Corrélations entre les variables et les facteurs;

Rotation: Technique qui consiste à pivoter les facteurs avec un angle θ;

Glossaire ACP

Contribution: Contribution de chaque variable/individu dans la formation de les axes;

Représentation: A quel degré les variables/individus sont bien représentés sur les axes;

Score factoriel: Pour chaque i, ce sont les nouvelles coordonnées sur les facteurs principaux;

Test de coude ou Scree Test: Graphique des valeurs propres, pris dans leur ordre

d’importance;

Test de Sphéricité de Bartlett: Compare la matrice des corrélation à une matrice identité.

Test Kaiser Mayer Olkin (KMO): Utilisé pour mesurer l’adéquation de l’ACP ou l’AF, il doit

être compris en 0,5 et 1;

Pourcentage de variance (inertie): Part de la variance totale attribuée à chaque facteur;

PRE-REQUIS

ANALYSE EN COMPOSANTES

PRINCIPALES

Notions sur les vecteurs

221

22

Supposons les deux vecteur V1 et V2 :

V1 = V2 =

Graphiquement les deux vecteurs se présentent comme suit:

V1

Y

X

V2

Y

X

Notions sur les vecteurs

Trois informations:

1- La direction

2- Le sens

3- La norme (longueur)

Soit le vecteur V =

𝑥1𝑥2.𝑥𝑛

𝑽 = 𝑥12 + 𝑥2

2 +⋯+ 𝑥𝑛2

ProjVα Vβ = (𝒗𝜶 .𝒗𝜷

𝒗𝜶 . 𝒗𝜶 )𝒗𝒂

Rappel sur les statistiques descriptives

𝒙 = 𝒙𝟏 + 𝒙𝟐 +⋯+ 𝒙𝒏𝒏𝒊=𝟏

𝒏 𝝈𝒙² =

(𝒙𝒊 − 𝒙 )²𝒏𝒊=𝟏

𝒏 𝝈𝒙 =

𝒙𝒊 − 𝒙 𝟐

𝒏

𝒏

𝒊=𝟏

𝒓𝒙𝒚 = (𝒙𝒊 − 𝒙 )(𝒚𝒊 − 𝒚 𝒏𝒊=𝟏 )

𝝈𝒙𝝈𝒚

PRINCIPE

ANALYSE EN COMPOSANTES

PRINCIPALES

Principe de base dans l’estimation des facteurs

Nuage d’individus

ACP Normée: menée sur des données centrées et réduites

Principe de base dans l’estimation des facteurs

Nuage de variables

Le cosinus de l’angle formé par les deux vecteurs est égal au coefficient de corrélation

entre ces deux vecteurs

Principe de base dans l’estimation des facteurs

Ajustement du nuage d’individus: Projection des i

Principe de base dans l’estimation des facteurs

Ajustement du nuage des individus: Projection des d²(i , l)

Principe de base dans l’estimation des facteurs

Ajustement du nuage des variables

ANALYSE EN COMPOSANTES PRINCIPALES

Mener une ACP sur SPSS

Mener une ACP sur SPSS

Estimer l’adéquation du modèle

Calculer les scores

factoriels

Interpréter les facteurs

Extraire les facteurs

Calculer la matrice des corrélations

Formuler le problème

I- Formuler le problème

Objectif(s) de l’étude;

Variables d’études;

Echelle;

Taille de l’échantillon;

Etude de cas Les avantages fondamentaux recherchés

par les consommateurs lors de l’achat d’un dentifrice

• Le sondage est réalisé sur un échantillon de 30 personnes dans un centre commercial, ces dernières ont donné leur avis sur les affirmations suivantes, sur une échelle de 1 à 7 (1: En total désaccord; 7: entièrement d’accord):

V1: Il est important d’utiliser un dentifrice qui prévient la formation des caries;

V2: Un dentifrice doit rendre les dents brillante;

V3: Un dentifrice doit renforcer les gencives;

V4: Un dentifrice doit rafraîchir l’haleine;

V5: La prévention ces caries n’est pas un avantages important du dentifrice

V6: Un dentifrice doit, avant tout, donner de belles dents;

I- Formuler le problème

I- Formuler le problème

Répondant V1 V2 V3 V4 V5 V6

1 7 3 6 4 4 2

2 1 3 2 4 5 4

3 6 2 7 4 1 3

4 4 5 4 6 2 5

30 2 3 2 4 7 2

Saisie des données sur SPSS

I- Formuler le problème

Saisie des données sur SPSS

Lancer l’ACP sur SPSS

Lancer l’ACP sur SPSS

Bouton Descriptives

Lancer l’ACP sur SPSS

Bouton Extraction

Lancer l’ACP sur SPSS

Bouton Rotation

Lancer l’ACP sur SPSS

Bouton Facteurs

II- Calculer la matrice des corrélation

II- Calculer la matrice des corrélation

III- Extraire les facteurs et déterminer leur nombre

Détermination a priori ou considérations théoriques;

Détermination fondée sur les valeurs propres;

Scree-Test;

Pourcentage de la variance;

Test de fiabilité de deux sous-échantillons;

Signification statistiques des valeurs propres;

III- Extraire les facteurs et déterminer leur nombre

IV- Interpréter les facteurs

IV- Interpréter les facteurs

IV- Interpréter les facteurs

Facteur 1 Facteur 2

V1 34,407 0,019

V2 0,146 31,815

V3 32,490 0,868

V4 0,400 32,238

V5 32,332 0,358

V6 0,225 34,702

Contribution des variables en %

Facteur 1 Facteur 2

V1 0,926 0,000

V2 0,004 0,719

V3 0,874 0,020

V4 0,011 0,728

V5 0,870 0,008

V6 0,006 0,784

Représentation des variables

V1: Il est important d’utiliser un dentifrice qui prévient la formation des caries;

V2: Un dentifrice doit rendre les dents brillante;

V3: Un dentifrice doit renforcer les gencives;

V4: Un dentifrice doit rafraîchir l’haleine;

V5: La prévention ces caries n’est pas un avantages important du dentifrice

V6: Un dentifrice doit, avant tout, donner de belles dents;

Après rotation

IV- Interpréter les facteurs

V1: Prévention de la formation des caries;

V2: Dents brillantes;

V3: Renforce les gencives;

V4: Rafraîchit l’haleine;

V5: La prévention des caries (NI)

V6: De belles dents;

Hygiène & santé des dents

Bien

faits so

ciau

x

V- Calcul des scores factoriels

V- Calcul des scores factoriels

VI- Déterminer l’ajustement du modèle

Une comparaison entre la matrice des

corrélations initiale et la matrice des

corrélations reconstituée à partir des

facteurs

Evaluation de la significativité des

résidus

VI- Déterminer l’ajustement du modèle

Quelques références