Introduction aux statistiques descriptives et tests d'hypothèses
-
Upload
clement-dussarps -
Category
Education
-
view
904 -
download
0
Transcript of Introduction aux statistiques descriptives et tests d'hypothèses
Enquêtes quantitativesStatistiques descriptives
Clément Dussarps
26/09/12
Clément Dussarps 2
Statistiques, mais comment ?
Sans mathématiques !(ou presque)
Clément Dussarps 3
Pourquoi des statistiques ?
Expliquer des comportements (humains notamment)
Identifier des liens entre publics et comportements : comprendre un public
Faire des groupes (typologies) Comparer des publics Comparer des comportements à des instants
différents Valider ou non des hypothèses …
=> Des outils pour observer, analyser, expliquer, comprendre
?
Clément Dussarps 4
Exemples d’applications pratiques
Votre mémoire ! Observer des différences de comportements vis-
à-vis de marques (qui achète quoi, quand, combien…)
Analyser l’impact d’une campagne publicitaire (existe-t-il des différences significatives par rapport à avant la campagne ?)
Déterminer des profils pour mieux cibler une campagne de communication (qui va acheter quoi, etc.)
Suivre son public, le connaître …
Clément Dussarps 5
Objectifs du cours
A la fin de la séance, vous devez être capable de… Choisir, pour une enquête à réaliser, entre un
échantillonnage probabiliste et non probabiliste Déterminer les objectifs d’une enquête Concevoir un questionnaire Formuler des hypothèses Construire un questionnaire sur Sphinx Saisir des réponses sur Sphinx
Clément Dussarps 6
Plan du coursDate Etapes
26 septembreCours : bases de l’échantillonnage, construction questionnaire, présentation du sujet ministériel, proposer ensemble des objectifsSphinx : faire 5 questions & saisie de réponses (5 individus)
Intersession (1 semaine) Relire cours, finir exercicesFaire groupes, proposer des objectifs & hypothèses
03 octobreCours : bases du traitement des données, validation d’hypothèses (khi-2), analyse multivariée (AFC)Sphinx : traitements de données
Intersession (2 semaines) Relire cours, finir exercicesProposer questionnaire
17 octobre Se mettre d’accord sur un questionnaireTester questionnaire entre nous
Intersession (4 semaines) Administration du questionnaire (10 rép. / personnes)
14 novembre Accompagnement pour traitement, dossiers, etc.
Intersession (3 semaines) Dossiers à faire (rapport d’enquête par rapport à une question précise)
05 décembre Présentation orale des dossiers + bilan
Clément Dussarps 7
Evaluation
3 notes Note globale sur les exercices rendus coeff. 1 1 note présentation orale coeff. 1 1 note dossier écrit coeff. 2
Clément Dussarps
L’échantillon
Clément Dussarps 9
Echantillonnage
Population de référence (ou mère) :Penser à bien la définir :
- « Etudiants en IUT Publicité 2ème année à Bordeaux »
- « Bûcherons Québecois de moins de 35 ans »
- « Femmes de 35 à 50 ans, qui ont au moins 1 enfant, et regardent TF1 au moins 1 fois par semaine»
- « Français en âge de voter (> 18 ans) »
?
Clément Dussarps 10
Echantillon et hasard
Un sac de billes (nombreuses !) Homogénéité (répartition ?)
Un sac de 10000 billes ?Tirer 100 billes Taux de sondage = 1%
Un sac de 1000 billes ?Tirer 100 billes aussi !10 seraient insuffisantesTaux de sondage = 10%
?
11
Echantillon et hasard
Ce que l’on veut :o Précision acceptableo Représentativité
Limites = budget, temps
Pour doubler la précision= échantillon x4
Clément Dussarps
Clément Dussarps 12
Sondage ou recensement ?
Recensement : faire l’appel dans une classe de 20 étudiants
Sondage = 1000 personnes sur 65 millions de personnes
Recensement = 65 millions de personnes ou x foyers
Différence d’objectifs Différence de coût Rapport coût/résultat
Clément Dussarps 13
Echantillonnage
Population de référence (ou mère) :
Clément Dussarps 14
Echantillonnage
Echantillon (généralité) = une partie de la population L’échantillon est
analysé.
A terme, il n’a de valeur que pour en tirer des conclusions sur la population totale.
Clément Dussarps 15
Echantillonnage
Echantillonnage aléatoireLa population de référence est connue et listée
On choisit x personnes sur la population, sans aucune pondération (tirage aléatoire, chacun a autant de chance qu’un autre d’être sélectionné)
Représentatif de la population (a priori), si elle est homogène.
Clément Dussarps 17
Echantillonnage
Echantillonnage stratifiéLa population de référence est connue et listée
On « stratifie » les groupes, on les répartis en sous-groupes, par ex par rapport : - au genre - à l’âge - à la CSP
Les sous-groupes ne sont pas toujours de tailles équivalentes.
Clément Dussarps 18
Echantillonnage
Echantillonnage en grappes (d’individus)La population de référence est connue et listée
Ici, les grappes sont « parfaites » (homogènes, même taille)
Ex : choisir 10 immeubles et frapper à toutes les portes.Les grappes sont-elles homogènes ?
Les individus d'une même grappe vérifient au moins une même caractéristique (âge, CSP…).
Clément Dussarps 20
Echantillonnage
Echantillonnage : quotasOn a certains éléments de la population de référence. Ex : 500 femmes, 500 hommes, 250 individus < 25 ans, etc.
On respecte les proportions de la population selon certains choix (ex : respect du genre, de l’âge, de la CSP…). Ex : en utilisant une base INSEE
Il faut bien préparer les groupes et classes de population (ex pour l’âge).
Clément Dussarps 21
Echantillonnage
Echantillonnage : de jugementSélection de personnes (ou types de personnes) jugées pertinentes pour l’étude.
Clément Dussarps 22
Echantillonnage
Echantillonnage : de convenance, volontaireOn connaît mal la population de référence.
Envoi d’e-mails à toute une population, abonnés d’un journal, sondage dans la rue sans méthode, etc.
Risque : tomber sur des très contents ou très mécontents (les « énervés » et les « youpiya »)=> Qui sont les non répondants ?
Clément Dussarps 23
Echantillonnage
Non probabiliste Quotas Jugement Convenance
o Choix raisonné (déductif) pour les quotas/panels
o Population un peu connue, mais sans liste complète
Probabiliste Aléatoire Stratifié En grappes
o Hasardo Population connue
(liste)
Clément Dussarps 24
Echantillonnage
Quelle méthode choisir ?o Probabiliste :
• la population est parfaitement connue (liste des différents individus). Pour l’aléatoire simple, seule la liste suffit (pas les caractéristiques)
• Rarement applicable du fait de cette condition• Peut être coûteux, personnes difficiles à avoir
o Non probabiliste (empirique) :• La liste exhaustive de la population n’est pas connue• On a une idée de certaines caractéristiques de la
population (ex : il y a 50% de femmes, 50% d’hommes).• Peut s’avérer fiable, notamment avec la méthode des
quotas
Clément Dussarps 25
Echantillonnage
Quelle méthode choisir parmi les non probabilistes :o Méthode des quotas
• Quand on n’a pas de base précise listant les individus (mais quelques chiffres sur la population totale)
• Bon rapport qualité / prixo Convenance
• Quand on n’a pas le choix : ni base précise, ni moyen d’appliquer les quotas
• Solution de facilité• Représentativité rarement fiable• Echantillon éventuellement redressable
o Panel / cohortes• Etude longitudinale (sur le temps) auprès d’un public précis
(ex : consommateurs d’un produit)
?
Clément Dussarps 26
Echantillonnage
Combien de personnes questionner ?o Tout dépend du budget, du temps, de la qualité
souhaitée (précision)…o Pour être précis, le nombre de personnes dans
l’échantillon n’est pas nécessairement proportionnel au nombre de personnes dans la population (ex : interroger 400 personnes VS interroger 800 personnes ne veut pas dire = précision x 2)
o Peut être arbitraire (ex : on interroge 1 personne sur 10 = 10%)
o Il est possible de redresser l’échantillon après enquête pour le faire correspondre aux quotas fixés
o Il existe aussi un calcul…
Clément Dussarps 27
Echantillonnage
Calculer la taille d’un échantillon
DES MATHEMATIQUES !!!
Des défibrillateurs sont disponibles pour les arrêts
cardiaques éventuels
Clément Dussarps 28
Echantillonnage
Calculer la taille d’un échantillon (quotas)
t = niveau de confiance à 95% = 1,96m = marge d’erreur à 5% = 0,05p = proportion de la variable étudiée dans la population (ex : 20% = 0,20) // si inconnue, prendre 50%
N =t² x p (1-p)
m²
Clément Dussarps 29
Echantillonnage
Il existe aussi des calculs pour estimer l’intervalle de confiance…
Pour en savoir plus : Google est votre ami
Clément Dussarps 30
Echantillonnage
Enquête biaisée : échantillon non représentatif, à cause d’une erreur volontaire ou non sur l’échantillonnage.
Exemple : faire un sondage sur les consommateurs d’un magasin, en interrogeant les personnes passant par une sortie et pas une autre, un mercredi après-midi… (échantillon de convenance, administration mal gérée !)
Exemple 2 : choisir une population de personnes abonnées à L’Humanité pour étudier les intentions de vote de la population française)
?
Clément Dussarps
L’enquête
Clément Dussarps 32
Un peu de vocabulaire…
Individu = « unité statistique élémentaire » (Martin, 2005)o Humainso Foyers (et parfois : foyers + individus)o Communeso Etc…
Variables : éléments étudiés (ex : l’âge) = questions posées
Modalités : réponses possibles (« modalités de réponse »)
Variable DonnéeAnnée de naissance 1990Commune de résidence BordeauxFréquence des soirées festives > 3 par semaine
Clément Dussarps 34
Types de questions
Fermées à choix unique
Fermées à choix multiples
Clément Dussarps 35
Types de questions
Fermées à choix multiples ordonnées
Fermées échelle :
Clément Dussarps 36
Types de questions
Types d’échelles :o « Très satisfait », « plutôt satisfait », « plutôt pas
satisfait », « insatisfait »o Numérique : 0, 1, 2, 3… Préciser le sens de l’échelle (ex :
0 = négatif, absence… ; 3 = très bien, très présent…)
Conseil (discutable) : choisir un nombre de valeurs pair. Cela évite les « valeurs refuge »Exemple : « TS », « PS », « Ni satisfait, ni insatisfait », « PPS », « IS »
Même si cela empêche la liberté de la neutralité…
Clément Dussarps 37
Types de questions
Ouverte numérique :
Ouverte texte (alphanumérique) :
Clément Dussarps
Méthodologie
Clément Dussarps 39
Réalisation de l’étude
Définir l’objectif global de l’enquête Définir la population de référence Définir un échantillon :
o Type d’individus : personnes, foyers, communes…o Périmètre géographique : où a lieu l’enquête et
jusqu’où ?o Date : quand a lieu l’enquête ?o Si stratification/quotas : quelles données doivent servir
pour le tri (genre, âge, CSP…) ? Définir les données à recueillir=> Méthode projet : QQOQCP : qui, quoi, où, quand, comment, pourquoi ?
Clément Dussarps 40
Réalisation de l’étude
Pourquoi ? Objectifs de l’enquête Qui ? Public Quoi ? Quelle forme a l’étude (sondage,
recensement…), quelles questions poser Où ? Périmètre de l’enquête Quand ? Temporalité (judicieusement choisie) Comment ? Forme d’administration (passation)
Clément Dussarps 41
Réalisation de l’étude
Exemple : les fumeurs dans une promo de Pub 2A à l’IUT de Bordeaux 3…
Penser à être précis selon les objectifs fixés = objectifs ici ?
Exemple de questions : Etes-vous fumeur : oui ; non Si oui, à quelle fréquence fumez-vous : … Si oui, êtes-vous sensible aux messages sur les
paquets … + données de profil etc.
Clément Dussarps 42
Quelques conseils
S’adapter à son public (quel vocabulaire ?, etc.) Savoir quelles données seront essentielles avant de
lancer l’enquête : sinon il manquera des données ! Formuler des hypothèses avant L’ordre des questions a son importance. On préfère
souvent mettre le profil à la fin = + facile à répondre, plus court…
L’ordre au niveau micro a aussi son importance : éviter d’influencer une réponse au regard d’une question posée juste avant (ex : « mangez-vous des sandwich (fréquence) ? » puis « pensez-vous manger sainement ? » (échelle))
« Règle » des trois oui : oui, oui… et oui !
Clément Dussarps 43
Quelques conseils Une question ne concerne qu’un seul élément (pas de double
question) Eviter la négation dans une question Etre précis dans les réponses et exhaustif. Si nécessaire,
prévoir une réponse « Autre » à préciser en question ouverte Etre précis c’est aussi éviter la subjectivité. Une question du
type « êtes-vous en activité depuis longtemps ? » n’est pas claire : « depuis combien de temps êtes-vous en activité » = « - d’1 an, 1 an, 2 ans, 3 ans, > 3 ans »
Eviter de donner une réponse dans la question : « ce produit sain est-il bon pour vous ? »
On peut rendre les réponses obligatoires, mais attention à ne pas être trop contraignant
Clément Dussarps 44
Quelques conseils
Faire attention avec les représentations, il n’est pas toujours aisé de se projeter. Ex : « pensez-vous aller au supermarché entre 18h et 20h dans les 3 jours à venir ? »
Dans tous les cas : tester le questionnaire sur un petit nombre (5 – 10 personnes suffisent généralement pour détecter les grosses erreurs, il en faut parfois plus pour détecter les manques dans les questions = 30 est bien)
Ce test permet de détecter :o Erreurs sur la forme : manière dont sont posées les questions
ou les réponses, manque d’une modalité de réponse, etc.o Sur le fond : manque d’informations pour conclure. Ex : profil
peu ou mal analysé au regard des objectifs
Clément Dussarps
Travail pratique
Clément Dussarps 46
Pratique
Présentation du sujet traité cette année« Soirées festives étudiantes et risques »
Objectifs ? Hypothèses ? Questions possibles ?
?
Clément Dussarps 47
Pratique
Prise en main Sphinx, faire 5 questions et saisir 5 réponses
Questions :o 1 fermée à choix unique (ex : genre = homme / femme)o 1 fermée à choix multiples, ordonnés (ex : quels sont vos
styles musicaux préférés parmi : Rock, Métal, Dance, Rap, Classique…)
o 1 fermée échelle (ex : fréquence d’écoute de musique)o 1 ouverte numérique (ex : âge)o 1 ouverte texte (quel est votre groupe de rock favori ?)
Choisir un ordre logique à ces questions Rajouter une condition (ex : ne poser la question
ouverte texte que si la personne a coché « rock »)
Clément Dussarps 48
Pour la prochaine fois… http://www.clementdussarps.fr/C1/ Finir les exercices pour samedi 29/09/12 à 12h00 (envoyer
à [email protected]) Relire le cours – m’envoyer questions par e-mail (réponse la
fois prochaine à tous)
Faire des groupes de 3 personnes maximum Proposer 3 à 5 problèmes à traiter sur le sujet de l’enquête
o « Soirées festives chez les étudiants et risques »o Penser à ce que vous voulez cibler : la manière dont les gens
perçoivent cela, ou dont ils vivent cela, etc.o Déterminer un échantillon possible
Proposer des hypothèses de réponse aux problèmes posés
49
Deux bons livres accessibles
De bonnes bases sans mathématiques :
De bons savoir-faire, regard intéressant sur les stats :
Clément Dussarps 50
Biblio/webographie Olivier Martin, « L’enquête et ses méthodes ; l’analyse de données quantitatives »,
2005, Armand Colin. Bernard Py, « La statistique sans formule mathématique », 2010, Pearson. Nombreux cours ici (Jean-Marc Fontan, Québec) : http://
www.omd.uqam.ca/membres/pages-perso/Jean-Marc/cours/SOC1101/ - voir les cours 3, 4, 5, Echantillonnage : http://
www.needocs.com/document/management-divers-divers-cours-d-echantillonnage,6127
http://www.astro.ulg.ac.be/cours/magain/stat/ Cours complet : http://
www.dunod.com/document/9782100521371/52137_AnnexesWeb_s.pdf
Manipulation des sondages : http://www.apprendre-a-manipuler.com/medias/les-5-techniques-les-plus-utilisees-pour-manipuler-les-sondages-dopinion-auquels-vous-repondez.html
Intéressant pour comprendre comment on peut « faire mentir » des chiffres
Clément Dussarps
Merci de votre attention