Techniques D_enquête Simplifiées

120
ECHANTILLONNAGE Pr. BOULAHOUAL Adil

description

Techniques D_enquête Simplifiées

Transcript of Techniques D_enquête Simplifiées

  • ECHANTILLONNAGE

    Pr. BOULAHOUAL Adil

  • Sondage

    Mthodes Taille

    Probabilistes EmpiriquesMarge derreur tolre

    Degr de confiance

    Normalit de la population

    Nature de linformation :Quanti (moyenne) ou

    Quali (proportion)

    Alatoire simple

    Stratifie

    Par degrs

    Systmatique

    Quotas

    Pr. BOULAHOUAL Adil

  • Enqute

    Ensemble des oprations de collecte et de traitement de donnes relatives quelques domaines que ce soit.

    Pr. BOULAHOUAL Adil

  • Population cible

    Rassemblement de tous les cas qui rpondent un ensemble de caractres spcifiques. Appele aussi univers ou ensemble statistique, cest lensemble des lments auxquels on sintresse.

    Pr. BOULAHOUAL Adil

  • Sondage

    Enqute incomplte, enqute partielle ou enqute par chantillonnage, cest une enqute au cours de laquelle seulement une partie des units de base de la population sont observe.

    Pr. BOULAHOUAL Adil

  • Echantillon

    Ensemble des units de base slectionnes et rellement observes au cours dun sondage.

    Pr. BOULAHOUAL Adil

  • Echantillonnage

    Ensemble des oprations qui permettent de slectionner de faon organise les lments de lchantillon.

    Pr. BOULAHOUAL Adil

  • Base de sondage

    Enumration ou prsentation ordonne de toutes les units de base constituant la population.

    Pr. BOULAHOUAL Adil

  • Erreur dchantillonnage

    Ecart entre les rsultats obtenus auprs dunchantillon et ce que nous apprendrait unrecensement comparable de la population. Plus lataille de lchantillon est grande plus lerreurdchantillonnage diminue.

    Pr. BOULAHOUAL Adil

  • Dtermination de la taille de lchantillon

    Pr. BOULAHOUAL Adil

  • la taille dchantillon dpend essentiellement de deux facteurs :

    La prcision souhaite : plus on souhaite desrsultats prcis, plus lchantillon ncessaire estimportant.

    Le budget disponible : plus on augmente la taille, plus le cot de lenqute saccrot.

    Pr. BOULAHOUAL Adil

  • Cas dune population de loi inconnue

    Taille dchantillon pour estimer une moyenne

    n

    Pr. BOULAHOUAL Adil

  • Exemple : Un parc de loisirs souhaite estimer 10dh prs lemontant moyen dachats effectus par chaque visiteur.une tude pilote mene sur 50 visiteurs choisis au hasard a

    Si on se fixe un seuil de confiance (1-) = 95%, La taille delchantillon est donc :

    2000 05,010100 n

    montr que lcart- type des achats est de 100 dh.

    Pr. BOULAHOUAL Adil

  • Cas dune population de loi inconnue

    Taille dchantillon pour estimer une proportion

    pqn

    Pr. BOULAHOUAL Adil

  • Exemple : Le parc souhaite estimer la proportion des visiteurs qui font des achats cinq points prs.Lenqute pilote a estim cette proportion 65%, cest dire p = 0,65

    Si on se fixe un seuil de confiance (1-) = 95%, La taille delchantillon est donc :

    1820 05,005,035,065,0

    n

    Pr. BOULAHOUAL Adil

  • Cas dune population normale

    Taille dchantillon pour estimer une moyenne

    Cas des prlvements dans une population finie avec remise ou dans une population infinie sans remise

    21 Zn

    Pr. BOULAHOUAL Adil

  • Exemple : Un parc de loisirs souhaite estimer 10dh prs le montant moyen dachats effectus par chaque visiteur.une tude pilote mene sur 50 visiteurs choisis au hasard a

    Si on se fixe un seuil de confiance (1-) = 95%, La taille delchantillon est donc :

    385 16,384 10100 1,96 n

    montr que lcart- type des achats est de 100 dh.

    Pr. BOULAHOUAL Adil

  • Cas dune population normale

    Taille dchantillon pour estimer une proportion

    Cas des prlvements dans une population finie avec remise ou dans une population infinie sans remise

    21 pqZn

    Pr. BOULAHOUAL Adil

  • Exemple : Le parc souhaite estimer la proportion des visiteurs qui font des achats cinq points prs.Lenqute pilote a estim cette proportion 65%, cest dire p = 0,65

    Si on se fixe un seuil de confiance (1-) = 95%, La taille delchantillon est donc :

    350 58,349 05,035,065,0 1,96 n

    Pr. BOULAHOUAL Adil

  • Cas dune population normale

    Taille dchantillon pour estimer une moyenne

    Cas des prlvements dans une population finie sans remise

    Z N N Z

    2

    -1

    2-1

    n

    Pr. BOULAHOUAL Adil

  • Cas dune population normale

    Taille dchantillon pour estimer une proportion

    Cas des prlvements dans une population finie sans remise.

    q p Z N N q p Z

    2

    -1

    2-1

    n

    Pr. BOULAHOUAL Adil

  • Mthodes dchantillonnage

    - Mthodes dchantillonnage probabilistes

    - Mthodes dchantillonnage empiriques

    Pr. BOULAHOUAL Adil

  • Mthodes dchantillonnage probabilistes

    - Echantillonnage alatoire et simple

    - Echantillonnage stratifi

    - Echantillonnage par degrs

    - Echantillonnage systmatique

    Pr. BOULAHOUAL Adil

  • Echantillonnage alatoire et simple

    Un chantillonnage est alatoire si tous lesindividus de la population ont la mmechance de faire partie de lchantillon; il estsimple si les prlvements des individussont raliss indpendamment les uns desautres.

    Pr. BOULAHOUAL Adil

  • Echantillonnage alatoire et simple

    Si la population est finie, lchantillonnagealatoire et simple correspond au tiragealatoire avec remise, qui permet de traiterles populations finies comme despopulations infinies.

    Pr. BOULAHOUAL Adil

  • Echantillonnage alatoire et simple

    - Constituer la base de sondage qui correspond la listecomplte et sans rptition des lments de lapopulation ;

    - Numroter ces lments de 1 N ;

    - Procder, laide dune table de nombres alatoires oudun gnrateur de nombres pseudo alatoires laslection des units diffrentes qui constituerontlchantillon.

    Pr. BOULAHOUAL Adil

  • Echantillonnage alatoire et simple

    Exemple :

    On souhaite avoir un chantillon alatoire et simple de5 entreprises parmi une population de 22 entreprises.On dispose de la base de sondage cest dire la listecomplte et sans rptition des 22 entreprisesnumrotes de 1 22. On prend un extrait dune tablede nombre alatoire par exemple :

    Pr. BOULAHOUAL Adil

  • Echantillonnage alatoire et simple

    On choisit au hasard un nombre de la table, supposons ce nombre 06121. Comme N= 22, on va retenir le premier groupe de 2 chiffres, ce qui donne les N :06, ensuite 12 ; 19 ; 17 ; les nombres (82,77 et 92) sont inutilisables. La cinquime entreprise sera le N 10.

    10480 15011 01536 02011 81647 9164622368 46573 25595 85393 30995 8919824130 48390 22527 97265 76393 6480942167 93093 06243 61680 07856 1637637570 39975 81837 16656 06121 9178277921 06907 11008 42751 27756 53498

    Pr. BOULAHOUAL Adil

  • Echantillonnage stratifi

    Lchantillonnage stratifi est une technique qui consiste subdiviser une population htrogne, deffectif N, enP sous populations ou strates plus homognesdeffectif Ni de telle sorte que N= N1+N2+. +Np.Un chantillon, deffectif ni, est par la suite, prlevindpendamment au sein de chacune des strates enappliquant un plan dchantillonnage au choix delutilisateur. Le plus souvent, on procdera par unchantillonnage alatoire et simple lintrieur dechaque strate.

    Pr. BOULAHOUAL Adil

  • Echantillonnage stratifi

    La stratification peut entraner des gains deprcision apprciables, elle facilite en outreles oprations de collecte des donnes etfournit des informations pour diffrentesparties de la population.

    Pr. BOULAHOUAL Adil

  • Echantillonnage stratifi

    Pour la rpartition de leffectif total, n, delchantillon dans les diffrentes strates, Lapremire solution, dite proportionnelle, consiste conserver la mme fraction dchantillonnagedans chaque strate. Une seconde solution, diteoptimale, tient compte du budget de lenqute.

    Pr. BOULAHOUAL Adil

  • Rpartition proportionnelle

    La rpartition proportionnelle consiste rpartir la taille de lchantillon n enutilisant la mme fraction de sondage f danschacune des strates. Cette solution tientcompte dun seul facteur qui est le poids dechaque strate.

    Pr. BOULAHOUAL Adil

  • Rpartition proportionnelle

    Dsignons par wi le poids de la strate et par f la fractionde sondage constant :

    le nombre dunits choisir dans chacune des strates estdonc :

    NiNet wi n f N

    iii N f n w n

    Pr. BOULAHOUAL Adil

  • Rpartition proportionnelle

    Exemple :

    Dans une population de 10000 entreprises,rparties en 5000 petites entreprises, 3000moyennes entreprises et 2000 grandes entreprises,on souhaite avoir un chantillon de 500entreprises.

    Fraction de sondage constante : f = 500 / 10000 = 5 %

    Pr. BOULAHOUAL Adil

  • Rpartition proportionnelle

    Strate Effectif Taille de lchantillon

    Petite 5000 5000 * 0,05 = 250Moyenne 3000 3000 * 0,05 = 150Grande 2000 2000 * 0,05 = 100

    Total 10000 500

    Pr. BOULAHOUAL Adil

  • Rpartition proportionnelle

    Strate Effectif Poids Taille de lchantillon

    Petite 5000 50% 500 * 0,5 = 250Moyenne 3000 30% 500 * 0,3 = 150Grande 2000 20% 500 * 0,2 = 100

    Total 10000 500

    Pr. BOULAHOUAL Adil

  • Rpartition optimale

    - Budget total de lenqute, G- Poids de la strate, wi- Cot de la collecte de linformation dans la strate, ci- Dispersion lintrieur de la strate, mesure par

    lcart type i.

    Pr. BOULAHOUAL Adil

  • Rpartition optimale

    le nombre dunits choisir dans chacune des strates est donn par :

    iii

    c wk in

    iii c w

    G

    k

    Pr. BOULAHOUAL Adil

  • Rpartition optimale

    Exemple :

    Dans la population des 10000 entreprises, on a pu avoir lesinformations suivantes :

    Strate wi ci i.

    Petite 0,5 50 0,8Moyenne 0,3 75 1,5Grande 0,2 100 2,2

    Pr. BOULAHOUAL Adil

  • Rpartition optimale

    le nombre dentreprises choisir dans chacune des stratesest donn par :

    c w

    G kiii

    449,42 1002,20,2 751,50,3 508,05,0

    5000

    sentreprise petites 26 50

    0,8 0,5 449,42 n1

    sentreprise moyennes 24 75

    1,5 0,3 449,42 n2

    sentreprise grandes 20 100

    2,2 0,2 449,42 n3

    Pr. BOULAHOUAL Adil

  • Echantillonnage par degrs

    Lchantillonnage par degrs regroupe toute une srie de plans dchantillonnage caractriss par un systme ramifi et hirarchis dunits.

    Pr. BOULAHOUAL Adil

  • Echantillonnage par degrs

    Dans le cas de deux degrs, par exemple, on considre que la population est constitue dun certain nombre dunits de sondage du premier degr (units primaires), chacune de ces units tant constitue dun certain nombre dunits du second degr. (units secondaires)

    On ralise dabord un chantillonnage dunits du premier degr. Ensuite, dans chaque unit slectionne au premier degr, on prlve un chantillon dunits du second degr. Le mode de slection pouvant varier dun degr lautre.

    Pr. BOULAHOUAL Adil

  • Echantillonnage par degrs

    Lchantillonnage par degrs simpose lorsquil est impossible dinventorier les lments de toute la population et quil est possible dnumrer les units prleves au premier degr. Il permet une concentration du travail sur le terrain et donc une rduction des cots.

    Pour un mme nombre total dobservations, il faut citer sa plus faible efficacit que lchantillonnage alatoire et simple.

    Pr. BOULAHOUAL Adil

  • Echantillonnage par degrs

    Exemple :

    Pour tudier le niveau de consommation des mnages dune ville, on a tir alatoirement 5 quartiers. Dans chaque quartier slectionn, on retient une rue sur 5, dans chaque rue retenue, on retient un immeuble sur 3, et dans chaque immeuble, un mnage par tage sera questionn.

    Pr. BOULAHOUAL Adil

  • Echantillonnage systmatique

    Lchantillonnage systmatique est une technique qui consiste prlever des units dchantillonnage situes intervalles gaux. Le choix du premier individu dtermine la composition de tout lchantillon.

    Pr. BOULAHOUAL Adil

  • Echantillonnage systmatique

    Si on connat leffectif total de la population N et quon souhaite prlever un chantillon deffectif n, lintervalle entre deux units successives slectionner est donn par :

    nNk

    Pr. BOULAHOUAL Adil

  • Echantillonnage systmatique

    Connaissant k, on choisit le plus souvent,pour dbuter, un nombre alatoire, i,compris entre 1 et k. le rang des unitsslectionnes est alors i, i+k, i+2k,

    Pr. BOULAHOUAL Adil

  • Echantillonnage systmatique

    Lchantillonnage systmatique est facile prparer et, en gnral facile excuter, il rduit le temps consacr la localisation des units slectionnes.

    Pr. BOULAHOUAL Adil

  • Echantillonnage systmatique

    Si les lments de la population seprsentent dans un ordre alatoire (pas detendance) lchantillonnage systmatiqueest quivalent lchantillonnage alatoireet simple. Par contre si les lments de lapopulation prsentent une tendance,lchantillonnage systmatique est plusprcis que lchantillonnage alatoire.

    Pr. BOULAHOUAL Adil

  • Echantillonnage systmatique

    Exemple :On veut slectionner un chantillon de 30 entreprises au seindune population de 1800 entreprises.

    Ainsi on va tirer une entreprise toutes les 60 en partant dunnombre tir alatoirement entre 1 et 60.Supposons ce nombre est le 15. On va donc slectionner la 15meentreprise puis la 75me, la 135me. jusqu la 1755me ce qui nousdonnera lchantillon de 30 entreprises.

    60301800k

    Pr. BOULAHOUAL Adil

  • Mthodes dchantillonnage empiriques

    - Echantillonnage accidentel (De convenance)

    - Echantillonnage priori

    - Echantillonnage Boule de neige

    - Echantillonnage par Quotas

    Pr. BOULAHOUAL Adil

  • Echantillonnage accidentel

    Il sagit dun chantillon constitu dindividus qui setrouvaient accidentellement lendroit et au moment olinformation a t collecte.

    Enqutes ralises dans la rue, les lieux publics, en sortie desuper march Questionnaires figurant dans les magasines et renvoysspontanment.

    Les chantillons accidentels ne peuvent tre considrs reprsentatifs daucune population. Il est risqu de gnraliser une population donne des rsultats obtenus par un chantillon accidentel.

    Pr. BOULAHOUAL Adil

  • Echantillonnage priori

    Cest un chantillonnage par jugement priori. Ilconsiste slectionner des individus dont onpense, avant de les interroger, quils peuventdtenir linformation.

    Le risque de ce type dchantillonnage est de considrer des individus, apparemment reprsentatifs de la population tudie.

    Pr. BOULAHOUAL Adil

  • Echantillonnage Boule de neige

    Cette mthode est rserve aux populationscomposes dindividus dont lidentification estdifficile ou qui possdent des caractristiquesrares.

    La mthode consiste faire construire lchantillonpar les individus eux-mmes. Il suffit denidentifier un petit nombre initial et de leurdemander de faire appel dautres individuspossdant les mmes caractristiques.

    Pr. BOULAHOUAL Adil

  • Echantillonnage par Quotas

    Lchantillonnage par quotas estlchantillonnage non probabiliste le plusconnu, et finalement le mieux acceptcomme substitut aux mthodes probabilistesdans le cas o ces dernires rencontreraientdes contraintes de base de sondage. Mais lareprsentativit de la population tudiereste douteuse.

    Pr. BOULAHOUAL Adil

  • Echantillonnage par Quotas

    Lchantillonnage par quotas consiste tudier la structure de la population selondes critres choisis (quotas) empiriquement.Lchantillon est ensuite construit demanire constituer une reproduction enminiature de la population sur ces critres.

    Pr. BOULAHOUAL Adil

  • Echantillonnage par Quotas

    Lchantillonnage par quotas est une formesimplifie de lchantillonnage stratifi fractionde sondage constante. Les quotas reprsentent lesvariables de stratification.

    Une fois les quotas sont fixs, les individus sontslectionns la convenance de lenquteur.

    Pr. BOULAHOUAL Adil

  • Echantillonnage par Quotas

    Les critres servant de base la dfinition des quotasne doivent pas tre nombreux. Au-del de 3 critres, ladmarche devient complexe. Les quotas doivent treconstruits sur une base de donnes fiables ( statistiquesdisponibles ) indiquant la rpartition de la populationsur les critres choisis. Les critres les plus utilissdans les tudes de march sont conomiques et socio-dmographiques en particulier lge, le sexe, lacatgorie socioprofessionnelle,

    Pr. BOULAHOUAL Adil

  • Echantillonnage par Quotas : Exemple

    On souhaite avoir un chantillon de 1000 individus. Lastructure de la population selon trois critres est lasuivante :Age Structure de Rpartition de

    la population lchantillon

    20 29 ans 40 % 40030 49 ans 35 % 35050 60 ans 25 % 250Total 100 % 1000

    Pr. BOULAHOUAL Adil

  • Echantillonnage par Quotas : Exemple

    Structure de la populationAge Sexe Masculin Fminin Total

    20 29 ans 48 % 52 % 100 %

    30 49 ans 49 % 51 % 100 %

    50 60 ans 45 % 55 % 100 %

    Pr. BOULAHOUAL Adil

  • Echantillonnage par Quotas : Exemple

    Rpartition de lchantillon

    Age Sexe Masculin Fminin Total

    20 29 ans 192 208 400

    30 49 ans 172 178 350

    50 60 ans 113 137 250

    Pr. BOULAHOUAL Adil

  • CSP

    AGE Sexe Sans Etudiant Agric Artisans Proflibrales

    Employs Ouvriers Total

    F 15% 25% 2% 10% 8% 30% 10% 100%

    30-49 M 8% 5% 15% 22% 15% 15% 20% 100%

    F 20% 4% 10% 16% 14% 24% 12% 100%

    50-60 M 6% 2% 25% 22% 18% 17% 10% 100%

    F 35% 1% 20% 20% 6% 13% 5% 100%

    20-29 M 10% 30% 5% 6% 9% 25% 15% 100%

    Pr. BOULAHOUAL Adil

  • CSP

    AGE Sexe Sans Etudiant Agric Artisans Proflibrales

    Employs Ouvriers Total

    20-29 M 19 58 10 12 17 48 28 192

    F 31 52 4 21 17 62 21 208

    30-49 M 14 9 26 38 26 26 33 172

    F 36 7 18 28 25 43 21 178

    50-60 M 7 2 28 25 20 19 12 113

    F 48 1 27 27 8 18 8 137

    Pr. BOULAHOUAL Adil

  • Test de reprsentativit de lchantillon

    Pour valider les rsultats de l'tude, et pourminimiser la marge d'erreur, il estindispensable de vrifier la reprsentativitde lchantillon.

    Pr. BOULAHOUAL Adil

  • Test de reprsentativit de lchantillon

    - Mise en tableau des rsultats

    - Test de reprsentativit

    Pr. BOULAHOUAL Adil

  • Mise en tableau des rsultats

    Il faut dans un premier temps laborer untableau dans lequel seront notes lesdonnes thoriques concernant lapopulation totale, ainsi que les donnesrelatives l'tude, ce tableau est appeltableau de test de reprsentativit.

    Pr. BOULAHOUAL Adil

  • Test de reprsentativit

    Appel test dajustement ou test Khi-deux, ce test est destin tester si lchantillon observ peut tre considr commereprsentatif de la population tudie. Pour cela on a besoin deconnatre les caractristiques de la population. Le testd'ajustement consiste calculer la valeur de la statistique khi-deux qui permet d'valuer les carts entre les frquencesobserves dans l'chantillon et les frquences thoriquescorrespondantes la population tudie. Lorsque les cartsseront petits, on acceptera la reprsentativit, sinon on larejettera.

    Pr. BOULAHOUAL Adil

  • Test de reprsentativit

    - Formuler une hypothse nulle- Calculer la valeur de Khi-deux observ- Dterminer la valeur de Khi-deux

    thorique- Rsultat du test de reprsentativit

    Pr. BOULAHOUAL Adil

  • Formuler une hypothse nulle

    lchantillon observ est reprsentatif de lapopulation tudie.

    Pr. BOULAHOUAL Adil

  • Calculer la valeur de Khi-deux observ

    thorique effectifue) thoriqeffectif - observ (effectif deux Khi

    Pr. BOULAHOUAL Adil

  • Dterminer la valeur de Khi-deux thorique

    On se fixe un seuil de confiance , on sereporte la table de distribution de Khi-deux, et on cherche la valeurcorrespondante une probabilit gale (1-) et un nombre de "degrs de libert (ddl)"gale au nombre de caractristiques de lapopulation moins 1.

    Pr. BOULAHOUAL Adil

  • Rsultat du test de reprsentativit

    la valeur de Khi-deux observ est nulle lorsque lesfrquences observes sont toutes gales auxfrquences thoriques, cest dire lorsquil y aune concordance parfaite entre lchantillonobserv et la population tudie. Cette valeur estdautant plus grande que les carts entre lesfrquences observes et thoriques sont plusgrands. Il dcoule de la comparaison du Khi-deuxobserv et du Khi-deux thorique :

    Pr. BOULAHOUAL Adil

  • Rsultat du test de reprsentativit

    - Si Khi-deux thorique est strictement suprieurau Khi-deux observ, l'hypothse nulle estaccepte. Donc l'chantillon est reprsentatif dela population tudie.

    - Si Khi-deux thorique est infrieur ou gal auKhi-deux observ, l'hypothse nulle estrejete. En d'autres termes, l'chantillon nest pasreprsentatif. Il faut donc raliser unredressement d'chantillon.

    Pr. BOULAHOUAL Adil

  • Test de reprsentativit : exemple

    Une enqute a t ralise au prs dun chantillonde 400 individus prlev au sein dune populationcible de 4 millions d'individus. Les donnes quel'on possde sur cette population sont les suivantes:Hommes 48% soit 1,92 millions dhommesFemmes 52% soit 2,08 millions de femmes

    Pr. BOULAHOUAL Adil

  • Test de reprsentativit : exempleSexe Hommes Femmes Total

    Niveau dinstruction % Effectifs % Effectifs

    AucunPrimaireSecondaireFormation professionnelleSuprieur

    353015137

    672000576000288000249600134400

    502510105

    1040000520000208000208000104000

    17120001096000496000457600238400

    Total 100 1920000 100 2080000 4000000

    Pr. BOULAHOUAL Adil

  • Test de reprsentativit : exemple

    Caractristiques de lchantillon :Sexe Hommes Femmes Total

    Niveau dinstruction % Effectifs % Effectifs

    AucunPrimaireSecondaireFormation professionnelleSuprieur

    322818148

    6154352715

    54231283

    1124825176

    173102604421

    Total 100 192 100 208 400

    Pr. BOULAHOUAL Adil

  • Test de reprsentativit : exemple

    Mise en tableau des rsultatsSexe Hommes Femmes

    Niveau dinstruction Effectifs thoriques

    Effectifs observs

    Effectifs thoriques

    Effectifs observs

    AucunPrimaireSecondaireFormation professionnelleSuprieur

    67,257,628,824,9613,44

    6154352715

    10452

    20,820,810,4

    1124825176

    Total 192 192 208 208

    Pr. BOULAHOUAL Adil

  • Test de reprsentativit : exemple

    Hypothse nulle :

    lchantillon observ est reprsentatif de lapopulation tudie.

    Pr. BOULAHOUAL Adil

  • Test de reprsentativit : exemple

    Khi-deux observ = [(61-67,2)/67,2 + (54-57,6)/57,6 + (35-28,8)/28,8 + (27-24,96)/24,96+(15-13,44)/13,44+ (112-104)/104+(48-52)/52+(25-20,8)/20,8+(17-20,8)/20,8+(6-10,4)/10,4]

    Khi-deux observ = 6,80

    Pr. BOULAHOUAL Adil

  • Test de reprsentativit : exemple

    Khi-deux thorique : si on se fixe un seuil deconfiance =5%, on se reporte la table dedistribution de Khi-deux, et on cherche la valeurcorrespondante une probabilit gale (1-)=0,95 et un nombre de "degrs de libert (ddl)"gale (10-1)=9, on trouve :

    Khi-deux thorique = 16,92

    Pr. BOULAHOUAL Adil

  • Test de reprsentativit : exemple

    Rsultat du test de reprsentativit

    Khi-deux thorique est strictement suprieurau Khi-deux observ, l'hypothse nulle estaccepte. Donc l'chantillon estreprsentatif de la population tudie.

    Pr. BOULAHOUAL Adil

  • Redressement de lchantillon

    Si l'chantillon slectionn n'est pas reprsentatifde la population tudie, aprs le test, il estncessaire de le redresser. On redresseral'chantillon si par exemple certainescaractristiques de la population sontsurreprsentes ou sous-reprsentes. On peutainsi tirer de l'chantillon original un chantillonreprsentatif.

    Pr. BOULAHOUAL Adil

  • Redressement de lchantillon

    Pour redresser l'chantillon, il existe deux mthodes distinctes :

    - Redressement par extraction

    - Redressement par substitution

    Pr. BOULAHOUAL Adil

  • Redressement par extraction

    La mthode dite par extraction limine tous les individusau-del du pourcentage obtenir. L'effectif de l'chantillonest donc d'autant plus rduit que les pourcentagesthoriques sont diffrents des pourcentages observs. Cettemthode permet d'aboutir un chantillon plusreprsentatif mais au risque d'obtenir un chantillonridiculement petit ou mme une impossibilit detraitement (le nombre minimum de questionnairesncessaire pour traiter une tude est de 60. D'autre part,pour valider les rsultats et pour effectuer des calculsstatistiques, il faut au minimum 5 effectifs par classe.).

    Pr. BOULAHOUAL Adil

  • Redressement par extraction : Exemple

    1200 personnes interroges pour une tude concernantl'attitude de la population face un produit suivent ladistribution suivante :

    HOMMES: 55% soit 660 interrogsFEMMES: 45% soit 540 interrogs

    Or, la population totale a une distribution :

    HOMMES:45% soit 540 pers. interrogerFEMMES: 55% soit 660 personnes interroger.

    Pr. BOULAHOUAL Adil

  • Redressement par extraction : Exemple

    Aprs redressement, on aura :

    HOMMES: 660-120=540 individus.FEMMES: 540 individus. (rsultat inchang)

    D'o une meilleure rpartition :

    HOMMES: 50% soit 540 individusFEMMES: 50% soit 540 individus

    Pr. BOULAHOUAL Adil

  • Redressement par extraction

    Cette mthode a le trs gros inconvnient de fairefondre l'chantillon original. Dans l'exemple, nousavons perdu 120 individus sonds. La prcision desestimations des rsultats s'en trouve fatalement affectepar ce procd, tout se passe comme si on avaitinterrog un plus petit nombre de personnes. Mais, onobtient une meilleure reprsentativit de la population.

    La mthode par extraction est intressante si la taille de lchantillon est suprieure 1000.

    Pr. BOULAHOUAL Adil

  • Redressement par substitution

    A l'oppos, la mthode par substitution remplace comme sonnom l'indique, tout individu en surnombre dans une modalitsur reprsente par un individu choisi au hasard dans unemodalit sous-reprsente. Ce dernier se trouve doncdupliqu. L'effectif de l'chantillon est maintenu,contrairement la mthode par extraction ( on a vu que l'ontait pass dans l'exemple d'un chantillon de 1200 individus un chantillon de 1080), mais au prix de nombreusesduplications qui tendent uniformiser l'chantillon. En fait,tout se passe comme si les individus des catgories sous-reprsentes avaient t interroges plusieurs fois.

    Pr. BOULAHOUAL Adil

  • Redressement par substitution

    Les imperfections de l'chantillon sontlimines sans risque apparent puisque lataille de l'chantillon ne se trouve pasaffecte.

    La mthode par substitution est valable si le diffrentiel de redressement est infrieur

    30%.

    Pr. BOULAHOUAL Adil

  • Redressement par substitution : Exemple

    La population totale compte :

    HOMMES : 45% FEMMES : 55%

    L'chantillon de 2000 individus tudis compte :

    HOMMES : 740 individus (37%) ; FEMMES : 1220 individus (61%) ; NREP :40 individus (2%)

    Pr. BOULAHOUAL Adil

  • Redressement par substitution : Exemple

    On pose le tableau suivant :

    OBTENUS SOUHAITES DIFFERENCE% Nbre % Nbre S-O

    NREP 2 40 0 0 -2%FEMMES 61 1220 55 1100 -6%HOMMES 37 740 45 900 +8%

    DIFFERENCIEL DE REDRESSEMENT=

    2%+6%+8%=16%.Pr. BOULAHOUAL Adil

  • Redressement par substitution : Exemple

    L'chantillon redress correspond ici au nombre souhait :

    HOMMES : 45% 900 individus.FEMMES : 55% 1100 individus.

    La rpartition par sexe correspond alors celle de la population totale.On remarque ici que le diffrentiel de redressement estinfrieur 16%, ce qui est un bon rsultat et qui ne remet pasen questions la validation des observations.

    Pr. BOULAHOUAL Adil

  • Redressement de lchantillon

    - la mthode par extraction est intressante si on sonde plusde 1000 personnes

    - la mthode par substitution est valable si le diffrentiel deredressement est infrieur 30%.

    - Si l'chantillon n'est pas reprsentatif, et quon ne peututiliser aucune des mthodes, il nous faut administrer denouveaux questionnaires. C'est pourquoi il faut vrifier leplus tt possible la reprsentativit de l'chantillon et toutde suite le redresser.

    Pr. BOULAHOUAL Adil

  • Rgles lies la forme du questionnaireRdaction du questionnaire

    Le vocabulaire et le style utiliss pour lardaction dun questionnaire doivent treceux employs par les rpondants et nonceux du rdacteur.

    Pr. BOULAHOUAL Adil

  • Rgles lies la forme du questionnaireRdaction du questionnaire

    Tout vocabulaire technique est viter, sauf si ltude est meneauprs de spcialistes.

    Tout vocabulaire ambigu est viter, cest dire tout mot ouexpression dont la comprhension prte confusion soit parcequil possde plusieurs sens, soit parce quil est subjectif.

    Lambigut peut galement provenir dutilisations diffrentesdun mme mot selon la rgion, la classe sociale ou la classedge.

    Le vocabulaire employ doit tre le plus simple le moins ambiguet adapt la population concerne par ltude.

    Pr. BOULAHOUAL Adil

  • Rgles lies la forme du questionnaireStyle de rdaction

    Il est frquent que le style de rdaction soit source de biais, soitdans la comprhension des questions, soit dans les rponses.

    Il faut viter les questions contenant une ngation ou doublengation. En plus de sa complexit, il y a le risque dorienter larponse dans un sens particulier.

    Il faut aussi viter les questions tendancieuses, par exemple latendance naturelle dire oui.

    Une question ne doit tre longue, elle ne doit pas dpasser une ligne une ligne et demi.

    Pr. BOULAHOUAL Adil

  • Rgles lies la forme du questionnaireStructure du questionnaire

    La structure du questionnaire concernelordre dapparition des questions, lalongueur et la prsence de questionsspciales.

    Il se structure autour de six points :

    Pr. BOULAHOUAL Adil

  • Rgles lies la forme du questionnaireStructure du questionnaire

    1. Prsentation de lenquteur et de lenqute2. Questions dintroduction3. Questions qualifiantes4. Questions de mise en route5. Questions spcifiques6. Questions didentification

    Pr. BOULAHOUAL Adil

  • 1. Prsentation de lenquteur et de lenqute

    - Organisme charg de ltude- Commanditaire de ltude- Intrt de ltude- Objectifs de ltude

    Pr. BOULAHOUAL Adil

  • 2. Questions dintroduction

    leur but est dinitier la conversation etgagner la sympathie du rpondant etlintresser au questionnaire qui va suivre. Ilsagit de questions gnrales souventouvertes.

    Pr. BOULAHOUAL Adil

  • 3. Questions qualifiantes

    Elles sont utiles si on a besoin de savoir silindividu possde linformation recherche.Elles sont souvent de forme dichotomique.Elles permettent dorienter le rpondant des parties spcifiques du questionnaire.

    Pr. BOULAHOUAL Adil

  • 4. Questions de mise en route

    Elles servent centrer progressivement lethme de ltude. On commence par desquestions simples, petit petit les questionsdeviennent plus complexes.

    Pr. BOULAHOUAL Adil

  • 5. Questions spcifiques

    Cest le cur du questionnaire, les questionsdoivent amener les informations les plusimportantes pour ltude.

    A ce stade, le rpondant sest imprgn de lespritde ltude et a nou une relation de sympathie aveclenquteur, on peut donc lui demander des effortsde rflexion ou des informations personnelles.

    Pr. BOULAHOUAL Adil

  • 6. Questions didentification

    Elles dcrivent les rpondants. Cette partiefournit les informations qui serviront classer les rpondants en groupes distincts.Il sagit de variables de segmentation.

    Pr. BOULAHOUAL Adil

  • Mise en page du questionnaire

    - Arer les questions ;- Utiliser de temps autre des symboles;- Soigner la typographie du texte : gras italique

    soulign;- Imprimer sur du papier de qualit, avec en tte de

    lorganisme responsable de ltude;- Utiliser, si ncessaire, de la couleur.

    Pr. BOULAHOUAL Adil

  • Pr-test du questionnaire

    Le but du pr-test est de dtecter les erreurs et ledisfonctionnement du questionnaire avant le travail surle terrain.

    Le pr-test consiste administrer les questionnaires un chantillon rduit dans les mmes conditions duterrain.

    Pr. BOULAHOUAL Adil

  • Pr-test du questionnaire

    Le pr-test peut se raliser de deux faons :

    - Pr-test dclar

    - Pr-test non dclar

    Pr. BOULAHOUAL Adil

  • Administration des questionnaire

    - Slection des enquteurs

    - Formation des enquteurs

    - Motivation des enquteurs

    - Contrle des enquteurs

    Pr. BOULAHOUAL Adil

  • Dpouillement des questionnaires

    - SAISIE

    - CONTROLE

    - ANALYSE DES DONNEES

    Pr. BOULAHOUAL Adil

  • SAISIE

    La saisie consiste reporter les codes sur unsupport informatique sous forme dunematrice de donnes (variables/individus) enutilisant un programme adquat. Cetteopration ncessite une concentrationextrme et un contrle svre.

    Pr. BOULAHOUAL Adil

  • CONTROLE

    Le contrle consiste dtecter parmi lesdonnes saisies ceux jugs errons pour lescorriger ou les liminer. Cette opration estappele puration des donnes, Ellecomporte les deux tapes suivantes :

    Pr. BOULAHOUAL Adil

  • CONTROLE

    - Contrle de validit

    - Contrle de cohrence

    Pr. BOULAHOUAL Adil

  • Contrle de validit

    Il consiste vrifier pour chaque variable siles codes ou les donnes saisiscorrespondent bien aux codes prvus lors dela codification ou au domaine de dfinitionde la variable.

    Pr. BOULAHOUAL Adil

  • Contrle de cohrence

    Il consiste vrifier la cohrence des renvoisprvus dans le questionnaire, cest dire vrifierpour certaines variables si les codes ou les donnessaisis concordent bien avec les codes ou lesdonnes saisis dautres variables.

    Pr. BOULAHOUAL Adil

  • ANALYSE DES DONNEES

    - Prsenter sous forme exploitable (tableaux statistiques,graphiques, diagrammes, etc..) C'est ce qu'on appelle lastatistique descriptive.

    - Substituer cet ensemble de renseignements quelques donnessimples, comparer cette reprsentation simplifie desrpartitions thoriques, et tenter de donner une explication duphnomne observ et en vrifier le bien fond.

    - Interprter, conclure et dfinir avec prcision le degr deconfiance accorder aux conclusions gnrales induites partirdes faits observs.

    Pr. BOULAHOUAL Adil

  • ANALYSE DES DONNEES

    Lanalyse des donnes peut faire l'objetd'une variable, et on parlera danalyseunidimensionnelle. Elle peut concernerdeux variables, on parle alors danalysebidimensionnelle. Elle peut concernerplusieurs variables, on parle alors danalysemultidimensionnelle.

    Pr. BOULAHOUAL Adil

  • ANALYSE UNIVARIEESTATISTIQUE DESCRIPTIVE

    Tableaux de frquences Graphiques Rduction des donnes

    Donnes discrtes

    Donnes en classes

    Barres

    Secteurs

    Btons

    Polygone

    Histogramme

    Position

    Dispersion

    Forme

    Pr. BOULAHOUAL Adil

  • ANALYSE BIVARIEERelation entre deux variables

    Corrlation Indpendance Tests statistiques

    Coefficient de corrlation

    Test de signification

    Test Khi deux

    Tableau crois

    Paramtriques

    Non paramtriques

    Pr. BOULAHOUAL Adil

  • Principe dun test statistique

    1. Formuler des hypothses :

    Hypothse nulle H0 : =

    Hypothse alternative H1: < ou > (unilatral) ou (bilatral)

    2. Calculer une valeur de dcision ou une probabilit de signification.

    3. Dcision :

    On rejette H0 si probabilit de signification seuil de signification

    On rejette H0 si valeur de dcision valeur tabule

    Pr. BOULAHOUAL Adil

  • NONNONOUIOUI

    Analysesfactorielles

    (A.C.P. et A.F.C.)

    Analyse des correspondances

    (A.C.M.)

    Typologie

    ANALYSE MULTIVARIEE

    NONNONOUIOUI

    NONNONOUIOUINONNONOUIOUI

    Analysede la variance

    Rgressionlinaire

    Analysediscriminante

    Analyseconjointe

    La variable expliquer est-elle

    quantitative ?

    Les variablesexplicativessont-elles

    quantitatives ?

    Les variables sontelles quantitatives ?

    Y-a-t-ilune variable expli-

    quer et une ou plusieurs variables expli-

    catives ?

    Mthodes descriptives

    NONNON

    Mthodes explicatives

    OUIOUI

    Les variablesexplicativessont-elles

    quantitatives ?

    Pr. BOULAHOUAL Adil