Stats_Pour_Les_Nuls.pdf

download Stats_Pour_Les_Nuls.pdf

of 99

Transcript of Stats_Pour_Les_Nuls.pdf

  • 7/27/2019 Stats_Pour_Les_Nuls.pdf

    1/99

    ERIC LOONIS

    les statisti ues ar lexem le

  • 7/27/2019 Stats_Pour_Les_Nuls.pdf

    2/99

    Stats pour les nuls

    les statistiques par lexemple

    2

    STATS POUR LES NULS1

    les statistiques par lexemple

    Par le Dr Eric Loonis

    Eric Loonis, 2013.

    Ce texte publi par Eric Loonis est protg par les lois et traits internationaux relatifs aux droits dauteur.Son impression sur papier est strictement rserve lacqureur et limite son usage personnel. Toute autrereproduction ou copie, par quelque procd que ce soit, y compris la mise disposition en ligne, constituerait

    une contrefaon et serait passible des sanctions prvues par les textes susviss et notamment le code franaisde la proprit intellectuelle et les conventions internationales en vigueur sur la protection des droitsdauteur.

    Les marques cites : IBM, SPSS Statistics, Excel, Word appartiennent strictement leurs ayantdroits.

    1 Les exercices proposs en exemple dans cet ouvrage sont bass sur la version 21 deIBM SPSS Statistics en franais.

  • 7/27/2019 Stats_Pour_Les_Nuls.pdf

    3/99

    Stats pour les nuls

    les statistiques par lexemple

    3

    TABLE DES MATIERES

    INTRODUCTION ........................................................................................................................................... 4

    1. LA MTHODOLOGIE.............................................................................................................................. 6

    1.1.LES TYPES DE RECHERCHE ....................................................................................................................... 61.2.LES VARIABLES INDPENDANTES ET DPENDANTES............................................................................... 91.3.LES PLANS DE RECHERCHE ..................................................................................................................... 151.3.1.PLANS DE RECHERCHE GROUPES INDPENDANTS............................................................................... 151.3.2.PLANS DE RECHERCHE MESURES RPTES........................................................................................ 181.3.3.PLANS DE RECHERCHE COMBINS ......................................................................................................... 211.4.LES TYPES DE VARIABLES ....................................................................................................................... 22

    2. FAIRE UNE RECHERCHE .................................................................................................................... 25

    2.1.LINTRODUCTION .................................................................................................................................... 252.2.LA PROBLMATIQUE ............................................................................................................................... 272.3.LES HYPOTHSES..................................................................................................................................... 282.4.LA MTHODE ........................................................................................................................................... 322.5.LES RSULTATS ....................................................................................................................................... 322.6.LA DISCUSSION ........................................................................................................................................ 332.7.LA CONCLUSION ...................................................................................................................................... 332.8.LES RFRENCES..................................................................................................................................... 34

    2.9.L

    A PUBLICATION..................................................................................................................................... 37

    3. FAIRE DES STATISTIQUES.................................................................................................................. 40

    3.1.LTUDE FICTIVE..................................................................................................................................... 403.2.LE DOSSIER EXCEL.................................................................................................................................. 413.2.1.PRPARATION DEXCEL ......................................................................................................................... 413.2.2.DOSSIER EXCEL : LA FEUILLE PRINCIPALE ............................................................................................ 433.2.3.DOSSIER EXCEL : LA FEUILLE HAD....................................................................................................... 483.2.4.DOSSIER EXCEL : LES FEUILLES TEST-RETEST....................................................................................... 513.3.PRPARATION DE SPSS........................................................................................................................... 533.4.CRATION DES FICHIERS SPSS .............................................................................................................. 57

    3.5.LES STATISTIQUES DESCRIPTIVES .......................................................................................................... 663.6.LQUIVALENCE DES GROUPES .............................................................................................................. 783.7.EFFETS DES VARIABLES DESCRIPTIVES ................................................................................................. 853.8.LES STATISTIQUES INFRENTIELLES ..................................................................................................... 89

    ANNEXE........................................................................................................................................................ 97

    COMMENT OBTENIR SPSS ?................................................................................................................... 98

  • 7/27/2019 Stats_Pour_Les_Nuls.pdf

    4/99

    Stats pour les nuls

    les statistiques par lexemple

    4

    Introduction

    Vous vous sentez nul en statistiques et vous pensez ne jamais y arriver ? Vous vous dites que pourun littraire comme vous, un simple tudiant en psychologie, les stats cest trop. Et pourtant, dsle master et plus tard en thse, il vous faudra bien en faire, si vous voulez valider vos recherches etsoutenir vos mmoires. Si vous tes thsard ou docteur, il vous faut encore des statistiques pour vospublications, nul ny chappe ! Alors cet ouvrage est l pour vous aider.

    Rassurez-vous, nous navons ni lintention, ni la prtention, de vous apprendre les arcanes de lastatistique et vous ne trouverez ici aucune formule mathmatique. Le principe de cet ouvrage est devous permettre, dabord, de bien comprendre ce que vous faites lorsque vous ralisez une rechercheet de connatre les principales tapes de cet art admirable de la recherche scientifique. Ensuite, ilsuffit de savoir exactement ce que vous voulez entreprendre et ce manuel vous donnera la recette.Inutile de savoir comment fonctionne la recette pour pouvoir sen servir, il suffit de lutiliser avec lelogiciel de statistiques IBM SPSS Statistics (que nous appelerons pour faire simple SPSS ,version dvaluation limite 14 jours, que vous pouvez tlcharger gratuitement sur le site officielde SPSS2). On na pas besoin de connatre la chimie pour faire de la cuisine !

    Une fois la recette ralise avec le logiciel de statistiques, le manuel vous dira simplement commentil faut lire les rsultats des tests et comment les interprter. Quoi de plus simple !

    Louvrage comporte trois parties :

    La mthodologie : dabord vous devez savoir quel niveau de recherche votre tude se place :recherche empirique, exprimentale, quasi exprimentale, thorique, clinique, cas unique ? Etapesuivante : vous devez bien comprendre la diffrence entre variable indpendante (ce que vousmanipulez) et variable dpendante (la rponse des sujets). Ensuite, il vous faut construire votre plande recherche. Quallez-vous faire ? Comparer deux groupes, rpter des mesures, les deux lafois ? Enfin, vient la question des diffrents types de variables : quantitatives, qualitatives,nominales, ordinales, parasites...

    Faire une recherche : ici on vous explique en dtail et avec un tas de bons conseils, toutes lestapes dune recherche, qui forment en mme temps le plan de votre mmoire (ou de larticle

    destin la publication scientifique) : introduction, problmatique, hypothses, mthode, rsultats,discussion, conclusion, rfrences et publication. Ne vous lancez pas dans la recherche ou lesstatistiques sans avoir bien lu et compris cette partie de louvrage, cela afin de vous pargner leserreurs classiques que commettent la plupart des tudiants (comme confondre VI et VD).

    Faire des statistiques : louvrage est accompagn dune tude fictive qui vous est prsente auformat Excel. Vous apprendrez prparer le dossier Excel pour saisir vos donnes, calculer lesscores automatiquement, rapidement, sans effort et sans erreur ; puis, prparer les diffrentes pagesExcel en prvision des diffrents calculs qui seront soumis SPSS. Aux tapes suivantes on vousdira comment paramtrer le logiciel SPSS et comment raliser vos fichiers de donnes SPSS partir

    2 Voir la fin de ce document la dmarche suivre pour pouvoir obtenir SPSS gratuitement pour 14 jours.

  • 7/27/2019 Stats_Pour_Les_Nuls.pdf

    5/99

    Stats pour les nuls

    les statistiques par lexemple

    5

    du dossier Excel. Cest ensuite que vous entrerez dans le vif du sujet : statistiques descriptives,quivalence des groupes, effet des variables descriptives, statistiques infrentielles, lorsquon est

    certain que toutes choses sont gales par ailleurs . Chacune de ces tapes vous est explique trssimplement, avec un support visuel (captures dcran) tir de SPSS. On vous dit mme commentinterprter et crire les tests statistiques. Un enfant de 10 ans saurait le faire ! A la fin, unsynoptique mthodologique reprend toutes les mthodes en une seule page synthtique.

    Cet ouvrage de statistiques pour les nuls est sans prtention. Il est possible quil senrichisse aufil du temps et des versions, mais pas trop ! Il ne sagit pas den faire un outil compliqu danalysesstatistiques de haut vol. Il sagit simplement de prsenter et de permettre lapplication de recettesstatistiques simples, courantes, qui suffisent pour la plus grande partie des tudes en psychologie.Cet ouvrage revendique sa modestie, car son pari est que l o il ny aurait rien (lorsque ltudianten psychologie nul en stats se sent incapable douvrir mme Excel), il y aura quelque chose, un

    peu de stats, pas trop, juste ce quil faut.

  • 7/27/2019 Stats_Pour_Les_Nuls.pdf

    6/99

    Stats pour les nuls

    les statistiques par lexemple

    6

    1. La mthodologie

    1.1. Les types de recherche

    Le graphique ci-dessus reprsente le Diabolo de la recherche , deux cnes relis par leur pointe.A partir dune problmatique, la dmarche empirique enqute sur une collection de faits [F1] [F2][F3], dont elle va tirer, par convergence, certaines lois gnrales. La dmarche thorique vasemparer de ces lois gnrales pour en tirer un modle (une thorie) et imaginer un plan

    exprimental. Ce plan reprsente le moyen rationnel de tester un certain nombre dhypothses [H1][H2] [H3], par divergence partir du modle. Les rsultats de lexprience seront analyss unniveau statistique (effet de rptition qui donne la preuve du modle et de la loi gnrale quilorganise), puis discuts et des conclusions en sont tires, qui valideront ou non les hypothses oulensemble du modle. Tout cela donne gnralement lieu publication pour la communaut deschercheurs (et pour la socit qui finance les chercheurs) et vient enrichir la problmatique. Cetenrichissement sera son tour repris dans de nouvelles recherches et ainsi de suite... De temps autre, il est bon de relever un cas particulier [F1] dans la collection de faits et de ltudier enprofondeur comme exemple, dans une confrontation directe avec le modle, cela pouvant illustrer etrenforcer le modle, ou au contraire, le mettre en doute, ou lenrichir par le jeu des exceptions.

    Collection defaits

    Ensembledhypothses

    F1

    F2

    F3

    F4

    Fn

    H1

    H2

    H3

    H4

    Hn

    Loisgnrales

    ModlePlan (quasi)exprimental

    Rafrachissement

    de la problmatique

    Problmatique

    Analyse statistiqueRsultatsDiscussionConclusionPublication

    Diabolode la recherche

  • 7/27/2019 Stats_Pour_Les_Nuls.pdf

    7/99

    Stats pour les nuls

    les statistiques par lexemple

    7

    Recherche empirique

    Lactivit de recherche dbute gnralement par une dmarche empirique, dite aussi convergente.Une enqute, des observations, produisent une srie ou collection de faits. Ces faits sont organisset on tente den tirer des rcurrences, des invariants, ou des variances systmatiques, partirdesquels (dmarche convergence) on tirera une loi gnrale. Telle est la dmarche empirique, quiprend uniquement appui sur ce qui est observ dans la collection du particulier pour en tirer des loisgnrales. En principe, la dmarche empirique ne ralise aucune manipulation (agir sur desvariables, choisir des groupes comparer...), tout au plus le chercheur va-t-il cibler telle ou tellepopulation afin de cerner sa problmatique.

    Le mmoire ou larticle de niveau empirique est introduit par une revue de la littrature qui rendcompte des tentatives antrieures dobservation et denqute et de leurs rsultats. Cette revue vient

    justifier la ncessit de la prsente tude. Puis, la mthode-observation denqute est prsente, avecventuellement la rfrence des instruments valids repris pour cette tude. Les rsultats delenqute sont prsents sous forme de tableaux statistiques (ici il sagira essentiellement destatistiques descriptives). Une discussion termine larticle, o lon dgage les grandes tendancesmontres par les rsultats, o lon prsente la validit cologique de lenqute, au sens o ellervlerait quelques lois gnrales qui pourraient faire lobjet dhypothses dans le cadre derecherches plus exprimentales.

    Recherche thorique

    A partir des invariants, des rcurrences que le chercheur a cru tirer de ses observations et enqutes,il a pu formuler des lois gnrales, des principes, quil va organiser et systmatiser suivant uneconstruction thorique, imaginaire, un modle. Ce modle, qui met en uvre des conceptsnouveaux, reprsente une version imagine des phnomnes rels tudis, qui propose dexpliquerles lois observes par la suppose mise en jeu de mcanismes, de processus cachs. Cessuppositions feront lobjet dhypothses pour la recherche exprimentale.

    Le mmoire ou larticle de niveau thorique commence par une revue de la littrature qui rendcompte des diffrents modles existants, en rapport avec la problmatique choisie, afin de montrerleur pertinence, mais aussi leurs limites. On avancera aussi les nouveaux faits qui peuvent rendrecaduques les modles anciens et ncessiter la construction dun nouveau modle. On doit pour cela

    rappeler brivement les faits dobservation et les lois qui en ont t tires. De l, on forgera denouveaux concepts qui seront articuls en un modle explicatif. Dans la discussion, on proposera uncertain nombre dhypothses tester partir de ce nouveau modle et on en prcisera les limites.

    Recherche exprimentale

    A partir dun modle, dune thorie, un certain nombre dhypothses (ce qui correspond unedmarche divergente) sont poses, qui vont demander tre testes. Pour cela, un plan dexprienceest mont. A la diffrence de la simple observation-enqute sur le terrain, qui se borne prendre desmesures pour en faire une analyse, le plan exprimental cherche manipuler des variables, encontrler dautres. Classiquement la manipulation porte sur les conditions environnementales ou

    daction des sujets ; mais la manipulation de base de toute recherche exprimentale est le

  • 7/27/2019 Stats_Pour_Les_Nuls.pdf

    8/99

    Stats pour les nuls

    les statistiques par lexemple

    8

    dcoupage de la population tudie en au moins deux sous-groupes que lon va comparer (parexemple, le groupe dtude et un groupe tmoin ou groupe de contrle). Ce que manipule le

    chercheur reprsente les variables indpendantes. Les hypothses sont des prdictions que lechercheur fait quant lissu de son exprience, en fonction du modle sur lequel il sappui(comment la variable indpendante, manipule par le chercheur comme constituer des groupes va influencer la variable dpendante que reprsente la rponse des sujets une exprience quipeut tre une rponse un questionnaire rtrospectif, ou une rponse comportementale dans unesituation). Les rsultats de lexprience vont valider ou invalider les hypothses.

    Recherche quasi exprimentale

    Ce qui est dit ci-dessus vaut aussi pour la recherche quasi exprimentale ; et ce qui est dit auparagraphe suivant vaut aussi pour la recherche exprimentale. Ce qui distingue lexprimental du

    quasi exprimental, cest que dans le premier cas vous fates votre recherche dans un laboratoire(au sens physique du terme) : vos sujets viennent vous voir, ils sont placs dans une pice spciale,soumis des dispositifs adapts et vous contrlez un maximum de variables parasites. Unerecherche est quasi exprimentale (cest le cas de la plupart des recherches en psychologie ralisespar les tudiants) lorsque vous allez la rencontre de vos sujets, hors de tout laboratoire, et quevous tes soumis un grand nombre de variables parasites (comme les conditions dvaluation, ledegr dauthenticit ou de vracit des rponses, une valuation rtrospective, un dfaut de contrlede certaines variables dmographiques, organismiques, un dfaut dappariement des groupes, etc.).

    Le mmoire ou larticle de niveau exprimental ou quasi exprimental doit commencer par bienposer le modle choisi pour ltude et justifier ce choix (pertinence du modle en regard desrsultats exprimentaux antrieurs). Une revue de la littrature rendant compte des expriencesantrieures est alors ncessaire pour pouvoir justifier la prsente exprience et sa ncessit. Puis, lamthode exprimentale est prsente, avec ses diffrents instruments de mesure et leurs rfrences.Le plan dexprience est dcrit avec prcision (il doit pouvoir tre reproduit), les variables sontprcises : celles qui conditionnent lexprience (variables indpendantes), celles qui sont mesures(variables dpendantes) et les variables parasites quil faudra envisager (des variables un peu trop indpendantes ). Les hypothses sont exposes comme autant de prdictions quant aux rsultats.Enfin, aprs une brve prsentation statistique de la population tudie, les rsultats sont prsentssous forme de tableaux ou graphiques statistiques (rsultats comprenant dans lordre : quivalencedes groupes, effets des variables statistiques sur les variables dpendantes et statistiques

    infrentielles validation/invalidation de vos hypothses). La discussion reprend les rsultats enregard des hypothses poses et valide ou invalide ces hypothses. Les variables parasites sontexamines. A partir de l, le modle est discut, voire remis en question. En conclusion, denouveaux concepts peuvent merger, un nouveau modle tre voqu, ou de nouvelles hypothsesformules.

    Recherche clinique

    La dmarche clinique, ltude de cas, sapparentent la dmarche empirique au sens o lechercheur se contente dobserver, de glaner des mesures. La diffrence va porter sur lintentionfinale de la dmarche. Alors que la dmarche empirique cherche multiplier les observations sur un

    grand nombre de sujets afin de pouvoir en tirer des singularits statistiques, la dmarche clinique

  • 7/27/2019 Stats_Pour_Les_Nuls.pdf

    9/99

    Stats pour les nuls

    les statistiques par lexemple

    9

    borne ses observations quelques cas, qui seront observs en profondeur . Le but nest pas larecherche de la singularit statistique, mais lillustration. Il sagit de saisir quelques lments de la

    ralit et dexplorer en dtails ces lments afin de soutenir un modle par des exemples prcis.

    Le mmoire ou larticle de niveau clinique commence par rendre compte dobservations, dtudesde cas antrieurs, glans dans la littrature scientifique. Il faut aussi prciser dans quel modle onsinscrit, car le sujet sera observ diffremment selon le modle choisi. On prsentera ensuite lecontexte et la mthode dobservation, les instruments utiliss. Le cas est enfin prsent : sonidentit, son histoire, son tat actuel. On pourra donner les rsultats des instruments valids (sur despopulations de rfrence) utiliss (tests, chelles...). Ltude clinique peut aussi prendre un petit air exprimental en comparant deux ou plusieurs cas extrmes (entre diffrents troubles, entre lenormal et le pathologique, entre diffrents types de personnalit...), sinon que lexigut de lapopulation interdira toute infrence statistique. Gnralement, on conclura larticle clinique par une

    discussion sur les limites de lobservation de ce(ces) cas, sur les limites du modle choisi, sur sapertinence, qui peut tre renforce ou affaiblie.

    A noter, que toute utile quelle soit pour exemplifier et illustrer lobservation, la recherche enpsychologie ne peut se contenter de recherches cliniques. La validit dun modle et dhypothsesne peut tre teste qu partir dtudes exprimentales (ou quasi exprimentales). Il n y a pas nonplus saffronter sur ces mthodes, elles sont complmentaires dans la dmarche globale de larecherche scientifique en psychologie.

    1.2. Les variables indpendantes et dpendantes

    Pour beaucoup dtudiants, cette distinction entre variable indpendante (VI) et variable dpendante(VD), est souvent un gros problme quils peuvent traner jusquau jour de soutenance de leur thse.Aussi, si vous ne deviez comprendre quune seule chose en mthodologie, cest bien cettediffrence entre VI et VD.

    La premire chose savoir est que ce qui distingue une VI dune VD nest pas dans la nature de lavariable. Si vous prenez, par exemple, le niveau danxit mesur avec une chelle danxit, cettevariable niveau danxit peut tre une mesure applique sur deux groupes alcoolique et non alcoolique et tre ainsi une variable dpendante (VD) de lalcoolisme (par exemple, les

    alcooliques sont plus anxieux que les non alcooliques, en rponse lchelle danxit).

    Cependant, vous pourriez aussi bien mesurer lanxit dans une population de buveurs en gnral etdichotomiser cette variable en deux groupes anxieux et non anxieux , lanxit devenantalors une VI. A partir de l, vous faites passer une chelle de consommation dalcool vos sujets,ce qui va reprsenter la VD (et non plus la VI) : le rsultat pouvant tre que les individus les plusanxieux sont ceux qui boivent le plus dalcool. Le tableau ci-dessous montre clairement que lesprotocoles 1 et 2 voient alcoolisme et anxit changer leurs rles en matire de VI et VD :

  • 7/27/2019 Stats_Pour_Les_Nuls.pdf

    10/99

    Stats pour les nuls

    les statistiques par lexemple

    10

    Protocole 1 Protocole 2VI Alcoolisme Anxit

    VD Anxit AlcoolismeHypothse

    Lalcoolisme influence lanxit oulanxit dpend de lalcoolisme.

    Lanxit influence lalcoolisme oulalcoo-lisme dpend de lanxit.

    Exemple

    Une tude pourrait montrer quaprs deseffets positifs anxiolytiques, lalcoolconsomm long terme entrane uneaugmentation de lanxit sociale.

    Une tude pourrait montrer que lespersonnes qui salcoolisent le plus sontaussi celles qui ont les niveaux danxitles plus levs.

    Vous allez vous demander : o est la vrit ? En science, et surtout en science humaine, il ny ajamais de vrit absolue, ni de causalit linaire. Certes, le fait de boire trop dalcool peut jouer surle niveau danxit (effets crbraux de lalcool), mais on peut aussi dire, en sens inverse, que pluson est anxieux et plus on prouve le besoin de se soulager en buvant. Les choses vont dans les deuxsens, la causalit est circulaire, non linaire (un seul sens)3. De l, on peut imaginer faire de larecherche dans un sens ou dans lautre, cest pour cela que VI et VD sont interchangeables.

    VI et VD sont donc attribues aux mesures dune faon arbitraire, selon le projet de recherche duchercheur.

    Lerreur qui tue !

    Il sagit dun raisonnement trs commun, bas sur une confusion smantique, qui entrane une

    mauvaise perception de VI et VD. Un exemple : un tudiant tudie un trait de personnalit, la recherche de sensations , chez des adolescents fumeurs et non fumeurs. Concrtement, que faitltudiant ? Dans ce cas prcis, il prend deux groupes dadolescents : des fumeurs et des nonfumeurs , quil distingue avec une chelle dvaluation du tabagisme, et il leur fait passer unechelle de recherche de sensations (valuation du trait de personnalit). Voici son hypothsegnrale :

    Le trait de personnalit recherche de sensations chez les adolescents, affecte le degr etlintensit de leur dpendance tabagique.

    A la suite de cela, notre tudiant prsente ses variables et annonce que le trait de recherche de

    sensations est la VI et le tabagisme la VD. Car le raisonnement de ltudiant est le suivant : pour lui plus les scores de recherche de sensations sont levs et plus laddiction au tabac sera svre .Cest cette faon de dire les choses, quil tire directement du verbe affecter prsent dans sonhypothse, qui le conduit voir les rponses lchelle de personnalit comme la VI et le tabagismecomme la VD.Pourtant, plus loin, au moment o il prsente linstrument de mesure de la recherche de sensations,ltudiant dira que : Nous nous attendons ce que les fumeurs aient de plus hauts scores derecherche de sensations que les non fumeurs . Ici nous voyons bien que ce que fait ltudiant est de

    3 Cest dailleurs pour cela que les alcooliques, et tous les addicts en gnral, se retrouvent enferms dans un cercle

    vicieux (la spirale addictive) qui fait que leur solution la souffrance psychique entrane elle-mme une souffrancepsychique secondaire.

  • 7/27/2019 Stats_Pour_Les_Nuls.pdf

    11/99

    Stats pour les nuls

    les statistiques par lexemple

    11

    comparer fumeurs et non fumeurs au point de vue de la rponse de trait recherche de sensations ,et non de comparer la rponse tabagique de groupes de sujets selon leur niveau de sensation

    seeking. Voici comment on peut rsumer cela dans un tableau :

    Ce que ltudiant croit faire Ce quil fait rellementVI Recherche de sensations TabagismeVD Tabagisme Recherche de sensations

    La recherche de sensation a une influence(affecte) sur le tabagisme.

    Le tabagisme a une influence sur la rponse lchelle de recherche de sensations.

    Do vient la confusion ?

    En fait, ce sont les verbes indiquant une causalit, une influence, comme affecter , influencer , agir sur et leurs quivalents, qui posent problme. A cause de ces verbes, deux types decausalit sont confondues : la causalit thorique et la causalit exprimentale. Nous lavonsexpliqu plus haut : la causalit thorique, celle du modle, nest pas linaire, mais le plus souventcirculaire. Un trait de personnalit affecte une conduite addictive, mais en retour, une conduiteaddictive, par son intensit et sa dure, peut aussi affecter la personnalit. Du ct de la causalitexprimentale, le chercheur choisit lun ou lautre sens dans cette circularit, car il ne peut pastravailler en disant une chose et son contraire. Il ne peut pas faire non plus, en mme temps, deuxchoses contradictoires. Le chercheur est contraint de choisir la variable quil va manipuler, ce quidfinit les variables de rponse des sujets en fonction de cette manipulation. Cest l la base de tout

    protocole exprimental.Notre tudiant a en tte la thorie (la recherche de sensations a une influence sur le tabagisme) et semlange les pinceaux en faisant le tabagisme a une influence sur la rponse lchelle desensations . Son erreur a t dutiliser un verbe daction causale dans son hypothse gnrale. Aulieu de dire :

    Le trait de personnalit recherche de sensations chez les adolescents, affecte le degr etlintensit de leur dpendance tabagique.

    Il aurait mieux valu quil dise :

    Il existe un lien entre la recherche de sensations et le tabagisme.

    En omettant de donner un sens cette liaison (ne parler simplement que de lien ), son espritserait rest libre dapprhender ce quil allait rellement faire. Or, il na pas fait des groupes derecherche de sensations (suivant le degr de recherche de sensations), pour en mesurer la svrit dutabagisme, mais il a fait deux groupes fumeurs et non fumeurs, pour en mesurer le trait depersonnalit. Ce quil a manipul, cest la variable tabagisme , qui est la VI, et non la variable trait , qui est bien la rponse, la VD. Un protocole de recherche reprsente toujours la mesuredune rponse selon une variable manipule, cest la causalit exprimentale, quil ne faut pasconfondre avec la causalit thorique.

  • 7/27/2019 Stats_Pour_Les_Nuls.pdf

    12/99

    Stats pour les nuls

    les statistiques par lexemple

    12

    A titre gnral, VI et VD peuvent tre dfinie ainsi :

    Variable Indpendante Variable DpendanteLa VI (variable indpendante) est la variablemanipule par lexprimentateur.

    La variable indpendante est encore appele explicative ou invoque

    Cest ce que manipule le chercheur :

    Exemples :- slection dune population ;- dcoupage en sous-groupes* ;- choix et regroupement des variables socio-dmographiques et organismiques (ge,sexe...) ;- conditions exprimentales (situations,preuves, tches).

    La VD (variable dpendante) est la rponse dessujets aux instruments de mesure, aux tests, auxpreuves, rponse qui dpend de la variablemanipule, la VI.

    La variable dpendante est encore appele explique ou provoque

    Cest la rponse comportementale des sujets,attendue et produite :

    Exemples :- rponses comportementales gnrales,spcifiques ;- rponses aux tests, chelles, questionnaires.

    * Attention : il arrive souvent que ce dcoupage en sous-groupes soit objectiv par lutilisationdun instrument de mesure (par exemple, une chelle dvaluation du tabagisme), mais cela ne veutpas dire quil sagit dune VD ! Vous utilisez simplement un instrument pour oprationnaliser votremanipulation (construction des groupes) au niveau de la VI (mais dans un autre protocole derecherche vous pourriez trs bien utiliser lchelle de tabagisme comme rponse exprimentaleet, dans ce cas, elle correspondra bien une VD la VI pouvant tre, par exemple, le trait depersonnalit).

    VI et VD sont articules lune avec lautre dans les hypothses, qui sorganisent hirarchiquementainsi :

    Hypothse gnrale (ou thorique) : partir de la problmatique et du modle qui cherche lexpliquer, le principe, la loi gnrale, organiss par le modle, reprsentent lhypothse

    gnrale ou thorique. Dans cette hypothse, il est rare que les variables soient mentionnes. Ony parle plutt de principes, dentits gnrales, qui forment un systme, remplissent desfonctions, fonctionnent entre elles, sans que soit clairement pose une causalit linaire (on seborne parler de liens , de liaisons ).

    Hypothses de travail : ici, les variables tudies apparaissent et sont articules entre ellescomme VI et VD, mais sous une forme descriptive gnrale de linfluence de VI sur VD,dfinies selon des conditions et donnes gnrales.

  • 7/27/2019 Stats_Pour_Les_Nuls.pdf

    13/99

    Stats pour les nuls

    les statistiques par lexemple

    13

    Hypothses oprationnelles : suivant le plan dexprience (le protocole de recherche), VI estprcis (groupe, situation, traitement...) et une prdiction est faite de linfluence de cette VI (il

    peut y en avoir plusieurs) sur la VD (il peut y en avoir plusieurs) qui est elle-mme prcise(rponse une tche, une preuve, un apprentissage, un test, un questionnaire, uneperformance...).

    Hypothses statistiques : si les rponses (VD) prsentent des valeurs normalises (dautresexpriences ont permis dtablir des normes de rponses), il est possible de reprendre de faonchiffre, quantifie, les hypothses de travail en prdisant des valeurs attendues. Sinon, onprdit des niveaux de rponse diffrencis, des carts de rponse, entre les sous-groupes dfinispar la VI.

    Il ny a normalement quune seule hypothse gnrale (thorique) pour un protocole ; de cette

    hypothse gnrale dcoule le plus souvent plusieurs hypothses de travail, qui dfinissent desorientations dans le protocole, et chaque hypothse de travail donne naissance plusieurshypothses oprationnelles, en gnral une par instrument de mesure utilis. Les hypothsesoprationnelles, surtout si elles sont chiffres (statistiques) et si elles doivent poser des prdictionssur plusieurs groupes, ne sont pas obligatoirement rdiges de faon littraire, mais peuventavantageusement tre prsentes sous la forme de tableaux, qui annoncent les valeurs, ou lesniveaux attendus.

    Les variables intermdiaires

    Dans un modle simple de type S-R, les variables indpendantes (les stimuli S) et leurs influencessur les variables dpendantes (les rponses des sujets R), sont suffisantes et ce qui ce passe dans la boite noire de lorganisme est ignor. Cependant, il est possible dadopter une position pluscomplexe et considrer les variables, entre S et R, rattaches lorganisme, le schma devenantalors S-O-R.

    Ces variables de lorganisme, dites variables intermdiaires , correspondent en psychologie, des processus psychologiques ou des activits intrieures des sujets, processus et activitsdclenchs par les VI et dont la prsence et les caractristiques sont rvles par infrences, partirde lobservation des comportements manifestes. Quelques exemples : la motivation, les processuscognitifs.

    Non observables directement, donc non mesurables, les variables intermdiaires doivent tredfinies en regard de leurs rfrents empiriques. Cependant, elles gardent toujours le statut deconstruits hypothtiques. Elles se situent au-del de la statistique et ne font quaider la discussiondes rsultats obtenus entre VI et VD.

    Les variables parasites

    Que la recherche soit confine au sein dun laboratoire, en tant purement exprimentale, ou quellese droule dans la nature tant alors quasi exprimentale, il apparat toujours des variables quisont non pertinentes pour les objectifs de la recherche, qui la parasitent et quil convient de

    contrler. Ces variables sont au mme rang que les variables indpendantes manipules par le

  • 7/27/2019 Stats_Pour_Les_Nuls.pdf

    14/99

    Stats pour les nuls

    les statistiques par lexemple

    14

    chercheur, au sens o elles peuvent influencer les variables dpendantes, les rponses des sujets.Plusieurs types de variables parasites sont considrer :

    Variables dmographiques : lieu de rsidence, situation familiale, catgoriesocioprofessionnelle dappartenance, niveau dtudes, revenus, type culturel, etc.

    Variables organismiques : sexe, ge, race, apparence, qualits physiques ou physiologiques,tat de sant, etc.

    Variables historiques : vnements significatifs de la vie, conditions dducation, trajectoire,par exemple, dune addiction, dun comportement problme, maladies passes, traitementspasss, emprisonnement, placement familial, etc.

    Variables de dispositif : il sagit des variables parasites qui appartiennent au dispositif de larecherche elle-mme, comme le sexe ou la race de lexprimentateur sil entre en contactdirectement avec les sujets tudis, lenvironnement et lambiance au cours de lexprience,ltat des sujets au cours de lexprience (physiologique et mental), certains dtailsexprimentaux comme la disposition des personnes, de lclairage, des instruments de contrle,la technique et la dure de passation des questionnaires et tests, etc.

    Les variables parasites apparaissent systmatiquement dans la question de lquivalence desgroupes, mais encore dans la constance des conditions exprimentales chaque mesure rpte.Comme le chercheur veut faire apparatre au mieux le seul effet des variables indpendantes quil achoisies selon la problmatique dont il traite, il souhaite liminer, neutraliser ou contrler les autresvariables qui pourraient jouer sur les rsultats. Plusieurs moyens sont sa disposition, quisappliquent selon les types de variables contrler :

    Maintien un niveau constant : vous faites en sorte que le niveau de la variable parasite resteconstant. Par exemple, si vous ne pouvez liminer le bruit au cours de mesures exprimentales,vous essaierez de maintenir constant le niveau de ce bruit. Si le sexe des sujets peut jouer surleur rponse, vous pouvez ne choisir que des sujets de sexe fminin ou masculin, afin de bienmettre en vidence leffet de votre variable indpendante.

    Variation systmatique : il sagit de reprer des niveaux reprsentatifs de la variable parasite etde les produire dune faon volontaire, systmatique, en respectant une distribution quivalentepour chaque niveau. Par exemple, vous essayez quil y ait le mme nombre de sujets danschaque catgorie socioprofessionnelle, pour chaque niveau intellectuel ou niveau dtudes,autant dhommes que de femmes, et ainsi de suite. Pour une variable de dispositif, comme ledegr dabstraction de mots mmoriser, vous pouvez considrer 5 niveaux dabstraction etrpartir galement les mots mmoriser sur ces 5 niveaux.

    Variation au hasard : vous pouvez laisser la variable parasite jouer librement, en laconsidrant comme une variable naturelle. Cependant, il est ncessaire que cela sapplique surun nombre important de sujets afin que le hasard, justement, ne dtermine des niveaux tropparticuliers de la variable. Il est aussi bon de contrler la normalit de cette variable, savoir

    si la distribution de ses niveaux est statistiquement normale, que les valeurs centrales ou

  • 7/27/2019 Stats_Pour_Les_Nuls.pdf

    15/99

    Stats pour les nuls

    les statistiques par lexemple

    15

    modres sont plus frquentes que les valeurs extrmes. Par exemple, pour la variable CSP(catgorie socioprofessionnelle), avec un grand nombre de sujets, ceux-ci peuvent se rpartir au

    hasard et dune faon quilibre entre toutes les catgories et vous pourriez vrifier la frquencede rpartition afin de contrler sil ny a pas une sur- ou sous-reprsentation dune catgorie surles autres.

    Elimination : plus facile dire qu faire, llimination de certaines variables parasites, surtoutcelles lies au dispositif exprimental, est parfois une solution. Par exemple, le sexe delexprimentateur, qui peut influer sur la rponse des sujets, peut faire lobjet dune variationsystmatique (il faut quil y ait le mme nombre de sujets pour les deux genresdexprimentateurs), ou bien vous liminez compltement lexprimentateur en plaant lessujets face un ordinateur avec lequel ils passent leurs tests.

    Bien entendu, dans le cadre des expriences sur ltre humain, on ne peut jamais tout contrler 4. Ilfaut simplement faire le maximum et tre attentif viter les erreurs grossires. Prfrer aussicertaines mthodes dautres. Par exemple, si possible viter les mesures rtrospectives, car alors lavariable mmoire peut vous jouer des tours. Et si vous devez faire du rtrospectif, vitez alorsdes empans temporels trop longs ou trop loigns dans le pass.

    Une variable nest vritablement parasite que selon son degr de pertinence par rapport votreprotocole de recherche. Si, par exemple, les travaux antrieurs ont largement montr que la variable situation familiale navait aucune influence sur ce que vous voulez mesurer, alors vous pouvezsans doute ngliger le contrle de cette variable (sauf si vous escomptez remettre en question lestravaux antrieurs).

    Vous ne devez pas oublier que si le contrle des variables parasites augmente la validit internedune recherche, il peut en diminuer la validit externe ou cologique. Par exemple, si vouscontrlez le sexe en ne choisissant que des hommes, vous ne pourrez prtendre que vos rsultatssappliquent aussi aux femmes.

    Enfin, vous verrez plus loin que les variables parasites sont contrles de faon statistique, par destests destins mesurer le degr de leur influence, afin de sassurer de respecter le principeexprimental fondamental du toutes choses gales par ailleurs .

    1.3. Les plans de recherche

    1.3.1. Plans de recherche groupes indpendants

    Le principe de toute recherche en psychologie consiste soumettre des groupes de sujets auxdiffrents niveaux dune ou plusieurs variables indpendantes afin de mesurer les effets decette(ces) variable(s) indpendante(s) sur la rponse comportementale des sujets qui y sont soumis.Par exemple, une variable indpendante peut tre une cure de sevrage alcoolique. Les deux niveauxde cette variable sont : 1) suivre une cure de sevrage et 2) ne suivre aucune cure de sevrage. On

    4 Dj, on peine y parvenir avec lanimal !

  • 7/27/2019 Stats_Pour_Les_Nuls.pdf

    16/99

    Stats pour les nuls

    les statistiques par lexemple

    16

    divise la population des sujets en deux groupes quivalents par ailleurs et lon soumet le premiergroupe la condition (1) de la variable indpendante (suivre la cure), tandis que le second groupe

    est laiss sa vie habituelle, le niveau (2) de la variable. Ensuite, on entreprend un certain nombrede mesures, comme le taux de consommation dalcool par jour, les niveaux de dpression etdanxit. Ces mesures sont la rponse des sujets, cest--dire les variables dpendantes, qui vontdpendre, selon les hypothses poses, du niveau de la variable indpendante suivre ou non unecure de sevrage.

    Larticulation organise entre variable indpendante et variable dpendante sappelle un plan derecherche . Il existe trois grandes catgories de plans de recherche. Voyons la premire : les plansde recherche groupes indpendants.

    Des groupes diffrents de sujets sont soumis chacun un niveau de la variable indpendante. Le

    nombre de groupes va dpendre du nombre de variables indpendantes et du nombre de niveaux dechacune des variables indpendantes. Pour trouver le nombre de groupes ncessaire, il suffit demultiplier entre eux les nombres de niveaux de chaque variable indpendante (VI). Quelquesexemples :

    VI a1 Gr. 1

    VI a2 Gr. 2

    Nombre de groupes = 1 variable x 2 niveaux = 2Ex. : la variable cure de sevrage alcoolique (VI a) a deux niveaux : ungroupe (Gr. 1) est soumis la cure (VI a1), lautre (Gr. 2) non (VI a2).

    1 VI 2 niveaux

    VI a1 Gr. 1

    VI a2 Gr. 2

    VI a3 Gr. 3

    VI a4 Gr. 4

    Nombre de groupes = 1 variable x 4 niveaux = 4Ex. : la variable privation de sommeil (VI a) a quatre niveaux : les quatregroupes (Gr. 1, Gr. 2, Gr. 3, Gr. 4) sont respectivement soumis 2 heures (VIa1), 4 heures (VI a2), 6 heures (VI a3) et 8 heures (VI a4) de privation desommeil.

    1 VI 4 niveaux

    VI b1 VI b2

    VI a1 Gr. 1 Gr. 2

    VI a2 Gr. 3 Gr. 4

    Nombre de groupes = 2 variables x 2 niveaux = 4Ex. : la variable privation de sommeil (VI a) a deux niveaux : avecprivation (VI a1) ou sans (VI a2) ; la seconde variable est le sexe (VI b), avec naturellement deux niveaux : fminin (VI b1) et masculin(VI b2). On a donc : un groupe de femmes prives de sommeil, lautrenon (Gr. 1 et Gr. 3), et la mme chose pour les deux groupesdhommes (Gr. 2 et Gr. 4), ce qui permet de contrler, par exemple,leffet sur la performance intellectuelle, la fois de lappartenance ausexe et de la privation ou non de sommeil.

    2 VI 2 niveaux

  • 7/27/2019 Stats_Pour_Les_Nuls.pdf

    17/99

    Stats pour les nuls

    les statistiques par lexemple

    17

    VI b1 VI b2 VI b3

    VI a1 Gr. 1 Gr. 2 Gr. 3VI a2 Gr. 4 Gr. 5 Gr. 6VI a3 Gr. 7 Gr. 8 Gr. 9

    VI a4 Gr. 10 Gr. 11 Gr. 12

    Nombre de groupes = 1 variable x 4 niveaux x 1 variable x 3

    niveaux = 12Ex. : la variable tranche dge a quatre niveaux : 21-25,26-30, 31-35, 36-40 ans (de VI a1 VI a4) ; la secondevariable privation de sommeil 3 niveaux : 2, 4 et 6heures de privation (de VI b1 VI b3).

    1 VI 4 niveaux + 1 VI 3 niveaux

    VI c1 VI c2 VI c3 VI c4VI b1 Gr. 1 Gr. 2 Gr. 3 Gr. 4

    VI b2 Gr. 5 Gr. 6 Gr. 7 Gr. 8VI a1 VI b3 Gr. 9 Gr. 10 Gr. 11 Gr. 12VI b1 Gr. 13 Gr. 14 Gr. 15 Gr. 16VI b2 Gr. 17 Gr. 18 Gr. 19 Gr. 20VI a2VI b3 Gr. 21 Gr. 22 Gr. 23 Gr. 24

    Nombre de groupes = 1 variable x 2niveaux x 1 variable x 3 niveaux x 1

    variable x 4 niveaux = 24Ex. : la variable sexe (VI a, 2 niveaux) ;la variable tranche dge (VI b, 3niveaux) et la variable privation desommeil (VI c, 4 niveaux).

    1 VI 2 niveaux + 1 VI 3 niveaux + 1 VI 1 niveau

    Difficults poses par les plans de recherche groupes indpendants

    Le problme principal est celui de lquivalence des groupes. La question est de savoir si les effets

    observs sur les variables dpendantes, dpendent uniquement des niveaux de(des) variable(s)indpendante(s). En effet, il est possible que dautres variables, comme lge, le sexe, le niveaudtude, etc., aient un impact sur la rponse des sujets.

    Ces diffrences entre les groupes de sujets peuvent apparatre dj au niveau mme de laconstitution des groupes (par exemple, vous recrutez les sujets dun groupe en tlphonant chez euxet ceux de lautre groupe en mettant une annonce dans un journal, au rsultat vous nobtiendrez pastout fait les mmes types de sujets). Vous devez donc, avant toute manipulation de la variableindpendante, former des groupes qui soient au plus semblables.

    Plusieurs moyens sont possibles : vous pouvez chercher regrouper des sujets qui ont des

    caractristiques systmatiquement identiques (par exemple, vous vous dites que pour liminerlinfluence du sexe, vous nallez prendre que des hommes ou que des femmes). Cependant, enfaisant ainsi, vous limitez la validit de vos rsultats un type de sujets. La seconde mthodeconsiste faire appel au hasard pour slectionner les sujets dans la population plus globale. Lehasard neutralise ainsi les biais qui pourraient rsulter du fait de choisir vous-mmes les sujets,mme avec les meilleures intentions. Une troisime mthode consiste apparier5 les sujets deux pardeux (par exemple, si vous avez un homme de quarante ans, niveau baccalaurat, mari avecenfants et au chmage dans un groupe, vous essaierez de trouver son homologue pour lautregroupe, avec des caractristiques les plus proches possibles).

    5 Et non pas appareiller , comme on peut le lire dans certains mmoires !

  • 7/27/2019 Stats_Pour_Les_Nuls.pdf

    18/99

    Stats pour les nuls

    les statistiques par lexemple

    18

    Une dernire mthode consiste prendre un groupe homogne assez grand et de faire une sorte depr-test sur une variable de caractristique ou sur une variable dpendante, puis de choisir le mme

    nombre de sujets aux deux extrmes de la distribution en rejetant ceux qui sont au milieu. Parexemple, vous voulez comparer le parcours de sevrage et aprs sevrage dalcooliques selon leurniveau de dpression au dpart. Vous allez faire passer une chelle de dpression 100 sujets, puisvous ne retiendrez pour la suite de ltude, que 20 de ceux qui sont le moins dpressifs (groupefaible dpression) et les 20 avec les plus hauts scores de dpression (groupe forte dpression). Vousobtenez ainsi deux groupes assez homognes par ailleurs, mais qui sont trs contrasts sur le plan dela variable intressante : la dpression.

    Bien entendu, toutes ces prcautions de slection et recrutement des sujets sont limites par lenombre de sujets disponibles et dautres contraintes. La constitution du groupe de contrle (celuiqui nest pas soumis au niveau de la variable dont on veut mesurer les effets), par exemple, est

    souvent rendu trs difficile par la nature mme du groupe exprimental (celui qui va tre soumis auniveau deffet de la variable). Pour des toxicomanes en cure de sevrage, la variable indpendantetant cure-pas cure , le groupe de contrle est constitu de toxicomanes qui ne sont pas en cure.Mais, alors quil est facile de recruter les sujets en cure (on dit que cest une population captive ,ils sennuient en centre de cure et attendent avec impatience de rencontrer ltudiant en psychologiequi va les couter et les distraire...), les toxicomanes chez eux, dans la rue, dans les associationsdaide, sont excessivement volatiles, ne viennent pas aux rendez-vous, nont que faire de rpondre vos questionnaires, etc. Sans parler du fait que certains peuvent avoir des traitements, des suivispsychologiques, qui font quils ne sont pas sans rien .

    A ces difficults sajoute le fait, quidalement, toute recherche devrait sappuyer sur un nombre leplus important possible de sujets, car les rsultats sont une sorte de loi gnrale que vous tirezde la rptition de lexprience, de la mesure, et plus on rpte et plus cest valable. Cette ncessitdu grand nombre entre souvent en conflit avec la ncessit dliminer des sujets pour atteindre unequivalence des groupes. Aussi, on nobtient jamais une quivalence parfaite, on ne fait quy tendreet vous verrez dans les parties recherche et statistique du manuel quil existe des moyens de tester ledegr de cette quivalence, que toutes choses sont gales par ailleurs .

    1.3.2. Plans de recherche mesures rptes

    Ici, cest un seul et mme groupe de sujets qui est confront tous les niveaux de la(les) variable(s)indpendante(s). Le premier niveau de la variable est souvent une situation de contrle, une lignede base , partir de laquelle les autres niveaux seront valus en fonction de cette situation debase. Souvent aussi, la mesure rpte concerne la variable Temps : ce qui change cest lasituation interne des sujets au cours du temps. Quelques exemples pour comprendre :

    VI a1 Gr. 11 Test

    VI a2 Gr. 12 Retest

    Nombre de tests = 1 variable x 2 niveaux = 2Ex. : la variable avant / aprs cure de sevrage (VI a, 2 niveaux). Onmesure la dpression et lanxit (variables dpendantes), avant (Gr. 11,test, situation de contrle, ligne de base) et aprs 1 mois de cure de sevragealcoolique (Gr. 12, retest).

    1 VI 2 niveaux (1 test 1 retest)

  • 7/27/2019 Stats_Pour_Les_Nuls.pdf

    19/99

    Stats pour les nuls

    les statistiques par lexemple

    19

    VI a1 Gr. 11 Test

    VI a2 Gr. 12 RetestVI a3 Gr. 13 Retest

    VI a4 Gr. 14 Retest

    VI a5 Gr. 15 Retest

    Nombre de tests = 1 variable x 5 niveaux = 5

    Ex. : la variable avant / aprs cure de sevrage 1 mois / 6 mois / 12mois / 18 mois (5 niveaux). On mesure la consommation dalcool(variable dpendante), avant (VI a1, test, situation de contrle, ligne debase) et aprs 1 mois de cure de sevrage alcoolique (VI a2, retest), puis 6 mois (VI a3), 12 mois (VI a4) et 18 mois aprs la fin de la cure(retests).

    1 VI 5 niveaux (1 test + 4 retests)

    VI b1 VI b2 VI b3

    VI a1 Gr. 11 Gr. 12 Gr. 13

    VI a2 Gr. 14 Gr. 15 Gr. 16

    VI a3 Gr. 17 Gr. 18 Gr. 19

    VI a4 Gr. 110 Gr. 111 Gr. 112

    Nombre de tests = 1 variable x 3 niveaux x 1 variable x 4niveaux = 12

    Ex. : la variable bruit ambiant (3 niveaux : 1) pas de bruit(V b1) ; 2) faible bruit (V b2) ; 3) bruit fort (V b3)) est testeavec la variable difficult de la tche (4 niveaux : 1)facile (V a1) ; 2) un peu difficile (V a2) ; 3) difficile (V a3) ;4) trs difficile (V a4)). Ainsi, chaque sujet est soumis aux12 situations qui combinent les diffrents niveaux des deuxvariables indpendantes. Un tel plan o la variable temps ne

    joue pas (les 12 expriences peuvent tre menes dans lamme matine), peut concerner les deux exemplesprcdents, avec une seule variable 2 ou 4 niveaux, testedans un court lapse de temps.

    1 VI 4 niveaux + 1 VI 3 niveaux (12 test)

    Difficults poses par les plans de recherche mesures rptes

    Ici, le problme de lquivalence des groupes de sujets semble disparatre, puisque nous navonsquun seul groupe de sujets. Cependant, mme si lon na plus quun seul groupe, il est bon que lessujets de ce groupe ne soient pas trop disparates, en ce qui concerne certaines de leurscaractristiques relies la variable dpendante, il faut une sorte dquivalence des sujets (chaquesujet avec son ensemble de test et retests forme bien une sorte de groupe ). Par exemple, si voustudiez lanxit chez des alcooliques au cours du temps (avant et aprs sevrage), il est prfrableque ces alcooliques soient de faon prpondrante tous addicts lalcool et quil ny ait pas parmieux des addicts aux drogues ou de gros consommateurs de mdicaments psychotropes. Car dans cecas, le niveau danxit ne dpendrait pas seulement du niveau de consommation alcoolique, maisaussi des autres consommations psychotropes qui ne sont pas, a priori, contrles par ltude. Parcontre, si vous avez votre disposition un trs grand nombre de sujets (par exemple, suprieur 300), vous pouvez faire confiance au hasard pour homogniser lensemble des consommationstoutes confondues et, ce moment-l, aprs contrle des consommations, faire une tude, non plussur laddiction alcoolique, mais laddiction aux substances en gnral (en prvoyant peut-tre untraitement statistique a posteriori sur des sous-groupes de consommateurs).

  • 7/27/2019 Stats_Pour_Les_Nuls.pdf

    20/99

    Stats pour les nuls

    les statistiques par lexemple

    20

    Un autre problme important de la rptition des mesures est le phnomne de rgressionstatistique. Il sagit, au fur et mesure des mesures (si vous faites un simple test et retest, donc

    seulement deux mesures, le problme ne se pose pas), dune tendance ce que les scores des sujetsles plus extrmes se resserrent autour de la moyenne. Pour y pallier, il suffit dutiliser lenvers latechnique de la constitution de groupes extrmes dcrite la page prcdente (Plans groupeindpendants) : ici nous ne voulons pas de sujets extrmes, donc sur 100 sujets dpressifs, vous negardez pour ltude que les 40 sujets au centre de la distribution des scores et vous rejetez les 30moins dpressifs et les 30 plus dpressifs.

    Une autre difficult importante des plans mesures rptes est lattrition : la perte de sujets entreles mesures. Pour diverses raisons : mdicales, professionnelles, familiales, de convenancepersonnelle, parfois tout simplement le dcs, font quil nest plus possible de rencontrer certainssujets 3 mois plus tard pour un retest. Plus le temps passe entre deux mesures et plus il y a de

    mesures et plus le taux dattrition est important. Cest pour cette raison quil vous faut, ds ledpart, prvoir large, en comptant par exemple 5% ou 10% dattrition. Si le nombre de sujets audpart nest pas assez important, vous risquez de ne plus en avoir suffisamment pour validerltude, ou vous allez tre confronts des problmes dhtrognit que le hasard et le grandnombre avaient gomms, mais qui ressurgissent avec la rarfaction des sujets.

    Un autre problme est la variablit des caractristiques des sujets dans le temps. Au dpart, vousavez fait un effort pour obtenir un groupe le moins disparate possible. Cependant, si les mesures serptent sur des mois ou des annes, cette homognit va peu peu disparatre. Par exemple, voustudiez la dpression 3, 6, 12, 18 mois ; mais vos rsultats seront fausss, car entre temps certainssujets peuvent vivre des preuves (sparation, deuil, chmage, accident) qui peuvent affecter leurscore de dpression, par rapport aux sujets qui nauront pas vcus ces preuves. A linverse, dessujets peuvent naturellement maturer , trouver un quilibre personnel, changer de vie (se marier,trouver un emploi, gagner un gain au loto), ce qui va influencer leur dpression dans le bon sens.L encore, seul le grand nombre peut gommer un peu ces disparits, ou permettre dliminer au furet mesure les sujets non conformes sans que leffectif ne devienne statistiquementinintressant (car bien sr, vous ne pouvez pas comparer les 100 sujets au dpart, avec les 50 sujets la fin, vous ne pouvez retenir que les 50 sujets qui ont pu tre valus, et au dpart et la fin).

    Autre problme, lorsque la rptition des mesures sinscrit au contraire sur le cours terme : ladmotivation des sujets, qui peut rsulter de la fatigue (physique, nerveuse, intellectuelle, parfois

    motionnelle), de la lassitude, de lagacement. Passer une mtine repasser les mmes tests peuteffectivement devenir trs pnible et cela va reprsenter une variable, difficile contrler, quijouera sur les rponses des sujets. Cette dmotivation peut dailleurs apparatre au cours dun seultest, si le questionnaire est trop long ou si lon utilise trop de questionnaires et que le temps depassation dpasse lheure. De plus, cette dmotivation ne jouera pas de la mme manire selon lessujets : un tudiant lesprit vif et habitu lire et rflchir se fatiguera moins vite quun sujet quine lit jamais, parce que ses capacits de lecture sont trs faibles et lui demandent un grand effort (etdont le cerveau et les capacits seraient dtriores du fait de consommations psychotropes). Pourcontrer ce problme de la dmotivation, plusieurs solutions, selon les cas : rduire la taille ou lenombre des questionnaires, des tests, amnager des pauses (avec petits gteaux et caf, maisattention aux interactions sociales entre sujets ou avec lexprimentateur pendant les pauses ou

    linfluence du caf !), choisir des sujets de mme performance (mais l attention au biais

  • 7/27/2019 Stats_Pour_Les_Nuls.pdf

    21/99

    Stats pour les nuls

    les statistiques par lexemple

    21

    cologique : vos rsultats seront difficilement gnralisables des populations plus larges), vouspouvez aussi rmunrer vos sujets pour les motiver, condition davoir le budget pour...

    Un autre problme peut apparatre dans leffet dordre. Dans le cadre dune rptition courtterme, le fait de faire passer un test avant lautre peut jouer sur la rponse au second. Cela peut trecontr en alternant de faon alatoire ou systmatique lordre de passation des tests pour chaquesujet.

    Dans le mme registre, mais long terme, apparat le problme de lhabituation. Les sujetsshabituent au test au fur et mesure des passations (cest le coup classique du vieux patientpsychiatrique, qui sourit en coin, en voyant le jeune tudiant en psychologie dbarquer avec sonRorschach ou son TAT), de sorte que les rponses refltent davantage cette habitude que ltat dusujet lui-mme. Certains tests comportent deux versions diffrentes, mais quivalentes, pour le test

    et le retest (comme lEysenck Personality Inventory, formulaires A et B). Sans cela, il ny a gurede solution ce problme.

    La plupart des problmes prsents ci-dessus peuvent tre neutraliss par les plans combins.

    1.3.3. Plans de recherche combins

    Comme le nom lindique, les plans combins associent une comparaison entre groupesindpendants et une rptition de la mesure. En consquence, un plan combin fait appel au moins

    deux variables indpendantes : une variable Groupe et une variable Rptition . Cependant,le second exemple ci-dessous, vous montre quun plus grand nombre de variables indpendantespeuvent tre utilises :

    VI b1 VI b2

    VI a1 Gr. 11 Gr. 21 Test

    VI a2 Gr. 12 Gr. 22 Retest

    Nombre de groupes = 1 variable x 2 niveaux = 2Nombre de tests = 1 variable x 2 niveaux x 1 variable x 2 niveaux= 4Ex. : au cours dune cure de sevrage alcoolique, la variable psychothrapie (VI b) deux niveaux, dfinit deux groupes(Gr. 1 et Gr. 2), respectivement avec (VI b1) et sans (VI b2)

    psychothrapie. Les variables dpendantes, par exemple, anxitet dpression, sont mesures suivant la variable indpendante Rptition (VI a) : au dbut de la cure (VI a1) et aprs 3 moisde cure (VI a2), ce qui donne les deux tests du groupe 1 (Gr. 11 etGr. 12) et les deux tests du groupe 2 (Gr. 21 et Gr. 22).

    1 VI 2 niveaux (groupe) + 1 VI 2 niveaux (rptition)

  • 7/27/2019 Stats_Pour_Les_Nuls.pdf

    22/99

    Stats pour les nuls

    les statistiques par lexemple

    22

    VI c1 VI c2 VI c3 VI c4VI b1 Gr. 11 Gr. 12 Gr. 13 Gr. 14

    VI b2 Gr. 21 Gr. 22 Gr. 23 Gr. 24VI a1VI b3 Gr. 31 Gr. 32 Gr. 33 Gr. 34VI b4 Gr. 41 Gr. 42 Gr. 43 Gr. 44VI b5 Gr. 51 Gr. 52 Gr. 53 Gr. 54VI a2VI b6 Gr. 61 Gr. 62 Gr. 63 Gr. 64VI b7 Gr. 71 Gr. 72 Gr. 73 Gr. 74VI b8 Gr. 81 Gr. 82 Gr. 83 Gr. 84VI a3VI b9 Gr. 91 Gr. 92 Gr. 93 Gr. 94VI b10 Gr. 101 Gr. 102 Gr. 103 Gr. 104VI b11 Gr. 111 Gr. 112 Gr. 113 Gr. 114VI a4

    VI b12 Gr. 12

    1

    Gr. 12

    2

    Gr. 12

    3

    Gr. 12

    4

    Test Retest Retest Retest1 VI 4 niveaux (critre groupe 1) + 1 VI 3 niveaux (critre groupe 2) + 1 VI 4 niveaux (rptition)

    Nombre de groupes = 1 variable x 4 niveaux x 1 variable x 3 niveaux = 12Nombre de tests = 1 variable x 4 niveaux x 1 variable x 3 niveaux x 1 variable x 4 niveaux = 48Ex. : la variable indpendante Mthode dapprentissage a quatre niveaux (VI a1 VI a4),dfinissant quatre super-groupes, qui sont eux-mmes subdiviss en trois sous-groupes selon lavariable indpendante Dure dapprentissage (VI b, par exemple, 10, 20 et 30 minutes), ce quidonne en tout douze groupes (de Gr. 1 Gr. 12). De plus, ces douze groupes sont soumis unevariable indpendante de Rptition (VI c) de la mesure de la rcupration mmorielle, quatre

    fois : 1 heure (VI c1, test), 1 jour (VI c2, retest), 8 jours (VI c3, retest) et 15 jours (VI c4, dernierretest). Ce qui nous donne bien 12 x 4 = 48 tests pour ce protocole.

    Les plans de recherche combins cumulent les problmes des plans de recherche par groupesindpendants et ceux mesures rptes (voir les pages les concernant). Plus gnralement, cesplans de recherche assez complexes (que lon peut dconseiller aux tudiants), ncessitent un trsgrand nombre de sujets au dpart, afin de garder une valeur statistique des rsultats, malgr lesinvitables attritions au fil du temps...

    1.4. Les types de variables

    Hormis la distinction fondamentale entre variables indpendantes (VI) et dpendantes (VD), il estimportant de connatre les diffrentes qualits attribues aux variables, car de ces qualits peuventdpendre le choix des recettes statistiques utilises et certains choix mthodologiques. Lesvariables, au point de vue de leur nature, se rangent en deux catgories, les variables quantitatives etqualitatives :

    1) Variables quantitatives

    Les variables quantitatives (on peut dire aussi variables dchelle scale en anglais ou continues),correspondent une grandeur naturelle, une mesure. Elles sont aussi dites continues, car elles

  • 7/27/2019 Stats_Pour_Les_Nuls.pdf

    23/99

    Stats pour les nuls

    les statistiques par lexemple

    23

    peuvent prendre toutes les valeurs possibles dans un intervalle. Quelques exemples de variablesquantitatives :

    La temprature indique par un thermomtre entre 0 et 100 centigrades : 12, 0,5, 24,8, 50, etc.

    Lge de sujets entre 18 et 65 ans : 5, 10, 23, 35, 54, 78 ans, etc.

    Les scores de dpression une chelle de dpression entre 0 et 13 : 5, 8, 6, 10, 11, etc.

    Les scores de performance une preuve de mmorisation entre 0 et 10 : 2, 7, 6, 5, 3, etc.

    2) Variables qualitatives

    Les variables qualitatives (on peut dire aussi variables discrtes, ou discontinues, ou catgorielles)ne concernent que certaines valeurs ou tranches de valeurs dans un intervalle ou encore descatgories ou classes de qualits. Quelques exemples de variables qualitatives :

    Des classes dge : classe 1 entre 18-25 ans, classe 2 entre 26-35 ans, classe 3 entre 36-45 ans,classe 4 partir de 46 ans et au-dessus.

    Des niveaux de dpression : pas de dpression entre 0 et 3 ; dpression lgre entre 4 et 7 ;dpression srieuse entre 8 et 11 ; dpression grave partir de 11 et au-dessus.

    Les catgories de genre : Homme et Femme .

    Les catgories socioprofessionnelles (CSP) : Agriculteur , Cadre, profession intellectuellesuprieure , Profession intermdiaire , Employ , Ouvrier , Retrait , etc.

    Vous aurez remarqu que lon peut subdiviser les variables qualitatives en deux types :

    Les variables ordinales : il sagit des classes de mesures, comme les tranches dge, les niveaux detemprature ou de dpression. Pour simplifier le traitement dune variable numrique, ou pour la

    rendre plus parlante, on peut regrouper le caractre continu de la variable par tranches, qui sontrparties sur lintervalle dune faon ordonne (par exemple, tranches de 0 5, de 6 10, de 11 15, de 16 20, etc.).

    Les variables nominales : ne concernent en aucune faon des valeurs numriques, mais devritables catgories, comme le fait dtre Homme ou Femme , Ouvrier ou Employ .

    Cependant, tout comme pour le choix de VI et de VD, il y a dans le choix de la qualit des variablesune part de conventionnel : le chercheur dcide librement si telle variable est prise un niveauquantitatif ou qualitatif. Par exemple, si lon reprend le cas de la variable continue des tempraturesentre 0 et 100, cette variable est vraiment continue si on accepte toutes les units de degrs entre 0

    et 100 (12, 15, 5, 78, etc.). Dans certains cas, on peut aller plus loin et accepter toutes les

  • 7/27/2019 Stats_Pour_Les_Nuls.pdf

    24/99

    Stats pour les nuls

    les statistiques par lexemple

    24

    mesures jusquaux fractions de degr, les millimes (12,923, 56,047, etc.). Pourtant, il est toujourspossible, pour un chercheur, de dcider quil mesure la temprature en millimes de degrs et de

    dcouper lintervalle entre 0 et 100 en 100 parties (ce ne sont plus des degrs, mais des noms detranches), la variable devenant alors discontinue et ordinale (12 signifie entre 12,000 et 12,999 ; 13signifie entre 13,000 et 13,999 ; et ainsi de suite).

    Un autre choix trs libre du chercheur rside dans le nom donn aux catgories dune variablequalitative catgorielle. Cette libert vous permet de transformer du texte en chiffre, en numros(qui ne sont pas des mesures quantitatives videmment). Cest ce qui arrive dans certainsquestionnaires ou inventaires, o le sujet doit rpondre laide dune chelle du type : Jamais , Parfois , Souvent , Trs souvent ; ce que le chercheur traduit en un score entre 0 et 3.Autres exemples : Oui , Non deviendront 1 et 0 ; Homme et Femme 1 et 2, etc.

  • 7/27/2019 Stats_Pour_Les_Nuls.pdf

    25/99

    Stats pour les nuls

    les statistiques par lexemple

    25

    2. Faire une recherche

    Les pages de ce chapitre du manuel prsentent les diffrentes parties dune recherche, qui sont aussiles diffrentes parties dun mmoire ou dun article scientifique (la diffrence entre mmoire etarticle scientifique tient le plus souvent la taille du texte : dans un mmoire on peut davantagestaler et entrer dans certains dtails ou reprendre des donnes antrieures pour en faire un exposassez tendu, alors que larticle est gnralement plus succinct. Cependant, cette notion de taillepeut sestomper quelque peu, si lon considre que de plus en plus les enseignants (surbooks)exigent des mmoires courts et que certaines revues scientifiques acceptent des articles de fondet de haut vol plus ou moins importants en taille).

    2.1. Lintroduction

    Lintroduction votre tude doit commencer par des considrations assez gnrales, qui voquent laproblmatique sur laquelle vous travaillez, et qui justifient en quelques sortes lintrt de votretude. Pour introduire ainsi votre sujet, il est trs important de rfrencer chacune de vosaffirmations, informations. Il est aussi important de commencer donner des donnes chiffres.

    Exemple :

    Ne pas crire : En gnral, le taux de rechute aprs un traitement est trs important.

    Mais crire : En gnral, le taux de rechute aprs un traitement varie entre 50% et 90% (Browell,Marlatt, Lichtenstein, & Wilson, 1986).

    Vous donnez ainsi une estimation chiffre du taux de rechute et cette estimation renvoie une tudevalide et publie dans une revue scientifique officielle (renoncez aux citations issues de magazinesde vulgarisation, ou pire de magazines tout court ! mme si cest le docteur Machin qui la dit).En donnant ainsi des chiffres et en les rfrenant, vous donnez au lecteur des informations prciseset fiables qui vont lclairer (et quil peut retrouver lui-mme et vrifier) et vous lui montrez quevous connaissez bien votre sujet, pour avoir lu (ou connu) les articles en question.

    Nota : en ce qui concerne le avoir lu . Bien sr, dans lidal, il est toujours bon et prfrabledavoir lu les articles que lon cite. Cependant, dans la pratique, ltudiant, comme le chercheurconfirm, se heurtent des limites de temps disponible pour lire, lnergie, parfois la motivation,ncessaires. Il existe aussi en science un souci dconomie de leffort que lon peut formuler ainsi :quelquun a dj fait leffort de lire un article et le cite avec un commentaire suffisant, doncpourquoi produire une redondance inutile de leffort dans la communaut scientifique et ne pas mecontenter de reprendre la citation du prcdent auteur. Cest ce qui se passe, en fait, pour la plupartdes citations : on se contente de reprendre la citation de lautre. Par exemple, vous navez jamais lularticle de Browell, Marlatt, Lichtenstein et Wilson (1986) concernant les taux de rechutealcoolique, mais vous avez repris cette information dans un autre article. Parfois, lhonntet

  • 7/27/2019 Stats_Pour_Les_Nuls.pdf

    26/99

    Stats pour les nuls

    les statistiques par lexemple

    26

    entrane certains dire, entre parenthses (Dupont, 1985, cit dans Durand, 1999), mais le procdne fait qualourdir le texte et accrotre artificiellement la bibliographie.

    Il est vrai que la citation de la citation ressemble un peu la blague de lhomme qua vu lhommequa vu lhomme (...) qua vu la bte et cela peut conduire des effets pervers, dignes desdformations qui apparaissent dans une rumeur. Un exemple frappant, le fameux article deGoodman (1990) qui dfinit les critres de laddiction. Rares sont les personnes qui ont vraiment lucet article (en anglais), mais par contre, nombreux sont celles qui y font rfrence et qui utilisentsans rflchir les critres de Goodman pour construire un instrument dvaluation ou slectionnerleurs sujets. La lecture que Loonis6 a faite de cet article , a pu montrer quil ne sagissait quedun commentary (bien quil soit publi dans une revue srieuse), caractre simplement spculatif,et non dune vritable dmonstration des critres. Par contre, larticle explicite des implicationspratiques et thoriques trs importantes, qui sont ignores, faute davoir t lues.

    En tout tat de cause, il faut sefforcer au fil des annes de recherche, de lire au moins les articlescls (et souvent clbres), afin de savoir exactement, et de premire main, de quoi lon parle.

    Exemple dintroduction :

    Dans de nombreux pays lalcoolisme est un srieux problme de sant publique. Ce problme estaggrav du fait que les traitements sont trop souvent suivis de rechute. En gnral, le taux derechute aprs un traitement varie entre 50% et 90% (Browell, Marlatt, Lichtenstein, & Wilson,1986). Daprs Chiauzzi (1989), entre 66% et 75% des abuseurs de drogues ou dalcool connatrontune rechute dans les trois mois suivants le traitement. Armor, Polich et Stambul (1978) indiquentque seulement 10% des alcooliques traits maintiennent leur abstinence plus de 2 ans. Dans unetude de suivi sur 2 ans au Chili, aprs un traitement en centre de rhabilitation, 63% des individusretournent lalcool (Bunout, Maza, Hirsch, Petermann, Godoy, & Prez, 1997).

    Labandon du traitement, qui entrane ou est la consquence de la rechute alcoolique, prsente destaux semblables aux rechutes directes. Baekeland et Lundwall (1975) rapportent des taux dabandonprcoce de 52% 75%. Une tude de Laflamme-Cusson et Moisan (1993) fait ressortir despourcentages comparables au Canada : 25% des patients abandonnent leur demande daide aprslentrevue dvaluation, 50% poursuivent pendant plus de quatre semaines et seulement 15%persistent plus de 6 mois. Dans une autre tude conduite au Canada (Brochu, Landry, Bergeron, &

    Chiocchio, 1995), des taux dabandon semblables sont observs aux diffrentes phases detraitement : 17% des patients abandonnent leur demande daide aprs lentrevue dvaluation, 45%abandonnent avant la deuxime phase de traitement et seulement 12% persistent au-del de sixmois.

    Toujours dans lintroduction, il ne faut pas vous contenter dune seule donne et dune seulerfrence. Vous devez avoir suffisamment explor la littrature scientifique (y compris et surtoutinternationale) pour pouvoir prsenter plusieurs donnes rfrences, qui sont souventcontradictoires ou sensiblement diffrentes. Vous devez donc dj esquisser ici une sorte de minidbat. Car, la fin de la conclusion (de lintroduction), vous devez justifier lintrt de votre tude :

    6http://www.academia.edu/4313320/Larticle_dAviel_Goodman_10_ans_apres

  • 7/27/2019 Stats_Pour_Les_Nuls.pdf

    27/99

    Stats pour les nuls

    les statistiques par lexemple

    27

    parce que des donnes sont contradictoires, ou imprcises, ou mal produites, parce quil y a dbat,discussion dans la communaut scientifique, alors, votre recherche est utile pour... il est utile,

    ncessaire de... Voil par quoi une conclusion dintroduction devrait se terminer.

    Exemple de conclusion lintroduction :

    Nanmoins, linterprtation de lensemble des rsultats de ces tudes ne permet pas darriver desconclusions fermes et, bien quun certain nombre de variables pertinentes aient pu tre identifies,la principale critique qui peut tre adresse ces recherches porte sur labsence de modlesthoriques et intgratifs dans ltude de ce phnomne. Aussi, il est ncessaire dutiliser un telmodle intgratif et den faire la dmonstration.

    2.2. La problmatique

    Un principe fondamental de la recherche scientifique en psychologie peut se formuler ainsi : voirlarge, faire troit (ou leprincipe de lentonnoir).

    Cela signifie que vous devez dabord ratisser large, puis, rduire votre problmatique et votremodle quelque chose de plus troit. Cette rduction, effet dentonnoir, est ncessaire pour deuxraisons : dabord, vous ne pouvez pas traiter de toute la complexit du rel et vous serez amen faire des choix (choisir un modle parmi les modles, choisir une population dans la populationgnrale, choisir vos hypothses, choisir vos variables VI et VD). La seconde raison est en

    continuit avec la premire, cest celle de la faisabilit : non seulement vous ne pouvez prtendreapprhender la complexit du rel humain (mme si vous tes une quipe de chercheurs), mais enplus, votre nergie, vos connaissances, vos moyens matriels, financiers, institutionnels, socio-conomiques, voire politiques, sont limits. Votre temps et vos objectifs sont aussi limits : on nevous demande pas dcrire une somme en 20 volumes sur 10 ans, on vous demande de faire unepetite recherche en quelques mois et dcrire un petit mmoire, un article, ou au pire une grossethse7.

    Dans la problmatique, vous devez survoler les diffrents modles qui ont tent dexpliciter votreproblmatique. Puis, vous devez faire un choix (il est arbitraire, vous tes libre, ce qui ne doit pasvous empcher de justifier rationnellement votre choix), parmi les modles, vous emparer de lun

    deux comme base pour votre tude. Cest le modle de rfrence.

    Ensuite, vous devez vraiment montrer au lecteur quel point vous vous tes empar du modle derfrence en formulant votre propre mini-modle, qui est une forme simplifie (pas forcment) etadapte du modle de rfrence, la problmatique concrte laquelle vous voulez apporter unerponse. Par exemple, si vous faites le choix daborder la problmatique de la rechute addictive au

    7 Il y eut une poque (au 20e sicle) o raliser une thse en 10 ans tait la norme. Mais devant linflation des travauxscientifiques et lavalanche permanente de nouveaux rsultats, cette laboration sur le long terme est devenueimpossible, la thse deviendrait interminable puisquil faudrait pratiquement chaque anne la reprendre la lumire desdcouvertes les plus rcentes. Aussi, une thse se droule-t-elle normalement en 3 ans : une anne pour prparer son

    sujet, explorer la littrature, reprer le terrain dtude et tablir la faisabilit ; une anne pour la ralisation du protocolede recherche sur le terrain ; une anne pour la rdaction et la soutenance.Not more !

  • 7/27/2019 Stats_Pour_Les_Nuls.pdf

    28/99

    Stats pour les nuls

    les statistiques par lexemple

    28

    travers du modle de rfrence de la thorie du renversement (Apter), vous pouvez rduire cettethorie complexe certains concepts et indicateurs (par exemple, la paire dtats

    mtamotivationnels tlique-paratlique) et imaginer (cest l votre mini-modle) des lments deprocessus explicatifs de la rechute partir de ces concepts. Vous ferez cela, tout en le reliant votreterrain de recherche (par exemple, des toxicomanes en postcure).

    Bien entendu, au passage, votre problmatique et votre mini-modle, peuvent tre tays par destravaux antrieurs ventuels que vous devez citer. Par exemple, vous pouvez en toute modestiereprendre un protocole exprimental (les fameuses tudes rplicatives replication studies , lundes grands principes de la recherche scientifique tant la reproductibilit, vous y contribuerez) etciter prcisment les rsultats antrieurs votre propre tude.

    2.3. Les hypothses

    La recherche scientifique consiste faire des prdictions... tout comme la voyante cartomanciennevous prdit lavenir, le turfiste les chevaux gagnants de la prochaine course ou le mtorologue letemps quil fera ce week-end. Cependant, les prdictions du chercheur sont tout fait diffrentes.Tout dabord, au contraire de la tireuse de cartes, nos prdictions sappliquent sur un modleplausible et rationnel (on ne peut pas dire que la correspondance entre le tirage alatoire de cartes

    jouer et des vnements futurs reprsente un modle plausible et rationnel, sauf le croire...).

    Ensuite, nos prdictions nont pas une valeur pragmatique, comme le bulletin mto, mais

    thorique : nous ne gagnons rien de concret dans le fait que nos prdictions soient exactes ou non,ni pour nous-mmes (le chercheur, sil est rmunr, touchera son salaire, que ses hypothses soientvrifies ou non), ni pour la socit dans le court terme (personne nattend le rsultat de nosprdictions pour le lendemain ou le week-end prochain, par contre, la socit est effectivementintresse par nos rsultats pour une action, une application, inscrites dans le long terme, parexemple, changer lapproche sanitaire de la problmatique de la dlinquance juvnile).

    Nos prdictions scientifiques sont plausibles, sappliquent sur un modle troit et rationnel et deplus, elles nont pas dorientation ! Nous voulons dire pas dorientation autre quarbitraire . Celasignifie que vous pouvez formuler vos hypothses en positif ou en ngatif. Par exemple, vous teslibres de poser :

    La cure de sevrage avec accompagnement psychologique aura un effet damlioration sur ltat

    psychologique (dpression et anxit) par rapport au groupe de contrle qui suit une cure de

    sevrage sans accompagnement psychologique.

    Ou le contraire :

    La cure de sevrage avec accompagnement psychologique namliorera pas ltat psychologique

    (dpression et anxit) tout comme le groupe de contrle qui suit une cure de sevrage sans

    accompagnement psychologique.

  • 7/27/2019 Stats_Pour_Les_Nuls.pdf

    29/99

    Stats pour les nuls

    les statistiques par lexemple

    29

    De plus, pour le chercheur, ses rsultats sont, nous lavons dit, pragmatiquement neutres, ce quisignifie que si une hypothse est valide, cest un rsultat ; mais si une hypothse nest pas valide,

    cest aussi un rsultat ! Pour le chercheur, que laccompagnement psychologique dans la cure desevrage amliore ou non ltat psychologique des sujets est, dans les deux cas, un rsultatintressant : sil y a amlioration, alors il ajoute une pierre au modle qui dit que laccompagnement psychologique en cours de cure de sevrage est cliniquement intressant , etsil ny a pas amlioration, il najoute pas de pierre, voire, il en retire une et il faut alors envisagerautre chose que laccompagnement psychologique au cours du sevrage.

    Cette libert dorientation, quant la formulation des prdictions, fait que le chercheur, entrelarrive des rsultats et la publication, est libre de choisir dans quel sens il publiera ses rsultats :

    Sens 1 : le chercheur prsente les modles de sa problmatique, choisit parmi eux son modle de

    rfrence, en tire son mini-modle, partir duquel il construit des hypothses classiques ou orthodoxes , cest--dire qui vont dans le sens communment attendu. Et, dans le cas o lesprdictions ne sont pas vrifies, le chercheur proposera la suite de la discussion de ses rsultatsun modle alternatif , htrodoxe , rvolutionnaire (au sens de rvolution scientifique8).

    Sens 2 : le chercheur prsente les modles de sa problmatique, mais se dmarque demble de cesmodles et propose, arguments scientifiques lappui, un mini-modle alternatif , htrodoxe , rvolutionnaire (au sens de rvolution scientifique8), partir duquel il construitdes hypothses alternatives , htrodoxes , rvolutionnaires , qui vont contre-courant deshypothses classiques ou orthodoxes . Et comme dans ce cas, les prdictions du chercheursont valides, dans la discussion des rsultats, il confortera son modle rvolutionnaire et tchera delui apporter quelques rserves et critiques en toute modestie (de toute faon dautres se chargerontbien de le faire, croyez-moi !).

    Lune et lautre orientation sont scientifiquement indiffrentes, car comme on la dit, un rsultat esttoujours un rsultat, quel que soit son orientation (quil valide ou pas lhypothse). Par contre,apparaissent ici des notions desthtique dans la prsentation des travaux et de satisfactionnarcissique du chercheur lui-mme : dans le sens 1 , le chercheur sacrifie son plaisir narcissique(si ses hypothses ne sont pas valides) au profit dune prsentation classique ; dans le sens 2 , lechercheur se fait plaisir (Ouah ! quest-ce que je suis fort, mes prdictions moi se sont ralises !),au profit dune prsentation avantageuse. Entre tre classique, rvolutionnaire ou chercheur puril,

    cest chacun de se faire son opinion. Mais il est temps de parler de ces fameuses hypothses.Quest-ce quune hypothse ?

    Une hypothse ( cet endroit, il sagit dhypothse oprationnelle, voir le chapitre Les V.I. et lesV.D. pour les diffrents niveaux dhypothses : gnral, de travail, oprationnel et statistique) estune prdiction (issue dun modle plausible et rationnel) qui pose une relation dinfluence entreune(des) variable(s) indpendante(s) et une(des) variable(s) dpendante(s) (les niveaux de la VI ontun effet sur sont explicatifs de la valeur de la VD). Par exemple, dans lhypothse ci-dessous :

    8 Kuhn, T. S. (1972).La structure des rvolutions scientifiques. Trad. Franaise, Paris : Flammarion.

  • 7/27/2019 Stats_Pour_Les_Nuls.pdf

    30/99

    Stats pour les nuls

    les statistiques par lexemple

    30

    La cure de sevrage avec accompagnement psychologique (VI) aura un effet damlioration sur

    ltat psychologique (VD = dpression et anxit) par rapport au groupe de contrle qui suit une

    cure de sevrage sans accompagnement psychologique.

    La VI est laccompagnement psychologique, elle possde deux niveaux : avec (groupeexprimental) et sans (groupe de contrle, on dit aussi tmoin) accompagnement psychologique.

    La VD est ltat psychologique, oprationnalis comme scores des chelles de dpression etdanxit.

    Linfluence est prdite de VI sur VD : laccompagnement psychologique influence ltatpsychologique.

    Enfin, rappelez-vous au chapitre sur Les V.I. et les V.D., que le sens de la prdiction, delinfluence, entre ce qui est VI ou VD, vous appartient : ici le chercheur tudie linfluence delaccompagnement psychologique sur ltat psychologique, mais un autre chercheur pourrait tudierlinfluence de ltat psychologique sur laccompagnement psychologique (par exemple, aveclhypothse plausible de ce que plus ltat psychologique est grave anxit et dpression et pluslaccompagnement psychologique est inefficace du fait de la non compliance9 des sujets).

    La VI est bien ce que manipule le chercheur (il divise son chantillon de sujets en deux groupes :ceux qui reoivent et ceux qui ne reoivent pas laccompagnement psychologique) et la VD est bienla rponse des sujets aux questionnaires (dpression et anxit). A ce propos, notez bien cettesubtilit de langage : quand vous faites une prdiction sur une amlioration dtat psychologique,sur un changement de comportement ou dattitude (sauf, dans ce cas, pouvoir observer vous-mmes le comportement), cest par commodit langagire, simplification, que lon dit danslhypothse que les niveaux de la VI ont une influence sur ltat ou le comportement ; car en ralit,la prdiction se borne porter sur la rponse aux instruments de mesure (questionnaires,inventaires, tests). Pour ce qui concerne le lien prdictif entre comportements, attitudes, tatspsychologiques rels et la rponse aux instruments, cest une autre histoire (cela dpendvidemment du degr de validit de linstrument de mesure).

    Rappel : voir le chapitre Les V.I. et les V.D. pour connatre les diffrents niveaux dhypothses :gnral, de travail, oprationnel et statistique.

    Les types dhypothses selon les types de recherche

    Au chapitre prsentant Les types de recherche, nous avions vu les quatre niveaux de la recherche :empirique, thorique, (quasi) exprimental et clinique. La possibilit de formuler des prdictionshypothtico-dductives varie selon ces niveaux de la recherche.

    9 Terme qui vient de langlais et qui est de plus en plus utilis en franais faute dun mot quivalent et qui signifie :

    ladhsion et la conformit dun sujet un protocole de soin ou dtude (par exemple, respecter les rendez-vous, lecadre du travail, rpondre aux consignes, prendre le traitement et respecter la posologie, etc.).

  • 7/27/2019 Stats_Pour_Les_Nuls.pdf

    31/99

  • 7/27/2019 Stats_Pour_Les_Nuls.pdf

    32/99

    Stats pour les nuls

    les statistiques par lexemple

    32

    2.4. La mthode

    Dans cette partie de votre travail, vous devez exposer exactement la mthode (et non lamthodologie, qui est la science des mthodes) que vous avez suivie pour raliser votre tude (ondoit savoir ce que vous avez fait et on doit pouvoir reproduire votre mthode). Cet expos comporteles lments suivants :

    Descriptif de votre population : il sagit dindiquer o et comment la population dtude trecrute, puis de la dcrire (nombre dhommes, de femmes, nombre total ; moyenne, cart type,minimum et maximum des ges). Vous devez dire exactement comment vous avez rencontr lessujets (dans une institution, quel type ; par une petite annonce, spontanment dans un lieu public, luniversit, par tlphone, par effet boule de neige une personne vous donne les coordonnes

    dune ou plusieurs autre(s) quelle connat et ainsi de suite , etc.). Vous pouvez utiliser destableaux chiffrs pour prsenter certaines donnes. Notamment, lorsque vous prsenterez lesdonnes dmographiques. Prcisez si les personnes ont rempli une Feuille de consentement.Prcisez aussi vos critres dinclusion et de non inclusion dans la recherche.

    Descriptif de votre protocole : vous devez expliquer clairement comment vous avez procd :pour rpartir vos chantillons dans les groupes (les critres), dans quelles conditions vous avezassur vos variables indpendantes (dispositif exprimental, lieu, conditions, dure, contrle desvariables parasites) ; quant, o, comment, vous avez enregistr vos variables dpendantes (le test, leretest ou le calendrier ou programme de rptition des mesures, etc.).

    Descriptif des instruments de mesure : celui qui tablit les critres de slection entre groupeexprimental et groupe tmoin (la VI) et ceux qui permettent de mesurer les variables dpendantes(VD), en donnant chaque fois la rfrence la plus rcente de validation de linstrument, dans lalangue des sujets. Dites si vous avez choisi de prendre en compte les donnes normatives (parexemple, partir de quel seuil vous classez les sujets comme dpressifs ou non).

    Bien entendu, vous tes libre dadapter le choix des informations et leur ordre de prsentation selonle niveau de votre recherche et ses caractristiques propres.

    2.5. Les rsultats

    Les rsultats sont prsents en trois parties :

    1. le contrle des variables descriptives (organismiques, dmographiques) sur lquivalencedes groupes afin dassurer le lecteur que vous avez pris en compte le principe du touteschoses gales par ailleurs . Pour cela, vous donnez des tableaux chiffrs, qui prcisent lesrsultats de vos tests statistiques sur ces variables (voir la partie Lquivalence des groupes dumanuel). Normalement, vos tests ne doivent pas indiquer une diffrence significative desgroupes au point de vue des variables descriptives. Dans le cas contraire, il faudra penser apporter des rserves vos rsultats dans la discussion.

  • 7/27/2019 Stats_Pour_Les_Nuls.pdf

    33/99

    Stats pour les nuls

    les statistiques par lexemple

    33

    2. le contrle des variables descriptives (organismiques, dmographiques) sur les variablesdpendantes afin dassurer le lecteur que vous avez pris en compte le principe