Méthodologie de la -...

42
Méthodologie Méthodologie de la de la recherche recherche Université Lille 2 Université Lille 2

Transcript of Méthodologie de la -...

MéthodologieMéthodologiede lade la

rechercherecherche

Université Lille 2Université Lille 2

Plan du coursPlan du cours1.1. La loi normale et lLa loi normale et l’’erreur derreur d’é’échantillonnagechantillonnage

2.2. Comparaison de deux échantillonsComparaison de deux échantillons

3.3. Comparaison de trois échantillons ou plusComparaison de trois échantillons ou plus

4.4. Corrélation et régressionCorrélation et régression

Plan du coursPlan du cours1.1. La loi normale et lLa loi normale et l’’erreur derreur d’é’échantillonnagechantillonnage

1.1. La loi normaleLa loi normale

2.2. Théorème de la limite centraleThéorème de la limite centrale

3.3. Tests dTests d’’hypothèses et inférence statistiquehypothèses et inférence statistique

4.4. InterprétationInterprétation1.1. Deux types dDeux types d’’erreurerreur

2.2. La puissance dLa puissance d’’un testun test

www.amazon.fr www.humankinetics.com

Quelques références Quelques références ……

Et sites Internet Et sites Internet ……

www.sportsci.orgwww.sportsci.org

Quelques logiciels Quelques logiciels ……

Statistica (www.statsoft.com)

SPSS (www.spss.com)

Sigmastat (www.spss.com)

etc …

Plan du coursPlan du cours1.1. La loi normale et lLa loi normale et l’’erreur derreur d’é’échantillonnagechantillonnage

1.1. La loi normaleLa loi normale

2.2. Théorème de la limite centraleThéorème de la limite centrale

3.3. Tests dTests d’’hypothèses et inférence statistiquehypothèses et inférence statistique

4.4. InterprétationInterprétation1.1. Deux types dDeux types d’’erreurerreur

2.2. La puissance dLa puissance d’’un testun test

Deux objectifsDeux objectifs

•• Obtenir une information descriptive Obtenir une information descriptivesur la population à partir de laquellesur la population à partir de laquellell’é’échantillon a été constituéchantillon a été constitué

•• Tester des hypothèses Tester des hypothèses

Emprunté à Glantz SA. Introduction aux biostatistiques. McGraw – Hill, New York, 1996.

Distribution de la taille des martiensDistribution de la taille des martiens

Emprunté à Glantz SA. Introduction aux biostatistiques. McGraw – Hill, New York, 1996.

Distribution de la taille des martiensDistribution de la taille des martiens

Effectif de la population = 200 sujetsEffectif de la population = 200 sujetsMoyenne de la taille de la population = 40 cmMoyenne de la taille de la population = 40 cmÉcart type de la taille de la population = 5 cmÉcart type de la taille de la population = 5 cm

68%

Emprunté à Glantz SA. Introduction aux biostatistiques. McGraw – Hill, New York, 1996.

Distribution de la taille des martiensDistribution de la taille des martiens

Effectif de la population = 200 sujetsEffectif de la population = 200 sujetsMoyenne de la taille de la population = 40 cmMoyenne de la taille de la population = 40 cmÉcart type de la taille de la population = 5 cmÉcart type de la taille de la population = 5 cm

68%

95%

Cote ZCote Z(ou Score Z)(ou Score Z)

!

µ"=x

Zsd

xxZ

!=

Pour une Population Pour un Échantillon

Cote ZCote Z(ou Score Z)(ou Score Z)

!

µ"=x

Z

5

4046Z

!=

µ = 40 cmσ = 5 cm

Soit Z = 1.2

Emprunté à Vincent WJ. Statistics in kinesiology. Human Kinetics, Champaign, Illinois, 1999.

Emprunté à Vincent WJ. Statistics in kinesiology. Human Kinetics, Champaign, Illinois, 1999.

Plan du coursPlan du cours1.1. La loi normale et lLa loi normale et l’’erreur derreur d’é’échantillonnagechantillonnage

1.1. La loi normaleLa loi normale

2.2. Théorème de la limite centraleThéorème de la limite centrale

3.3. Tests dTests d’’hypothèses et inférence statistiquehypothèses et inférence statistique

4.4. InterprétationInterprétation1.1. Deux types dDeux types d’’erreurerreur

2.2. La puissance dLa puissance d’’un testun test

Population :Population :Groupe de personnes (ou autre) qui ont au moins unecaractéristique en commun.

Définie par deux paramètres : µ et σExemple : hommes âgés de 31 à 40 ans qui ne pratiquent aucune activité physique.Varier genre, âge ou niveau d’activité physique

Échantillon :Échantillon :Groupe de personnes (ou autre) tirées de la population.

Définie par deux statistiques : ξ et SDExemple : réentraînement post-chirurgical du membre inférieur

Emprunté à Glantz SA. Introduction aux biostatistiques. McGraw – Hill, New York, 1996.

PopulationPopulationn = 200µ = 40 cmσ = 5 cm

Échantillon 1n = 10ξ = 41.5 cmSD = 5 cm

Emprunté à Glantz SA. Introduction aux biostatistiques. McGraw – Hill, New York, 1996.

PopulationPopulationn = 200µ = 40 cmσ = 5 cm

Échantillon 2n = 10ξ = 36 cmSD = 5 cm

Emprunté à Glantz SA. Introduction aux biostatistiques. McGraw – Hill, New York, 1996.

PopulationPopulationn = 200µ = 40 cmσ = 5 cm

Échantillon 3n = 10ξ = 39.5 cmSD = 5 cm

Emprunté à Glantz SA. Introduction aux biostatistiques. McGraw – Hill, New York, 1996.

PopulationPopulationn = 200µ = 40 cmσ = 5 cm

1016 possibilitésn = 10ξ = 40 cmSuit loi normale

Théorie de la limite centraleThéorie de la limite centrale

La distribution des moyennes dLa distribution des moyennes d’é’échantillons estchantillons estapproximativement normale, quelle que soit laapproximativement normale, quelle que soit lapopulation à partir de laquelle les échantillonspopulation à partir de laquelle les échantillonssont constitués.sont constitués.

La moyenne de lLa moyenne de l’’ensemble de toutes les moyennesensemble de toutes les moyennesdd’é’échantillons possibles est égale à la moyenne dechantillons possibles est égale à la moyenne dela population.la population.

Plan du coursPlan du cours1.1. La loi normale et lLa loi normale et l’’erreur derreur d’é’échantillonnagechantillonnage

1.1. La loi normaleLa loi normale

2.2. Théorème de la limite centraleThéorème de la limite centrale

3.3. Tests dTests d’’hypothèses et inférence statistiquehypothèses et inférence statistique

4.4. InterprétationInterprétation1.1. Deux types dDeux types d’’erreurerreur

2.2. La puissance dLa puissance d’’un testun test

Hypothèse nulle (notée HHypothèse nulle (notée H00))Il n’existe aucune relation ou aucune différence entre lesgroupes.Exemple : il n’existe pas de différence de force maximale des membresinférieurs entre les garçons et les filles de 10 ans.

Hypothèse alternative (notée HHypothèse alternative (notée H11))Il existe une relation ou une différence entre les groupes.Exemple : il existe une différence de force maximale des membres inférieursentre les garçons et les filles de 10 ans.

Sous Sous H0 :Garçons et filles appartiennent à la même population.Les différences observées sont dues à lLes différences observées sont dues à l’’erreur derreur d’é’échantillonnagechantillonnage

Sous HSous H11 : :Garçons et filles appartiennent à deux populationsdistinctesLes différences observées sont dues à lLes différences observées sont dues à l’’erreur derreur d’é’échantillonnage etchantillonnage età la différence imputable au genreà la différence imputable au genre

QUELLE LIMITE ?QUELLE LIMITE ?

Deux échantillons R1 et F1 : Différence D1.Deux échantillons R1 et F1 : Différence D1.Deux échantillons R2 et F2 : Différence D2.Deux échantillons R2 et F2 : Différence D2.Et ainsi de suite Et ainsi de suite ……

EXEMPLE :EXEMPLE :Consommation annuelle dConsommation annuelle d’’anti-inflammatoires dans deuxanti-inflammatoires dans deuxpopulations différentes (Rugbymen vs Footballeurs)populations différentes (Rugbymen vs Footballeurs)

Rugby vs Footballeurs: mêmepopulation??

R100R….R6R5R4R3R2R1

Dosage(mg)

Rugbymen

F100F….F6F5F4F3F2F1

Dosage(mg)

Footballeurs

D100D….D6D5D4D3D2D1

Dosage(mg)

R-F

Théorie de la limite centraleThéorie de la limite centrale

• La distribution des différences (D1, D2,…, Dn) suit une loi normale

• La moyenne de toutes les différences estégale à la différence moyenne entre lesdeux populations.

Si la population est la même

VALEURS DES DIFFERENCES

FREQUENCES

0

Si la population est differenteProche 0

Emprunté à Vincent WJ. Statistics in kinesiology. Human Kinetics, Champaign, Illinois, 1999.

La différenceentre les deuxpopulations

est nulle

Erreur dErreur d’é’échantillonnagechantillonnage : même s : même s’’il nil n’’y pas de différence entre lesy pas de différence entre lesdeux populations, la probabilité de trouver Z = 0 est très faibledeux populations, la probabilité de trouver Z = 0 est très faible

Existence d’un % d’erreur

HH00HH11HH11

Plan du coursPlan du cours1.1. La loi normale et lLa loi normale et l’’erreur derreur d’é’échantillonnagechantillonnage

1.1. La loi normaleLa loi normale

2.2. Théorème de la limite centraleThéorème de la limite centrale

3.3. Tests dTests d’’hypothèses et inférence statistiquehypothèses et inférence statistique

4.4. InterprétationInterprétation1.1. Deux types dDeux types d’’erreurerreur

2.2. La puissance dLa puissance d’’un testun test

Deux types dDeux types d’’erreur statistiqueerreur statistique

Erreur de type I (ou de première espèce, ou faux positif)Erreur de type I (ou de première espèce, ou faux positif)

LL’’expérimentateur conclue à une différence entre les groupesexpérimentateur conclue à une différence entre les groupesalors qualors qu’’en réalité il nen réalité il n’’y en a pas.y en a pas.

Risque Risque αα (5%, ou 0.05) (5%, ou 0.05)

Erreur de type II (ou de seconde espèce, ou faux négatif)Erreur de type II (ou de seconde espèce, ou faux négatif)

LL’’expérimentateur conclue à lexpérimentateur conclue à l’’absence de différence entre lesabsence de différence entre lesgroupes alors qugroupes alors qu’’en réalité il y en a une.en réalité il y en a une.

Risque Risque ββ (20%, ou 0.20)(20%, ou 0.20)

Erreur deErreur detype IItype II

ConclusionConclusioncorrectecorrecte

HH00 est estacceptéeacceptée

ConclusionConclusioncorrectecorrecte

Erreur deErreur detype Itype I

HH00 est estrejetéerejetée

HH00 est fausse est fausseHH00 est vraie est vraie

RéalitéRéalité

α et β sont déterminés en fonction durisque d’erreur qui est le moins coûteux.

QuQu’’est ce qui est le plus grave : accepterest ce qui est le plus grave : accepterll’’hypothèse nulle alors quhypothèse nulle alors qu’’elle est fausse, ouelle est fausse, ou

la rejeter alors qula rejeter alors qu’’elle est vraie ?elle est vraie ?

Erreur de mesureErreur de mesureββ trop petit (pas assez sujets) trop petit (pas assez sujets)αα trop petit (0.01) trop petit (0.01)Traitement mal appliquéTraitement mal appliqué

Erreur de mesureErreur de mesureÉchantillon non aléatoireÉchantillon non aléatoireαα trop grand (0.10) trop grand (0.10)Biais induit par le chercheurBiais induit par le chercheurUtilisation incorrecte dUtilisation incorrecte d’’ununtest unilatéraltest unilatéral

Type IIType IIType IType ISources dSources d’’erreurerreur

Erreur de mesureErreur de mesureββ trop petit (pas assez sujets) trop petit (pas assez sujets)αα trop petit (0.01) trop petit (0.01)Traitement mal appliquéTraitement mal appliqué

Erreur de mesureErreur de mesureÉchantillon non aléatoireÉchantillon non aléatoireαα trop grand (0.10) trop grand (0.10)Biais induit par le chercheurBiais induit par le chercheurUtilisation incorrecte dUtilisation incorrecte d’’ununtest unilatéraltest unilatéral

Type IIType IIType IType ISources dSources d’’erreurerreur

Erreur de mesureErreur de mesureββ trop petit (pas assez sujets) trop petit (pas assez sujets)αα trop petit (0.01) trop petit (0.01)Traitement mal appliquéTraitement mal appliqué

Erreur de mesureErreur de mesureÉchantillon non aléatoireÉchantillon non aléatoireαα trop grand (0.10) trop grand (0.10)Biais induit par le chercheurBiais induit par le chercheur

Type IIType IIType IType ISources dSources d’’erreurerreur

Erreur de mesureErreur de mesureββ trop petit (pas assez sujets) trop petit (pas assez sujets)αα trop petit (0.01) trop petit (0.01)Traitement mal appliquéTraitement mal appliqué

Erreur de mesureErreur de mesureÉchantillon non aléatoireÉchantillon non aléatoireαα trop grand (0.10) trop grand (0.10)Biais induit par le chercheurBiais induit par le chercheur

Type IIType IIType IType ISources dSources d’’erreurerreur

Plan du coursPlan du cours1.1. La loi normale et lLa loi normale et l’’erreur derreur d’é’échantillonnagechantillonnage

1.1. La loi normaleLa loi normale

2.2. Théorème de la limite centraleThéorème de la limite centrale

3.3. Tests dTests d’’hypothèses et inférence statistiquehypothèses et inférence statistique

4.4. InterprétationInterprétation1.1. Deux types dDeux types d’’erreurerreur

2.2. La puissance dLa puissance d’’un testun test

La puissance dLa puissance d’’un test statistiqueun test statistiqueCapacité de rejeter lCapacité de rejeter l’’hypothèse nulle lorsquhypothèse nulle lorsqu’’elle estelle estfausse (évite de commettre une erreur de type 2)fausse (évite de commettre une erreur de type 2)

Puissance = 1 - Puissance = 1 - ββ (soit 0.80, ou 80%) (soit 0.80, ou 80%)

Paramètres de la puissance :Paramètres de la puissance :

•• la taille de l la taille de l’é’échantillonchantillon

•• l l’’effet minimum recherchéeffet minimum recherché

•• la variabilité du paramètre mesuré la variabilité du paramètre mesuré

•• le risque le risque αα retenu (5%, 0.05) retenu (5%, 0.05)

Intérêt de la puissance statistiqueIntérêt de la puissance statistique

Contrôler le risque de commettre une erreurContrôler le risque de commettre une erreurde type IIde type II

Estimer le nombre de sujets nécessaires pourEstimer le nombre de sujets nécessaires pourgarantir une puissance supérieure ou égale àgarantir une puissance supérieure ou égale à80% (comité d80% (comité d’é’éthique, organismesthique, organismessubventionnaires)subventionnaires)