Laurent Bosquet Université Lille...

39
Méthodologie Méthodologie de la de la recherche recherche Laurent Bosquet Laurent Bosquet Université Lille 2 Université Lille 2

Transcript of Laurent Bosquet Université Lille...

Page 1: Laurent Bosquet Université Lille 2staps.univ-lille2.fr/.../ressources_peda/prepa_kine/correlation.pdf · Plan du cours. 1. La loi normale et l’erreur d’échantillonnage. 2. Comparaison

Méthodologie Méthodologie de la de la

rechercherecherche

Laurent BosquetLaurent Bosquet

Université Lille 2Université Lille 2

Page 2: Laurent Bosquet Université Lille 2staps.univ-lille2.fr/.../ressources_peda/prepa_kine/correlation.pdf · Plan du cours. 1. La loi normale et l’erreur d’échantillonnage. 2. Comparaison

Plan du coursPlan du cours

1.1. La loi normale et l’erreur d’échantillonnageLa loi normale et l’erreur d’échantillonnage

2.2. Comparaison de deux échantillonsComparaison de deux échantillons

3.3. Comparaison de trois échantillons ou plusComparaison de trois échantillons ou plus

4.4. Corrélation et régressionCorrélation et régression

Page 3: Laurent Bosquet Université Lille 2staps.univ-lille2.fr/.../ressources_peda/prepa_kine/correlation.pdf · Plan du cours. 1. La loi normale et l’erreur d’échantillonnage. 2. Comparaison

Plan du coursPlan du cours

Corrélation et RégressionCorrélation et Régression

1.1. Coefficient de corrélation du produit des moments de Coefficient de corrélation du produit des moments de PearsonPearson

2.2. Coefficient de corrélation des rangs de SpearmanCoefficient de corrélation des rangs de Spearman

3.3. RésuméRésumé

4.4. Régression Régression bivariéebivariée

Page 4: Laurent Bosquet Université Lille 2staps.univ-lille2.fr/.../ressources_peda/prepa_kine/correlation.pdf · Plan du cours. 1. La loi normale et l’erreur d’échantillonnage. 2. Comparaison

Coefficient de corrélationCoefficient de corrélation

Indique le degré dIndique le degré d ’association entre deux variables’association entre deux variables

Coefficient numérique compris entre +1 et Coefficient numérique compris entre +1 et --11Corrélation positive (0 < r < 1) : relation proportionnelleCorrélation positive (0 < r < 1) : relation proportionnelle

Corrélation négative (Corrélation négative (--1 < r < 0) : relation inversement proportionnelle1 < r < 0) : relation inversement proportionnelle

N’implique en aucun cas une relation de CAUSE A EFFET

Page 5: Laurent Bosquet Université Lille 2staps.univ-lille2.fr/.../ressources_peda/prepa_kine/correlation.pdf · Plan du cours. 1. La loi normale et l’erreur d’échantillonnage. 2. Comparaison

11èreère étape : étape : PeutPeut--on utiliser le coefficient de corrélation ?on utiliser le coefficient de corrélation ?

•• La relation estLa relation est--elle linéaire ?elle linéaire ?

Vérifier le nuage de pointsVérifier le nuage de points

•• Les valeurs sont elles indépendantes ?Les valeurs sont elles indépendantes ?

Test Test DurbinDurbin WatsonWatson

ou … la logique !ou … la logique !

Page 6: Laurent Bosquet Université Lille 2staps.univ-lille2.fr/.../ressources_peda/prepa_kine/correlation.pdf · Plan du cours. 1. La loi normale et l’erreur d’échantillonnage. 2. Comparaison

fHome

Page 7: Laurent Bosquet Université Lille 2staps.univ-lille2.fr/.../ressources_peda/prepa_kine/correlation.pdf · Plan du cours. 1. La loi normale et l’erreur d’échantillonnage. 2. Comparaison

Variable 1Variable 1 Variable 2Variable 2 Var 1 x Var 2Var 1 x Var 2

11 1212 121222 33 6633 11 3344 2424 969655 2222 11011066 5959 35435477 66 424288 1515 12012099 33 27271010 1717 170170

Page 8: Laurent Bosquet Université Lille 2staps.univ-lille2.fr/.../ressources_peda/prepa_kine/correlation.pdf · Plan du cours. 1. La loi normale et l’erreur d’échantillonnage. 2. Comparaison

Variable 1Variable 1 Variable 2Variable 2 Var 1 x Var 2Var 1 x Var 2

11 1212 121222 33 6633 11 3344 2424 969655 2222 11011066 5959 35435477 66 424288 1515 12012099 33 27271010 1717 170170

r = 0.11r = 0.11

Page 9: Laurent Bosquet Université Lille 2staps.univ-lille2.fr/.../ressources_peda/prepa_kine/correlation.pdf · Plan du cours. 1. La loi normale et l’erreur d’échantillonnage. 2. Comparaison

Variable 1Variable 1 Variable 2Variable 2 Var 1 x Var 2Var 1 x Var 2

11 1212 121222 33 6633 11 3344 2424 969655 2222 11011066 5959 35435477 66 424288 1515 12012099 33 27271010 1717 170170

Page 10: Laurent Bosquet Université Lille 2staps.univ-lille2.fr/.../ressources_peda/prepa_kine/correlation.pdf · Plan du cours. 1. La loi normale et l’erreur d’échantillonnage. 2. Comparaison

Variable 1Variable 1 Variable 2Variable 2 Var 1 x Var 2Var 1 x Var 2

11 1212 121222 33 6633 11 3344 2424 969655 2222 11011066 5959 35435477 66 424288 1515 12012099 33 27271010 1717 170170

r = 0.94r = 0.94

Page 11: Laurent Bosquet Université Lille 2staps.univ-lille2.fr/.../ressources_peda/prepa_kine/correlation.pdf · Plan du cours. 1. La loi normale et l’erreur d’échantillonnage. 2. Comparaison

11èreère étape : étape : PeutPeut--on utiliser le coefficient de corrélation ?on utiliser le coefficient de corrélation ?

•• La relation estLa relation est--elle linéaire ?elle linéaire ?

Vérifier le nuage de pointsVérifier le nuage de points

•• Les valeurs sont elles indépendantes ?Les valeurs sont elles indépendantes ?

Test Test DurbinDurbin WatsonWatson

ou … la logique !ou … la logique !

Page 12: Laurent Bosquet Université Lille 2staps.univ-lille2.fr/.../ressources_peda/prepa_kine/correlation.pdf · Plan du cours. 1. La loi normale et l’erreur d’échantillonnage. 2. Comparaison

22èmeème étape : étape :

Formuler les hypothèses statistiquesFormuler les hypothèses statistiques

Hypothèse Hypothèse nulle (H0)

Il n ’existe pas de relation entre les deux variables

Hypothèse alternative (HHypothèse alternative (H11))

Il existe une relation entre les deux variables

Page 13: Laurent Bosquet Université Lille 2staps.univ-lille2.fr/.../ressources_peda/prepa_kine/correlation.pdf · Plan du cours. 1. La loi normale et l’erreur d’échantillonnage. 2. Comparaison

33èmeème étape : étape :

Choisir le coefficient appropriéChoisir le coefficient approprié

Méthode paramétriqueMéthode paramétrique

Le coefficient de corrélation du produit des moments de Pearson

Méthode non paramétriqueMéthode non paramétrique

Le coefficient de corrélation des rangs de Spearman

Page 14: Laurent Bosquet Université Lille 2staps.univ-lille2.fr/.../ressources_peda/prepa_kine/correlation.pdf · Plan du cours. 1. La loi normale et l’erreur d’échantillonnage. 2. Comparaison

33èmeème étape : étape :

Vérifier la normalité de la distributionVérifier la normalité de la distribution

Test Shapiro Test Shapiro WilkWilk

H0 : la distribution de l’échantillon suit une loi normaleCoefficient de corrélation de Pearson

H1 : la distribution de l’échantillon ne suit pas une loi normaleCoefficient de corrélation de Spearman

Page 15: Laurent Bosquet Université Lille 2staps.univ-lille2.fr/.../ressources_peda/prepa_kine/correlation.pdf · Plan du cours. 1. La loi normale et l’erreur d’échantillonnage. 2. Comparaison

Plan du coursPlan du cours

Corrélation et RégressionCorrélation et Régression

1.1. Coefficient de corrélation du produit des moments de Coefficient de corrélation du produit des moments de PearsonPearson

2.2. Coefficient de corrélation des rangs de SpearmanCoefficient de corrélation des rangs de Spearman

3.3. RésuméRésumé

4.4. Régression Régression bivariéebivariée

Page 16: Laurent Bosquet Université Lille 2staps.univ-lille2.fr/.../ressources_peda/prepa_kine/correlation.pdf · Plan du cours. 1. La loi normale et l’erreur d’échantillonnage. 2. Comparaison

Coefficient de corrélation du produit des Coefficient de corrélation du produit des moments de Pearsonmoments de Pearson

Formule «Formule « moyenne moyenne -- écart typeécart type »»

YX

Y.XnXY

rσσ

−=

22

∑−∑=nn

XX

Page 17: Laurent Bosquet Université Lille 2staps.univ-lille2.fr/.../ressources_peda/prepa_kine/correlation.pdf · Plan du cours. 1. La loi normale et l’erreur d’échantillonnage. 2. Comparaison

Coefficient de corrélation du produit des Coefficient de corrélation du produit des moments de moments de PearsonPearson

Formule «Formule « moyenne moyenne -- écart typeécart type »»

X Y X2 Y2 XY

3 5 9 25 152 7 4 49 14.. .. .. .. ..

∑∑XX ∑∑YY ∑∑XX22 ∑∑YY22 ∑∑XYXY

Page 18: Laurent Bosquet Université Lille 2staps.univ-lille2.fr/.../ressources_peda/prepa_kine/correlation.pdf · Plan du cours. 1. La loi normale et l’erreur d’échantillonnage. 2. Comparaison

Coefficient de corrélation du produit des Coefficient de corrélation du produit des moments de Pearsonmoments de Pearson

Formule «Formule « moyenne moyenne -- écart typeécart type »»

YX

Y.XnXY

rσσ

−=

2

nX

n

2XX

∑−∑=σ

Page 19: Laurent Bosquet Université Lille 2staps.univ-lille2.fr/.../ressources_peda/prepa_kine/correlation.pdf · Plan du cours. 1. La loi normale et l’erreur d’échantillonnage. 2. Comparaison

Table du r de Pearson Table du r de Pearson (Pearson et Hartley, 1966)(Pearson et Hartley, 1966)

ddl = n-2

Page 20: Laurent Bosquet Université Lille 2staps.univ-lille2.fr/.../ressources_peda/prepa_kine/correlation.pdf · Plan du cours. 1. La loi normale et l’erreur d’échantillonnage. 2. Comparaison

Quelle signification clinique ?Quelle signification clinique ?

Il n’existe pas de relation entre les deux variables

Il existe une relation entre les deux variables

Page 21: Laurent Bosquet Université Lille 2staps.univ-lille2.fr/.../ressources_peda/prepa_kine/correlation.pdf · Plan du cours. 1. La loi normale et l’erreur d’échantillonnage. 2. Comparaison

Quelle signification clinique ?Quelle signification clinique ?

Il n’existe pas de relation entre les deux variables

Variance commune

(r2) Il existe une relation entre les deux variables

Page 22: Laurent Bosquet Université Lille 2staps.univ-lille2.fr/.../ressources_peda/prepa_kine/correlation.pdf · Plan du cours. 1. La loi normale et l’erreur d’échantillonnage. 2. Comparaison

Quelle signification clinique ?Quelle signification clinique ?

Variance commune

(r2)

Si 00 < rSi 00 < r22 < 25% (0.0 < r < 0.5) : < 25% (0.0 < r < 0.5) : Très faibleTrès faible

Si 25 < rSi 25 < r22 < 50% (0.5 < r < 0.7) : < 50% (0.5 < r < 0.7) : FaibleFaible

Si 50 < rSi 50 < r22 < 65% (0.7 < r < 0.8) : < 65% (0.7 < r < 0.8) : ModéréModéré

Si 65 < rSi 65 < r22 < 80% (0.8 < r < 0.9) : < 80% (0.8 < r < 0.9) : ÉlevéÉlevé

Si 80 < rSi 80 < r22 < 100% (0.9 < r < 1.0) : < 100% (0.9 < r < 1.0) : Très élevéTrès élevé

Page 23: Laurent Bosquet Université Lille 2staps.univ-lille2.fr/.../ressources_peda/prepa_kine/correlation.pdf · Plan du cours. 1. La loi normale et l’erreur d’échantillonnage. 2. Comparaison

Plan du coursPlan du cours

Corrélation et RégressionCorrélation et Régression

1.1. Coefficient de corrélation du produit des moments de Coefficient de corrélation du produit des moments de PearsonPearson

2.2. Coefficient de corrélation des rangs de SpearmanCoefficient de corrélation des rangs de Spearman

3.3. RésuméRésumé

4.4. Régression Régression bivariéebivariée

Page 24: Laurent Bosquet Université Lille 2staps.univ-lille2.fr/.../ressources_peda/prepa_kine/correlation.pdf · Plan du cours. 1. La loi normale et l’erreur d’échantillonnage. 2. Comparaison

Coefficient de corrélation des rangs de Coefficient de corrélation des rangs de SpearmanSpearman

Classer les sujets selon leur rang pour chacune des deux variablClasser les sujets selon leur rang pour chacune des deux variableses

Sujets Rang Rang Diff. (Diff.)2

Var 1 Var 2

1 5 9 - 4 162 7 4 +3 9.. .. .. .. ..n 12 12 0 0

∑∑(Diff.)(Diff.)2 2 : : XXXX

Page 25: Laurent Bosquet Université Lille 2staps.univ-lille2.fr/.../ressources_peda/prepa_kine/correlation.pdf · Plan du cours. 1. La loi normale et l’erreur d’échantillonnage. 2. Comparaison

Coefficient de corrélation des rangs de Coefficient de corrélation des rangs de SpearmanSpearman

( )1nnD6

1 2

2

−−=ρ ∑

n = taille de l’échantillonn = taille de l’échantillon∑∑ DD22 = somme des différences au carré= somme des différences au carré

Page 26: Laurent Bosquet Université Lille 2staps.univ-lille2.fr/.../ressources_peda/prepa_kine/correlation.pdf · Plan du cours. 1. La loi normale et l’erreur d’échantillonnage. 2. Comparaison

Table du Table du ρρ de Spearman de Spearman (Pearson et Hartley, 1966)(Pearson et Hartley, 1966)

Page 27: Laurent Bosquet Université Lille 2staps.univ-lille2.fr/.../ressources_peda/prepa_kine/correlation.pdf · Plan du cours. 1. La loi normale et l’erreur d’échantillonnage. 2. Comparaison

Quelle signification clinique ?Quelle signification clinique ?

Si 0.0 < Si 0.0 < ρρ < 0.5 : < 0.5 : Très faibleTrès faible

Si 0.5 < Si 0.5 < ρρ < 0.7 : < 0.7 : FaibleFaible

Si 0.7 < Si 0.7 < ρρ < 0.8 : < 0.8 : ModéréModéré

Si 0.8 < Si 0.8 < ρρ < 0.9 : < 0.9 : ÉlevéÉlevé

Si 0.9 < Si 0.9 < ρρ < 1.0 : < 1.0 : Très élevéTrès élevé

Page 28: Laurent Bosquet Université Lille 2staps.univ-lille2.fr/.../ressources_peda/prepa_kine/correlation.pdf · Plan du cours. 1. La loi normale et l’erreur d’échantillonnage. 2. Comparaison

Plan du coursPlan du cours

Corrélation et RégressionCorrélation et Régression

1.1. Coefficient de corrélation du produit des moments de Coefficient de corrélation du produit des moments de PearsonPearson

2.2. Coefficient de corrélation des rangs de SpearmanCoefficient de corrélation des rangs de Spearman

3.3. RésuméRésumé

4.4. Régression Régression bivariéebivariée

Page 29: Laurent Bosquet Université Lille 2staps.univ-lille2.fr/.../ressources_peda/prepa_kine/correlation.pdf · Plan du cours. 1. La loi normale et l’erreur d’échantillonnage. 2. Comparaison

Degré d’association entre deux variables : Degré d’association entre deux variables : le coefficient de corrélationle coefficient de corrélation

STOPSTOP

OUIOUI NONNONLa relation estLa relation est-- elle linéaire ?elle linéaire ?

Les variables sontLes variables sont-- elles elles indépendantes ?indépendantes ?

OUIOUI NONNON

La distribution suitLa distribution suit-- elle une elle une loi normale ?loi normale ?

Signification cliniqueSignification clinique SPEARMANSPEARMANPEARSONPEARSON

Page 30: Laurent Bosquet Université Lille 2staps.univ-lille2.fr/.../ressources_peda/prepa_kine/correlation.pdf · Plan du cours. 1. La loi normale et l’erreur d’échantillonnage. 2. Comparaison

Plan du coursPlan du cours

Corrélation et RégressionCorrélation et Régression

1.1. Coefficient de corrélation du produit des moments de Coefficient de corrélation du produit des moments de PearsonPearson

2.2. Coefficient de corrélation des rangs de SpearmanCoefficient de corrélation des rangs de Spearman

3.3. RésuméRésumé

4.4. Régression Régression bivariéebivariée

Page 31: Laurent Bosquet Université Lille 2staps.univ-lille2.fr/.../ressources_peda/prepa_kine/correlation.pdf · Plan du cours. 1. La loi normale et l’erreur d’échantillonnage. 2. Comparaison

Relation entre la distance (m) et le temps (s)Relation entre la distance (m) et le temps (s)

0

2000

4000

6000

8000

10000

12000

0 250 500 750 1000 1250 1500 1750 2000

Temps (s)

Dist

ance

(m)

1500 m3:26

3000 m7:20

5000 m12:39

10000 m26:22

r = 0.99

Y = a(X) + b Y = distance (m)X = temps (s)a = penteb = ordonnée à l ’origine

Page 32: Laurent Bosquet Université Lille 2staps.univ-lille2.fr/.../ressources_peda/prepa_kine/correlation.pdf · Plan du cours. 1. La loi normale et l’erreur d’échantillonnage. 2. Comparaison

Conditions dConditions d ’utilisation de la ’utilisation de la régression régression bivariéebivariée

•• La relation est elle linéaire ?La relation est elle linéaire ?

•• Les valeurs sont elles indépendantes ?Les valeurs sont elles indépendantes ?

•• La distribution de chaque variable suit La distribution de chaque variable suit elle une loi normale ?elle une loi normale ?

Page 33: Laurent Bosquet Université Lille 2staps.univ-lille2.fr/.../ressources_peda/prepa_kine/correlation.pdf · Plan du cours. 1. La loi normale et l’erreur d’échantillonnage. 2. Comparaison

Régression Régression bivariéebivariée

Valeur 1Valeur 1 Valeur 2Valeur 2

X (temps)X (temps) 206206 759759

Y (distance)Y (distance) 15001500 50005000

1. Calculer la pente1. Calculer la pente

12

12

XXYYPente

−−

=2067591500500033.6

−−

=

Page 34: Laurent Bosquet Université Lille 2staps.univ-lille2.fr/.../ressources_peda/prepa_kine/correlation.pdf · Plan du cours. 1. La loi normale et l’erreur d’échantillonnage. 2. Comparaison

Régression Régression bivariéebivariée

Valeur 1Valeur 1 Valeur 2Valeur 2

X (temps)X (temps) 206206 759759

Y (distance)Y (distance) 15001500 50005000

2. Calculer l’ordonnée à l2. Calculer l’ordonnée à l ’origine’origine

( ) bX33.6Y +=

( ) b75933.65000 +=

Page 35: Laurent Bosquet Université Lille 2staps.univ-lille2.fr/.../ressources_peda/prepa_kine/correlation.pdf · Plan du cours. 1. La loi normale et l’erreur d’échantillonnage. 2. Comparaison

Régression Régression bivariéebivariée

Valeur 1Valeur 1 Valeur 2Valeur 2

X (temps)X (temps) 206206 759759

Y (distance)Y (distance) 15001500 50005000

2. Calculer l’ordonnée à l2. Calculer l’ordonnée à l ’origine’origine

( ) bX33.6Y +=b = 196

( ) b75933.65000 +=

Page 36: Laurent Bosquet Université Lille 2staps.univ-lille2.fr/.../ressources_peda/prepa_kine/correlation.pdf · Plan du cours. 1. La loi normale et l’erreur d’échantillonnage. 2. Comparaison

Régression Régression bivariéebivariée

Valeur 1Valeur 1 Valeur 2Valeur 2

X (temps)X (temps) 206206 759759

Y (distance)Y (distance) 15001500 50005000

3. Établir l’équation de régression linéaire3. Établir l’équation de régression linéaire

( ) 196X33.6Y +=

Page 37: Laurent Bosquet Université Lille 2staps.univ-lille2.fr/.../ressources_peda/prepa_kine/correlation.pdf · Plan du cours. 1. La loi normale et l’erreur d’échantillonnage. 2. Comparaison

Régression Régression bivariéebivariée

Valeur 1Valeur 1 Valeur 2Valeur 2

X (temps)X (temps) 206206 759759

Y (distance)Y (distance) 15001500 50005000

( ) 196X33.6Y +=

Préciser systématiquement :Préciser systématiquement :• les caractéristiques de la population• le coefficient de corrélation• l’erreur de prédiction (erreur type de l’estimé)

Page 38: Laurent Bosquet Université Lille 2staps.univ-lille2.fr/.../ressources_peda/prepa_kine/correlation.pdf · Plan du cours. 1. La loi normale et l’erreur d’échantillonnage. 2. Comparaison

Régression Régression bivariéebivariée

L’erreur type de l’estimé (ETL’erreur type de l’estimé (ETEE))

2YE r1ET −σ=

Page 39: Laurent Bosquet Université Lille 2staps.univ-lille2.fr/.../ressources_peda/prepa_kine/correlation.pdf · Plan du cours. 1. La loi normale et l’erreur d’échantillonnage. 2. Comparaison