Laurent Bosquet Université Lille...
Transcript of Laurent Bosquet Université Lille...
Méthodologie Méthodologie de la de la
rechercherecherche
Laurent BosquetLaurent Bosquet
Université Lille 2Université Lille 2
Plan du coursPlan du cours
1.1. La loi normale et l’erreur d’échantillonnageLa loi normale et l’erreur d’échantillonnage
2.2. Comparaison de deux échantillonsComparaison de deux échantillons
3.3. Comparaison de trois échantillons ou plusComparaison de trois échantillons ou plus
4.4. Corrélation et régressionCorrélation et régression
Plan du coursPlan du cours
Corrélation et RégressionCorrélation et Régression
1.1. Coefficient de corrélation du produit des moments de Coefficient de corrélation du produit des moments de PearsonPearson
2.2. Coefficient de corrélation des rangs de SpearmanCoefficient de corrélation des rangs de Spearman
3.3. RésuméRésumé
4.4. Régression Régression bivariéebivariée
Coefficient de corrélationCoefficient de corrélation
Indique le degré dIndique le degré d ’association entre deux variables’association entre deux variables
Coefficient numérique compris entre +1 et Coefficient numérique compris entre +1 et --11Corrélation positive (0 < r < 1) : relation proportionnelleCorrélation positive (0 < r < 1) : relation proportionnelle
Corrélation négative (Corrélation négative (--1 < r < 0) : relation inversement proportionnelle1 < r < 0) : relation inversement proportionnelle
N’implique en aucun cas une relation de CAUSE A EFFET
11èreère étape : étape : PeutPeut--on utiliser le coefficient de corrélation ?on utiliser le coefficient de corrélation ?
•• La relation estLa relation est--elle linéaire ?elle linéaire ?
Vérifier le nuage de pointsVérifier le nuage de points
•• Les valeurs sont elles indépendantes ?Les valeurs sont elles indépendantes ?
Test Test DurbinDurbin WatsonWatson
ou … la logique !ou … la logique !
fHome
Variable 1Variable 1 Variable 2Variable 2 Var 1 x Var 2Var 1 x Var 2
11 1212 121222 33 6633 11 3344 2424 969655 2222 11011066 5959 35435477 66 424288 1515 12012099 33 27271010 1717 170170
Variable 1Variable 1 Variable 2Variable 2 Var 1 x Var 2Var 1 x Var 2
11 1212 121222 33 6633 11 3344 2424 969655 2222 11011066 5959 35435477 66 424288 1515 12012099 33 27271010 1717 170170
r = 0.11r = 0.11
Variable 1Variable 1 Variable 2Variable 2 Var 1 x Var 2Var 1 x Var 2
11 1212 121222 33 6633 11 3344 2424 969655 2222 11011066 5959 35435477 66 424288 1515 12012099 33 27271010 1717 170170
Variable 1Variable 1 Variable 2Variable 2 Var 1 x Var 2Var 1 x Var 2
11 1212 121222 33 6633 11 3344 2424 969655 2222 11011066 5959 35435477 66 424288 1515 12012099 33 27271010 1717 170170
r = 0.94r = 0.94
11èreère étape : étape : PeutPeut--on utiliser le coefficient de corrélation ?on utiliser le coefficient de corrélation ?
•• La relation estLa relation est--elle linéaire ?elle linéaire ?
Vérifier le nuage de pointsVérifier le nuage de points
•• Les valeurs sont elles indépendantes ?Les valeurs sont elles indépendantes ?
Test Test DurbinDurbin WatsonWatson
ou … la logique !ou … la logique !
22èmeème étape : étape :
Formuler les hypothèses statistiquesFormuler les hypothèses statistiques
Hypothèse Hypothèse nulle (H0)
Il n ’existe pas de relation entre les deux variables
Hypothèse alternative (HHypothèse alternative (H11))
Il existe une relation entre les deux variables
33èmeème étape : étape :
Choisir le coefficient appropriéChoisir le coefficient approprié
Méthode paramétriqueMéthode paramétrique
Le coefficient de corrélation du produit des moments de Pearson
Méthode non paramétriqueMéthode non paramétrique
Le coefficient de corrélation des rangs de Spearman
33èmeème étape : étape :
Vérifier la normalité de la distributionVérifier la normalité de la distribution
Test Shapiro Test Shapiro WilkWilk
H0 : la distribution de l’échantillon suit une loi normaleCoefficient de corrélation de Pearson
H1 : la distribution de l’échantillon ne suit pas une loi normaleCoefficient de corrélation de Spearman
Plan du coursPlan du cours
Corrélation et RégressionCorrélation et Régression
1.1. Coefficient de corrélation du produit des moments de Coefficient de corrélation du produit des moments de PearsonPearson
2.2. Coefficient de corrélation des rangs de SpearmanCoefficient de corrélation des rangs de Spearman
3.3. RésuméRésumé
4.4. Régression Régression bivariéebivariée
Coefficient de corrélation du produit des Coefficient de corrélation du produit des moments de Pearsonmoments de Pearson
Formule «Formule « moyenne moyenne -- écart typeécart type »»
YX
Y.XnXY
rσσ
−=
∑
22
∑−∑=nn
XX
Xσ
Coefficient de corrélation du produit des Coefficient de corrélation du produit des moments de moments de PearsonPearson
Formule «Formule « moyenne moyenne -- écart typeécart type »»
X Y X2 Y2 XY
3 5 9 25 152 7 4 49 14.. .. .. .. ..
∑∑XX ∑∑YY ∑∑XX22 ∑∑YY22 ∑∑XYXY
Coefficient de corrélation du produit des Coefficient de corrélation du produit des moments de Pearsonmoments de Pearson
Formule «Formule « moyenne moyenne -- écart typeécart type »»
YX
Y.XnXY
rσσ
−=
∑
2
nX
n
2XX
∑−∑=σ
Table du r de Pearson Table du r de Pearson (Pearson et Hartley, 1966)(Pearson et Hartley, 1966)
ddl = n-2
Quelle signification clinique ?Quelle signification clinique ?
Il n’existe pas de relation entre les deux variables
Il existe une relation entre les deux variables
Quelle signification clinique ?Quelle signification clinique ?
Il n’existe pas de relation entre les deux variables
Variance commune
(r2) Il existe une relation entre les deux variables
Quelle signification clinique ?Quelle signification clinique ?
Variance commune
(r2)
Si 00 < rSi 00 < r22 < 25% (0.0 < r < 0.5) : < 25% (0.0 < r < 0.5) : Très faibleTrès faible
Si 25 < rSi 25 < r22 < 50% (0.5 < r < 0.7) : < 50% (0.5 < r < 0.7) : FaibleFaible
Si 50 < rSi 50 < r22 < 65% (0.7 < r < 0.8) : < 65% (0.7 < r < 0.8) : ModéréModéré
Si 65 < rSi 65 < r22 < 80% (0.8 < r < 0.9) : < 80% (0.8 < r < 0.9) : ÉlevéÉlevé
Si 80 < rSi 80 < r22 < 100% (0.9 < r < 1.0) : < 100% (0.9 < r < 1.0) : Très élevéTrès élevé
Plan du coursPlan du cours
Corrélation et RégressionCorrélation et Régression
1.1. Coefficient de corrélation du produit des moments de Coefficient de corrélation du produit des moments de PearsonPearson
2.2. Coefficient de corrélation des rangs de SpearmanCoefficient de corrélation des rangs de Spearman
3.3. RésuméRésumé
4.4. Régression Régression bivariéebivariée
Coefficient de corrélation des rangs de Coefficient de corrélation des rangs de SpearmanSpearman
Classer les sujets selon leur rang pour chacune des deux variablClasser les sujets selon leur rang pour chacune des deux variableses
Sujets Rang Rang Diff. (Diff.)2
Var 1 Var 2
1 5 9 - 4 162 7 4 +3 9.. .. .. .. ..n 12 12 0 0
∑∑(Diff.)(Diff.)2 2 : : XXXX
Coefficient de corrélation des rangs de Coefficient de corrélation des rangs de SpearmanSpearman
( )1nnD6
1 2
2
−−=ρ ∑
n = taille de l’échantillonn = taille de l’échantillon∑∑ DD22 = somme des différences au carré= somme des différences au carré
Table du Table du ρρ de Spearman de Spearman (Pearson et Hartley, 1966)(Pearson et Hartley, 1966)
Quelle signification clinique ?Quelle signification clinique ?
Si 0.0 < Si 0.0 < ρρ < 0.5 : < 0.5 : Très faibleTrès faible
Si 0.5 < Si 0.5 < ρρ < 0.7 : < 0.7 : FaibleFaible
Si 0.7 < Si 0.7 < ρρ < 0.8 : < 0.8 : ModéréModéré
Si 0.8 < Si 0.8 < ρρ < 0.9 : < 0.9 : ÉlevéÉlevé
Si 0.9 < Si 0.9 < ρρ < 1.0 : < 1.0 : Très élevéTrès élevé
Plan du coursPlan du cours
Corrélation et RégressionCorrélation et Régression
1.1. Coefficient de corrélation du produit des moments de Coefficient de corrélation du produit des moments de PearsonPearson
2.2. Coefficient de corrélation des rangs de SpearmanCoefficient de corrélation des rangs de Spearman
3.3. RésuméRésumé
4.4. Régression Régression bivariéebivariée
Degré d’association entre deux variables : Degré d’association entre deux variables : le coefficient de corrélationle coefficient de corrélation
STOPSTOP
OUIOUI NONNONLa relation estLa relation est-- elle linéaire ?elle linéaire ?
Les variables sontLes variables sont-- elles elles indépendantes ?indépendantes ?
OUIOUI NONNON
La distribution suitLa distribution suit-- elle une elle une loi normale ?loi normale ?
Signification cliniqueSignification clinique SPEARMANSPEARMANPEARSONPEARSON
Plan du coursPlan du cours
Corrélation et RégressionCorrélation et Régression
1.1. Coefficient de corrélation du produit des moments de Coefficient de corrélation du produit des moments de PearsonPearson
2.2. Coefficient de corrélation des rangs de SpearmanCoefficient de corrélation des rangs de Spearman
3.3. RésuméRésumé
4.4. Régression Régression bivariéebivariée
Relation entre la distance (m) et le temps (s)Relation entre la distance (m) et le temps (s)
0
2000
4000
6000
8000
10000
12000
0 250 500 750 1000 1250 1500 1750 2000
Temps (s)
Dist
ance
(m)
1500 m3:26
3000 m7:20
5000 m12:39
10000 m26:22
r = 0.99
Y = a(X) + b Y = distance (m)X = temps (s)a = penteb = ordonnée à l ’origine
Conditions dConditions d ’utilisation de la ’utilisation de la régression régression bivariéebivariée
•• La relation est elle linéaire ?La relation est elle linéaire ?
•• Les valeurs sont elles indépendantes ?Les valeurs sont elles indépendantes ?
•• La distribution de chaque variable suit La distribution de chaque variable suit elle une loi normale ?elle une loi normale ?
Régression Régression bivariéebivariée
Valeur 1Valeur 1 Valeur 2Valeur 2
X (temps)X (temps) 206206 759759
Y (distance)Y (distance) 15001500 50005000
1. Calculer la pente1. Calculer la pente
12
12
XXYYPente
−−
=2067591500500033.6
−−
=
Régression Régression bivariéebivariée
Valeur 1Valeur 1 Valeur 2Valeur 2
X (temps)X (temps) 206206 759759
Y (distance)Y (distance) 15001500 50005000
2. Calculer l’ordonnée à l2. Calculer l’ordonnée à l ’origine’origine
( ) bX33.6Y +=
( ) b75933.65000 +=
Régression Régression bivariéebivariée
Valeur 1Valeur 1 Valeur 2Valeur 2
X (temps)X (temps) 206206 759759
Y (distance)Y (distance) 15001500 50005000
2. Calculer l’ordonnée à l2. Calculer l’ordonnée à l ’origine’origine
( ) bX33.6Y +=b = 196
( ) b75933.65000 +=
Régression Régression bivariéebivariée
Valeur 1Valeur 1 Valeur 2Valeur 2
X (temps)X (temps) 206206 759759
Y (distance)Y (distance) 15001500 50005000
3. Établir l’équation de régression linéaire3. Établir l’équation de régression linéaire
( ) 196X33.6Y +=
Régression Régression bivariéebivariée
Valeur 1Valeur 1 Valeur 2Valeur 2
X (temps)X (temps) 206206 759759
Y (distance)Y (distance) 15001500 50005000
( ) 196X33.6Y +=
Préciser systématiquement :Préciser systématiquement :• les caractéristiques de la population• le coefficient de corrélation• l’erreur de prédiction (erreur type de l’estimé)
Régression Régression bivariéebivariée
L’erreur type de l’estimé (ETL’erreur type de l’estimé (ETEE))
2YE r1ET −σ=