Tests de normalité Test de F Tests non paramétriques de comparaison de moyennes Dr Marc Cuggia UMR...

42
Tests de normalité Test de F Tests non paramétriques de comparaison de moyennes Dr Marc Cuggia UMR 936

Transcript of Tests de normalité Test de F Tests non paramétriques de comparaison de moyennes Dr Marc Cuggia UMR...

Page 1: Tests de normalité Test de F Tests non paramétriques de comparaison de moyennes Dr Marc Cuggia UMR 936.

Tests de normalitéTest de F

Tests non paramétriques de comparaison de moyennes

Dr Marc CuggiaUMR 936

Page 2: Tests de normalité Test de F Tests non paramétriques de comparaison de moyennes Dr Marc Cuggia UMR 936.

Rappel Comparaison de moyenne : Test de Z

Condition : Effectifs supérieurs à 30 Si condition non remplie alors :

Test de T (student) Conditions :

Distributions des populations d'où sont issues les échantillons doivent être normale

Tests de normalité (Test de Shapiro, Test de kolmogorov-smirnoff)

Les variances des deux populations d'où sont issus les échantillons doivent être égales. (Leur rapport <3)

Test d'homoscedasticité (test de F)

Page 3: Tests de normalité Test de F Tests non paramétriques de comparaison de moyennes Dr Marc Cuggia UMR 936.

Et sinon ?

Si Petit effectif

et

pas de normalité et/ou pas d'homoscedasiticité

alors

Tests non paramétriques

Mann et witney

Wilcoxon

Page 4: Tests de normalité Test de F Tests non paramétriques de comparaison de moyennes Dr Marc Cuggia UMR 936.

Test de normalité

Exemple : Tour de poitrines de soldats écossais en

pouces Données :

taille frequence33 334 1835 8136 18537 42038 74939 107340 107941 93442 65843 37044 9245 5046 2147 448 1

33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48

0

200

400

600

800

1000

1200

Page 5: Tests de normalité Test de F Tests non paramétriques de comparaison de moyennes Dr Marc Cuggia UMR 936.

Test de Kolmogorov-Smirnov

HypothèseHo : La distribution étudiée est distribution normaleH1 : La distribution étudiée n’est pas normale Ici p<0,000 => l’hypothèse Ho est rejettée : La distribution n’est pas normale

Page 6: Tests de normalité Test de F Tests non paramétriques de comparaison de moyennes Dr Marc Cuggia UMR 936.

Test de Shapiro en 9 étapes1.Classer les diffrentes valeurs de la série par ordre croissant

2.Calculer S2 tel que

3.Calculer m

4.Calculer les differences respectives tel que

5.d1=Xn-X1;d2=X(n-1)-X2 etc... dn

6.A chacune des differences, on affecte un coéfficient a, avec n nombre de difference

7.Calculer la quantité b tel que

8.Calculer le rapport W

9.Comparer W calculé à W tabulé avec le nombre n de données

S 2=∑ x i− y i

b=∑ a id iW= b

2

S 2

Page 7: Tests de normalité Test de F Tests non paramétriques de comparaison de moyennes Dr Marc Cuggia UMR 936.

SHAPIRO WILK La méthode développée par Shapiro-Wilk est

dans bien des cas, la plus puissante, en particulier lorsque l’échantillon provient d’une distribution asymétrique.

Cette méthode implique l’emploi de tables, actuellement calculées pour une taille d’échantillon comprise entre 5 et 50. (5 ≤ n ≤ 50)

Comme dans tout autre test, il faudra déterminer à l’avance un risque de rejeter l’hypothèse nulle alors que celle-ci est vraie (α).

Page 8: Tests de normalité Test de F Tests non paramétriques de comparaison de moyennes Dr Marc Cuggia UMR 936.

Étapes de réalisation du test de Shapiro-Wilk

Étape 1

Classer les n observations par ordre de grandeur croissante :

Étape 2

Calculer la Somme des Carrés des Écarts:

Page 9: Tests de normalité Test de F Tests non paramétriques de comparaison de moyennes Dr Marc Cuggia UMR 936.

Étape 3 Calculer les différences :

Si n est pair il y aura alors n/2 différences. Si n est impair il y aura alors (n-1)/2 différences,

l’observation médiane ne sera pas utilisée.

Page 10: Tests de normalité Test de F Tests non paramétriques de comparaison de moyennes Dr Marc Cuggia UMR 936.

Étape 4 Calculer :

Les coefficients ai sont donnés dans une table en fonction de n et i .

Page 11: Tests de normalité Test de F Tests non paramétriques de comparaison de moyennes Dr Marc Cuggia UMR 936.

Étape 5 Calculer :

Page 12: Tests de normalité Test de F Tests non paramétriques de comparaison de moyennes Dr Marc Cuggia UMR 936.

Étape 6 Comparer W à W1-α,n

W1-α,n est trouvé dans la table de Shapiro-Wilk en fonction du risque d’erreur α et de la taille de l’échantillon (le nombre d’observations) n

On peut écrire P() = 1- α Finalement, si W < W1-α,n la distribution ne suit pas une loi

normale si W ≥ W1-α,n la distribution suit une loi normale

Page 13: Tests de normalité Test de F Tests non paramétriques de comparaison de moyennes Dr Marc Cuggia UMR 936.

exercice

Exemple : On a fait des essais de fatigue sur un certain biomatériau utilisé dans les prothèses d’épaule (nombre de cycles avant rupture) et on a obtenu la série suivante :

31, 39, 62, 89, 115, 125, 140, 225, 251, 270, 342, 400, 442, 580, 850.

Peut-on conclure avec un risque d’erreur de 5% (niveau de confiance 95%) que ces données proviennent d’une distribution suivant une loi normale?

Page 14: Tests de normalité Test de F Tests non paramétriques de comparaison de moyennes Dr Marc Cuggia UMR 936.

Étape 1 : On place les données en ordre croissant :

31, 39, 62, 89, 115, 125, 140, 225, 251, 270, 342, 400, 442, 580, 850

Page 15: Tests de normalité Test de F Tests non paramétriques de comparaison de moyennes Dr Marc Cuggia UMR 936.

Étape 2 : On calcule la somme des carrés des écarts

Page 16: Tests de normalité Test de F Tests non paramétriques de comparaison de moyennes Dr Marc Cuggia UMR 936.

Étape 3 : On calcule les différences di

Page 17: Tests de normalité Test de F Tests non paramétriques de comparaison de moyennes Dr Marc Cuggia UMR 936.

Étape 4 : On calcule la valeur de b Pour ce calcul nous avons besoins des

coefficients ai de la table Shapiro-Wilk pour n = 15.

Page 18: Tests de normalité Test de F Tests non paramétriques de comparaison de moyennes Dr Marc Cuggia UMR 936.

Étape 5 : On calcule

Page 19: Tests de normalité Test de F Tests non paramétriques de comparaison de moyennes Dr Marc Cuggia UMR 936.

Étape 6 : On compare W à W1-α,n Avec α=5% et n = 15 on trouvera dans la table

le W95%,15= 0,881

Puisque 0,876<0,881 on a donc W < W1-α,n et par le fait même, la distribution ne suit pas une loi normale avec un risque d’erreur de 5%.

Page 20: Tests de normalité Test de F Tests non paramétriques de comparaison de moyennes Dr Marc Cuggia UMR 936.

Exercice à faire

1,08 7,68 8,28 8,23 7,63 11,74 10,30 11,72 12,87 9,02

Page 21: Tests de normalité Test de F Tests non paramétriques de comparaison de moyennes Dr Marc Cuggia UMR 936.

No1 Oui la distribution de la quantité de minéraux suit une loi normale

W=0,9278

Page 22: Tests de normalité Test de F Tests non paramétriques de comparaison de moyennes Dr Marc Cuggia UMR 936.

n 2 3 4 5 6 7 8 9 10J

1 0.7071 0.7071 0.6872 0.6646 0.6431 0.6233 0.6052 0.5888 0.57392 0.0000 0.1677 0.2413 0.2806 0.3031 0.3164 0.3244 0.32913 0.0000 0.0875 0.1401 0.1743 0.1976 0.21414 0.0000 0.0561 0.0947 0.12245 0.0000 0.0399

n 11 12 13 14 15 16 17 18 19 20J

1 0.5601 0.5475 0.5359 0.5251 0.5150 0.5056 0.4963 0.4886 0.4808 0.47342 0.3315 0.3325 0.3325 0.3318 0.3306 0.3290 0.3273 0.3253 0.3232 0.32113 0.2260 0.2347 0.2412 0.2460 0.2495 0.2521 0.2540 0.2553 0.2561 0.25654 0.1429 0.1586 0.1707 0.1802 0.1878 0.1939 0.1988 0.2027 0.2059 0.20855 0.0695 0.0922 0.1099 0.1240 0.1353 0.1447 0.1524 0.1587 0.1641 0.16866 0.0000 0.0303 0.0539 0.0727 0.0880 0.1005 0.1109 0.1197 0.1271 0.13347 0.0000 0.0240 0.0433 0.0593 0.0725 0.0837 0.0932 0.10138 0.0000 0.0196 0.0359 0.0496 0.0612 0.07119 0.0000 0.0163 0.0303 0.0422

10 0.0000 0.0140

n 21 22 23 24 25 26 27 28 29 30J

1 0.4643 0.4590 0.4542 0.4493 0.4450 0.4407 0.4366 0.4328 0.4291 0.42542 0.3185 0.3156 0.3126 0.3098 0.3069 0.3043 0.3018 0.2992 0.2968 0.29443 0.2578 0.2571 0.2563 0.2554 0.2543 0.2533 0.2522 0.2510 0.2499 0.24874 0.2119 0.2131 0.2139 0.2145 0.2148 0.2151 0.2152 0.2151 0.2150 0.21485 0.1736 0.1764 0.1787 0.1807 0.1822 0.1836 0.1848 0.1857 0.1064 0.18706 0.1399 0.1443 0.1480 0.1512 0.1539 0.1563 0.1584 0.1601 0.1616 0.16307 0.1092 0.1150 0.1201 0.1245 0.1283 0.1316 0.1346 0.1372 0.1395 0.14158 0.0804 0.0878 0.0941 0.0997 0.1046 0.1089 0.1128 0.1162 0.1192 0.12199 0.0530 0.0618 0.0696 0.0764 0.0823 0.0876 0.0923 0.0965 0.1002 0.1036

10 0.0263 0.0368 0.0459 0.0539 0.0610 0.0672 0.0728 0.0778 0.0822 0.086211 0.0000 0.0122 0.0228 0.0321 0.0403 0.0476 0.0540 0.0598 0.0650 0.069712 0.0000 0.0107 0.0200 0.0284 0.0358 0.0424 0.0483 0.053713 0.0000 0.0094 0.0178 0.0253 0.0320 0.038114 0.0000 0.0084 0.0159 0.022715 0.0000 0.0076

  

                                         

 

                                       

 

                                       

Page 23: Tests de normalité Test de F Tests non paramétriques de comparaison de moyennes Dr Marc Cuggia UMR 936.

N W ‘99%’10 0.842 0.78111 0.850 0.79212 0.859 0.80513 0.856 0.81414 0.874 0.82515 0.881 0.83516 0.837 0.84417 0.892 0.85118 0.897 0.85819 0.901 0.86320 0.905 0.86821 0.908 0.87322 0.911 0.87823 0.914 0.88124 0.916 0.88425 0.918 0.88826 0.920 0.89127 0.923 0.89428 0.924 0.89629 0.926 0.89830 0.927 0.90031 0.929 0.90232 0.930 0.90433 0.931 0.90634 0.933 0.90835 0.934 0.91036 0.935 0.91237 0.936 0.91438 0.938 0.91639 0.939 0.91740 0.940 0.91941 0.941 0.92042 0.942 0.92243 0.943 0.92344 0.944 0.92445 0.945 0.92646 0.945 0.92747 0.946 0.92848 0.947 0.92949 0.947 0.92950 0.947 0.930

W  ‘95%’

Page 24: Tests de normalité Test de F Tests non paramétriques de comparaison de moyennes Dr Marc Cuggia UMR 936.

Au travail :

Soit l'échantillon suivant.

Déterminez grace à la méthode de shapiro si la population d'où est issu l'échantillon est normale.

Patient 1 2 3 4 5 6Glycémie 2 1,7 2,5 3 2,3 4

Page 25: Tests de normalité Test de F Tests non paramétriques de comparaison de moyennes Dr Marc Cuggia UMR 936.

Test de comparaison des variancestest de F

test de fisher snedecor

Page 26: Tests de normalité Test de F Tests non paramétriques de comparaison de moyennes Dr Marc Cuggia UMR 936.

Test d’égalité des variances Test de Fisher-Senecor Utilisé pour comparer les variances de 2 séries de variable quantitatives Lorsqu’on veut vérifier les conditions d’applications de certains tests paramétriques qui

exigent une HOMOSEDASTICITE Variables : quantitatives Paramètre: variances Tailles des échantillons : indifférentes Séries étudiées : indépendantes

Ho : σ21= σ2

2

H1 : bilateral σ21=/= σ2

2 ET unilateral σ21> σ2

2 ou σ21<σ2

2

Avec σ21 et σ2

2 les variances des deux populations dont sont issus les échantillons

s21 et s2

2: les variances des deux échantillons à comparer

n1 et n2 les effectifs des deux échantillons k1 et k2 : les degrés de libertés pour chaque échantillons

Conditions d’applications : les distributions doivent être normales dans les deux populations d’où proviennent les deux échantillons

Page 27: Tests de normalité Test de F Tests non paramétriques de comparaison de moyennes Dr Marc Cuggia UMR 936.

Principe du test : on teste le rapport F des deux variances s2

1 et s22, en nommant la s2

1 la variance la plus élevée.

Sous l’hypothèse nulle, ce rapport F est peut different de 1 et les fluctuations d’échantillonage suivent une loi de Fisher.

1ket 1k avec 221122

21 nns

sF

Page 28: Tests de normalité Test de F Tests non paramétriques de comparaison de moyennes Dr Marc Cuggia UMR 936.

H1 F Rejet Ho Interprétation

bilatérale <F2,5% Non σ21 ne diffère pas significativement de σ2

2

>= F2,5% Oui σ21 diffère significativement de σ2

2

unilatérale <F5% Non σ21 ne diffère pas significativement de σ2

2

>= F5% Oui Une variance des deux séries est significativement proportionnellement plus grande à l’autre

Page 29: Tests de normalité Test de F Tests non paramétriques de comparaison de moyennes Dr Marc Cuggia UMR 936.

On désire comparer la PAD d’un groupe de sujets sains (m=70,1) et d’une groupe de sujets atteints de drépanocytose (m=61,8).

On dispose que de 20 individus par groupe. La variance de la PAD est respectivement de

116,7 et de 47,6. Peut on comparer ces moyennes ?

Page 30: Tests de normalité Test de F Tests non paramétriques de comparaison de moyennes Dr Marc Cuggia UMR 936.

En raison du faible effectif des groupe, on réalise un test de T. Ce test nécessite une homoscédasticité des populations à comparer. On test l’égalité des variances avec un test de F

Ho : les 2 variances ne sont pas différentes H1 : les deux variances diffèrent.

F=116,7/47,6 = 2,45 avec k1=k2=20-1=19 On lit la table F2,5% : elle ne donne pas la valeur pour 19 mais pour 20

(F2,5%=2,46).

La valeur de F trouvée est inférieure à ce seuil: On ne rejette pas Ho, et on admet que les variances sont identiques. On peut donc réaliser un test de student

Page 31: Tests de normalité Test de F Tests non paramétriques de comparaison de moyennes Dr Marc Cuggia UMR 936.
Page 32: Tests de normalité Test de F Tests non paramétriques de comparaison de moyennes Dr Marc Cuggia UMR 936.

Test non paramétriques

Test de Mann Whitney : Utilisé pour comparer deux séries

indépendantes ou appariées d’une variables quantitative

On ne s’intéresse pas aux valeurs mais aux rangs des valeurs après les avoir ordonnées

Le test ne nécessite aucune condition d’application,

Page 33: Tests de normalité Test de F Tests non paramétriques de comparaison de moyennes Dr Marc Cuggia UMR 936.

Le test de et Mann-Whitney (ou test U)

séries indépendantes Variables : quantitatives Grandeur étudiées: rangs des valeurs Séries étudiées : indépendantes Ho :

Distributions superposées H1 :

bilatérale : distributions décalées Unilatérale : distributions décalées dans un sens ou

dans un autre Nota : pour les séries appariées, on utilise

le test de wilcoxon

Page 34: Tests de normalité Test de F Tests non paramétriques de comparaison de moyennes Dr Marc Cuggia UMR 936.

Étapes du test : Détermination du rang des valeurs

Il faut classer toutes les observations des deux séries selon leurs valeurs, de la première à la nième, et numéroter leurs valeurs.

Cela définit le rang de chaque observation Lorsque deux valeurs sont identiques, on calcule leur rang moyen ex-aequo

Calculer w1 = somme des rangs d’une série (la plus courte) Calculer la somme attendue des rangs

wa= n1(N+1)/2

Calculer la variance de w1

sw12=n1n2(N+1)/12

Calculer

- 21

1

w

a

s

wwz

Page 35: Tests de normalité Test de F Tests non paramétriques de comparaison de moyennes Dr Marc Cuggia UMR 936.

H1 Z Rejet Ho Interprétation

bilatérale <1,96 Non Les distribution ne sont pas significativement décalées

>=1,96 Oui Les distribution sont significativement décalées

unilatérale <1,65 Non Les distribution ne sont pas significativement décalées

>1,65 Oui Les distributions sont décalées dans un sens donné

Page 36: Tests de normalité Test de F Tests non paramétriques de comparaison de moyennes Dr Marc Cuggia UMR 936.
Page 37: Tests de normalité Test de F Tests non paramétriques de comparaison de moyennes Dr Marc Cuggia UMR 936.
Page 38: Tests de normalité Test de F Tests non paramétriques de comparaison de moyennes Dr Marc Cuggia UMR 936.
Page 39: Tests de normalité Test de F Tests non paramétriques de comparaison de moyennes Dr Marc Cuggia UMR 936.
Page 40: Tests de normalité Test de F Tests non paramétriques de comparaison de moyennes Dr Marc Cuggia UMR 936.
Page 41: Tests de normalité Test de F Tests non paramétriques de comparaison de moyennes Dr Marc Cuggia UMR 936.
Page 42: Tests de normalité Test de F Tests non paramétriques de comparaison de moyennes Dr Marc Cuggia UMR 936.

Réferences

Thierry Ancelle. Statistique – Epidémiologie chez Maloine

Jean Bouyer : Méthodes statistiques : médecine-biologie chez ESTEM