Stat Descriptive1

of 25 /25
Pr. BOUAITI 30/09/2015 Pr. BOUAITI ([email protected]) 1 BIOSTATISTIQUE Pr E. BOUAITI UPR Médecine sociale UNIVERSITE MOHAMMED V - RABAT FACULTE DE MEDECINE ET DE PHARMACIE Programme 1. Principes de base en Biostatistiques 2. La statistique descriptive 3. Organisation et Présentation des données 4. Estimation et fluctuations d’échantillonnage 5. Les principales lois de probabilité 6. Principes des tests statistiques 7. Les tests de comparaison de pourcentages 8. Les tests de comparaison de moyennes 2 Pr. BOUAITI ([email protected]) 30/09/2015 Programme 1. Principes de base en Biostatistiques 2. La statistique descriptive 3. Organisation et Présentation des données 4. Estimation et fluctuations d’échantillonnage 5. Les principales lois de probabilité 6. Principes des tests statistiques 7. Les tests de comparaison de pourcentages 8. Les tests de comparaison de moyennes 3 Pr. BOUAITI ([email protected]) 30/09/2015

description

h

Transcript of Stat Descriptive1

Page 1: Stat Descriptive1

Pr. BOUAITI 30/09/2015

Pr. BOUAITI ([email protected]) 1

BIOSTATISTIQUE

Pr E. BOUAITIUPR Médecine sociale

UNIVERSITE MOHAMMED V - RABATFACULTE DE MEDECINE ET DE PHARMACIE

Programme

1. Principes de base en Biostatistiques2. La statistique descriptive3. Organisation et Présentation des données4. Estimation et fluctuations d’échantillonnage5. Les principales lois de probabilité6. Principes des tests statistiques 7. Les tests de comparaison de pourcentages8. Les tests de comparaison de moyennes

2Pr. BOUAITI ([email protected])30/09/2015

Programme

1. Principes de base en Biostatistiques2. La statistique descriptive3. Organisation et Présentation des données4. Estimation et fluctuations d’échantillonnage5. Les principales lois de probabilité6. Principes des tests statistiques 7. Les tests de comparaison de pourcentages8. Les tests de comparaison de moyennes

3Pr. BOUAITI ([email protected])30/09/2015

Page 2: Stat Descriptive1

Pr. BOUAITI 30/09/2015

Pr. BOUAITI ([email protected]) 2

La Statistique Descriptive

Plan

• Définition• Rappels• Statistique descriptive : Variable qualitative• Statistique descriptive : Variable quantitative• Statistique à deux dimensions• Conclusion

30/09/2015 Pr. BOUAITI ([email protected]) 5

La Statistique DescriptiveDéfinition

• C’est l'ensemble des méthodes et techniques permettant de– Présenter– Décrire – et Résumerdes données nombreuses et variées.

30/09/2015 Pr. BOUAITI ([email protected]) 6

Page 3: Stat Descriptive1

Pr. BOUAITI 30/09/2015

Pr. BOUAITI ([email protected]) 3

La Statistique DescriptiveDéfinition

• Peut concerner :– Une variable à la fois : statistique à une

dimension– Deux variables à la fois : statistique à deux

dimensions– Plus de deux variables à la fois : statistique

multidimensionnelle.

30/09/2015 Pr. BOUAITI ([email protected]) 7

La Statistique DescriptiveDéfinition

• Décrire les données par – Des paramètres statistiques :

• Réduction des données à quelques valeurs numériques caractéristiques.

– Des tableaux : distributions de fréquences.

– Des diagrammes : graphiques.

30/09/2015 Pr. BOUAITI ([email protected]) 8

Pour la bien mener il faut savoir de quelle type de variable s’agit-il

Plan

• Définition• Rappels• Statistique descriptive : Variable qualitative• Statistique descriptive : Variable quantitative• Statistique à deux dimensions• Conclusion

30/09/2015 Pr. BOUAITI ([email protected]) 9

Page 4: Stat Descriptive1

Pr. BOUAITI 30/09/2015

Pr. BOUAITI ([email protected]) 4

Rappels : Base de données

Nom Situation de famille

Nombre d’enfants

Age sexe

Patient 1 Marié 2 30 M

Patient 2 Veuf 3 45 M

Patiente 3 Mariée 0 27 F

Patiente 4 Célibataire 0 32 F

Patient 5 Marié 1 39 M

…. …. …. …. ….

Le nombre d'individus étant généralement grand, une telle série brute est difficilement lisible et interprétable. Il est indispensable de la résumer.

30/09/2015 Pr. BOUAITI ([email protected]) 10

Exemple : base de donnéesN°patient Prénom Circonstances delaiconsultation Sexe Age Annee orig_vil Dur_hosj type_brul ATCD

15 Sanae phlyctène : henné F 20 2 008 19 2 2208 Zineb liq_chd même jour F 20 2 004 21 0 2125 Fatima flam_gaz dans la semaine F 21 2 006 45 0 262 Fatima Zahra flamme même jour F 23 2 007 Kenitra 14 0 2

135 Maguat flamme F 24 2 006 Mauritanie 110 0 290 Mahjouba liq_chd après un mois F 24 2 006 Temara 12 0 2

223 Loubna flamme dans la semaine F 26 2 004 Casa Blanca 10 0 1252 Fatima Zahra liq_chd même jour F 26 2 009 Rabat 22 0 118 Fatima ex_bo_gz même jour F 26 2 008 Taounate 21 0 249 Houda dans la semaine F 27 2 007 Kenitra 21 0 258 Hanane ex_bo_gz dans la semaine F 27 2 007 Taounate 30 0 211 Najat liq_chd après une semaine F 27 2 008 Salé 14 0 1

234 Hadhoum liq_chd même jour F 28 2 004 Rabat 5 0 2197 Rahma flam_gaz même jour F 28 2 005 88 0 240 Halima liq_chd F 29 2 008 Kenitra 9 0 250 Amina liq_chd dans la semaine F 29 2 007 Kenitra 13 0 2

330 Saida flam_gaz dans la semaine F 30 2 010 Midelt 62 0 2255 Zinba ex_bo_gz même jour F 30 2 009 Tadla 69 0 2274 Kaoutar liq_chd après une semaine F 30 2 009 7 0 1102 Khadija flam_gaz même jour F 31 2 006 Khemissat 50 0 2250 touriya liq_chd dans la semaine F 32 2 009 Salé 35 0 1336 Fatima flamme même jour F 32 2 010 Tiflet 92 0 2241 Touria flamme même jour F 32 2 004 13 0 1133 Fatima Zahra ex_bo_gz après une semaine F 32 2 006 Eljadida 0 1142 Fatima flamme dans la semaine F 34 2 005 24 0 2149 Najat liq_chd F 34 2 005 52 0 2140 Hassna ex_bo_gz même jour F 35 2 005 Méknés 9 0 2283 Achoura ex_bo_gz même jour F 35 2 009 Tiflet 93 0 2103 Lekheila flamme dans la semaine F 36 2 006 Mauritanie 27 0 2296 Amina liq_chd après une semaine F 36 2 010 Agadir 21 0 2

30/09/2015 Pr. BOUAITI ([email protected]) 11

Rappels : variables

Variables

Variables qualitatives

DichotomiquesBinaires

Ordinales

Nominales

Variables quantitatives

Continues

Discrètes

30/09/2015 Pr. BOUAITI ([email protected]) 12

Observables

Mesurables

- Couleur-Ville d’origine

-Niveaud’étude

-Taille-Poids

-Nombredepatients

- Sexe

Page 5: Stat Descriptive1

Pr. BOUAITI 30/09/2015

Pr. BOUAITI ([email protected]) 5

Plan

• Définition• Rappels• Statistique descriptive : Variable qualitative• Statistique descriptive : Variable quantitative• Statistique à deux dimensions• Conclusion

30/09/2015 Pr. BOUAITI ([email protected]) 13

Statistique descriptiveVariable qualitative

Variables

Variables qualitatives

DichotomiquesBinaires

Ordinales

Nominales

Variables quantitatives

Continues

Discrètes

30/09/2015 Pr. BOUAITI ([email protected]) 14

Observables

Mesurables

- Sexe

- Couleur-Ville d’origine

-Niveaud’étude

-Taille-Poids

-Nombredepatients

Statistique descriptiveVariable qualitative

• Un caractère qualitatif ne peut être mesuré • D’où notion de fréquence

• Fréquence absolue : effectif• Nombre d’individus par classe : n– 100 sujets: 24 ont la maladie x

• Fréquences relatives• Pour chaque classe, le rapport de son effectif au

nombre total d’individus • Exprimées en pourcentage– p = : 0,24 ou 24 %

30/09/2015 Pr. BOUAITI ([email protected]) 15

Page 6: Stat Descriptive1

Pr. BOUAITI 30/09/2015

Pr. BOUAITI ([email protected]) 6

Statistiques descriptivesvariables qualitatives

16

xini fi

x1 n1 f1

x2 n2 f2

… … …xp np fp

S1p xi n 1

Chaque ligne correspond à une modalité différente.

ni correspond au nombre d’observations (effectif) ayant comme valeur xi

fi correspond à la fréquence (pourcentage) d’observations ayant comme valeur xi

100nnf i

i X

30/09/2015 Pr. BOUAITI ([email protected])

Statistiques descriptivesvariables qualitatives

• On a noté la situation familiale des 150 patients d’une étude

Nom Situation de famille

Patient 1 Marié

Patient 2 Veuf

Patiente 3 Mariée

Patiente 4 Célibataire

Patient 5 Divorcé

…. ….

30/09/2015 Pr. BOUAITI ([email protected]) 17

Statistiques descriptivesvariables qualitatives

Modalités Effectifs (n)

Marié 80

Célibataire 30

Veuf 20

Divorcé 20

Total 150

30/09/2015 Pr. BOUAITI ([email protected]) 18

Page 7: Stat Descriptive1

Pr. BOUAITI 30/09/2015

Pr. BOUAITI ([email protected]) 7

Statistiques descriptivesvariables qualitatives

Modalités Effectifs (n) Pourcentage

Marié 80 53,3%

Célibataire 30 20%

Veuf 20 13,3%

Divorcé 20 13,3%

Total 150 100%

30/09/2015 Pr. BOUAITI ([email protected]) 19

Statistiques descriptivesvariables qualitatives

20

Sexe n %

Masculin 70 58,3%

Féminin 50 41,7%

Total 120 100%30/09/2015 Pr. BOUAITI ([email protected])

Statistiques descriptivesvariables quantitatives continues

21

Classe d'âge ni %[14-16[ 10 9,1%

[16-18[ 20 18,2%

[18-20[ 35 31,8%

[20-22[ 15 13,6%

[22-24[ 5 4,5%

>24 25 22,7%

Total 110 100,0%

30/09/2015 Pr. BOUAITI ([email protected])

Page 8: Stat Descriptive1

Pr. BOUAITI 30/09/2015

Pr. BOUAITI ([email protected]) 8

Plan

• Définition• Rappels• Statistique descriptive : Variable qualitative• Statistique descriptive : Variable quantitative• Statistique à deux dimensions• Conclusion

30/09/2015 Pr. BOUAITI ([email protected]) 22

Statistique descriptiveVariable qualitative

Variables

Variables qualitatives

DichotomiquesBinaires

Ordinales

Nominales

Variables quantitatives

Continues

Discrètes

30/09/2015 Pr. BOUAITI ([email protected]) 23

Observables

Mesurables

- Sexe

- Couleur-Ville d’origine

-Niveaud’étude

-Taille-Poids

-Nombredepatients

Statistiques descriptivesvariables quantitatives

• Paramètres de position : Mesures de la tendance centrale

• Paramètres de dispersion

2430/09/2015 Pr. BOUAITI ([email protected])

Position

Dispersion

Page 9: Stat Descriptive1

Pr. BOUAITI 30/09/2015

Pr. BOUAITI ([email protected]) 9

Paramètres de position

• Moyenne arithmétique

• Médiane

• Mode

2530/09/2015 Pr. BOUAITI ([email protected])

Moyenne arithmétique

26

• La somme de toutes les valeurs individuelles divisée par le nombre de valeurs

푚 =∑ 푥푖푛

• Avec : – n : nombre d’observations – xi : les valeurs de la variable– ∑ 푥푖: la somme de toutes les valeurs

observées.

30/09/2015 Pr. BOUAITI ([email protected])

Moyenne arithmétiqueExemple

27

• Exemple: Calculer la moyenne des valeurs suivantes : 10, 12, 18, 20, 25, 35

풎 = ∑ 풙풊풏풊 ퟏ풏

= ퟏퟎ ퟏퟐ ퟏퟖ ퟐퟎ ퟐퟓ ퟑퟓퟔ

= ퟏퟐퟎퟔ

= ퟐퟎ

30/09/2015 Pr. BOUAITI ([email protected])

Page 10: Stat Descriptive1

Pr. BOUAITI 30/09/2015

Pr. BOUAITI ([email protected]) 10

Moyenne arithmétiquedonnées groupées

Tranches d’âge Nombre (ni)

[10-20[ 4[20-30[ 6[30-40[ 10[40-50[ 4[50-60[ 4[60-70[ 2

Total (n) 30

2830/09/2015 Pr. BOUAITI ([email protected])

Moyenne arithmétiquedonnées groupées

29

• Si les observations sont groupées en classes, alors

푚 =∑ 푛푖푥푖

푛• ni : le nombre de sujets pour la classe xi • xi : la valeur centrale de la classe

30/09/2015 Pr. BOUAITI ([email protected])

Moyenne arithmétiquedonnées groupées

Tranches d’âge Nombre (ni)Valeur centrale

(xi)ni x xi

[10-20[ 4 15 60[20-30[ 6 25 150[30-40[ 10 35 350[40-50[ 4 45 180[50-60[ 4 55 220[60-70[ 2 65 130

Total (n) 30 1090

30

풎 = ∑ 풏풊풙풊풏풊 ퟏ

풏= 1090/30=36,3

30/09/2015 Pr. BOUAITI ([email protected])

Page 11: Stat Descriptive1

Pr. BOUAITI 30/09/2015

Pr. BOUAITI ([email protected]) 11

Paramètres de position

• Moyenne arithmétique

• Médiane

• Mode

3130/09/2015 Pr. BOUAITI ([email protected])

Médiane

32

• La médiane est la valeur qui divise les observations en 2 groupes de taille égale :– Le premier contenant les valeurs inférieures à la

médiane – Et le second les valeurs supérieures à la médiane

La valeur qui partage la série en 2 parties de même effectif (ordre croissant+++)

30/09/2015 Pr. BOUAITI ([email protected])

Médianeexemples

• 9 patients hospitalisés dans un service de médecine. Leurs durées de séjour (en jours) sont les suivantes :

3; 15; 23; 46; 64; 126; 279; 623; 1350

• La médiane est la valeur de rang 5 : 64j

30/09/2015 Pr. BOUAITI ([email protected]) 33

n=3 n=3

Page 12: Stat Descriptive1

Pr. BOUAITI 30/09/2015

Pr. BOUAITI ([email protected]) 12

Médiane

34

• Méthode de calcul– Classer les valeurs par ordre de grandeur

(ascendante ou descendante). – Identifier le milieu de la série de valeurs :

• Place de la valeur médiane =

Avec N = Nombre total de valeurs dans la série de valeurs.

– Le chiffre se trouvant à cette place dans la série de valeurs correspond à la médiane.

30/09/2015 Pr. BOUAITI ([email protected])

Médianeexemples

• Médiane d’un nombre impair de données 10, 12, 18, 20, 25

– Ranger les valeurs en ordre ascendant : 10, 12, 18, 20, 25

– Déterminer le point central de la série : (5 valeurs +1)/ 2 = 3.

– La médiane est donc la valeur en 3ème position dans la série

– La 3ème valeur est 18. – La médiane équivaut donc à 18.

3530/09/2015 Pr. BOUAITI ([email protected])

Médianeexemples

• Médiane d’un nombre pair de données 10, 12, 18, 20, 25, 45

– Ranger les valeurs en ordre ascendant : 10, 12, 18, 20, 25, 45

– Déterminer le point central de la série (6 valeurs+1)/2 = 7/2 = 3,5.

– La médiane est la valeur à mi-chemin entre le 3ème

et le 4ème chiffre : Le 3ème chiffre est 18 et le 4ème

est 20. – La médiane est (18+20)/2 = 19.

3630/09/2015 Pr. BOUAITI ([email protected])

Page 13: Stat Descriptive1

Pr. BOUAITI 30/09/2015

Pr. BOUAITI ([email protected]) 13

Moyenne - Médiane

30/09/2015 Pr. BOUAITI ([email protected]) 37

Série de valeurs:

10, 12, 18, 20, 25

10, 12, 18, 20, 25, 45

Moyenne Médiane

17 18

21,7 19

La moyenne est sensible aux valeurs extrêmes

La médiane est insensible aux valeurs extrêmes

Paramètres de position

• Moyenne arithmétique

• Médiane

• Mode

3830/09/2015 Pr. BOUAITI ([email protected])

Mode

• La valeur que l’on observe le plus fréquemment dans une série de valeurs.

• Exemple 1 : Le mode des valeurs 10, 12, 12, 12, 18, 18, 20, 25, 35 est 12

• Exemple 2 : La série 10, 12, 12, 12, 18, 18, 18, 20, 25, 35 à 2 modes, 12 et 18

3930/09/2015 Pr. BOUAITI ([email protected])

Page 14: Stat Descriptive1

Pr. BOUAITI 30/09/2015

Pr. BOUAITI ([email protected]) 14

Mode

30/09/2015 Pr. BOUAITI ([email protected]) 40

45 98 150 203 256 309 361 414 467 519 572Créatinine (µmol/l)

0

40

80

120

N

2.1 3.3 4.6 5.8 7.0 8.3 9.5 10.8 12.0 13.3 14.5Glycémie (mmol/l)

0

50

100

150

200

250

NDistribution unimodale Distribution bimodale

• Si distribution unimodale, symétrique– les 3 coïncident

-4 -2 0 2 4

0.0

0.1

0.2

0.3

0.4

ddp

Mode = Médiane = Moyenne

18 22 23 25 27

Mode, médiane, moyenne

4130/09/2015 Pr. BOUAITI ([email protected])

• Si distribution asymétriqueà droite à gauche

mode < médiane < moyenne moyenne < médiane < mode

02468

101214161820

1 2 3 4 5 6 7 8 9

PSA (ng/l)

%

Médiane

Moyenne

Mode

2 4 6 8 10Notes

Histogramme

Mode

MédianeMoyenne

Mode, médiane, moyenne

4230/09/2015 Pr. BOUAITI ([email protected])

Page 15: Stat Descriptive1

Pr. BOUAITI 30/09/2015

Pr. BOUAITI ([email protected]) 15

Statistiques descriptivesvariables quantitatives

• Paramètres de position : Mesures de la tendance centrale

• Paramètres de dispersion

4330/09/2015 Pr. BOUAITI ([email protected])

Position

Dispersion

Paramètres de dispersion

• Étendue

• Les quartiles

• La variance

• Écart-type

4430/09/2015 Pr. BOUAITI ([email protected])

Étendue

• L’étendue indique la distance entre la plus grande et la plus petite valeur observée dans la distribution.

Étendue = valeur maximale - valeur minimale

• Exemple : – Une série : 10, 12, 18, 20, 25, 35– Étendue : 10 à 35.

4530/09/2015 Pr. BOUAITI ([email protected])

Page 16: Stat Descriptive1

Pr. BOUAITI 30/09/2015

Pr. BOUAITI ([email protected]) 16

Étendue

0

20

40

60

80100

120

140

160

180

200

Nom

bre

0 100 200 300 400 500 600 700 800 900 1000Créatinine J PBR

Histogramme

Valeur min = 45µmol/l

Valeur max = 939 µmol/l

Etendue = 894 µmol/l

Valeur min = 45µmol/l

Valeur max = 572 µmol/l

Etendue = 527 µmol/l

0

20

40

60

80

100

120

140

Nom

bre

0 100 200 300 400 500 600 700 800 900Créatinine J PBR

Histogramme

4630/09/2015 Pr. BOUAITI ([email protected])

Paramètres de dispersion

• Étendue

• Les quartiles

• La variance

• Écart-type

4730/09/2015 Pr. BOUAITI ([email protected])

Les quartiles

Ce sont des valeurs (Q1, Q2, Q3) qui séparent l’échantillon en 4 parties qui contiennent le

même nombre de données.

30/09/2015 Pr. BOUAITI ([email protected]) 48

25%

Quart 1 Quart 2 Quart 3 Quart 4

25% 25%25%

Page 17: Stat Descriptive1

Pr. BOUAITI 30/09/2015

Pr. BOUAITI ([email protected]) 17

Les quartiles

• Le premier quartile ou le quartile inférieur Q1 = 25 % des valeurs sont inférieures à Q1 et 75 % lui sont supérieures

• Le troisième quartile ou le quartile supérieur Q3 = 75 % des valeurs sont inférieures à Q3 et 25 % lui sont supérieures

• La médiane = le deuxième quartile Q2

4930/09/2015 Pr. BOUAITI ([email protected])

Les quartiles

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

3 4 4 5 5 5 6 6 6 6 8 8 10 12 15

30/09/2015 Pr. BOUAITI ([email protected]) 50

Médiane de la distribution (15+1)/2 = 8e donnée

Q2

Q1Q3

Médiane des données précédent Q2

Médiane des données qui suivent Q2

Quart 1 Quart 2 Quart 3 Quart 4

Les quartilesexemple

• Données ordonnées : 10, 12, 18, 20, 25, 45• Médiane Q2: (20 + 18)/2 = 19• Quartile inférieur Q1:

– la médiane de 10, 12, 18 = 12

• Quartile supérieur Q3: – la médiane de 20, 25, 45 = 25

5130/09/2015 Pr. BOUAITI ([email protected])

Page 18: Stat Descriptive1

Pr. BOUAITI 30/09/2015

Pr. BOUAITI ([email protected]) 18

Paramètres de dispersion

• Étendue

• Les quartiles

• La variance

• Écart-type

5230/09/2015 Pr. BOUAITI ([email protected])

La variance

• La variance : – La moyenne des carrés des écarts à la moyenne– La somme des carrés des écarts à la moyenne

divisée par le nombre d'observations

풔ퟐ =∑ (푥푖 − 푚)2푛푖

푛 − 1

5330/09/2015 Pr. BOUAITI ([email protected])

La varianceméthode de calcul

• Calculer la moyenne m• Calculer la différence entre chaque

observation et la moyenne (xi - m) • Porter chacune de ces différences au carré

(xi - m)2

• Additionner tous ces carrés et diviser la somme des carrés par le nombre d’observations moins 1 (n -1)

5430/09/2015 Pr. BOUAITI ([email protected])

Page 19: Stat Descriptive1

Pr. BOUAITI 30/09/2015

Pr. BOUAITI ([email protected]) 19

La varianceexemple

• Calculer la variance s2 : 10, 12, 18, 20, 25, 35– Calculer la moyenne : m=20

Observations xi 10 12 18 20 25 35

Différence à la moyenne

xi- 20-10 -8 -2 0 +5 +15

Carré de la différence à la

moyenne100 64 4 0 25 225

55

– Calculer la somme des carrés de la différence à la moyenne : 100+64+4+0+25+225=418

– Diviser la somme des carrés par n -1 soit : = 83,630/09/2015 Pr. BOUAITI ([email protected])

Paramètres de dispersion

• Étendue

• Les quartiles

• La variance

• Écart-type

5630/09/2015 Pr. BOUAITI ([email protected])

Écart-type

• Mesure la dispersion autour de m• La mesure de dispersion la plus couramment

utilisée• = Standard Deviation (SD)• Calcul

30/09/2015 Pr. BOUAITI ([email protected]) 57

푆퐷 =∑ (푥푖 − 푚)2푛푖푛 − 1 s =

Page 20: Stat Descriptive1

Pr. BOUAITI 30/09/2015

Pr. BOUAITI ([email protected]) 20

Écart-type

Représente l ’écart moyen des données de l’échantillon par rapport à la moyenne

30/09/2015 Pr. BOUAITI ([email protected]) 58

m

x1x2

x4

x5

x6x7x9

x10

x11

x12

x8

x3

Écart-type

Représente l ’écart moyen des données de l’échantillon par rapport à la moyenne

30/09/2015 Pr. BOUAITI ([email protected]) 59

m=20

10

18

1220

35

25

Écart-type

• En pratique :– Calculer la variance – Puis prendre la racine carrée du résultat obtenu

• Exemple : calculer l’écart-type de la série de 6 valeurs : 10, 12, 18, 20, 25, 35– On calcul la variance : s2 =83,6– Puis l’écart-type est la racine carrée du résultat

obtenu := 83,6 = 9,14

30/09/2015 Pr. BOUAITI ([email protected]) 60

Page 21: Stat Descriptive1

Pr. BOUAITI 30/09/2015

Pr. BOUAITI ([email protected]) 21

61

La signification probabiliste de l’écart-type

m

Echantillon 1 Echantillon 2

s2 < s1

s2

s1

30/09/2015 Pr. BOUAITI ([email protected])

La signification probabiliste de l’écart-type

62

50 % des individus en-dessous de la moyenne et 50 % au-dessus 68 % des individus entre µ-1σ et µ+1σ

95 % des individus entre µ-1,96σ et µ+1,96σ99,7 % des individus entre µ -3σ et µ+3σ

95 % des individus entre µ-1,96σ et µ+1,96σ

30/09/2015 Pr. BOUAITI ([email protected])

La signification probabiliste de l’écart-type

• Exemple : Chez le sujet adulte non diabétique• La glycémie est distribuée selon une loi normale• Moyenne : 0,86 g/L• Écart - type 0,07 g/L

63

95 % des sujets « normaux » de cette population ont une glycémie comprise

entre 0,72 et 1,00 g/L30/09/2015 Pr. BOUAITI ([email protected])

95 % des individus entre µ-1,96σ et µ+1,96σ

Page 22: Stat Descriptive1

Pr. BOUAITI 30/09/2015

Pr. BOUAITI ([email protected]) 22

Plan

• Définition• Rappels• Statistique descriptive : Variable qualitative• Statistique descriptive : Variable quantitative• Statistique à deux dimensions• Conclusion

30/09/2015 Pr. BOUAITI ([email protected]) 64

Statistique descriptive à 2 dimensions

• Objectif : mettre en évidence les relations qui existent entre deux séries d'observations.– Nature des variables : les deux variables peuvent

être • Qualitatives• Quantitatives • Ou l'une quantitative et l'autre qualitative.

– Deux variables mesurées chez le même individu• Exemples :

– Présence d’un cancer et tabagisme...– Poids et taille

30/09/2015 Pr. BOUAITI ([email protected]) 65

Statistique descriptive à 2 dimensionsdeux variables qualitatives

Sujet Cancer Tabac1 oui oui2 oui oui3 non non4 oui oui5 oui oui6 oui non7 oui non8 oui oui9 non oui

10 non Oui… … …

30/09/2015 Pr. BOUAITI ([email protected]) 66

Canceroui non total

Tabacoui 40 20 60non 10 30 40total 50 50 100

• Distribution de fréquences : tables de contingence.

Page 23: Stat Descriptive1

Pr. BOUAITI 30/09/2015

Pr. BOUAITI ([email protected]) 23

Statistique descriptive à 2 dimensionsdeux variables qualitatives

30/09/2015 Pr. BOUAITI ([email protected]) 67

Canceroui non total

Tabacoui 40 20 60non 10 30 40total 50 50 100

Nombre de mesures totale : n

Effectif d'une case = nij

Total de chaque ligne = li

Total de chaque colonne = cj

Statistique descriptive à 2 dimensionsdeux variables qualitatives

• 100 = Nombre total de mesures.• 50 = Nombre d'individus ayant

un cancer.• 60= Nombre d'individus sont

fumeurs.• 40 / 100 = % d'individus

fumeurs ayant un cancer.• 40 / 60 = % d'individus parmi les

fumeurs ayant un cancer. • 40 / 50 = % d'individus parmi les

malades ayant un cancer qui sont des fumeurs.

30/09/2015 Pr. BOUAITI ([email protected]) 68

Canceroui non total

Tabacoui 40 20 60non 10 30 40total 50 50 100

Recherche de facteurs de risques

Recherche de facteurs de risques

Cancer du poumon et tabagisme• Fréquences relatives : Risques

30/09/2015 Pr. BOUAITI ([email protected]) 69

Canceroui non total

Tabacoui 40 20 60non 10 30 40total 50 50 100

• Cancer chez les fumeurs: • R1 = 40/60 = 0,70

• Cancer chez les non fumeurs: • R0 = 10/40 = 0,25

Page 24: Stat Descriptive1

Pr. BOUAITI 30/09/2015

Pr. BOUAITI ([email protected]) 24

Recherche de facteurs de risques

• Risque relatif : – Le rapport du risque chez les exposés (R1) sur le

risque des non exposés (R0).– RR = R1/R0 = 0,7/0,25 =2,8

• Odds ratio (OR) ou rapport de cotes:– Cote (Odds) :

• Chez les fumeurs : R1/(1-R1) = 2,33• Chez les non fumeurs : R0/(1-R0) = 0,33

– OR = 2,33/0,33 = 730/09/2015 Pr. BOUAITI ([email protected]) 70

Statistique descriptive à 2 dimensionsdeux variables quantitatives

patient Age (ans) taille (cm)1 21 1692 24 1883 25 1624 22 1615 19 1806 21 1897 24 1848 22 1519 22 175

10 21 162… … …

30/09/2015 Pr. BOUAITI ([email protected]) 71

Statistique descriptive à 2 dimensionsdeux variables quantitatives

• Coefficient de corrélation linéaire (ρ ou r)

• COV (X,Y) = moyenne des produits des écarts à la moyenne

30/09/2015 Pr. BOUAITI ([email protected]) 72

VAR(Y)VAR(X)Y)COV(X,

,

YX

Page 25: Stat Descriptive1

Pr. BOUAITI 30/09/2015

Pr. BOUAITI ([email protected]) 25

Coefficient de corrélation linéaire

• Mesure l'intensité de la liaison linéaire entre X et Y• Le coefficient de corrélation varie entre -1 et 1. • 0 signifie une association nulle• Le signe correspond à la direction de la corrélation.

– Quand les deux valeurs augmentent ou diminuent ensemble il s'agit d'une corrélation positive.

– Quand une valeur augmente alors que l'autre diminue il s'agit d'une corrélation négative

• |ρx,y| Proche de 1 RELATION LINEAIRE entre les variables

30/09/2015 Pr. BOUAITI ([email protected]) 73

Exemple

30/09/2015 Pr. BOUAITI ([email protected]) 74

Conclusion

• La statistique descriptive– Première étape d’études épidémiologiques– Obligatoire

• Variable qualitative– Effectif & Pourcentage

• Variable quantitative– Moyenne ± écart- type– Médiane et quartiles

30/09/2015 Pr. BOUAITI ([email protected]) 75