Pr. BOUAITI 30/09/2015
Pr. BOUAITI ([email protected]) 1
BIOSTATISTIQUE
Pr E. BOUAITIUPR Médecine sociale
UNIVERSITE MOHAMMED V - RABATFACULTE DE MEDECINE ET DE PHARMACIE
Programme
1. Principes de base en Biostatistiques2. La statistique descriptive3. Organisation et Présentation des données4. Estimation et fluctuations d’échantillonnage5. Les principales lois de probabilité6. Principes des tests statistiques 7. Les tests de comparaison de pourcentages8. Les tests de comparaison de moyennes
2Pr. BOUAITI ([email protected])30/09/2015
Programme
1. Principes de base en Biostatistiques2. La statistique descriptive3. Organisation et Présentation des données4. Estimation et fluctuations d’échantillonnage5. Les principales lois de probabilité6. Principes des tests statistiques 7. Les tests de comparaison de pourcentages8. Les tests de comparaison de moyennes
3Pr. BOUAITI ([email protected])30/09/2015
Pr. BOUAITI 30/09/2015
Pr. BOUAITI ([email protected]) 2
La Statistique Descriptive
Plan
• Définition• Rappels• Statistique descriptive : Variable qualitative• Statistique descriptive : Variable quantitative• Statistique à deux dimensions• Conclusion
30/09/2015 Pr. BOUAITI ([email protected]) 5
La Statistique DescriptiveDéfinition
• C’est l'ensemble des méthodes et techniques permettant de– Présenter– Décrire – et Résumerdes données nombreuses et variées.
30/09/2015 Pr. BOUAITI ([email protected]) 6
Pr. BOUAITI 30/09/2015
Pr. BOUAITI ([email protected]) 3
La Statistique DescriptiveDéfinition
• Peut concerner :– Une variable à la fois : statistique à une
dimension– Deux variables à la fois : statistique à deux
dimensions– Plus de deux variables à la fois : statistique
multidimensionnelle.
30/09/2015 Pr. BOUAITI ([email protected]) 7
La Statistique DescriptiveDéfinition
• Décrire les données par – Des paramètres statistiques :
• Réduction des données à quelques valeurs numériques caractéristiques.
– Des tableaux : distributions de fréquences.
– Des diagrammes : graphiques.
30/09/2015 Pr. BOUAITI ([email protected]) 8
Pour la bien mener il faut savoir de quelle type de variable s’agit-il
Plan
• Définition• Rappels• Statistique descriptive : Variable qualitative• Statistique descriptive : Variable quantitative• Statistique à deux dimensions• Conclusion
30/09/2015 Pr. BOUAITI ([email protected]) 9
Pr. BOUAITI 30/09/2015
Pr. BOUAITI ([email protected]) 4
Rappels : Base de données
Nom Situation de famille
Nombre d’enfants
Age sexe
Patient 1 Marié 2 30 M
Patient 2 Veuf 3 45 M
Patiente 3 Mariée 0 27 F
Patiente 4 Célibataire 0 32 F
Patient 5 Marié 1 39 M
…. …. …. …. ….
Le nombre d'individus étant généralement grand, une telle série brute est difficilement lisible et interprétable. Il est indispensable de la résumer.
30/09/2015 Pr. BOUAITI ([email protected]) 10
Exemple : base de donnéesN°patient Prénom Circonstances delaiconsultation Sexe Age Annee orig_vil Dur_hosj type_brul ATCD
15 Sanae phlyctène : henné F 20 2 008 19 2 2208 Zineb liq_chd même jour F 20 2 004 21 0 2125 Fatima flam_gaz dans la semaine F 21 2 006 45 0 262 Fatima Zahra flamme même jour F 23 2 007 Kenitra 14 0 2
135 Maguat flamme F 24 2 006 Mauritanie 110 0 290 Mahjouba liq_chd après un mois F 24 2 006 Temara 12 0 2
223 Loubna flamme dans la semaine F 26 2 004 Casa Blanca 10 0 1252 Fatima Zahra liq_chd même jour F 26 2 009 Rabat 22 0 118 Fatima ex_bo_gz même jour F 26 2 008 Taounate 21 0 249 Houda dans la semaine F 27 2 007 Kenitra 21 0 258 Hanane ex_bo_gz dans la semaine F 27 2 007 Taounate 30 0 211 Najat liq_chd après une semaine F 27 2 008 Salé 14 0 1
234 Hadhoum liq_chd même jour F 28 2 004 Rabat 5 0 2197 Rahma flam_gaz même jour F 28 2 005 88 0 240 Halima liq_chd F 29 2 008 Kenitra 9 0 250 Amina liq_chd dans la semaine F 29 2 007 Kenitra 13 0 2
330 Saida flam_gaz dans la semaine F 30 2 010 Midelt 62 0 2255 Zinba ex_bo_gz même jour F 30 2 009 Tadla 69 0 2274 Kaoutar liq_chd après une semaine F 30 2 009 7 0 1102 Khadija flam_gaz même jour F 31 2 006 Khemissat 50 0 2250 touriya liq_chd dans la semaine F 32 2 009 Salé 35 0 1336 Fatima flamme même jour F 32 2 010 Tiflet 92 0 2241 Touria flamme même jour F 32 2 004 13 0 1133 Fatima Zahra ex_bo_gz après une semaine F 32 2 006 Eljadida 0 1142 Fatima flamme dans la semaine F 34 2 005 24 0 2149 Najat liq_chd F 34 2 005 52 0 2140 Hassna ex_bo_gz même jour F 35 2 005 Méknés 9 0 2283 Achoura ex_bo_gz même jour F 35 2 009 Tiflet 93 0 2103 Lekheila flamme dans la semaine F 36 2 006 Mauritanie 27 0 2296 Amina liq_chd après une semaine F 36 2 010 Agadir 21 0 2
30/09/2015 Pr. BOUAITI ([email protected]) 11
Rappels : variables
Variables
Variables qualitatives
DichotomiquesBinaires
Ordinales
Nominales
Variables quantitatives
Continues
Discrètes
30/09/2015 Pr. BOUAITI ([email protected]) 12
Observables
Mesurables
- Couleur-Ville d’origine
-Niveaud’étude
-Taille-Poids
-Nombredepatients
- Sexe
Pr. BOUAITI 30/09/2015
Pr. BOUAITI ([email protected]) 5
Plan
• Définition• Rappels• Statistique descriptive : Variable qualitative• Statistique descriptive : Variable quantitative• Statistique à deux dimensions• Conclusion
30/09/2015 Pr. BOUAITI ([email protected]) 13
Statistique descriptiveVariable qualitative
Variables
Variables qualitatives
DichotomiquesBinaires
Ordinales
Nominales
Variables quantitatives
Continues
Discrètes
30/09/2015 Pr. BOUAITI ([email protected]) 14
Observables
Mesurables
- Sexe
- Couleur-Ville d’origine
-Niveaud’étude
-Taille-Poids
-Nombredepatients
Statistique descriptiveVariable qualitative
• Un caractère qualitatif ne peut être mesuré • D’où notion de fréquence
• Fréquence absolue : effectif• Nombre d’individus par classe : n– 100 sujets: 24 ont la maladie x
• Fréquences relatives• Pour chaque classe, le rapport de son effectif au
nombre total d’individus • Exprimées en pourcentage– p = : 0,24 ou 24 %
30/09/2015 Pr. BOUAITI ([email protected]) 15
Pr. BOUAITI 30/09/2015
Pr. BOUAITI ([email protected]) 6
Statistiques descriptivesvariables qualitatives
16
xini fi
x1 n1 f1
x2 n2 f2
… … …xp np fp
S1p xi n 1
Chaque ligne correspond à une modalité différente.
ni correspond au nombre d’observations (effectif) ayant comme valeur xi
fi correspond à la fréquence (pourcentage) d’observations ayant comme valeur xi
100nnf i
i X
30/09/2015 Pr. BOUAITI ([email protected])
Statistiques descriptivesvariables qualitatives
• On a noté la situation familiale des 150 patients d’une étude
Nom Situation de famille
Patient 1 Marié
Patient 2 Veuf
Patiente 3 Mariée
Patiente 4 Célibataire
Patient 5 Divorcé
…. ….
30/09/2015 Pr. BOUAITI ([email protected]) 17
Statistiques descriptivesvariables qualitatives
Modalités Effectifs (n)
Marié 80
Célibataire 30
Veuf 20
Divorcé 20
Total 150
30/09/2015 Pr. BOUAITI ([email protected]) 18
Pr. BOUAITI 30/09/2015
Pr. BOUAITI ([email protected]) 7
Statistiques descriptivesvariables qualitatives
Modalités Effectifs (n) Pourcentage
Marié 80 53,3%
Célibataire 30 20%
Veuf 20 13,3%
Divorcé 20 13,3%
Total 150 100%
30/09/2015 Pr. BOUAITI ([email protected]) 19
Statistiques descriptivesvariables qualitatives
20
Sexe n %
Masculin 70 58,3%
Féminin 50 41,7%
Total 120 100%30/09/2015 Pr. BOUAITI ([email protected])
Statistiques descriptivesvariables quantitatives continues
21
Classe d'âge ni %[14-16[ 10 9,1%
[16-18[ 20 18,2%
[18-20[ 35 31,8%
[20-22[ 15 13,6%
[22-24[ 5 4,5%
>24 25 22,7%
Total 110 100,0%
30/09/2015 Pr. BOUAITI ([email protected])
Pr. BOUAITI 30/09/2015
Pr. BOUAITI ([email protected]) 8
Plan
• Définition• Rappels• Statistique descriptive : Variable qualitative• Statistique descriptive : Variable quantitative• Statistique à deux dimensions• Conclusion
30/09/2015 Pr. BOUAITI ([email protected]) 22
Statistique descriptiveVariable qualitative
Variables
Variables qualitatives
DichotomiquesBinaires
Ordinales
Nominales
Variables quantitatives
Continues
Discrètes
30/09/2015 Pr. BOUAITI ([email protected]) 23
Observables
Mesurables
- Sexe
- Couleur-Ville d’origine
-Niveaud’étude
-Taille-Poids
-Nombredepatients
Statistiques descriptivesvariables quantitatives
• Paramètres de position : Mesures de la tendance centrale
• Paramètres de dispersion
2430/09/2015 Pr. BOUAITI ([email protected])
Position
Dispersion
Pr. BOUAITI 30/09/2015
Pr. BOUAITI ([email protected]) 9
Paramètres de position
• Moyenne arithmétique
• Médiane
• Mode
2530/09/2015 Pr. BOUAITI ([email protected])
Moyenne arithmétique
26
• La somme de toutes les valeurs individuelles divisée par le nombre de valeurs
푚 =∑ 푥푖푛
• Avec : – n : nombre d’observations – xi : les valeurs de la variable– ∑ 푥푖: la somme de toutes les valeurs
observées.
30/09/2015 Pr. BOUAITI ([email protected])
Moyenne arithmétiqueExemple
27
• Exemple: Calculer la moyenne des valeurs suivantes : 10, 12, 18, 20, 25, 35
풎 = ∑ 풙풊풏풊 ퟏ풏
= ퟏퟎ ퟏퟐ ퟏퟖ ퟐퟎ ퟐퟓ ퟑퟓퟔ
= ퟏퟐퟎퟔ
= ퟐퟎ
30/09/2015 Pr. BOUAITI ([email protected])
Pr. BOUAITI 30/09/2015
Pr. BOUAITI ([email protected]) 10
Moyenne arithmétiquedonnées groupées
Tranches d’âge Nombre (ni)
[10-20[ 4[20-30[ 6[30-40[ 10[40-50[ 4[50-60[ 4[60-70[ 2
Total (n) 30
2830/09/2015 Pr. BOUAITI ([email protected])
Moyenne arithmétiquedonnées groupées
29
• Si les observations sont groupées en classes, alors
푚 =∑ 푛푖푥푖
푛• ni : le nombre de sujets pour la classe xi • xi : la valeur centrale de la classe
30/09/2015 Pr. BOUAITI ([email protected])
Moyenne arithmétiquedonnées groupées
Tranches d’âge Nombre (ni)Valeur centrale
(xi)ni x xi
[10-20[ 4 15 60[20-30[ 6 25 150[30-40[ 10 35 350[40-50[ 4 45 180[50-60[ 4 55 220[60-70[ 2 65 130
Total (n) 30 1090
30
풎 = ∑ 풏풊풙풊풏풊 ퟏ
풏= 1090/30=36,3
30/09/2015 Pr. BOUAITI ([email protected])
Pr. BOUAITI 30/09/2015
Pr. BOUAITI ([email protected]) 11
Paramètres de position
• Moyenne arithmétique
• Médiane
• Mode
3130/09/2015 Pr. BOUAITI ([email protected])
Médiane
32
• La médiane est la valeur qui divise les observations en 2 groupes de taille égale :– Le premier contenant les valeurs inférieures à la
médiane – Et le second les valeurs supérieures à la médiane
La valeur qui partage la série en 2 parties de même effectif (ordre croissant+++)
30/09/2015 Pr. BOUAITI ([email protected])
Médianeexemples
• 9 patients hospitalisés dans un service de médecine. Leurs durées de séjour (en jours) sont les suivantes :
3; 15; 23; 46; 64; 126; 279; 623; 1350
• La médiane est la valeur de rang 5 : 64j
30/09/2015 Pr. BOUAITI ([email protected]) 33
n=3 n=3
Pr. BOUAITI 30/09/2015
Pr. BOUAITI ([email protected]) 12
Médiane
34
• Méthode de calcul– Classer les valeurs par ordre de grandeur
(ascendante ou descendante). – Identifier le milieu de la série de valeurs :
• Place de la valeur médiane =
Avec N = Nombre total de valeurs dans la série de valeurs.
– Le chiffre se trouvant à cette place dans la série de valeurs correspond à la médiane.
30/09/2015 Pr. BOUAITI ([email protected])
Médianeexemples
• Médiane d’un nombre impair de données 10, 12, 18, 20, 25
– Ranger les valeurs en ordre ascendant : 10, 12, 18, 20, 25
– Déterminer le point central de la série : (5 valeurs +1)/ 2 = 3.
– La médiane est donc la valeur en 3ème position dans la série
– La 3ème valeur est 18. – La médiane équivaut donc à 18.
3530/09/2015 Pr. BOUAITI ([email protected])
Médianeexemples
• Médiane d’un nombre pair de données 10, 12, 18, 20, 25, 45
– Ranger les valeurs en ordre ascendant : 10, 12, 18, 20, 25, 45
– Déterminer le point central de la série (6 valeurs+1)/2 = 7/2 = 3,5.
– La médiane est la valeur à mi-chemin entre le 3ème
et le 4ème chiffre : Le 3ème chiffre est 18 et le 4ème
est 20. – La médiane est (18+20)/2 = 19.
3630/09/2015 Pr. BOUAITI ([email protected])
Pr. BOUAITI 30/09/2015
Pr. BOUAITI ([email protected]) 13
Moyenne - Médiane
30/09/2015 Pr. BOUAITI ([email protected]) 37
Série de valeurs:
10, 12, 18, 20, 25
10, 12, 18, 20, 25, 45
Moyenne Médiane
17 18
21,7 19
La moyenne est sensible aux valeurs extrêmes
La médiane est insensible aux valeurs extrêmes
Paramètres de position
• Moyenne arithmétique
• Médiane
• Mode
3830/09/2015 Pr. BOUAITI ([email protected])
Mode
• La valeur que l’on observe le plus fréquemment dans une série de valeurs.
• Exemple 1 : Le mode des valeurs 10, 12, 12, 12, 18, 18, 20, 25, 35 est 12
• Exemple 2 : La série 10, 12, 12, 12, 18, 18, 18, 20, 25, 35 à 2 modes, 12 et 18
3930/09/2015 Pr. BOUAITI ([email protected])
Pr. BOUAITI 30/09/2015
Pr. BOUAITI ([email protected]) 14
Mode
30/09/2015 Pr. BOUAITI ([email protected]) 40
45 98 150 203 256 309 361 414 467 519 572Créatinine (µmol/l)
0
40
80
120
N
2.1 3.3 4.6 5.8 7.0 8.3 9.5 10.8 12.0 13.3 14.5Glycémie (mmol/l)
0
50
100
150
200
250
NDistribution unimodale Distribution bimodale
• Si distribution unimodale, symétrique– les 3 coïncident
-4 -2 0 2 4
0.0
0.1
0.2
0.3
0.4
ddp
Mode = Médiane = Moyenne
18 22 23 25 27
Mode, médiane, moyenne
4130/09/2015 Pr. BOUAITI ([email protected])
• Si distribution asymétriqueà droite à gauche
mode < médiane < moyenne moyenne < médiane < mode
02468
101214161820
1 2 3 4 5 6 7 8 9
PSA (ng/l)
%
Médiane
Moyenne
Mode
2 4 6 8 10Notes
Histogramme
Mode
MédianeMoyenne
Mode, médiane, moyenne
4230/09/2015 Pr. BOUAITI ([email protected])
Pr. BOUAITI 30/09/2015
Pr. BOUAITI ([email protected]) 15
Statistiques descriptivesvariables quantitatives
• Paramètres de position : Mesures de la tendance centrale
• Paramètres de dispersion
4330/09/2015 Pr. BOUAITI ([email protected])
Position
Dispersion
Paramètres de dispersion
• Étendue
• Les quartiles
• La variance
• Écart-type
4430/09/2015 Pr. BOUAITI ([email protected])
Étendue
• L’étendue indique la distance entre la plus grande et la plus petite valeur observée dans la distribution.
Étendue = valeur maximale - valeur minimale
• Exemple : – Une série : 10, 12, 18, 20, 25, 35– Étendue : 10 à 35.
4530/09/2015 Pr. BOUAITI ([email protected])
Pr. BOUAITI 30/09/2015
Pr. BOUAITI ([email protected]) 16
Étendue
0
20
40
60
80100
120
140
160
180
200
Nom
bre
0 100 200 300 400 500 600 700 800 900 1000Créatinine J PBR
Histogramme
Valeur min = 45µmol/l
Valeur max = 939 µmol/l
Etendue = 894 µmol/l
Valeur min = 45µmol/l
Valeur max = 572 µmol/l
Etendue = 527 µmol/l
0
20
40
60
80
100
120
140
Nom
bre
0 100 200 300 400 500 600 700 800 900Créatinine J PBR
Histogramme
4630/09/2015 Pr. BOUAITI ([email protected])
Paramètres de dispersion
• Étendue
• Les quartiles
• La variance
• Écart-type
4730/09/2015 Pr. BOUAITI ([email protected])
Les quartiles
Ce sont des valeurs (Q1, Q2, Q3) qui séparent l’échantillon en 4 parties qui contiennent le
même nombre de données.
30/09/2015 Pr. BOUAITI ([email protected]) 48
25%
Quart 1 Quart 2 Quart 3 Quart 4
25% 25%25%
Pr. BOUAITI 30/09/2015
Pr. BOUAITI ([email protected]) 17
Les quartiles
• Le premier quartile ou le quartile inférieur Q1 = 25 % des valeurs sont inférieures à Q1 et 75 % lui sont supérieures
• Le troisième quartile ou le quartile supérieur Q3 = 75 % des valeurs sont inférieures à Q3 et 25 % lui sont supérieures
• La médiane = le deuxième quartile Q2
4930/09/2015 Pr. BOUAITI ([email protected])
Les quartiles
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
3 4 4 5 5 5 6 6 6 6 8 8 10 12 15
30/09/2015 Pr. BOUAITI ([email protected]) 50
Médiane de la distribution (15+1)/2 = 8e donnée
Q2
Q1Q3
Médiane des données précédent Q2
Médiane des données qui suivent Q2
Quart 1 Quart 2 Quart 3 Quart 4
Les quartilesexemple
• Données ordonnées : 10, 12, 18, 20, 25, 45• Médiane Q2: (20 + 18)/2 = 19• Quartile inférieur Q1:
– la médiane de 10, 12, 18 = 12
• Quartile supérieur Q3: – la médiane de 20, 25, 45 = 25
5130/09/2015 Pr. BOUAITI ([email protected])
Pr. BOUAITI 30/09/2015
Pr. BOUAITI ([email protected]) 18
Paramètres de dispersion
• Étendue
• Les quartiles
• La variance
• Écart-type
5230/09/2015 Pr. BOUAITI ([email protected])
La variance
• La variance : – La moyenne des carrés des écarts à la moyenne– La somme des carrés des écarts à la moyenne
divisée par le nombre d'observations
풔ퟐ =∑ (푥푖 − 푚)2푛푖
푛 − 1
5330/09/2015 Pr. BOUAITI ([email protected])
La varianceméthode de calcul
• Calculer la moyenne m• Calculer la différence entre chaque
observation et la moyenne (xi - m) • Porter chacune de ces différences au carré
(xi - m)2
• Additionner tous ces carrés et diviser la somme des carrés par le nombre d’observations moins 1 (n -1)
5430/09/2015 Pr. BOUAITI ([email protected])
Pr. BOUAITI 30/09/2015
Pr. BOUAITI ([email protected]) 19
La varianceexemple
• Calculer la variance s2 : 10, 12, 18, 20, 25, 35– Calculer la moyenne : m=20
Observations xi 10 12 18 20 25 35
Différence à la moyenne
xi- 20-10 -8 -2 0 +5 +15
Carré de la différence à la
moyenne100 64 4 0 25 225
55
– Calculer la somme des carrés de la différence à la moyenne : 100+64+4+0+25+225=418
– Diviser la somme des carrés par n -1 soit : = 83,630/09/2015 Pr. BOUAITI ([email protected])
Paramètres de dispersion
• Étendue
• Les quartiles
• La variance
• Écart-type
5630/09/2015 Pr. BOUAITI ([email protected])
Écart-type
• Mesure la dispersion autour de m• La mesure de dispersion la plus couramment
utilisée• = Standard Deviation (SD)• Calcul
30/09/2015 Pr. BOUAITI ([email protected]) 57
푆퐷 =∑ (푥푖 − 푚)2푛푖푛 − 1 s =
Pr. BOUAITI 30/09/2015
Pr. BOUAITI ([email protected]) 20
Écart-type
Représente l ’écart moyen des données de l’échantillon par rapport à la moyenne
30/09/2015 Pr. BOUAITI ([email protected]) 58
m
x1x2
x4
x5
x6x7x9
x10
x11
x12
x8
x3
Écart-type
Représente l ’écart moyen des données de l’échantillon par rapport à la moyenne
30/09/2015 Pr. BOUAITI ([email protected]) 59
m=20
10
18
1220
35
25
Écart-type
• En pratique :– Calculer la variance – Puis prendre la racine carrée du résultat obtenu
• Exemple : calculer l’écart-type de la série de 6 valeurs : 10, 12, 18, 20, 25, 35– On calcul la variance : s2 =83,6– Puis l’écart-type est la racine carrée du résultat
obtenu := 83,6 = 9,14
30/09/2015 Pr. BOUAITI ([email protected]) 60
Pr. BOUAITI 30/09/2015
Pr. BOUAITI ([email protected]) 21
61
La signification probabiliste de l’écart-type
m
Echantillon 1 Echantillon 2
s2 < s1
s2
s1
30/09/2015 Pr. BOUAITI ([email protected])
La signification probabiliste de l’écart-type
62
50 % des individus en-dessous de la moyenne et 50 % au-dessus 68 % des individus entre µ-1σ et µ+1σ
95 % des individus entre µ-1,96σ et µ+1,96σ99,7 % des individus entre µ -3σ et µ+3σ
95 % des individus entre µ-1,96σ et µ+1,96σ
30/09/2015 Pr. BOUAITI ([email protected])
La signification probabiliste de l’écart-type
• Exemple : Chez le sujet adulte non diabétique• La glycémie est distribuée selon une loi normale• Moyenne : 0,86 g/L• Écart - type 0,07 g/L
63
95 % des sujets « normaux » de cette population ont une glycémie comprise
entre 0,72 et 1,00 g/L30/09/2015 Pr. BOUAITI ([email protected])
95 % des individus entre µ-1,96σ et µ+1,96σ
Pr. BOUAITI 30/09/2015
Pr. BOUAITI ([email protected]) 22
Plan
• Définition• Rappels• Statistique descriptive : Variable qualitative• Statistique descriptive : Variable quantitative• Statistique à deux dimensions• Conclusion
30/09/2015 Pr. BOUAITI ([email protected]) 64
Statistique descriptive à 2 dimensions
• Objectif : mettre en évidence les relations qui existent entre deux séries d'observations.– Nature des variables : les deux variables peuvent
être • Qualitatives• Quantitatives • Ou l'une quantitative et l'autre qualitative.
– Deux variables mesurées chez le même individu• Exemples :
– Présence d’un cancer et tabagisme...– Poids et taille
30/09/2015 Pr. BOUAITI ([email protected]) 65
Statistique descriptive à 2 dimensionsdeux variables qualitatives
Sujet Cancer Tabac1 oui oui2 oui oui3 non non4 oui oui5 oui oui6 oui non7 oui non8 oui oui9 non oui
10 non Oui… … …
30/09/2015 Pr. BOUAITI ([email protected]) 66
Canceroui non total
Tabacoui 40 20 60non 10 30 40total 50 50 100
• Distribution de fréquences : tables de contingence.
Pr. BOUAITI 30/09/2015
Pr. BOUAITI ([email protected]) 23
Statistique descriptive à 2 dimensionsdeux variables qualitatives
30/09/2015 Pr. BOUAITI ([email protected]) 67
Canceroui non total
Tabacoui 40 20 60non 10 30 40total 50 50 100
Nombre de mesures totale : n
Effectif d'une case = nij
Total de chaque ligne = li
Total de chaque colonne = cj
Statistique descriptive à 2 dimensionsdeux variables qualitatives
• 100 = Nombre total de mesures.• 50 = Nombre d'individus ayant
un cancer.• 60= Nombre d'individus sont
fumeurs.• 40 / 100 = % d'individus
fumeurs ayant un cancer.• 40 / 60 = % d'individus parmi les
fumeurs ayant un cancer. • 40 / 50 = % d'individus parmi les
malades ayant un cancer qui sont des fumeurs.
30/09/2015 Pr. BOUAITI ([email protected]) 68
Canceroui non total
Tabacoui 40 20 60non 10 30 40total 50 50 100
Recherche de facteurs de risques
Recherche de facteurs de risques
Cancer du poumon et tabagisme• Fréquences relatives : Risques
30/09/2015 Pr. BOUAITI ([email protected]) 69
Canceroui non total
Tabacoui 40 20 60non 10 30 40total 50 50 100
• Cancer chez les fumeurs: • R1 = 40/60 = 0,70
• Cancer chez les non fumeurs: • R0 = 10/40 = 0,25
Pr. BOUAITI 30/09/2015
Pr. BOUAITI ([email protected]) 24
Recherche de facteurs de risques
• Risque relatif : – Le rapport du risque chez les exposés (R1) sur le
risque des non exposés (R0).– RR = R1/R0 = 0,7/0,25 =2,8
• Odds ratio (OR) ou rapport de cotes:– Cote (Odds) :
• Chez les fumeurs : R1/(1-R1) = 2,33• Chez les non fumeurs : R0/(1-R0) = 0,33
– OR = 2,33/0,33 = 730/09/2015 Pr. BOUAITI ([email protected]) 70
Statistique descriptive à 2 dimensionsdeux variables quantitatives
patient Age (ans) taille (cm)1 21 1692 24 1883 25 1624 22 1615 19 1806 21 1897 24 1848 22 1519 22 175
10 21 162… … …
30/09/2015 Pr. BOUAITI ([email protected]) 71
Statistique descriptive à 2 dimensionsdeux variables quantitatives
• Coefficient de corrélation linéaire (ρ ou r)
• COV (X,Y) = moyenne des produits des écarts à la moyenne
30/09/2015 Pr. BOUAITI ([email protected]) 72
VAR(Y)VAR(X)Y)COV(X,
,
YX
Pr. BOUAITI 30/09/2015
Pr. BOUAITI ([email protected]) 25
Coefficient de corrélation linéaire
• Mesure l'intensité de la liaison linéaire entre X et Y• Le coefficient de corrélation varie entre -1 et 1. • 0 signifie une association nulle• Le signe correspond à la direction de la corrélation.
– Quand les deux valeurs augmentent ou diminuent ensemble il s'agit d'une corrélation positive.
– Quand une valeur augmente alors que l'autre diminue il s'agit d'une corrélation négative
• |ρx,y| Proche de 1 RELATION LINEAIRE entre les variables
30/09/2015 Pr. BOUAITI ([email protected]) 73
Exemple
30/09/2015 Pr. BOUAITI ([email protected]) 74
Conclusion
• La statistique descriptive– Première étape d’études épidémiologiques– Obligatoire
• Variable qualitative– Effectif & Pourcentage
• Variable quantitative– Moyenne ± écart- type– Médiane et quartiles
30/09/2015 Pr. BOUAITI ([email protected]) 75