Statistiques et épidémiologieudsmed.u-strasbg.fr/labiostat/IMG/pdf/Orthopsie_2008...Fréquence de...

Post on 11-Jan-2020

0 views 0 download

Transcript of Statistiques et épidémiologieudsmed.u-strasbg.fr/labiostat/IMG/pdf/Orthopsie_2008...Fréquence de...

Capacité d'orthopsie 2008-2009 1

Statistiques et épidémiologie

erik.sauleau@chru-strasbourg.fr

Capacité d'orthopsie 2008-2009 2

Plan

1. La variabilité

2. L'épidémiologie et les indicateurs

3. Les trois volets de l'épidémiologie

4. Plan d'étude et échantillonnage

5. Éléments de méthodologie

Capacité d'orthopsie 2008-2009 3

La variabilité

Capacité d'orthopsie 2008-2009 4

Un exemple

� Glycémie à jeun de plusieurs sujets4,2 4,8 4,8 6,44,2 5,8 6,3 4,53,8 5,7 4,9 5,24,9 4,8 3,5 5,04,2 5,5 6,7 4,7… … … ...

Capacité d'orthopsie 2008-2009 5

Définition

� Le résultat d’une mesure diffère d’un mesurage à l’autre� D’un sujet à l’autre

� D’un temps à l’autre chez un même sujet

� La variabilité est un phénomène naturel et inévitable

� La variabilité n’est pas l'imprécision ni l'erreur de mesure

Capacité d'orthopsie 2008-2009 6

Variabilité et incertitude

� Incertain = ce qu'on va observer et non pas ce que se passe réellement

� État biologique

� Suite particulière d'événements trop nombreux pour que l’on puisse les connaître exhaustivement

� Déterministe

Capacité d'orthopsie 2008-2009 7

Variabilité : phénomène naturel

• Les populations diffèrent• Cancer œsophage chine / Europe

• Les individus diffèrent• Même les jumeaux homozygotes

• Les cellules de même différenciation diffèrent

• L'expression génétique diffère• Élimination de protéines "mal conformées"

Capacité d'orthopsie 2008-2009 8

Variabilité : phénomène naturel

• La variabilité est indispensable à la vie et àl'évolution

• L'absence de variabilité est quasiment impossible en biologie

• La variabilité impose le recours àl'observation• Mesure de "constantes" biologiques

• Opposition avec la physique

Capacité d'orthopsie 2008-2009 9

Variabilité : inévitable

• Diminution par la standardisation• Mesures• Matériel• Individus

• Exemple de la mesure de la glycémie• Hommes non diabétiques• 8 heures du matin• Repas standard la veille• Coucher à 23 heures et 8 heures de sommeil• …

Capacité d'orthopsie 2008-2009 10

Variabilité n'est pas …

• Imprécision• Arrondir 19 et 22 cigarettes/jour à 1 paquet/jour

• Erreur de mesure• Difficultés de la mesure de la taille des nouveaux-

nés

Capacité d'orthopsie 2008-2009 11

Variabilité et aléa

• On espère avoir • Valeur mesurée = vrai valeur : Oi = Vi

• En pratique on a • Valeur mesurée = vrai valeur + variabilité :

Oi = Vi + ei

• On cherche à diminuer ei

• Contrôle des facteurs de variabilité

• Reste l'erreur résiduelle

Capacité d'orthopsie 2008-2009 12

Variabilité et aléa

• Pour l'analyse statistique• Valeur mesurée = valeur commune + erreur

résiduelle

Oi = V + ei

• Conséquences• La variabilité du groupe traduit les variabilités

individuelles

Capacité d'orthopsie 2008-2009 13

Exemple

• Comparaison de deux traitements A et B• Hypocholestérolémiant• Dosage du cholestérol HDL sanguin

• On admet• Effet moyen, fixe des traitements• Variabilité naturelle autour de cet effet

• Dosages de cholestérol• Sujets du groupe recevant A : Oi = VA + ei

• Sujets du groupe recevant B : Oi = VB + ei

Capacité d'orthopsie 2008-2009 14

Exemple

• Conséquences• Réponse à un facteur : propriété moyenne d'un

groupe• Pour un sujet

�Effet moyen du traitement�Erreur résiduelle

• Analyse statistique sur la comparaison entre VAet VB�Un traitement est meilleur en moyenne�L'effet du traitement est jugé au niveau du groupe

Capacité d'orthopsie 2008-2009 15

Variabilité et causalité

� Pour un sujet unique, on ne peut pas distinguer � L’effet d’un traitement

� D'une évolution spontanée

� Pas de conclusion de causalité au niveau individuel mais recherche de causalité au niveau d'un groupe � épidémiologie analytique

Capacité d'orthopsie 2008-2009 16

Variabilité et causalité

• "Le tabac multiplie par 2,3 le risque de cancer du poumon"• Le groupe des fumeurs a, en moyenne, un risque

2,3 plus élevé que le groupe des non-fumeurs

• Un individu, fumeur ou non-fumeur, aura ou n'aura pas un cancer du poumon

• Causalité probabiliste au niveau du groupe

Capacité d'orthopsie 2008-2009 17

L'épidémiologie

Capacité d'orthopsie 2008-2009 18

De l’épidémiologie descriptive

� Définition(s)� OMS (1968)

"Étude de la distribution et des déterminants des maladies chez l'homme"� Idem Mac Mahon (1970)

� Rumeau-Rouquette (1993)

" Étude de la distribution des maladies et indicateurs de santé"

Capacité d'orthopsie 2008-2009 19

� Recherche� Hypothèse à tester

� Vérification scientifique

� Généralisation

� Étiologie� Étude des causes et des facteurs de risque

� Choléra, Londres 1848

… vers …

Capacité d'orthopsie 2008-2009 20

l’épidémiologie analytique

� Retour à la définition de l'épidémiologie descriptive� Au mieux = variation parallèle maladie-facteur

� Études écologiques

� Corrélation

� Étape suivante = causalité

� Épidémiologie analytique

Capacité d'orthopsie 2008-2009 21

Épidémiologie évaluative

� Évaluer les actions de santé� Efficacité� Effets non prévus� Impact général� Couverture

� Les trois volets de l'évaluation (Donabedian)

Moyens

ProcéduresRésultats

Capacité d'orthopsie 2008-2009 22

Indicateurs

• Variables• Maladie

• Facteur de risque

• Autre facteur

� Sources ponctuelles = enquêtes ad hoc

� Sondages

� Enquêtes épidémiologiques

Capacité d'orthopsie 2008-2009 23

Indicateurs

� Sources en routine� Statistiques de mortalité (INSERM)

� Déclarations obligatoires

� Hôpitaux (PMSI), médecins sentinelles, médecins du travail

� Registres

� Statistiques sociodémographiques (INSEE, INED)

� Moyens, consommations (Ministères, DREES)

� ETC

Capacité d'orthopsie 2008-2009 24

Indicateurs

� Validité intrinsèque� Reproductibilité (temps, espace)

� Acceptabilité

� Fiabilité

� Utilité

Capacité d'orthopsie 2008-2009 25

Indicateurs de maladie

� Normal � anormal (pathologique)

G. Canguilhem. Le normal et le pathologique. PUF, 2ième édition, Paris, 1996.

� Types d'indicateurs� Mortalité� Morbidité� Handicap

Capacité d'orthopsie 2008-2009 26

Indicateurs de mortalité

� Nombre de cas

� Probabilité de décès

Nombre de décès sur la période

divisé par

Personnes présentes au début de la période

Capacité d'orthopsie 2008-2009 27

Indicateurs de mortalité

� Mieux que "personnes présentes au début de la période" = personnes à risque et durée d'exposition� Personne-temps (person-year)

� Taux de mortalité

Nombre de décès sur la période

divisé par

Personnes-temps pendant la période

Capacité d'orthopsie 2008-2009 28

Indicateurs de morbidité

� Maladies ou symptômes

� Nombreux indicateurs

� Prévalence� Nombre de cas à un instant donné parmi une

population

� Coupe transversale

Capacité d'orthopsie 2008-2009 29

Indicateurs de morbidité

� Incidence cumulée (cf. probabilité de décès)

Nombre de nouveaux cas sur la période

divisé par

Non malades au début de la période

� Incidence instantanée (cf. taux de mortalité)

Nombre de nouveaux cas sur la période

divisé par

Personnes-temps non malades pendant la période

Capacité d'orthopsie 2008-2009 30

Espérance de vie

� Espérance de vie à la naissance = moyenne des âges au décès d'une génération fictive soumise aux conditions de mortalité de l’année

� Résumé annuel de mortalité pour des sujets nés une même année

Capacité d'orthopsie 2008-2009 31

Indicateurs de handicaps

� � différentes situationsMaladie � déficience � incapacité � désavantage

(extériorisée) (objectivisée) (socialisée)

� Déficience = altération d'une fonction

� Incapacité = réduction de la capacité à accomplir une activité

� Désavantage = limitation d'un rôle normal

Capacité d'orthopsie 2008-2009 32

Indicateurs d'exposition

• Définir le recueil• Exposition qualitative

�Exposé vs non-exposé

• Exposition semi-qualitative�Peu vs moyen vs très

• Exposition quantitative�Mesures ponctuelles

�Dosimètres

�Durée d'exposition

Capacité d'orthopsie 2008-2009 33

Ce qu'il faut retenir

� La variabilité et son caractère inévitable (résiduelle) mais en partie contrôlable

� Les trois volets de l'épidémiologie

� L'utilisation d'indicateurs

� La notion de personnes-années

� La définition de l'incidence et la prévalence

Capacité d'orthopsie 2008-2009 34

Épidémiologie descriptive

Capacité d'orthopsie 2008-2009 35

Enquête transversale

� Objectif = mesurer la fréquence d'un phénomène ou la valeur d'un indicateur

� Unique = prévalence à l'instant t

� Répétée dans le temps� Évolution de prévalence

� (Évolution de l') incidence

� Avant-après

� Répétée dans l'espace� Comparaison de prévalence

� Ici-ailleurs

Capacité d'orthopsie 2008-2009 36

Études écologiques

� Épidémiologie descriptive� Au mieux = variation parallèle maladie-facteur

� Études écologiques (corrélation)

� Peu coûteuses

� Vérification d'hypothèse(s) avant …

� Étape suivante = causalité = épidémiologie analytique

Capacité d'orthopsie 2008-2009 37

Études écologiques

� Corrélation

� Prévisions

� MAIS PAS CAUSALITE

In S. Kono, M. Ikeda, M. Ogata.Salt and geographical mortality of gastric cancer and stroke in Japan.

J Epidemiol Community Health, 37:43-46, 1983

y = 21,655x - 73,989

R2 = 0,7205

200

250

300

350

400

12 14 16 18 20 22

sel/jour.personne (g)

Mor

talit

é A

VC

(p.100000

)

Capacité d'orthopsie 2008-2009 38

Épidémiologie analytique

Capacité d'orthopsie 2008-2009 39

Épidémiologie analytique

� Étude des causes� Basée sur l'observation

� Et non sur l'intervention (cf. épidémiologie évaluative)

� Mesure l'association entre "maladie" et "facteurs de risque " en tenant compte de ce qui pourrait brouiller cette association (facteurs de confusion)

Capacité d'orthopsie 2008-2009 40

Jugement de causalité

� Causalité = faisceau d'arguments� Critères internes

� Séquence dans le temps� Facteur � Latence � Maladie

� Force de l'association maladie-facteur� Relation dose-effet

� Fréquence de la maladie augmente si la dose de facteur augmente (ou sa durée)

� Cohérence dans les sous-populations� Homme-femme par exemple

Capacité d'orthopsie 2008-2009 41

Jugement de causalité

� Critères externes� Constances dans d'autres populations� Relation dose-effet entre études� Cohérence espace-temps

� Les variations de la maladie ou du facteur dans le temps ou dans l'espace entraîne des variations de l'autre

� Études expérimentales� Plausibilité biologique et physiopathologie� Connaissances générales

Capacité d'orthopsie 2008-2009 42

Types d'enquête

� Épidémiologie analytique basée sur l'observation de la maladie et des facteurs� Vers le futur = prospective

� Vers le passé = rétrospective

� Mixte

Capacité d'orthopsie 2008-2009 43

Types d'enquête

� Cas-témoin� Malades et non malades ("comparables")� Reconstitution rétrospective de leur exposition

� Cohorte (prospective)� Non malades� Suivis pour mesurer exposition et maladie

� Cohorte rétrospective� Idem� Reconstitution rétrospective de leur exposition

Capacité d'orthopsie 2008-2009 44

Je suis l'épidémiologiste

Passé Futur

Facteurs non

Facteurs oui

Non malades

Malades

Non maladesFacteurs non

Facteurs oui

Cohorte rétrospective

Facteurs non

Facteurs oui

Non malades

Malades

Non maladesCohorte

Non maladesMalades

Facteurs non

Facteurs oui

Cas-témoins

Capacité d'orthopsie 2008-2009 45

Études cas-témoins

� Mesures association = odds-ratio uniquement

� Nombre plus faible de sujets

� Maladie rare

� Délai long entre exposition et maladie

� Absence de suivi

� Reconstitution des facteurs

� Population hospitalière� Choix des témoins

Capacité d'orthopsie 2008-2009 46

Cohorte

� Mesures association = risque relatif ou odds-ratio

� Nombre élevé de sujets� Selon fréquence de la maladie

� Longueur du suivi� Moyens importants

� Perdus de vue

� Délai court entre exposition et maladie

� Milieux professionnels

� Pas les populations hospitalières

Capacité d'orthopsie 2008-2009 47

Cas particulier : l'essai thérapeutique

� Confins entre essais biologiques, épidémiologie analytique et évaluation

� Déterminer l’utilité d’un produit pour traiter une pathologie� Médicament

� Procédure thérapeutique

� Procédure diagnostique

� Quatre types chronologiques

Capacité d'orthopsie 2008-2009 48

Essai thérapeutique de phase I

� Étudier la tolérance (toxicité) et la pharmacocinétique d’une nouvelle substance

� Première étude chez l’homme

� Non comparatif

� Sujets sains (sauf cas particulier : anti-mitotiques)

� Effectifs faibles voir très faibles (5 à 50 patients)

� Administration successives, doses croissantes

Capacité d'orthopsie 2008-2009 49

Essai thérapeutique de phase II

� Étudie l’efficacité� Thérapeutique (relation effet dose) � Pharmacologique (critère de substitution)

� Effectifs faibles (20 à 100 sujets)� Sur sujets sains ou malades (selon les cas)� Recherche de la dose optimale� Parfois scindée en

� IIa détermination de l’activité� IIb recherche du taux de réponse (sur sujets malades)

� Parfois comparatif

Capacité d'orthopsie 2008-2009 50

Essai thérapeutique de phase III

� On compare deux produits� Nouveau produit vs placebo� Randomisé (tirage au sort des traitements pour les sujets)� Efficacité ou supériorité

� Il peut y avoir plus que 2 produits comparés� Étude exposés-non exposés particulière� Prospectif� Sur des sujets malades � Effectifs importants � � AMM

Capacité d'orthopsie 2008-2009 51

Essai thérapeutique de phase IV

� Essai ayant débuté après la mise sur le marché

� Étudie la sécurité, les indications et l’administration réelle du produit

� Effectifs très grands� Effets indésirables rares� Non comparatif en général� Prospectif (mieux) ou rétrospectif (moins

bien)

Capacité d'orthopsie 2008-2009 52

Étude pronostique

� Un groupe de sujets ayant une pathologie donnée

� Recherche de facteurs de risque de survenue d’un évènement particulier (complication, décès, rechute etc)

� Ces facteurs de risques sont appelés facteurs pronostiques

� Théoriquement c’est une étude prospective parfois rétrospective lorsqu’elle est construite à partir de dossier (déconseillé +++).

Capacité d'orthopsie 2008-2009 53

Association maladie-facteur s

� Facteurs supposés explicatifs

� Facteurs de confusion� Facteur lié à la maladie et à l'exposition et qui brouille la

mesure de l'association maladie-exposition

� Lutte contre la confusion� Appariement (échantillon)

� Ajustements (analyse)� Chi² Mantel-Haenszel

� Modèles régressifs multivariés

� Modèle de Cox

C

MF

Capacité d'orthopsie 2008-2009 54

Biais = erreur systématique

� Sélection (constitution de l'échantillon)� Non réponse, perdus de vue

� Non-comparabilité

� Autosélection dans les cas-témoins (survie sélective, décès précoces)

� Healthy worker effect des cohortes professionnelles

� Classement� Mesure d'exposition

� Mesure de la maladie

� Confusion

Capacité d'orthopsie 2008-2009 55

Épidémiologie évaluative

Capacité d'orthopsie 2008-2009 56

Définition

� Juger des effets (positifs et négatifs) d'une intervention en santé publique� Action destinée à améliorer l'état de santé d'un

groupe

� Prévention� Primaire : incidence de la maladie

� Exemple : évaluation d'une campagne de dépistage

� Secondaire : prévalence et évolution de la maladie

� Tertiaire : rechute, séquelles, dépendance

Capacité d'orthopsie 2008-2009 57

Indicateurs

� Nombreux, différents selon les cas

� Mesurer� Amélioration des connaissances

� Modification du comportement

� Modification de l'état de santé

� Modification des attitudes thérapeutiques

Capacité d'orthopsie 2008-2009 58

Qualité des indicateurs

� Sensibilité, spécificité

Malades Non maladesTest positifTest négatif

a bc d

ca

aésensibilit

+=

db

déspécificit

+=

Vrais positifs parmi les malades Vrais négatifs parmi les non malades

Capacité d'orthopsie 2008-2009 59

Types d'enquête

� Recueil sur un groupe = avant-après� Mêmes sujets

� Groupe globalement

� Recueil sur un groupe avec intervention et un groupe sans = ici-ailleurs� Sans contrôle des sujets

� Essais randomisés la plus rigoureuse

Capacité d'orthopsie 2008-2009 60

Bibliographie générale

� J. Bouyer, D. Hémon, S. Cordier et al. Épidémiologie : principes

et méthodes quantitative. Éditions INSERM, Paris, 1993.

� C. Rumeau-Rouquette, B. Blondel, M. Kaminski, G. Bréart.

Épidémiologie : méthodes et pratique. Médecine-Sciences,

Flammarion, Paris, 1993.

� NE. Breslow, NE. Day. Statistical methods in cancer research. IARC Scientific publication N°32 et N°82, Lyon, 1980 et 1987.

� M. Jenicek, R. Cléroux. Epidémiologie : principes, techniques,

applications. Edisem, Québec, 1987.

Capacité d'orthopsie 2008-2009 61

Ce qu'il faut retenir

� Les caractéristiques� Étude cas-témoins

� Étude de cohorte

� Essai thérapeutique (phase III)

� La notion de biais

� Les définitions de sensibilité et spécificité

Capacité d'orthopsie 2008-2009 62

Plan d'étude

Capacité d'orthopsie 2008-2009 63

Plan de tout étude

� Grandes phases1. Problématique

2. Choix du type d'enquête et traitement des non-réponses

3. Définition de la population

4. Investigations

5. Analyse

� Rédiger un protocole précis

Capacité d'orthopsie 2008-2009 64

(1) Problématique

� Études antérieures

� Définition des objectifs

� Moyens� Matériels

� Humains

� Juridiques et légaux (CNIL, Loi Huriet-Serusclat)

� De la formulation de la problématique dépend les étapes suivantes

Capacité d'orthopsie 2008-2009 65

(1) Problématique

� Variable(s) résultat (à expliquer)

� Variable(s) explicative(s)

� Variables continues ou discrètes

� Types de variables� Qualitatives (ordonnées ou non)

� Quantitatives (continues ou discrètes)

Capacité d'orthopsie 2008-2009 66

(2) Type d'enquête

� Choix du type d'enquête� Échantillon = phénomène fréquent

� Exhaustif = phénomène rare

� Du choix dépend les étapes suivantes� Exemple : incidence du cancer � enquête

exhaustive dans un registre

� Traitement des "non-réponses"

Capacité d'orthopsie 2008-2009 67

(3) Population d'étude

� Ensemble d'unités sur lesquelles on peut relever (mesurer) une caractéristique

� Peut être un groupe de personnes (famille, couple)

� Taille� Grande taille mais pas toujours

� En statistiques, supposée de taille infinie

� Exceptionnellement très petite : maladie génétique, intoxication

Capacité d'orthopsie 2008-2009 68

(3) Population d'étude

� Les questions que l'on se pose s'adressent toujours à la population (même si théorique)

� On ne peut pas travailler sur l'ensemble de la population � Pour des raisons pratiques (populations

mouvantes, de taille variable)

� Pour des raisons éthiques (traitement toxique)

� Technique d'échantillonnage

Capacité d'orthopsie 2008-2009 69

(3) Population d'étude

� Échantillon� Extrait de la population

� Apporte des informations sur la population

� Perte d'information

� Doit représenter au mieux la variabilité de la population� Sans en connaître toutes les caractéristiques

� Au mieux par tirage au sort� Nombre de sujets nécessaires (NSN)

Capacité d'orthopsie 2008-2009 70

(3) Population d'étude

� Population exhaustive� Disposer de la base exhaustive des unités

� Échantillon� Base exhaustive ou partielle

� Tirage au sort (théorie des sondages)

� Quotas

Capacité d'orthopsie 2008-2009 71

(3) Population d'étude

� Type de population� Territorial

� Professionnel

� Clientèle� Hôpital

� Organisme de remboursement

Capacité d'orthopsie 2008-2009 72

(3) Population d'étude

� Unités statistiques� Individu

� Ménage

� Évènement

� Actes médicaux

� …

Capacité d'orthopsie 2008-2009 73

(3) Population d'étude

� Critères d'inclusion-exclusion

� Critères d'exclusion� Peu contraignants et peu nombreux

� Résultats applicables à une large population

� Résultats pragmatiques

� Contraignants et nombreux� Résultats applicables à un sous groupe seulement

� Résultats explicatifs

Capacité d'orthopsie 2008-2009 74

(3) Échantillonnage

� Différents plans d'échantillonnage

� Sondage aléatoire simple� Unités tirées au sort dans la base de la population

� Nécessité d'une base exhaustive

� Plan de sondage de référence� Position des autres plans

� En terme de biais et dispersion

Capacité d'orthopsie 2008-2009 75

(3) Échantillonnage

� Notion d'estimateur� Population = vraies valeurs

� Échantillon = estimation de ces vraies valeurs

� Estimation = imprécision

Capacité d'orthopsie 2008-2009 76

(3) Échantillonnage� Deux écueils à corriger

� Biais = erreur systématique

� Le pire …

• Dispersion= erreur aléatoire= erreur aléatoire

Capacité d'orthopsie 2008-2009 77

(3) Échantillonnage

� Autres plans d'échantillonnage� Sondage stratifié

� Sous-groupes homogènes mais différents

� Sondage en grappe� Toutes les unités au sein de sous-groupes tirés au

sort

� Exemple� Tirage au sort d'immeubles� Interroger tous les habitants des immeubles retenus

� Plans complexes

Capacité d'orthopsie 2008-2009 78

(4) Investigations

Capacité d'orthopsie 2008-2009 79

(5) Analyse : cf. dernier chapitre

0.0

0.1

0.2

0.3

0.4

Capacité d'orthopsie 2008-2009 80

Ce qu'il faut retenir

� Les chapitres obligatoires d'un plan d'étude

� L'importance des critères d'inclusion et d'exclusion

� La notion d'échantillonnage et d'estimation

Capacité d'orthopsie 2008-2009 81

Méthodes statistiques

Enfin!

Capacité d'orthopsie 2008-2009 82

Plan de tout étude (rappel)

� Grandes phases1. Problématique

2. Choix du type d'enquête et traitement des non-réponses

3. Définition de la population

4. Investigations

5. Analyse

� Rédiger un protocole précis

Capacité d'orthopsie 2008-2009 83

Plan des analyses

A moduler selon les cas

1. Descriptif des variables� Graphes

� Tableaux

� Résumé

2. Analyse univariée

3. Analyse multivariée� Tests d'hypothèses

� Modélisation

Capacité d'orthopsie 2008-2009 84

Analyse descriptive

Capacité d'orthopsie 2008-2009 85

Représentation graphique

� De nombreux types� Histogramme

� Nuage de point

� Boîte-à-moustaches = box-plot

� Courbes de survie (Kaplan-Meier)

� Autres (nombre +++)

� Selon le type de variables

Capacité d'orthopsie 2008-2009 86

Types de variables

• Quantitative = mesurable sur une échelle• Continue = valeurs réelles

�Poids, âge

• Discrète = valeurs isolées�Dilution, nombre d'enfants

• Notion de continuité relative à l'échelle�Age : 10, 12, 14, 15, 16

�Mais pas 10, 10, 10, 15, 15

Capacité d'orthopsie 2008-2009 87

Types de variables

• Qualitative = non mesurable sur une échelle• Sans ordre (catégorielle)

�Sexe, localisation de cancer, groupe sanguin

• Avec ordre (semi-quantitative)�Stade d'un cancer, exposition faible/moyenne/élevée

�Transformation d'une variable quantitativeAge<25, [25-40[, [40-75[, [75 et plus� Perte d'information

Capacité d'orthopsie 2008-2009 88

Types de variables

• Semi-quantitative vs quantitative discrète• Équivalence sous des hypothèses de distances

entre valeurs�Stade de cancer I, II, III, IV (clinique)

�Stade de cancer 1, 2, 3, 4 � le stade IV est-il 2 fois plus grave que le stade 2?

Capacité d'orthopsie 2008-2009 89

Histogramme

Capacité d'orthopsie 2008-2009 90

Histogramme

� Étude choc septique et lactate

� Décès à 3 jours (oui/non)

� Sur l’axe vertical : fréquence

� 105 décès parmi 1278 patients

Capacité d'orthopsie 2008-2009 91

Nuage de points

Capacité d'orthopsie 2008-2009 92

Boîte à moustache

Médiane = p50

Q3 = p75

Q1 = p25

Donnée extrême

1,5 x (Q3 – Q1) = 1,5 x EIQ

Capacité d'orthopsie 2008-2009 93CECSMO 2008-2009

Box-plot et histogramme

� La box plot ne montre pas tous les détails d'un histogramme

Capacité d'orthopsie 2008-2009 94

Autres

Capacité d'orthopsie 2008-2009 95

Autres

Capacité d'orthopsie 2008-2009 96

Autres

Capacité d'orthopsie 2008-2009 97CECSMO 2008-2009

Autres

Capacité d'orthopsie 2008-2009 98CECSMO 2008-2009

Autres

Capacité d'orthopsie 2008-2009 99

Résumé d'une variable continue

• Indicateurs ponctuels de position• Moyenne µ

• Percentiles�Médiane=Q2=p50, Q1, Q3

�p2,5, p97,5

• Mode (valeur la plus fréquente)�Dépend du regroupement en classe

�Parfois non-unicité

NB : Distribution unimodale et symétrique � mode, moyenne et médiane confondues

Capacité d'orthopsie 2008-2009 100

Résumé d'une variable continue

• Moyenne

•• Manipulable

• Sensible aux extrêmes

• Médiane

• Partage distribution en 2

• Peu manipulable

• Peu sensible aux extrêmes

∑=

=n

iix

n 1

Capacité d'orthopsie 2008-2009 101

Résumé d'une variable continue

• Age de 5 étudiants : 19, 20, 20, 21, 22• Médiane

�19 : 1 étudiant

�19, 20 : 3 étudiants

�19 à 21 : 4 étudiants

�19 à 22 : 5 étudiants

• Moyenne�1/5(19+20+20+21+22)

Q2 = 20 ans

µ = 20,4 ans

Capacité d'orthopsie 2008-2009 102

Résumé d'une variable continue

• Age de 5 étudiants : 19, 20, 20, 21, 42• Médiane

�19 : 1 étudiant

�19, 20 : 3 étudiants

�19 à 21 : 4 étudiants

�19 à 42 : 5 étudiants

• Moyenne�1/5(19+20+20+21+42)

Q2 = 20 ans

µ = 24,4 ans

Capacité d'orthopsie 2008-2009 103

Résumé d'une variable continue

• Mesures de la variabilité• Écart interquartile : Q75-Q25

• Étendue : maximum - minimum• Variance

�Somme des écarts carrés autour de la moyenne�Divisée par l'effectif

• Écart-type = racine carrée de la variance• Coefficient de variation

( )

11

2

2

−=∑=

n

xn

ii µ

σ

µσ

Capacité d'orthopsie 2008-2009 104

Résumé d'une variable continue

• Age de 5 étudiants : 19, 20, 20, 21, 22• µ = 20,4 ans

• Écarts carrés�(19 - 20,4)² = 1,96

�(20 - 20,4)² = 0,16

�(21 - 20,4)² = 0,36

�(22 - 20,4)² = 2,56

• Somme divisée�5,2 / (5-1) = 1,3

Σ = 5,2

σ = 1,14 ans

Capacité d'orthopsie 2008-2009 105

Résumé d'une variable continue

• Age de 5 étudiants : 19, 20, 20, 21, 22

• Σx = 19 + 20 + 20 + 21 + 22 = 102

• Σx² = 19² + 20² + 20² + 21² + 22² = 2086

• σ² = ¼ (2086 – 102²/5) = 1,3

( )

−−

=−

−=

∑∑

∑=

=

=n

x

xnn

xn

in

i

n

ii

2

1

1

21

2

2

11

1

µσ

Capacité d'orthopsie 2008-2009 106

Loi normale

� Loi de Laplace-Gauss ou loi normale� Principale loi de probabilité

� Quasi-généralité dans bien des domaines.

� Peut être observée empiriquement

� Aspect typique� Forme en cloche

� Symétrique

� Moyenne, médiane et mode sont confondus

Capacité d'orthopsie 2008-2009 107

Un exemple

� Glycémie à jeun de plusieurs sujets4,2 4,8 4,8 6,44,2 5,8 6,3 4,53,8 5,7 4,9 5,24,9 4,8 3,5 5,04,2 5,5 6,7 4,7… … … ...

Capacité d'orthopsie 2008-2009 108

Loi normale

� Aire sous la courbe entre deux points

2,5%

2,5%

1,96

-1,96

ECH

IP

0.0

0.1

0.2

0.3

0.4

p(X

)

-3 -2 -1 0 1 2 3

X

Normal Densityµ = 0σ = 1

Moyenneet

écart-type

Capacité d'orthopsie 2008-2009 109

Loi normale

� Loi de Gauss centrée-réduite� µ=0 et σ=1

� 95% des valeurs sont situées entre 0±1,96

� La relation se généralise� µ et σ quelconques

� 95% des valeurs sont situées entre µ±1,96.σ

Capacité d'orthopsie 2008-2009 110

Résumé d'une variable continue

� Calcul d'estimateurs ponctuels et de leur variabilité � intervalle de confiance

σ+µσ−µ 22 ˆ96.1ˆ;ˆ96.1ˆ

∑=

=µn

1iix

n

1ˆ ( )∑

=µ−=σ

n

1i

2i

2 xn

Méthode dumaximum

devraisemblance

Capacité d'orthopsie 2008-2009 111

Retour à la population

• La probabilité que la "vraie" valeur moyenne µ soit comprise dans l’intervalle de confiance à 95% est de 0,95• Plus la taille d’échantillon est importante, plus

l’étendue de l’intervalle est faible

• Plus l’échantillon est hétérogène, plus l’étendue de l'intervalle est importante

Capacité d'orthopsie 2008-2009 112

Résumé d'une variable qualitative

Capacité d'orthopsie 2008-2009 113

Données de survie

� Pour chaque individu� Variables explicatives

� Couple de variables� Survenue de l'événement = censure

� Oui : décès, apparition de la maladie, d'une complication

� Non : perdu de vue ou fin de l'étude

� Délai avant censure

Capacité d'orthopsie 2008-2009 114

Courbe de survie : Kaplan-Meier

inclusion

inclusion Décès (ou évènement)

Censure (Perdu de vue, fin d’étude)

Capacité d'orthopsie 2008-2009 115

Courbe de survie : Kaplan-Meier

Capacité d'orthopsie 2008-2009 116

Courbe de survie : Kaplan-Meier

100%

Capacité d'orthopsie 2008-2009 117

Courbe de survie : Kaplan-Meier

100%

Capacité d'orthopsie 2008-2009 118

Courbe de survie : Kaplan-Meier

100%

Décès

Censure

Capacité d'orthopsie 2008-2009 119

Courbe de survie : Kaplan-Meier

� Trouver la médiane de survie� Temps pour lequel la survie passe sous la valeur

de 50 %

� Si la survie reste supérieure à 50 %, prendre troisième quartile de survie (75%) ou autre valeur

� Trouver la survie à un temps donné� Lecture opposée de la recherche de la médiane

Capacité d'orthopsie 2008-2009 120

Médiane 68 jours

Courbe de survie : Kaplan-Meier

Capacité d'orthopsie 2008-2009 121

Survie à 100 jours 33%

Courbe de survie : Kaplan-Meier

Capacité d'orthopsie 2008-2009 122

Ce qu'il faut retenir

� Les trois grandes étapes des analyses

� La multiplicité des représentations graphiques

� Les particularités des données de survie

� Le rôle de la loi normale

� Les résumés d'une variable� Moyenne

� Médiane

� Variance

Capacité d'orthopsie 2008-2009 123

Analyses univariées etmultivariées

Capacité d'orthopsie 2008-2009 124

Analyses uni- vs multivariées

� Analyse univariée � Analyse d’un seul facteur sur le résultat

� Effet d’un traitement sur la survie

� Analyse multivariée� Analyse de plusieurs facteurs simultanément sur

le résultat

� Effet d’un traitement et de l’âge sur la survie

� "Multivariate" = plusieurs variables résultat

Capacité d'orthopsie 2008-2009 125

Démarche générale

• Une variable résultat (à expliquer)

• Des variables explicatives

• Montrer la relation de cause à effet• Dans la population

• A partir des données d'échantillons

� Tests d'hypothèse

Capacité d'orthopsie 2008-2009 126

Tests d'hypothèses

• Exemple de l'efficacité d'un traitement sur un dosage sanguin• Constitution de deux groupes (échantillons)

�Groupe A reçoit le traitement (population A)

�Groupe B reçoit un placebo (population B)

• Hypothèse nulle�Les moyennes des dosages dans les 2 populations

sont les mêmes

H0 : µA=µB

Capacité d'orthopsie 2008-2009 127

Tests d'hypothèses

� En raison des aléas du tirage au sort, même si les effets sont identiques, les moyennes observées mAet mB sont différentes

� La différence mA-mB varie autour de 0

� Sous H0, on peut calculer la Pr(mA-mB>limite)

Capacité d'orthopsie 2008-2009 128

Tests d'hypothèses

� Formalisation• S'il n'y a pas de différence entre les deux

moyennes, l'événement mA-mB>1,96.σ est rare : Pr<0,05

• Ici σ est un estimateur de la variabilité de la différence (somme pondérée)

• S'il a été observé c'est que H0 est fausse et on retient son complémentaire H1 : µA≠µB

• Test d'hypothèse nulle

Capacité d'orthopsie 2008-2009 129

Tests d'hypothèses

� Si H0 est vraie, on la rejette (test significatif) avec un risque α

� Si H1 est vraie, on ne rejette pas H0 avec un risque β

� Si H1 est vraie, on rejette H0 avec un "risque" 1-β : la puissance

� Classiquement� α=5%

� 1-β=80 ou 90%

Capacité d'orthopsie 2008-2009 130

Tests d'hypothèses

� Forme générale� Fixer H0 et H1

� Calcul d'une statistique observée T

� Détermination d'une statistique limite L, telle que Pr(T > L) > α

� Si T > L, on rejette H0

� Si T < L, on ne rejette pas H0

� Règle de décision de Neyman-Pearson

Capacité d'orthopsie 2008-2009 131

Mesure de risque

� Risque dans un groupe� Risque absolu = fréquence de la maladie chez les

exposés ou chez les non exposés� a / (a+b)

� c / (c+d)

Malades Non maladesFacteur ouiFacteur non

a bc d

Capacité d'orthopsie 2008-2009 132

Association maladie-facteur

� Deux mesures très utilisées� Risque relatif = fréquence de la maladie chez les

exposés par rapport à la fréquence chez les non exposés (modèle multiplicatif)

Malades Non maladesFacteur ouiFacteur non

a bc d

dc

cba

a

RR .estim

+

+=Estimation donc erreur

Capacité d'orthopsie 2008-2009 133

Association maladie-facteur

� Deux mesures très utilisées� Odds ratio = rapport des cotes (turf)

� "cote" de la maladie chez exposés = rapport entre fréquence de la maladie chez exposés et 1-fréquence

� "cote" chez les non exposés

Malades Non maladesFacteur ouiFacteur non

a bc d

bc

adOR .estim =

Estimation donc erreur

Capacité d'orthopsie 2008-2009 134

Association maladie-facteur

� Des mesure plus rarement utilisées� Risque attribuable = proportion de malades évités

si le facteur était supprimé

� Excès de risque = différence de fréquence de la maladie entre exposés et non exposés (modèle additif)

� Fraction préventive

Malades Non maladesFacteur ouiFacteur non

a bc d

Capacité d'orthopsie 2008-2009 135

Association maladie-facteur

� Fraction étiologique chez les exposés� Proportion des cas que l’on peut attribuer au facteur de

risque

� Si p est la prévalence de l'exposition dans la population :

� Toutes ces mesures sont estimées et doivent donc être assorties d'un intervalle de confiance

Malades Non maladesFacteur ouiFacteur non

a bc d

11

1

+−−=)(

)(RRp

RRpFER

Capacité d'orthopsie 2008-2009 136

Association maladie-facteur

� Test de l'association� Le Chi² magique

� Test de l'OR ou du RR à 1

Malades Non maladesFacteur ouiFacteur non

a bc d

( ) ( )( )( )( )( )dbcadcba

dcbabcad 221 ++++

+++−=χ

Capacité d'orthopsie 2008-2009 137

Un exemple

• Comparer deux traitements dans le cadre d’un essai randomisé sur les lombosciatiques• Corticoïdes par infiltrations

• Placebo

• Critère de jugement : succès/échec à J20 par auto-évaluation du patient

• Planification de l’étude : inclusion prévue de 43 patients/groupe

Capacité d'orthopsie 2008-2009 138

Un exemple

• Au terme de l’étude• 85 patients inclus

• Résultats observés : �Corticoïdes : 22/43 (51,2%) de succès

�Placebo : 10/42 (23,8%) de succès

• Hypothèses• H0 : taux de succès identiques entre corticoïdes

et placebo

• H1 : taux de succès différents

Capacité d'orthopsie 2008-2009 139

Un exemple

• Risques• Erreur de première espèce α : conclure à une

différence d’efficacité entre corticoïdes et placebo alors que les taux de succès sont identiques

• Erreur de seconde espèce β : ne pas réussir àprouver une différence d’efficacité entre corticoïdes et placebo alors que cette différence existe

• Puissance 1-β : prouver une différence d’efficacité entre corticoïdes et placebo quand la différence existe

Capacité d'orthopsie 2008-2009 140

Un exemple

• Sous H0• Taux de succès attendus

�Sous corticoïdes�Sous placebo�(22 + 10) / (43 + 42) = 37,6 %

• Nombre de succès attendus�Sous corticoïdes : 43 x 0,376 = 16,19�Sous placebo : 42 x 0,376 = 15,81

Corticoïdes PlaceboSuccèsÉchec

22 1021 32

Capacité d'orthopsie 2008-2009 141

Un exemple

• Sous H0• Attendus

• Écarts carrés pondérés par les attendus (O-E)²/E

Corticoïdes PlaceboSuccèsÉchec

22 1021 32

Corticoïdes PlaceboSuccèsÉchec

16,19 15,8126,81 26,19

Corticoïdes PlaceboSuccèsÉchec

2,09 2,141,26 1,29

Capacité d'orthopsie 2008-2009 142

Un exemple

• La statistique = Chi2• Somme des écarts carrés pondérés

• Chi2 calculé = 6,77

• A comparer à une distribution théorique

( )∑

−=E

EO ²²χ

ddl 40% 30% 20% 10% 5% 1% 0,1%1 0,71 1,07 1,64 2,71 3,84 6,63 10,832 1,83 2,41 3,22 4,61 5,99 9,21 13,823 2,95 3,66 4,64 6,25 7,81 11,34 16,274 4,04 4,88 5,99 7,78 9,49 13,28 18,475 5,13 6,06 7,29 9,24 11,07 15,09 20,516 6,21 7,23 8,56 10,64 12,59 16,81 22,467 7,28 8,38 9,80 12,02 14,07 18,48 24,328 8,35 9,52 11,03 13,36 15,51 20,09 26,129 9,41 10,66 12,24 14,68 16,92 21,67 27,88

10 10,47 11,78 13,44 15,99 18,31 23,21 29,59

Table de la loi du Chi ²

Capacité d'orthopsie 2008-2009 143

Un exemple

• Conclusion

• Chi2 observé supérieur à la valeur théorique• Rejet de H0

• On met en évidence une différence de taux de succès

• Degré de signification : p = 0,009

Capacité d'orthopsie 2008-2009 144

Degré de signification

• Plus il est faible, moins les résultats observés sont en cohérence avec H0

• En aucun, importance de la différence entre groupes

• Valeur de p dépend• Différence observée entre les deux groupes• Taille d’échantillon• S’il existe une différence réelle, aussi infime soit-elle, entre

2 groupes, n’importe quel test statistique va aboutir à une valeur de p inférieure à 0,05, dès lors que le nombre de sujets étudiés sera important

Capacité d'orthopsie 2008-2009 145

Exemple (retour)

• 22/43 (51,2%) vs 10/42 (23,8%)• Différence d’efficacité = 27,4%• p = 0,009

• 14/22 (63,6%) vs 5/21 (23,8%)• Différence d’efficacité = 39,8%• p = 0,009

• 1104/4200 (26,3%) vs 1000/4200 (23,8%)• Différence d’efficacité = 2,5%• p = 0,009

Capacité d'orthopsie 2008-2009 146

Degré de signification

• Un résultat non statistiquement significatif• H0 est vraie (pas de différence entre les groupes)

• Puissance statistique insuffisante (NSN)

• Ne pas mettre en évidence de différence statistiquement significative entre deux groupes ne signifie pas qu’il n'y a pas de différence

Capacité d'orthopsie 2008-2009 147

Modélisation

•Buts de l'analyse statistique• Descriptif

• Explicatif

• Prédictif

•Besoin d'outils mathématiques• Traduction de la réalité

• Choix

• Perte d'information

Capacité d'orthopsie 2008-2009 148

Modélisation

• Forme générale : g(Y) = f(X) + Σ• Y = variable(s) à expliquer

• X = variable(s) explicative

• g et f = éventuelles fonctions de transformation

• Σ = matrice de variance-covariance

• Un cas des plus simples• Y = aX + b + ε• ε ~ N(0,σ²)

– Importance des tests d'adéquation

Capacité d'orthopsie 2008-2009 149

Modélisation

• Attention au modèle choisi• Lien entre le nombre d’heures de cours et la note

à un examen

• P<0,001

Capacité d'orthopsie 2008-2009 150

Modélisation

• Attention au modèle choisi• Lien entre le nombre d’heures de cours et la note

à un examen

• P<0,001• R²=0,33

Capacité d'orthopsie 2008-2009 151

Modélisation

• Modèles linéaires• Régression simple : Y = aX + b• Régression multiple : Y = a1X1 + a2X2 +…+ b

• Modèles logistiques• Y = dichotomique (1 vs 0)• g(Y) = logit(Pr(Y=1)) = a1X1 + a2X2 +…+ b• Les ai sont des odds ratios (exponentielle)

Capacité d'orthopsie 2008-2009 152

Modélisation

• Données de survie et modèle de Cox• h = risque instantané de décès• log(h(X,t)) = log(h0(t)) + a1X1 + a2X2 + …

• Nombreux autres modèles• Lissage• Modèles mixtes• …

Capacité d'orthopsie 2008-2009 153

Puissance

� La variabilité définit la puissance d'une étude et donc le nombre de sujets nécessaires� Si la variabilité est grande, plus difficile d'observer

de petites différences

� Le calcul du nombre de sujets nécessaires est donc fait en tenant compte de la variabilité attendue

Capacité d'orthopsie 2008-2009 154

Nombre de sujets nécessaires

� Détermine la puissance du test : probabilitéde mettre en évidence une différence quand elle existe

� Le nombre de sujet nécessaire se calcule àpartir de� α et β

� Différence entre les moyennes que l'on souhaite mettre en évidence� Plus la différence est petite, plus le NSN est grand

Capacité d'orthopsie 2008-2009 155

Exemple (retour)

• Hypothèse quantitative sous H1 a priori• 70% de succès sous corticoïdes

• 40% de succès sous placebo

• Risques d’erreur• Erreur de première espèce : α = 5%

• Erreur de seconde espèce : β = 20%

� 43 patients par groupe

Capacité d'orthopsie 2008-2009 156

Correction du risque α

� Pour comparer deux groupes : α = 5%

� Sur plusieurs comparaisons, la probabilité d’observer une différence entre les groupes (alors qu’il n’y a pas de différence : H0) doit rester de 5%

� Si on fait deux comparaisons, la probabilité de trouver au moins un test significatif n’est plus de 5%

� Il faut donc « corriger » le risque α

Capacité d'orthopsie 2008-2009 157

Correction du risque α

� Exemple de deux comparaisons

� Pr(Aucun significatif) = 0,9025 et pas 0,95

� donc probabilité d’avoir au moins un test significatif 0,0975

0,05

0,05

0,95 × 0,95 = 0,9025

Capacité d'orthopsie 2008-2009 158

Correction du risque α

� Exemple de deux comparaisons

� Pour avoir α = 0,95

� On doit prendre la signification de chaque test à 0,0253

0,0253

0,0253

0,975 × 0,975 = 0,951

Capacité d'orthopsie 2008-2009 159

Ce qu'il faut retenir

� Définition des analyses univariées vs multivariées

� Notion de tests d'hypothèse et leur forme générale

� Calcul d'un RR et d'un OR

� Les pièges du degré de signification

� Grandes classes de modèles

� La notion de NSN

Capacité d'orthopsie 2008-2009 160

Mon cher Watson, essayer de faire votre propre analyse. Vous connaissez mes méthodes, appliquez les !

S. Holmes, Le signe des 4.