Biais en épidémiologie...Dernier scénario • Un homme s’arrête en plein voyage dans le...
Transcript of Biais en épidémiologie...Dernier scénario • Un homme s’arrête en plein voyage dans le...
Biais en épidémiologie
Anne EGODMIS Département Méthodologie de
l’Information en SantéCHU Grenoble
Objectifs• Rappeler quelques notions
– Sur les objectifs des différentes études épidémiologiques – Et sur la recherche de la causalité– Sur la qualité des études et leur lecture critique …
• … dont la recherche de biais – En les situant parmi les critères de qualité d’une étude– En distinguant les mécanismes de confusion, sélection, et
classement• Voir comment les corriger
– En amont à la conception de l’étude– En aval au moment de l’analyse
Epidémio?• L'épidémiologie est l'étude des facteurs influant sur la
santé et les maladies des populations humaines. Il s'agit d'une science qui se rapporte à la répartition, à la fréquence et à la gravité des états pathologiques.
• L'étude de la répartition et des déterminants des évènements de santé sert de fondement à la logique des interventions faites dans l'intérêt de la santé publique et de la médecine préventive.La reconnaissance de l'épidémiologie comme champ d'étude est relativement récente, mais elle est l'un des piliers de la santé publique et de la médecine à travers l'histoire.
(Source Wikipedia)
Objectifs descriptifs et étiologiques
• Connaissance de la fréquence des maladies et leur description est nécessaire
• Identification de facteurs associés à la maladie• Comment passer de « association » à « cause » de
maladies
Briquet Cancer du poumon
préférez les allumettes !
p < 0.0000000000001
Exemple de scénarios : causalitéou non?
• Vous avez placé une bouilloire pleine sur le feu.• Plusieurs minutes passent et le téléphone sonne.• Juste après, la bouilloire siffle.• Vous êtes assis(e) dans le salon avec votre chien.• Un étranger s’approche de la maison.• Votre chien commence à aboyer.
Si le téléphone n’avait pas sonné, la bouilloire aurait-elle sifflé?Si l’étranger ne s’était pas approché, le chien aurait-il aboyé?
Autre scénario
• Jean est né puis Jean est décédé. Si Jean n’était pas né, il ne serait pas mort.
• Donc la naissance de Jean est la cause de son décès.
Dernier scénario
• Un homme s’arrête en plein voyage dans le désert. Il a 2 ennemis. L’un des 2 a mis un poison mortel dans son réservoir d’eau. L’autre a fait un trou sous ce réservoir.
• L’eau empoisonnée a totalement couléavant que l’homme ne boive, et il meurt de soif. Quelle est la cause du décès? Le poison ou le trou dans le réservoir?
Définition théorique • X et Y se sont produits, et Y ne se serait pas produit si X
ne s’était pas produit• X et Y se sont produits, et dans ces circonstances, Y ne
se serait pas produit si X ne s’était pas produit • X et Y se sont produits, et dans ces circonstances, et
avec un mécanisme causal, Y ne se serait pas produit si X ne s’était pas produit
• X et Y se sont produits, et dans ces circonstances, et avec un mécanisme causal, Y ne se serait pas produit si X ne s’était pas produit de la façon et au moment où il s’est produit
Définition de Rothman• Une cause de maladie est un antécédent, une
condition ou caractéristique, qui était nécessaire à la maladie, au moment où elle est survenue, les autres conditions étant fixées par ailleurs.
• Une cause de maladie est un antécédent, une condition ou caractéristique, qui précédait la maladie et sans laquelle la maladie ne serait pas arrivée du tout ou ne serait pas arrivée avant un certain temps.
Identification de la causalité
• Association?Différence non expliquée par le hasard• Temporalité?L’exposition précède la maladie• Plausible?Mécanisme physiopathologique et pas
d’autre explication possible
Ce serait trop simple!Différents facteurs (1 à plusieurs) dans une seule et même
causeDifférentes causes dans une seule et même maladie
• Facteurs insuffisants• Mais nécessaires• D’une cause non nécessaire• Mais suffisante pour développer la maladie
In english : INUS (Insufficient Necessary Unnecessary Sufficient)
Exemple : AVC
Cause1
Cause2
Cause3
Cholestérol
Obésité
TabacStress Gènes
Hypertension
Exercice physique
Alimentation
Effet causal
Fq Maladie chez les exposés
Fq Maladie chez les exposés si ils n’avaient pas été exposés
Pour identifier le rôle d’une exposition
que la fréquence de la maladie chez ces mêmes
sujets s’ils n’avaient pas étéexposés
Non observableCirconstances qu’il faut s’efforcer de reproduire le mieux possible
Comment chercher cet effet causal?
Si l’exposition est la cause de la maladie, alors
La fréquence de la maladie doit être plus grande chez
les exposés ObservableFait mesurable
Si la prématurité est une cause de mortalité
La mortalité doit être plus importante chez les
prématurés queExposition
la mortalité chez les prématurés s’ils n’avaient pas
été prématurés…
Approximation d’absence d’exposition
Objectif = rendre identique les 2 groupes pour toutes les causesde maladie sauf l’exposition… sauf que cette comparabilitéabsolue n’est jamais vue, jamais certaine, jamais connue!
… autrement dit chez les enfants à terme
Qualité des études : principes de l’EBM
“Evidence-based medicine is the integration of best research evidence with clinical expertise and patient values”
- Dave SackettPatient
Concerns
Clinical Expertise
Best research evidence
EBM
Principes de l’EBM
William Osler, 1849-1919Médecin sage et expérimenté
Jeune docteur qui sait chercher l’information et la critiquer
Par qui préfériez-vous être soigné?
Types d’enquête et niveau de preuveBUT : Rechercher l ’ASSOCIATION entre un facteur (intervention, dépistage, traitement, …) et un indicateur (maladie ou ses marqueurs)
Enquêtes observationnelles:Série de casCas témoinsCohortesEnquêtes quasi-expérimentales :
ici-ailleurs / avant-après
Essais randomisés
Contrôle de l ’intervention (choix des sujets, suivi de l’application de l ’intervention, choix des données recueillies)
Pertinence de la comparaison des groupes
Les types d’enquête : « la pyramide de l’évidence »
Critères en EBM
1 Validité de
l’étude:Objectif,
population et méthodes
2 Ampleur des
résultats:Expression des
résultats, importance et pertinence clinique
3Extrapolation: en quoi les résultats peuvent-
ils être appliqués à la population cible
Validité d’une étude
• Validité interne : résultats corrects dans l’étude
– Formulation de l’objectif (PICO)– Design retenu– Choix de la population– Déroulement de l’étude– Analyse des données
Biais
Correction partielle de certains biais
Pour y voir clair : la PICO question
• Patient, population ou problème
– Comment je peux définir la population qui correspond le mieux à la situation qui m’intéresse?
• Intervention, facteur pronostique, ou exposition
– De quelle intervention exactement suis-je en train de parler?
• Comparaison ou contrôle (si nécessaire)
– Quelle est la principale alternative?
• Outcome que je souhaite mesurer
– Qu’est-ce que je peux espérer améliorer, supprimer, modifier?
Pour y voir clair : la PICO question
Etude diagnostique
Série de cas Cas Témoins
Cohorte Avant Après
Ici Ailleurs
Essai randomisé
Population Population source
Intervention Test
E et nonEM et nonM
Cas M E Après Ici Traitement
Contrôle Gold standard T non M Non E Avant Ailleurs Placebo
Outcome M E M M M M
Population et échantillon
• Objectif final = appliquer les résultats àune population cible (ensemble des naissances prématurées en France)
• En pratique : – utilisation d’une population source
(naissances prématurées Rhône Alpes)– à partir de laquelle on sélectionne un
échantillon (ex : 1 naissance sur 5) ≈ outil de travail
Différents types d’erreur• Peuvent intervenir dans la conception, le déroulement ou
l’analyse de l’étude• Liées au hasard, symétriques (fluctuations
d’échantillonnage, erreurs de mesure, bruit) : responsable du manque de précision
• Systématiques, asymétriques = biais : responsable d’un défaut de validité interne.
Biais = distorsion d’une mesure - de la fréquence d’une maladie, - d’un RR, d’un OR …
liée à un facteur associé à la maladie ou l’exposition, et conduisant à une sur ou sous estimation, jusque absence d’effet
3 sources de biais• Sélection : mauvaise représentation des sujets
concernés par l’objectif, intervenant au moment du recrutement ou du suivi
• Confusion : manque de contrôle des caractéristiques des sujets inclus
• Classement : mauvaise mesure de l’outcome
Sources de non comparabilité des groupes àdes moments variables du déroulement de l’étude
Sources de non comparabilité des groupes
Non exposés
Exposés
Exposition
Facteurs différenciant les groupes
« Contrôles non exposés ≈ exposés s’ils n’avaient pas été exposés »
Sources de non comparabilité des groupes
Non exposés
Exposés
ClassementSélectionConfusionExposition
Facteurs différenciant les groupes
« Contrôles non exposés ≈ exposés s’ils n’avaient pas été exposés »
Population source
SuiviE / nonE
Mesure de la maladie
M
Sélection= de la population source àl’échantillon
= attrition de l’échantillon liée àdes perdus de vue
Classement = Différence d’identification de la maladie entre exposés et non exposés
EchantillonE / nonE
Sources de non comparabilitédes groupes
Confusion : constitution des groupes
Biais de sélection : mécanismes
Légende: Lettres capitales (“ABCD”) = effectifs si échantillon représentatifMinuscules (“abcd”) = proportions des effectifs restants (sélection initiale ou perdus de vue)
M+ M-
E+
E-
A
C
B
D
a b
c d
Proportions de perdus de vue inégales selon l’exposition (mécanisme dépendant de l’exposition)
M+ M-
E+
E-
A
C
B
D
a b
c d
Proportions de perdus de vue inégales selon la maladie (mécanisme dépendant de la maladie)
M+ M-
E+
E-
A
C
B
D
a b
c d
Proportions de perdus de vue inégales selon exposition et maladie (mécanisme dépendant de l’exposition et de la maladie)
M+ M-
E+
E-
A
C
B
D
a b
c d
Proportions semblables de perdus de vue
Si a = b = c = d
M+ M-
E+
E-
A
C
B
D
a b
c d
RR =PrM+ | E+
PrM+ | E-=
aA / (aA +bB)
cC / (cC +dD)=
aA / (aA +aB)
aC / (aC +aD)=
A / (A +B)
C / (C +D)
Pas d’effet sur le risque relatif
OR =( PrM+ | E+) / ( PrM- | E+)
=
Pas d’effet sur l’odds ratio
( PrM+ | E-) / ( PrM- | E-)
aA / (aA +bB)
bB / (aA +bB)
cC / (cC +dD)
dD / (cC +dD)
=
aA
aB
aCaD
=AD
BC
M+ M-
E+
E-
a bc d
A
C
B
D
RR =PrM+ | E+
PrM+ | E-=
aA / (aA + bB)
cC / (cC + dD)=
aA / (aA + aB)
cC / (cC + cD)=
A / (A + B)
C / (C + D)
Pas d’effet sur le risque relatif
Si dépendant de l’expositiona = b c = da, b ≠ c, d
OR = =
Effet sur l’odds ratio
aA / (aA + aB)
aB / (aA + aB)
cC / (cC + cD)
cD / (cC + cD)
= =AD
BC
PrM+ | E+PrM- | E+
PrM+ | E-
PrM- | E-
aA / (aA + bB)
bB / (aA + bB)
cC / (cC + dD)
dD / (cC + dD)
=
A
B
C
D
aA / a(A + B)
aB / a(A + B)
cC / c(C + D)
cD / c(C + D)
=
Proportions de perdus de vue inégales selon l’exposition
M+ M-
E+
E-
a b
c d
A
C
B
D
RR =PrM+ | E+
PrM+ | E-=
aA / (aA +bB)
cC / (cC +dD)=
aA / (aA +bB)
aC / (aC +bD)
RR modifié
Si dépendant de la maladie
a = c b = da, c ≠ b, d
OR =
Pas d’effet sur odds ratio
aA / (aA + bB)
bB / (aA + bB)
aC / (aC + bD)
bD / (aC + bD)
= =abAD
abBC
PrM+ | E+PrM- | E+
PrM+ | E-PrM- | E-
aA / (aA + bB)
bB / (aA + bB)
cC / (cC + dD)
dD / (cC + dD)
= =
aA
bB
aCbD
=AD
BC
Proportions de perdus de vue inégales selon la maladie
M+ M-
E+
E-
a b
c d
A
C
B
D
RR modifié (proportions inégales selon la maladie)
Odds ratio aussi modifié
Si dépendant de maladie et exposition a ≠ b ≠ c ≠ d
OR =aAdD
cCbB
PrD+ | E+PrD- | E+
PrD+ | E-PrD- | E-
=
aA / (aA + bB)
bB / (aA + bB)
cC / (cC + dD)
dD / (cC + dD)
= =
aA
bB
cCdD
≠AD
Proportions de perdus de vue inégales selon la maladie et l’exposition (dépendant de maladie et exposition)
BC
M+ M-
E+
E-
a bc d
A
C
B
D f (E-)
e (E+)
g (M+) h (M-)
Si perdus de vue indépendants de
maladie et exposition:
a = egb = ehc = fgd = fh
a ≠ b ≠ c ≠ d(La proportion de chaque cellule est le produit de la proportionde perdus de vue selon maladie et selon exposition, mais elles
sont inconnues)
OR = = =
PrM+ | E+PrM- | E+
PrM+ | E-
aA / (aA + bB)
bB / (aA + bB)
cC / (cC + dD)
dD / (cC + dD)
=
aA
bB
cCdD
AD
BC=
egAehB
fgChfD
egA * hfDehB * fgC
=eghfADehfgBC
Proportions de perdus de vue inégales selon la maladie et l’exposition (mais indépendantes de maladie et exposition)
RR modifié (proportions inégales selon la maladie)
Pas d’effet sur odds ratio
PrM- | E-
=
Exemple à partir de perdus de vueChez les nouveau-nés sortis de maternité dans le département (P), un programme de soutien à l’allaitement maternel avec intervention à domicile le 1er mois (I) est mis en place afin d’augmenter le taux d’allaitement à 3 mois (O) par rapport à la prise en charge habituelle (C).
Echantillon de 1500 nnés et suivi téléphonique à 3 mois
Sans perdus de vueM+ M‐
E+ 600 0,80 150 0,20 750 RR 2,000,67 0,25
E‐ 300 0,40 450 0,60 750 OR 6,000,33 0,75900 600 1500
Perdus de vue (375/1500, soit 25%) : Les patientes ayant bénéficié de l’intervention répondent plus à 3 mois, indépendamment du fait d’allaiter ou non.
L’intervention les a sensibilisées au sujet?
Sans perdus de vueM+ M‐
E+ 600 0,80 150 0,20 750 RR 2,000,67 0,25
E‐ 300 0,40 450 0,60 750 OR 6,000,33 0,75900 600 1500
90% des E+ et 60% des E‐M+ M‐
E+ 540 0,80 135 0,20 675 RR 2,000,75 0,33
E‐ 180 0,40 270 0,60 450 OR 6,000,25 0,67720 405 1125
A gauche=échantillon correct – A droite=sélection d’une partie de la population
Mécanisme dépendant de l’exposition
40% des M+ et 70% des M‐M+ M‐
E+ 240 0,70 105 0,30 345 RR 2,520,67 0,25
E‐ 120 0,28 315 0,72 435 OR 6,000,33 0,75360 420 780
Plus de perdus de vue chez les femmes qui allaitent.
Les patientes qui allaitent ont moins le temps de répondre à l’enquête, indépendamment du fait qu’elles aient bénéficié ou non de l’intervention?
Sans perdus de vueM+ M‐
E+ 600 0,80 150 0,20 750 RR 2,000,67 0,25
E‐ 300 0,40 450 0,60 750 OR 6,000,33 0,75900 600 1500
Mécanisme dépendant de la maladie
M+ M‐E+ 260 0,74 90 0,26 350 RR 3,19
0,72 0,21E‐ 100 0,23 330 0,77 430 OR 9,53
0,28 0,79360 420 780
40% des M+ et 70% des M‐ mais sélection liée à l'exposition
Les patientes qui allaitent ont moins le temps de répondre à l’enquête, mais celles qui ont bénéficié de l’intervention répondent mieux :
Le fait de répondre est associée à la fois à l’allaitement et au fait d’avoir bénéficié de l’intervention?
40% des M+ et 70% des M‐M+ M‐
E+ 240 0,70 105 0,30 345 RR 2,520,67 0,25
E‐ 120 0,28 315 0,72 435 OR 6,000,33 0,75360 420 780
Mécanisme dépendant de l’exposition et de la maladie
En résumé : biais de sélectionDe manière générale :
• Mauvaise représentation de la population cible dans l’échantillon • liée à un mécanisme dépendant de la maladie ± exposition• survenant
– dans la constitution initiale de l’échantillon – durant l’étude par attrition
• Induisant une erreur ou distorsion dans l’estimation – d’un risque (prévalence, incidence, sensibilité, …) – ou dans la mesure d’une association (RR, OR, …) lorsque la sélection est liée à un facteur lui-même associée à l’exposition ou la maladie
• Erreur porte sur RR ou OR ou les deux selon mécanisme
Différents biais de sélectionPopulation Maladie Exposition Mécanisme ou tiers facteur Résultat
Constitution de l’échantillon (enquêtes transversales)
Naissances en niveau 3
Etat de santénéonatale
Présence du pédiatre en salle de naissance
Niveau 3 : Surreprésentation des enfants qui vont mal et bénéficient de la présence du pédiatre
Association présence du pédiatre et décès!
Sujets hospitalisés pour accidents de la route
Décès intrahospitalier
Alcool Décès intrahospitalier : Sous représentation des sujets décédés sur la voie publique
Sous estimation de l’association alcool et décès
Constitution de l’échantillon (cohortes)
Sujets actifs Maladie respiratoire
Exposition professionnelle (isocyanates)
Activité professionnelle : Sous représentation des sujets exposés qui sont en arrêt de travail du fait de la maladie. « Healthy worker effect »
Sous estimation de l’association exposition maladie
Constitution de l’échantillon (cas témoins)
Naissances (cas=malformations congénitales et témoins=sans malfo)
Cas prévalents
Expositiion début de grossesse
Expositions pouvant être liées à la survenue de malfo et à l’accès au diagnostic prénatal et décès intrautérin précoce (ex : CSP, zone rurale, …). Solution = prendre les cas incidents
Sous estimation du rôle de certaines expositions
Différents biais de sélectionPopulation Maladie Expositio
nMécanisme ou tiers facteur Résultat
Constitution de l’échantillon (cas témoins)
Recrutement hospitalier des cas (maladie X) et témoins (motif Z)
Maladie X Exposition X
Probabilités d’admission dans le centre différentes entre cas et témoins et associés à la maladie et l’exposition (ex : CSP). Biais de Berkson
Cas (cancer vessie) et témoins (maladies CV)
Cancer vessie Tabac Surappariement des cas et témoins (témoins non représentatifs de la population source d’où sont issus les cas)
Sous estimation de l’association tabac cancer
Suivi de cohortes
Naissances Développement psychomoteur àl’âge scolaire
Prématurité Les perdus de vue sont de NSE moindre et le NSE est associé àla prématurité et à un pronostic moins bon
Sur estimation du pronostic et sous estimation du lien avec le NSE
Eviter les biais de sélectionChoix de l’échantillon
Population source
Echantillon
Population cible
Objectif : extrapolation des résultats?
≈ ?
≈ ?
Sujets non représentés ou sous représentés
Sujets non représentés
ou sous représentés
Eviter les biais de sélectionChoix de l’échantillon
Naissances Rhône Alpes
Naissances CHU
Naissances en France
Objectif : extrapolation des résultats?
≈ ?
≈ ?
Eviter les biais de sélectionChoix de l’échantillon
Malades hospitalisés
Patients non consécutifs
Maladie X
Objectif : extrapolation des résultats?
≈ ?
≈ ?
Eviter les biais de sélectionChoix de l’échantillon
• Représentativité de l’échantillon :– Échantillon – population source– Population source – population cible
• Exhaustivité ≠ représentativité, ne suffit pas
Eviter les biais de sélectionChoix d’un groupe de référence
• Choix d’un groupe de référence :– Stratification– Appariement individuel
• Bien connaître la population source (ex : pas facile quand malades hospitalisés) et disposer d’une base de sondage
• Au minimum, on doit trouver dans le groupe de référence ≈ la fréquence de base de l’exposition ( cas témoins) ou fréquence de base de la maladie (cohorte)
Groupe de référence
Cas ou exposés +
Eviter les biais de sélectionSuivi de groupes d’étude
• Identifier les raisons limitant le suivi des sujets• Tenir compte de la durée d’exposition des sujets au
cours du suivi : dans le calcul de l’incidence des évènements, utiliser les personnes*année au lieu des personnes au dénominateur, pour tenir compte des perdus de vue. (donne une estimation au moins valide dans l’étude, mais n’élimine pas le biais)
Biais de classement : mécanismeM+ M-
E+
E-
A
C
B
D
A’ B’
Le total A+B+C+D est conservé.La répartition entre A et B (ou entre A et C, …) devient A’ et B’ et A+B=A’+B’
Biais de classement : mécanismeDe manière générale :• Mauvais classement dans l’une des 4 cases (E*M) du tableau de contingence• si il est lié à une identification différentielle
– de l’exposition (on trouve plus facilement des facteurs de risque chez les M+ que chez les M- ou inversement)– de la maladie (on diagnostique plus fréquemment la maladie chez les E+ que chez les E- ou inversement)
• Erreur quantitative (effectifs) ou qualitative (niveau d’exposition ou gravité de la maladie, sens de l’association)
E+ E‐M+ 7200 0,45 8800 0,55 16000
0,06 0,02 RR 2,23M‐ 123000 0,26 346000 0,74 469000 OR 2,30
0,94 0,98130200 354800 485000
ExempleParmi les malades, 20% des exposés sont classés non exposés (pas d’erreur chez les non malades)« Les malades déclarent moins facilement leur consommation d’alcool »
Sousestimation de l’association
E+ E‐M+ 9000 0,56 7000 0,44 16000
0,07 0,02 RR 3,44M‐ 123000 0,26 346000 0,74 469000 OR 3,62
0,93 0,98132000 353000 485000
E+ E‐M+ 9000 0,56 7000 0,44 16000
0,08 0,02 RR 4,52M‐ 98400 0,21 370600 0,79 469000 OR 4,84
0,92 0,98107400 377600 485000
ExempleParmi les non malades, 20% des exposés sont classés non exposés (pas d’erreur chez les malades)« Les non malades se souviennent moins qu’ils ont eu un traitement particulier »
Surestimation de l’association
E+ E‐M+ 9000 0,56 7000 0,44 16000
0,07 0,02 RR 3,44M‐ 123000 0,26 346000 0,74 469000 OR 3,62
0,93 0,98132000 353000 485000
Différents biais de classement• Cas témoins : Attitude différente des enquêteurs : recherche d’exposition plus insistante
chez les maladesBiais de mémorisation de la part des sujets inclus : oubli des expositions
chez les témoins
• Cohorte :Identification de la maladie plus fréquente chez les exposés (plus d’examens
complémentaires, plus de comorbidité)
• Etude diagnostique :Résultats du test plus souvent positifs chez les malades si connaissance du
résultat du Gold standard
• Essai randomisé :Succès du traitement plus fréquent dans le groupe traité par manque
d’objectivité dans la mesure du résultat (absence d’aveugle)
≠Erreurs non différentiellesTendent toujours à diminuer l’OR entre exposition et maladie par réduction du contraste entre les groupes :
Ici 20% des exposés sont classés à tort comme non exposés chez les malades comme les non malades ≈ « dilution » de 20% des exposés parmi les non exposés.
E+ E‐M+ 9000 0,56 7000 0,44 16000
0,67 0,25M‐ 123000 0,26 346000 0,74 469000 OR 3,62
0,33 0,75132000 353000 485000
E+ E‐M+ 7200 0,45 8800 0,55 16000
0,07 0,02 RR 2,94M‐ 98400 0,21 370600 0,79 469000 OR 3,08
0,93 0,98105600 379400 485000
≠Erreurs non différentiellesIci 20% des non exposés sont classés à tort comme exposés chez les malades comme les non malades ≈ « dilution » de 20% des non exposés parmi les exposés.
E+ E‐M+ 9000 0,56 7000 0,44 16000
0,67 0,25M‐ 123000 0,26 346000 0,74 469000 OR 3,62
0,33 0,75132000 353000 485000
E+ E‐M+ 10400 0,65 5600 0,35 16000
0,05 0,02 RR 2,59M‐ 192200 0,41 276800 0,59 469000 OR 2,67
0,95 0,98202600 282400 485000
Eviter les biais de classementConception de l’étude :
• Choix des patients : coopérativité, capacités de recours à la mémoire, surveillance médicale a priori comparables
• Standardiser les conditions de recueil d’informations • Même protocole de diagnostic chez exposés et non
exposés, même protocole chez cas et témoins
Déroulement de l’étude :• Questionnaires standardisés• Investigation d’un ensemble d’expositions sans
identifier l’exposition principale de l’étude• …
Eviter les biais de classement… Eviter la subjectivité du malade ou de l’observateur (influencé par la connaissance de la maladie ou l’exposition)
Mesure en double aveugle, à chaque fois que c’est possible
Mesure :• Du critère de jugement (succès ttm) dans l’essai randomisé• De la maladie dans une cohorte• Des expositions dans un cas témoin• Du résultat du test et du résultat du gold standard dans une étude diagnostique
Confusion : mécanismes• Mauvaise appréciation de la relation exposition et maladie liée à un tiers
facteur • l’association mesurée ne correspond pas à l’effet propre de E sur M • Facteur associé à la maladie et l’exposition• et inégalement présent dans les groupes comparés
• Contrairement aux biais de sélection et de classement :- Peut être corrigé en amont mais aussi par l ’analyse statistique - Ne résultent pas de l’intervention de l’investigateur : n’est ni une erreur de mesure,
ni un mauvais choix de l’échantillon- Est liée à « la nature des choses » (facteurs connus mais aussi inconnus)
• Proche de certains biais de sélectionEx du Healthy worker effect : mesure de l’effet d’expositions professionnelles (E) sur
une maladie (M) biaisée car les sujets ayant un meilleur état de santé (F) ont une activité professionnelle.
Sous estimation de l’effet de l’exposition ≈ effet de l’exposition + bon état de santéDans biais de sélection, il manque certains sujetsDans biais de confusion, impossibilité d’identifier cette variable
Exemple
E+ E‐M+ 184 0,21 680 0,79 864
0,18 0,07 RR 2,71M‐ 816 0,08 9320 0,92 10136
0,82 0,931000 10000 11000
Strate 1 <25 ans Strate 2 25‐40 ans Strate 2 >=40 ansE+ E‐ E+ E‐ E+ E‐
M+ 16 0,07 200 0,93 216 M+ 48 0,06 240 0,28 288 M+ 120 0,14 240 0,28 3600,08 0,04 RR 2,00 0,16 0,08 RR 2,00 0,24 0,12 RR 2,00
M‐ 184 0,04 4800 0,96 4984 M‐ 252 0,02 2760 0,27 3012 M‐ 380 0,04 1760 0,17 21400,92 0,96 0,84 0,92 0,76 0,88200 5000 5200 300 3000 3300 500 2000 2500
Quand biais de confusion : Relation brute exposition et maladie ≠ relation exposition et maladie selon strates de F (âge par ex)
Mesure effet de E mais avec la structure d’âge de l’échantillon
ExempleConjonction de deux phénomènes :• Répartition par âge des exposés différente de celle des non exposés : plus de sujets âgés chez les exposés• Répartition des malades liée à l’âge : plus de malades chez les sujets âgés
E+ E‐<25 ans 200 5000
0,20 0,5025‐40 ans 300 3000
0,30 0,30>=40 ans 500 2000
0,50 0,201000 10000
<25 ans 25‐40 ans >=40 ansM+ 216 288 360
0,04 0,09 0,14M‐ 4984 3012 2140
0,96 0,91 0,865200 3300 2500
En résuméF est facteur de confusion dans la relation entre E et M :• Si l’association brute entre E et M (marginale) est différente de l’association entre E et M selon le niveau de F (conditionnelle)• F est associé à la fois à E et à M• Le phénomène se reproduira dans chaque échantillon qui sera extrait de la population
E
F
M
Dans l’exemple : F augmente l’association entre E et M, car sujets âgés plus exposés et plus malades
E
F
M
+
+
+
?
E
F
M
Autre exemple : les exposés sont plus souvent des hommes (association sexe et E), mais les hommes sont moins souvent malades (association sexe et M)L’association brute E et M est plus faible que l’association entre E et M par sexe
E
F (homme)
M
+
+
-
?
Hommes Femmes TotalE+ E‐ E+ E‐ E+ E‐
M+ 100 15 100 75 200 900,13 0,05 0,27 0,10 0,18 0,09
M‐ 650 285 275 675 925 9600,87 0,95 0,73 0,90 0,82 0,91750 300 375 750 1125 1050
RR 2,7 RR 2,7 RR 2,1
Formulation du résultat
• RR brut ≠ RR conditionnels• Effet propre de E avec M, correspond à effet de E
– « Indépendamment de F »– A « F » égal (sexe, âge, tabagisme, NSE, …),
l’association entre E et M …
Confusion et interaction• Si RR conditionnels sont ≠ selon le niveau de F, il y a interaction entre E et
F
Exemple réel : étude du rôle du type de tabac fumé sur le cancer de vessie chez les hommes fumeurs selon qu’ils inhalent ou non la fumée
• On ne peut pas parler de LA relation entre tabac fumé et cancer ou la résumer par un résultat, il y a « plusieurs » relations
• L’analyse est dans ce cas réalisée par niveau de F (ici inhalation ou pas de la fumée)
E+ BrunE‐ Blond ou mixte
E+ BrunE‐ Blond ou mixte
E+ BrunE‐ Blond ou mixte
M+ cancer vessie 353 54 267 32 86 22
M‐ pas de cancer 253000 73000 134000 39000 119000 34000
253353 73054 134267 39032 119086 34022
RR 1,9 RR 2,4 RR 1,1
Total F+ Inhalent F‐ N'inhalent pasTabac fumé Tabac fumé Tabac fumé
Eviter / prendre en compte d’un facteur de confusion
• Identifier en amont les facteurs de confusion : lire la littérature
• Tirage au sort– Randomisation dans un essai (égale répartition en moyenne des
facteurs de confusion potentiels)– Impossible si étude observationnelle où on ne peut pas attribuer
l’exposition de manière expérimentale
• Restriction de la population d’étude– Ne prendre qu’un niveau du facteur de confusion (les hommes si sexe,
les sujets âgés si âge, …)– Mais impossibilité d’étude de l’effet conjoint F et E ou d’éventuelle
interaction– Impossibilité d’extrapoler les résultats aux femmes, aux sujets jeunes,
…– Exclusion de certains sujets (si rares dans l’échantillon)
Eviter / prendre en compte d’un facteur de confusion
• Appariement– Équilibrer la distribution du facteur de confusion entre les groupes
d’étude (exposés et non exposés dans une cohorte, malades et témoins dans un cas témoins) …
Même si F est associé à l’exposition, dans l’enquête pas d’association entre F et E (cohorte)
Même si F est associé à la maladie, dans l’enquête pas d’association entre F et M (cas témoins)
Appariement par stratesChoix des non exposés dans même classe d’âge que les non exposésChoix des témoins de même sexe que les cas
Appariement individuelJumeauxEnfants de la même classeChoix des non exposés dans même classe d’âge que les non exposésChoix des témoins de même sexe que les cas
Eviter / prendre en compte d’un facteur de confusion
• Dans l’analyse : ! Biais de confusion résiduel toujours possible (même si stratification, appariement, …)Risque de surappariementRR ou OR ajustés …
Eviter / prendre en compte d’un facteur de confusion
• … estimer RR ajustés ou OR ajustés = risque de M lié à E, « indépendamment de F » ou « à F
égal » ou « en contrôlant F »• Méthode d’ajustement de Mantel-Haenszel
– Scinder F (tabac brun/blond, NSE bas/élevé, classes d’âge, …)– Analyser la relation E * M dans chaque strate (RRc conditionnels) et
dans l’ensemble de l’échantillon (liaison marginale)– En l’absence d’interaction, estimation du RRa ≈ moyenne des RRc,
pondérée par la taille des strates
• Analyse multivariée– Permet de prendre en compte l’exposition E et des facteurs de risques– Facteurs de risque connus ou supposés de la maladie– Doit être précédée d’étapes intermédiaires d’analyse
Ce qu’il faut retenir• Biais ⊂ Validité interne d’une étude, elle-même conditionnant
l’extrapolation des résultats• Mauvaise mesure d’un indicateur de santé ou de l’effet propre
d’un facteur de risque• Liée à un défaut de comparabilité des groupes• avec une mauvaise représentation des sujets (sélection), une
mauvaise identification des informations (classement), ou la mesure d’un effet conjoint lié à un tiers facteur (confusion)
• Peut intervenir dans tous types d’études interventionnelles ou non
• De la conception (sélection, confusion), au déroulement (sélection) ou au moment de la mesure du critère de jugement (classement)
• Doit surtout être anticipé (sélection, classement) et peut en partie être corrigé (confusion)