Biais en épidémiologie...Dernier scénario • Un homme s’arrête en plein voyage dans le...

Biais en épidémiologie

Anne EGODMIS Département Méthodologie de

l’Information en SantéCHU Grenoble

Objectifs• Rappeler quelques notions

– Sur les objectifs des différentes études épidémiologiques – Et sur la recherche de la causalité– Sur la qualité des études et leur lecture critique …

• … dont la recherche de biais – En les situant parmi les critères de qualité d’une étude– En distinguant les mécanismes de confusion, sélection, et

classement• Voir comment les corriger

– En amont à la conception de l’étude– En aval au moment de l’analyse

Epidémio?• L'épidémiologie est l'étude des facteurs influant sur la

santé et les maladies des populations humaines. Il s'agit d'une science qui se rapporte à la répartition, à la fréquence et à la gravité des états pathologiques.

• L'étude de la répartition et des déterminants des évènements de santé sert de fondement à la logique des interventions faites dans l'intérêt de la santé publique et de la médecine préventive.La reconnaissance de l'épidémiologie comme champ d'étude est relativement récente, mais elle est l'un des piliers de la santé publique et de la médecine à travers l'histoire.

(Source Wikipedia)

Objectifs descriptifs et étiologiques

• Connaissance de la fréquence des maladies et leur description est nécessaire

• Identification de facteurs associés à la maladie• Comment passer de « association » à « cause » de

maladies

Briquet Cancer du poumon

préférez les allumettes !

p < 0.0000000000001

Exemple de scénarios : causalitéou non?

• Vous avez placé une bouilloire pleine sur le feu.• Plusieurs minutes passent et le téléphone sonne.• Juste après, la bouilloire siffle.• Vous êtes assis(e) dans le salon avec votre chien.• Un étranger s’approche de la maison.• Votre chien commence à aboyer.

Si le téléphone n’avait pas sonné, la bouilloire aurait-elle sifflé?Si l’étranger ne s’était pas approché, le chien aurait-il aboyé?

Autre scénario

• Jean est né puis Jean est décédé. Si Jean n’était pas né, il ne serait pas mort.

• Donc la naissance de Jean est la cause de son décès.

Dernier scénario

• Un homme s’arrête en plein voyage dans le désert. Il a 2 ennemis. L’un des 2 a mis un poison mortel dans son réservoir d’eau. L’autre a fait un trou sous ce réservoir.

• L’eau empoisonnée a totalement couléavant que l’homme ne boive, et il meurt de soif. Quelle est la cause du décès? Le poison ou le trou dans le réservoir?

Définition théorique • X et Y se sont produits, et Y ne se serait pas produit si X

ne s’était pas produit• X et Y se sont produits, et dans ces circonstances, Y ne

se serait pas produit si X ne s’était pas produit • X et Y se sont produits, et dans ces circonstances, et

avec un mécanisme causal, Y ne se serait pas produit si X ne s’était pas produit

• X et Y se sont produits, et dans ces circonstances, et avec un mécanisme causal, Y ne se serait pas produit si X ne s’était pas produit de la façon et au moment où il s’est produit

Définition de Rothman• Une cause de maladie est un antécédent, une

condition ou caractéristique, qui était nécessaire à la maladie, au moment où elle est survenue, les autres conditions étant fixées par ailleurs.

• Une cause de maladie est un antécédent, une condition ou caractéristique, qui précédait la maladie et sans laquelle la maladie ne serait pas arrivée du tout ou ne serait pas arrivée avant un certain temps.

Identification de la causalité

• Association?Différence non expliquée par le hasard• Temporalité?L’exposition précède la maladie• Plausible?Mécanisme physiopathologique et pas

d’autre explication possible

Ce serait trop simple!Différents facteurs (1 à plusieurs) dans une seule et même

causeDifférentes causes dans une seule et même maladie

• Facteurs insuffisants• Mais nécessaires• D’une cause non nécessaire• Mais suffisante pour développer la maladie

In english : INUS (Insufficient Necessary Unnecessary Sufficient)

Exemple : AVC

Cause1

Cause2

Cause3

Cholestérol

Obésité

TabacStress Gènes

Hypertension

Exercice physique

Alimentation

Effet causal

Fq Maladie chez les exposés

Fq Maladie chez les exposés si ils n’avaient pas été exposés

Pour identifier le rôle d’une exposition

que la fréquence de la maladie chez ces mêmes

sujets s’ils n’avaient pas étéexposés

Non observableCirconstances qu’il faut s’efforcer de reproduire le mieux possible

Comment chercher cet effet causal?

Si l’exposition est la cause de la maladie, alors

La fréquence de la maladie doit être plus grande chez

les exposés ObservableFait mesurable

Si la prématurité est une cause de mortalité

La mortalité doit être plus importante chez les

prématurés queExposition

la mortalité chez les prématurés s’ils n’avaient pas

été prématurés…

Approximation d’absence d’exposition

Objectif = rendre identique les 2 groupes pour toutes les causesde maladie sauf l’exposition… sauf que cette comparabilitéabsolue n’est jamais vue, jamais certaine, jamais connue!

… autrement dit chez les enfants à terme

Qualité des études : principes de l’EBM

“Evidence-based medicine is the integration of best research evidence with clinical expertise and patient values”

- Dave SackettPatient

Concerns

Clinical Expertise

Best research evidence

EBM

Principes de l’EBM

William Osler, 1849-1919Médecin sage et expérimenté

Jeune docteur qui sait chercher l’information et la critiquer

Par qui préfériez-vous être soigné?

Types d’enquête et niveau de preuveBUT : Rechercher l ’ASSOCIATION entre un facteur (intervention, dépistage, traitement, …) et un indicateur (maladie ou ses marqueurs)

Enquêtes observationnelles:Série de casCas témoinsCohortesEnquêtes quasi-expérimentales :

ici-ailleurs / avant-après

Essais randomisés

Contrôle de l ’intervention (choix des sujets, suivi de l’application de l ’intervention, choix des données recueillies)

Pertinence de la comparaison des groupes

Les types d’enquête : « la pyramide de l’évidence »

Critères en EBM

1 Validité de

l’étude:Objectif,

population et méthodes

2 Ampleur des

résultats:Expression des

résultats, importance et pertinence clinique

3Extrapolation: en quoi les résultats peuvent-

ils être appliqués à la population cible

Validité d’une étude

• Validité interne : résultats corrects dans l’étude

– Formulation de l’objectif (PICO)– Design retenu– Choix de la population– Déroulement de l’étude– Analyse des données

Biais

Correction partielle de certains biais

Pour y voir clair : la PICO question

• Patient, population ou problème

– Comment je peux définir la population qui correspond le mieux à la situation qui m’intéresse?

• Intervention, facteur pronostique, ou exposition

– De quelle intervention exactement suis-je en train de parler?

• Comparaison ou contrôle (si nécessaire)

– Quelle est la principale alternative?

• Outcome que je souhaite mesurer

– Qu’est-ce que je peux espérer améliorer, supprimer, modifier?

Pour y voir clair : la PICO question

Etude diagnostique

Série de cas Cas Témoins

Cohorte Avant Après

Ici Ailleurs

Essai randomisé

Population Population source

Intervention Test

E et nonEM et nonM

Cas M E Après Ici Traitement

Contrôle Gold standard T non M Non E Avant Ailleurs Placebo

Outcome M E M M M M

Population et échantillon

• Objectif final = appliquer les résultats àune population cible (ensemble des naissances prématurées en France)

• En pratique : – utilisation d’une population source

(naissances prématurées Rhône Alpes)– à partir de laquelle on sélectionne un

échantillon (ex : 1 naissance sur 5) ≈ outil de travail

Différents types d’erreur• Peuvent intervenir dans la conception, le déroulement ou

l’analyse de l’étude• Liées au hasard, symétriques (fluctuations

d’échantillonnage, erreurs de mesure, bruit) : responsable du manque de précision

• Systématiques, asymétriques = biais : responsable d’un défaut de validité interne.

Biais = distorsion d’une mesure - de la fréquence d’une maladie, - d’un RR, d’un OR …

liée à un facteur associé à la maladie ou l’exposition, et conduisant à une sur ou sous estimation, jusque absence d’effet

3 sources de biais• Sélection : mauvaise représentation des sujets

concernés par l’objectif, intervenant au moment du recrutement ou du suivi

• Confusion : manque de contrôle des caractéristiques des sujets inclus

• Classement : mauvaise mesure de l’outcome

Sources de non comparabilité des groupes àdes moments variables du déroulement de l’étude

Sources de non comparabilité des groupes

Non exposés

Exposés

Exposition

Facteurs différenciant les groupes

« Contrôles non exposés ≈ exposés s’ils n’avaient pas été exposés »

Sources de non comparabilité des groupes

Non exposés

Exposés

ClassementSélectionConfusionExposition

Facteurs différenciant les groupes

« Contrôles non exposés ≈ exposés s’ils n’avaient pas été exposés »

Population source

SuiviE / nonE

Mesure de la maladie

M

Sélection= de la population source àl’échantillon

= attrition de l’échantillon liée àdes perdus de vue

Classement = Différence d’identification de la maladie entre exposés et non exposés

EchantillonE / nonE

Sources de non comparabilitédes groupes

Confusion : constitution des groupes

Biais de sélection : mécanismes

Légende: Lettres capitales (“ABCD”) = effectifs si échantillon représentatifMinuscules (“abcd”) = proportions des effectifs restants (sélection initiale ou perdus de vue)

M+ M-

E+

E-

A

C

B

D

a b

c d

Proportions de perdus de vue inégales selon l’exposition (mécanisme dépendant de l’exposition)

M+ M-

E+

E-

A

C

B

D

a b

c d

Proportions de perdus de vue inégales selon la maladie (mécanisme dépendant de la maladie)

M+ M-

E+

E-

A

C

B

D

a b

c d

Proportions de perdus de vue inégales selon exposition et maladie (mécanisme dépendant de l’exposition et de la maladie)

M+ M-

E+

E-

A

C

B

D

a b

c d

Proportions semblables de perdus de vue

Si a = b = c = d

M+ M-

E+

E-

A

C

B

D

a b

c d

RR =PrM+ | E+

PrM+ | E-=

aA / (aA +bB)

cC / (cC +dD)=

aA / (aA +aB)

aC / (aC +aD)=

A / (A +B)

C / (C +D)

Pas d’effet sur le risque relatif

OR =( PrM+ | E+) / ( PrM- | E+)

=

Pas d’effet sur l’odds ratio

( PrM+ | E-) / ( PrM- | E-)

aA / (aA +bB)

bB / (aA +bB)

cC / (cC +dD)

dD / (cC +dD)

=

aA

aB

aCaD

=AD

BC

M+ M-

E+

E-

a bc d

A

C

B

D

RR =PrM+ | E+

PrM+ | E-=

aA / (aA + bB)

cC / (cC + dD)=

aA / (aA + aB)

cC / (cC + cD)=

A / (A + B)

C / (C + D)

Pas d’effet sur le risque relatif

Si dépendant de l’expositiona = b c = da, b ≠ c, d

OR = =

Effet sur l’odds ratio

aA / (aA + aB)

aB / (aA + aB)

cC / (cC + cD)

cD / (cC + cD)

= =AD

BC

PrM+ | E+PrM- | E+

PrM+ | E-

PrM- | E-

aA / (aA + bB)

bB / (aA + bB)

cC / (cC + dD)

dD / (cC + dD)

=

A

B

C

D

aA / a(A + B)

aB / a(A + B)

cC / c(C + D)

cD / c(C + D)

=

Proportions de perdus de vue inégales selon l’exposition

M+ M-

E+

E-

a b

c d

A

C

B

D

RR =PrM+ | E+

PrM+ | E-=

aA / (aA +bB)

cC / (cC +dD)=

aA / (aA +bB)

aC / (aC +bD)

RR modifié

Si dépendant de la maladie

a = c b = da, c ≠ b, d

OR =

Pas d’effet sur odds ratio

aA / (aA + bB)

bB / (aA + bB)

aC / (aC + bD)

bD / (aC + bD)

= =abAD

abBC

PrM+ | E+PrM- | E+

PrM+ | E-PrM- | E-

aA / (aA + bB)

bB / (aA + bB)

cC / (cC + dD)

dD / (cC + dD)

= =

aA

bB

aCbD

=AD

BC

Proportions de perdus de vue inégales selon la maladie

M+ M-

E+

E-

a b

c d

A

C

B

D

RR modifié (proportions inégales selon la maladie)

Odds ratio aussi modifié

Si dépendant de maladie et exposition a ≠ b ≠ c ≠ d

OR =aAdD

cCbB

PrD+ | E+PrD- | E+

PrD+ | E-PrD- | E-

=

aA / (aA + bB)

bB / (aA + bB)

cC / (cC + dD)

dD / (cC + dD)

= =

aA

bB

cCdD

≠AD

Proportions de perdus de vue inégales selon la maladie et l’exposition (dépendant de maladie et exposition)

BC

M+ M-

E+

E-

a bc d

A

C

B

D f (E-)

e (E+)

g (M+) h (M-)

Si perdus de vue indépendants de

maladie et exposition:

a = egb = ehc = fgd = fh

a ≠ b ≠ c ≠ d(La proportion de chaque cellule est le produit de la proportionde perdus de vue selon maladie et selon exposition, mais elles

sont inconnues)

OR = = =

PrM+ | E+PrM- | E+

PrM+ | E-

aA / (aA + bB)

bB / (aA + bB)

cC / (cC + dD)

dD / (cC + dD)

=

aA

bB

cCdD

AD

BC=

egAehB

fgChfD

egA * hfDehB * fgC

=eghfADehfgBC

Proportions de perdus de vue inégales selon la maladie et l’exposition (mais indépendantes de maladie et exposition)

RR modifié (proportions inégales selon la maladie)

Pas d’effet sur odds ratio

PrM- | E-

=

Exemple à partir de perdus de vueChez les nouveau-nés sortis de maternité dans le département (P), un programme de soutien à l’allaitement maternel avec intervention à domicile le 1er mois (I) est mis en place afin d’augmenter le taux d’allaitement à 3 mois (O) par rapport à la prise en charge habituelle (C).

Echantillon de 1500 nnés et suivi téléphonique à 3 mois

Sans perdus de vueM+ M‐

E+ 600 0,80 150 0,20 750 RR 2,000,67 0,25

E‐ 300 0,40 450 0,60 750 OR 6,000,33 0,75900 600 1500

Perdus de vue (375/1500, soit 25%) : Les patientes ayant bénéficié de l’intervention répondent plus à 3 mois, indépendamment du fait d’allaiter ou non.

L’intervention les a sensibilisées au sujet?


E+ 600 0,80 150 0,20 750 RR 2,000,67 0,25

E‐ 300 0,40 450 0,60 750 OR 6,000,33 0,75900 600 1500

90% des E+ et 60% des E‐M+ M‐

E+ 540 0,80 135 0,20 675 RR 2,000,75 0,33

E‐ 180 0,40 270 0,60 450 OR 6,000,25 0,67720 405 1125

A gauche=échantillon correct – A droite=sélection d’une partie de la population

Mécanisme dépendant de l’exposition

40% des M+ et 70% des M‐M+ M‐

E+ 240 0,70 105 0,30 345 RR 2,520,67 0,25

E‐ 120 0,28 315 0,72 435 OR 6,000,33 0,75360 420 780

Plus de perdus de vue chez les femmes qui allaitent.

Les patientes qui allaitent ont moins le temps de répondre à l’enquête, indépendamment du fait qu’elles aient bénéficié ou non de l’intervention?


E+ 600 0,80 150 0,20 750 RR 2,000,67 0,25

E‐ 300 0,40 450 0,60 750 OR 6,000,33 0,75900 600 1500

Mécanisme dépendant de la maladie

M+ M‐E+ 260 0,74 90 0,26 350 RR 3,19

0,72 0,21E‐ 100 0,23 330 0,77 430 OR 9,53

0,28 0,79360 420 780

40% des M+ et 70% des M‐ mais sélection liée à l'exposition

Les patientes qui allaitent ont moins le temps de répondre à l’enquête, mais celles qui ont bénéficié de l’intervention répondent mieux :

Le fait de répondre est associée à la fois à l’allaitement et au fait d’avoir bénéficié de l’intervention?

40% des M+ et 70% des M‐M+ M‐

E+ 240 0,70 105 0,30 345 RR 2,520,67 0,25

E‐ 120 0,28 315 0,72 435 OR 6,000,33 0,75360 420 780

Mécanisme dépendant de l’exposition et de la maladie

En résumé : biais de sélectionDe manière générale :

• Mauvaise représentation de la population cible dans l’échantillon • liée à un mécanisme dépendant de la maladie ± exposition• survenant

– dans la constitution initiale de l’échantillon – durant l’étude par attrition

• Induisant une erreur ou distorsion dans l’estimation – d’un risque (prévalence, incidence, sensibilité, …) – ou dans la mesure d’une association (RR, OR, …) lorsque la sélection est liée à un facteur lui-même associée à l’exposition ou la maladie

• Erreur porte sur RR ou OR ou les deux selon mécanisme

Différents biais de sélectionPopulation Maladie Exposition Mécanisme ou tiers facteur Résultat

Constitution de l’échantillon (enquêtes transversales)

Naissances en niveau 3

Etat de santénéonatale

Présence du pédiatre en salle de naissance

Niveau 3 : Surreprésentation des enfants qui vont mal et bénéficient de la présence du pédiatre

Association présence du pédiatre et décès!

Sujets hospitalisés pour accidents de la route

Décès intrahospitalier

Alcool Décès intrahospitalier : Sous représentation des sujets décédés sur la voie publique

Sous estimation de l’association alcool et décès

Constitution de l’échantillon (cohortes)

Sujets actifs Maladie respiratoire

Exposition professionnelle (isocyanates)

Activité professionnelle : Sous représentation des sujets exposés qui sont en arrêt de travail du fait de la maladie. « Healthy worker effect »

Sous estimation de l’association exposition maladie

Constitution de l’échantillon (cas témoins)

Naissances (cas=malformations congénitales et témoins=sans malfo)

Cas prévalents

Expositiion début de grossesse

Expositions pouvant être liées à la survenue de malfo et à l’accès au diagnostic prénatal et décès intrautérin précoce (ex : CSP, zone rurale, …). Solution = prendre les cas incidents

Sous estimation du rôle de certaines expositions

Différents biais de sélectionPopulation Maladie Expositio

nMécanisme ou tiers facteur Résultat

Constitution de l’échantillon (cas témoins)

Recrutement hospitalier des cas (maladie X) et témoins (motif Z)

Maladie X Exposition X

Probabilités d’admission dans le centre différentes entre cas et témoins et associés à la maladie et l’exposition (ex : CSP). Biais de Berkson

Cas (cancer vessie) et témoins (maladies CV)

Cancer vessie Tabac Surappariement des cas et témoins (témoins non représentatifs de la population source d’où sont issus les cas)

Sous estimation de l’association tabac cancer

Suivi de cohortes

Naissances Développement psychomoteur àl’âge scolaire

Prématurité Les perdus de vue sont de NSE moindre et le NSE est associé àla prématurité et à un pronostic moins bon

Sur estimation du pronostic et sous estimation du lien avec le NSE

Eviter les biais de sélectionChoix de l’échantillon

Population source

Echantillon

Population cible

Objectif : extrapolation des résultats?

≈ ?

≈ ?

Sujets non représentés ou sous représentés

Sujets non représentés

ou sous représentés


Naissances Rhône Alpes

Naissances CHU

Naissances en France


≈ ?

≈ ?


Malades hospitalisés

Patients non consécutifs

Maladie X


≈ ?

≈ ?


• Représentativité de l’échantillon :– Échantillon – population source– Population source – population cible

• Exhaustivité ≠ représentativité, ne suffit pas

Eviter les biais de sélectionChoix d’un groupe de référence

• Choix d’un groupe de référence :– Stratification– Appariement individuel

• Bien connaître la population source (ex : pas facile quand malades hospitalisés) et disposer d’une base de sondage

• Au minimum, on doit trouver dans le groupe de référence ≈ la fréquence de base de l’exposition ( cas témoins) ou fréquence de base de la maladie (cohorte)

Groupe de référence

Cas ou exposés +

Eviter les biais de sélectionSuivi de groupes d’étude

• Identifier les raisons limitant le suivi des sujets• Tenir compte de la durée d’exposition des sujets au

cours du suivi : dans le calcul de l’incidence des évènements, utiliser les personnes*année au lieu des personnes au dénominateur, pour tenir compte des perdus de vue. (donne une estimation au moins valide dans l’étude, mais n’élimine pas le biais)

Biais de classement : mécanismeM+ M-

E+

E-

A

C

B

D

A’ B’

Le total A+B+C+D est conservé.La répartition entre A et B (ou entre A et C, …) devient A’ et B’ et A+B=A’+B’

Biais de classement : mécanismeDe manière générale :• Mauvais classement dans l’une des 4 cases (E*M) du tableau de contingence• si il est lié à une identification différentielle

– de l’exposition (on trouve plus facilement des facteurs de risque chez les M+ que chez les M- ou inversement)– de la maladie (on diagnostique plus fréquemment la maladie chez les E+ que chez les E- ou inversement)

• Erreur quantitative (effectifs) ou qualitative (niveau d’exposition ou gravité de la maladie, sens de l’association)

E+ E‐M+ 7200 0,45 8800 0,55 16000

0,06 0,02 RR 2,23M‐ 123000 0,26 346000 0,74 469000 OR 2,30

0,94 0,98130200 354800 485000

ExempleParmi les malades, 20% des exposés sont classés non exposés (pas d’erreur chez les non malades)« Les malades déclarent moins facilement leur consommation d’alcool »

Sousestimation de l’association

E+ E‐M+ 9000 0,56 7000 0,44 16000

0,07 0,02 RR 3,44M‐ 123000 0,26 346000 0,74 469000 OR 3,62

0,93 0,98132000 353000 485000

E+ E‐M+ 9000 0,56 7000 0,44 16000

0,08 0,02 RR 4,52M‐ 98400 0,21 370600 0,79 469000 OR 4,84

0,92 0,98107400 377600 485000

ExempleParmi les non malades, 20% des exposés sont classés non exposés (pas d’erreur chez les malades)« Les non malades se souviennent moins qu’ils ont eu un traitement particulier »

Surestimation de l’association

E+ E‐M+ 9000 0,56 7000 0,44 16000

0,07 0,02 RR 3,44M‐ 123000 0,26 346000 0,74 469000 OR 3,62

0,93 0,98132000 353000 485000

Différents biais de classement• Cas témoins : Attitude différente des enquêteurs : recherche d’exposition plus insistante

chez les maladesBiais de mémorisation de la part des sujets inclus : oubli des expositions

chez les témoins

• Cohorte :Identification de la maladie plus fréquente chez les exposés (plus d’examens

complémentaires, plus de comorbidité)

• Etude diagnostique :Résultats du test plus souvent positifs chez les malades si connaissance du

résultat du Gold standard

• Essai randomisé :Succès du traitement plus fréquent dans le groupe traité par manque

d’objectivité dans la mesure du résultat (absence d’aveugle)

≠Erreurs non différentiellesTendent toujours à diminuer l’OR entre exposition et maladie par réduction du contraste entre les groupes :

Ici 20% des exposés sont classés à tort comme non exposés chez les malades comme les non malades ≈ « dilution » de 20% des exposés parmi les non exposés.

E+ E‐M+ 9000 0,56 7000 0,44 16000

0,67 0,25M‐ 123000 0,26 346000 0,74 469000 OR 3,62

0,33 0,75132000 353000 485000

E+ E‐M+ 7200 0,45 8800 0,55 16000

0,07 0,02 RR 2,94M‐ 98400 0,21 370600 0,79 469000 OR 3,08

0,93 0,98105600 379400 485000

≠Erreurs non différentiellesIci 20% des non exposés sont classés à tort comme exposés chez les malades comme les non malades ≈ « dilution » de 20% des non exposés parmi les exposés.

E+ E‐M+ 9000 0,56 7000 0,44 16000

0,67 0,25M‐ 123000 0,26 346000 0,74 469000 OR 3,62

0,33 0,75132000 353000 485000

E+ E‐M+ 10400 0,65 5600 0,35 16000

0,05 0,02 RR 2,59M‐ 192200 0,41 276800 0,59 469000 OR 2,67

0,95 0,98202600 282400 485000

Eviter les biais de classementConception de l’étude :

• Choix des patients : coopérativité, capacités de recours à la mémoire, surveillance médicale a priori comparables

• Standardiser les conditions de recueil d’informations • Même protocole de diagnostic chez exposés et non

exposés, même protocole chez cas et témoins

Déroulement de l’étude :• Questionnaires standardisés• Investigation d’un ensemble d’expositions sans

identifier l’exposition principale de l’étude• …

Eviter les biais de classement… Eviter la subjectivité du malade ou de l’observateur (influencé par la connaissance de la maladie ou l’exposition)

Mesure en double aveugle, à chaque fois que c’est possible

Mesure :• Du critère de jugement (succès ttm) dans l’essai randomisé• De la maladie dans une cohorte• Des expositions dans un cas témoin• Du résultat du test et du résultat du gold standard dans une étude diagnostique

Confusion : mécanismes• Mauvaise appréciation de la relation exposition et maladie liée à un tiers

facteur • l’association mesurée ne correspond pas à l’effet propre de E sur M • Facteur associé à la maladie et l’exposition• et inégalement présent dans les groupes comparés

• Contrairement aux biais de sélection et de classement :- Peut être corrigé en amont mais aussi par l ’analyse statistique - Ne résultent pas de l’intervention de l’investigateur : n’est ni une erreur de mesure,

ni un mauvais choix de l’échantillon- Est liée à « la nature des choses » (facteurs connus mais aussi inconnus)

• Proche de certains biais de sélectionEx du Healthy worker effect : mesure de l’effet d’expositions professionnelles (E) sur

une maladie (M) biaisée car les sujets ayant un meilleur état de santé (F) ont une activité professionnelle.

Sous estimation de l’effet de l’exposition ≈ effet de l’exposition + bon état de santéDans biais de sélection, il manque certains sujetsDans biais de confusion, impossibilité d’identifier cette variable

Exemple

E+ E‐M+ 184 0,21 680 0,79 864

0,18 0,07 RR 2,71M‐ 816 0,08 9320 0,92 10136

0,82 0,931000 10000 11000

Strate 1 <25 ans Strate 2 25‐40 ans Strate 2 >=40 ansE+ E‐ E+ E‐ E+ E‐

M+ 16 0,07 200 0,93 216 M+ 48 0,06 240 0,28 288 M+ 120 0,14 240 0,28 3600,08 0,04 RR 2,00 0,16 0,08 RR 2,00 0,24 0,12 RR 2,00

M‐ 184 0,04 4800 0,96 4984 M‐ 252 0,02 2760 0,27 3012 M‐ 380 0,04 1760 0,17 21400,92 0,96 0,84 0,92 0,76 0,88200 5000 5200 300 3000 3300 500 2000 2500

Quand biais de confusion : Relation brute exposition et maladie ≠ relation exposition et maladie selon strates de F (âge par ex)

Mesure effet de E mais avec la structure d’âge de l’échantillon

ExempleConjonction de deux phénomènes :• Répartition par âge des exposés différente de celle des non exposés : plus de sujets âgés chez les exposés• Répartition des malades liée à l’âge : plus de malades chez les sujets âgés

E+ E‐<25 ans 200 5000

0,20 0,5025‐40 ans 300 3000

0,30 0,30>=40 ans 500 2000

0,50 0,201000 10000

<25 ans 25‐40 ans >=40 ansM+ 216 288 360

0,04 0,09 0,14M‐ 4984 3012 2140

0,96 0,91 0,865200 3300 2500

En résuméF est facteur de confusion dans la relation entre E et M :• Si l’association brute entre E et M (marginale) est différente de l’association entre E et M selon le niveau de F (conditionnelle)• F est associé à la fois à E et à M• Le phénomène se reproduira dans chaque échantillon qui sera extrait de la population

E

F

M

Dans l’exemple : F augmente l’association entre E et M, car sujets âgés plus exposés et plus malades

E

F

M

+

+

+

?

E

F

M

Autre exemple : les exposés sont plus souvent des hommes (association sexe et E), mais les hommes sont moins souvent malades (association sexe et M)L’association brute E et M est plus faible que l’association entre E et M par sexe

E

F (homme)

M

+

+

-

?

Hommes Femmes TotalE+ E‐ E+ E‐ E+ E‐

M+ 100 15 100 75 200 900,13 0,05 0,27 0,10 0,18 0,09

M‐ 650 285 275 675 925 9600,87 0,95 0,73 0,90 0,82 0,91750 300 375 750 1125 1050

RR 2,7 RR 2,7 RR 2,1

Formulation du résultat

• RR brut ≠ RR conditionnels• Effet propre de E avec M, correspond à effet de E

– « Indépendamment de F »– A « F » égal (sexe, âge, tabagisme, NSE, …),

l’association entre E et M …

Confusion et interaction• Si RR conditionnels sont ≠ selon le niveau de F, il y a interaction entre E et

F

Exemple réel : étude du rôle du type de tabac fumé sur le cancer de vessie chez les hommes fumeurs selon qu’ils inhalent ou non la fumée

• On ne peut pas parler de LA relation entre tabac fumé et cancer ou la résumer par un résultat, il y a « plusieurs » relations

• L’analyse est dans ce cas réalisée par niveau de F (ici inhalation ou pas de la fumée)

E+ BrunE‐ Blond ou mixte



M+ cancer vessie 353 54 267 32 86 22

M‐ pas de cancer 253000 73000 134000 39000 119000 34000

253353 73054 134267 39032 119086 34022

RR 1,9 RR 2,4 RR 1,1

Total F+ Inhalent F‐ N'inhalent pasTabac fumé Tabac fumé Tabac fumé

Eviter / prendre en compte d’un facteur de confusion

• Identifier en amont les facteurs de confusion : lire la littérature

• Tirage au sort– Randomisation dans un essai (égale répartition en moyenne des

facteurs de confusion potentiels)– Impossible si étude observationnelle où on ne peut pas attribuer

l’exposition de manière expérimentale

• Restriction de la population d’étude– Ne prendre qu’un niveau du facteur de confusion (les hommes si sexe,

les sujets âgés si âge, …)– Mais impossibilité d’étude de l’effet conjoint F et E ou d’éventuelle

interaction– Impossibilité d’extrapoler les résultats aux femmes, aux sujets jeunes,

…– Exclusion de certains sujets (si rares dans l’échantillon)


• Appariement– Équilibrer la distribution du facteur de confusion entre les groupes

d’étude (exposés et non exposés dans une cohorte, malades et témoins dans un cas témoins) …

Même si F est associé à l’exposition, dans l’enquête pas d’association entre F et E (cohorte)

Même si F est associé à la maladie, dans l’enquête pas d’association entre F et M (cas témoins)

Appariement par stratesChoix des non exposés dans même classe d’âge que les non exposésChoix des témoins de même sexe que les cas

Appariement individuelJumeauxEnfants de la même classeChoix des non exposés dans même classe d’âge que les non exposésChoix des témoins de même sexe que les cas


• Dans l’analyse : ! Biais de confusion résiduel toujours possible (même si stratification, appariement, …)Risque de surappariementRR ou OR ajustés …


• … estimer RR ajustés ou OR ajustés = risque de M lié à E, « indépendamment de F » ou « à F

égal » ou « en contrôlant F »• Méthode d’ajustement de Mantel-Haenszel

– Scinder F (tabac brun/blond, NSE bas/élevé, classes d’âge, …)– Analyser la relation E * M dans chaque strate (RRc conditionnels) et

dans l’ensemble de l’échantillon (liaison marginale)– En l’absence d’interaction, estimation du RRa ≈ moyenne des RRc,

pondérée par la taille des strates

• Analyse multivariée– Permet de prendre en compte l’exposition E et des facteurs de risques– Facteurs de risque connus ou supposés de la maladie– Doit être précédée d’étapes intermédiaires d’analyse

Ce qu’il faut retenir• Biais ⊂ Validité interne d’une étude, elle-même conditionnant

l’extrapolation des résultats• Mauvaise mesure d’un indicateur de santé ou de l’effet propre

d’un facteur de risque• Liée à un défaut de comparabilité des groupes• avec une mauvaise représentation des sujets (sélection), une

mauvaise identification des informations (classement), ou la mesure d’un effet conjoint lié à un tiers facteur (confusion)

• Peut intervenir dans tous types d’études interventionnelles ou non

• De la conception (sélection, confusion), au déroulement (sélection) ou au moment de la mesure du critère de jugement (classement)

• Doit surtout être anticipé (sélection, classement) et peut en partie être corrigé (confusion)

Sources• AccessibleEpidémiologie. Principes et méthodes quantitatives. Inserm

(Editions médicales internationales. Editions Tec&Doc)

• Plus difficileModern Epidemiology. Third edition. KJ Rothman, S

Greenland, TL Lash. (Lippincott Williams & Wilkins, Philadelphia)

Biais en épidémiologie...Dernier scénario • Un homme s’arrête en plein voyage dans le...

Documents

Transcript of Biais en épidémiologie...Dernier scénario • Un homme s’arrête en plein voyage dans le...