La G-computation et les méthodes basées sur la théorie du...

La G-computation et les méthodes basées surla théorie du score de propension dans le cadred'un critère de jugement binaire : une étudecomparative afin d'évaluer leurs performances.

A. Chatton, F. Le Borgne, Y. Foucher et al.

Journées GDR Statistique et Santés 2018 – 28 septembre 2018

UMR Inserm 1246 – SPHERE, Université de Nantes, Nantes, France

LabCom RISCA, Nantes, France

Études observationnelles

Contexte

1/16

Facteur de confusion

ÉvènementTraitement

biais

Introduction

Méthodes

Simulation

Application

Discussion

Conclusion

• Variable qui résume les caractéristiquesinitiales (Z) liées à l’indication du traitement(X) d’un individu i*

pi = P(Xi = 1|Zi = zi)

• Estimé à partir d’un modèle logistique

logit(pi) = βζi

Avec ζi = (1,z1i,…,zpi) dont p covariables

Score de propension (PS)

2/16* : Rosenbaum et Rubin (1983)

Introduction

Méthodes

Simulation

Application

Discussion

Conclusion

• 2 effets marginaux (populationnels)‡ :

– ATE ⇨ population entière

– ATT ⇨ patients traités

• 4 méthodes possibles :

– Appariement

– Pondération

– Stratification

– Ajustement

Score de propension (PS)

3/16‡ : Imbens (2004)

Gayat et al. (2010)

Introduction

Méthodes

Simulation

Application

Discussion

Conclusion

• Meilleure méthode pour estimer effetmarginal ?

Focus sur ATT ici

• Quelles variables prendre en compte dans la G-computation ?

4/16

Objectifs

Introduction

Méthodes

Simulation

Application

Discussion

Conclusion

• Principe :

– Pondérer la contribution de chaque sujet

– Obtenir un pseudo-échantillon où la distribution descovariables est équilibrée entre les groupes

• Plus techniquement :

– Utilisation de poids stabilisés* : 𝜔𝑖 = 𝑥𝑖 +1−𝑥𝑖 × 𝑝𝑖

1 − 𝑝𝑖

– Utilisation d’un estimateur robuste de la variance‡

𝑙𝑜𝑔𝑖𝑡 𝑃 𝑌𝑖 = 1 𝑋𝑖 = 𝑥𝑖 = 𝛼0 + 𝛼1𝑥𝑖

• En pratique :

– Méthode basée sur le PS avec les meilleures performances†

Pondération (IPTW)

5/16

* : Morgan et Todd (2008)‡ : Robins et al. (2000)† : Le Borgne et al. (2015)

Introduction

Méthodes

Simulation

Application

Discussion

Conclusion

Appariement (PSM)

6/16

• Principe :– Apparier chaque individu traité à un autre non-traité selon

leur βζ

• Plus techniquement :– Méthode des plus proche voisins 1:1 sans remise*

– Seuil à 0.2 écart-type de βζ *

– Régression logistique conditionnelle‡

𝑙𝑜𝑔𝑖𝑡(𝑃 𝑌𝑖 = 1 𝑋𝑖 = 𝑥𝑖 ) = 𝛼0 + 𝛼1𝑥𝑖

• En pratique :– Seul l’ATT est estimable ici†

– Méthode basée sur le PS la plus usitée§

* : Austin (2014a)‡ : Austin (2009)

† : Austin et Stuart (2014)§ : Ali et al. (2015)

Introduction

Méthodes

Simulation

Application

Discussion

Conclusion

• Basée sur une régression « traditionnelle »

• Estime aussi un effet marginal* :

1. Q-Model : 𝑙𝑜𝑔𝑖𝑡(𝑃 𝑌𝑖 = 1 𝑋𝑖 = 𝑥𝑖 , 𝑍𝑖 = 𝑧𝑖 ) = 𝛾𝑥𝑖 + 𝛽ζ𝑖

2. Probabilités prédites d’être traité ou non :

• ො𝜋1 = 𝑛−1 σ𝑖 𝑒𝑥𝑝𝑖𝑡( ො𝛾 ∗ 1 + መ𝛽ζ𝑖)

• ො𝜋0 = 𝑛−1 σ𝑖 𝑒𝑥𝑝𝑖𝑡( ො𝛾 ∗ 0 + መ𝛽ζ𝑖)

3. OR marginal = ෝ𝜋1 ∗ (1−ෝ𝜋0)

ෝ𝜋0 ∗ (1−ෝ𝜋1)

G-Computation (GC)

7/16* : Robins (1986), Snowden et al. (2011)

Introduction

Méthodes

Simulation

Application

Discussion

Conclusion

• 4 stratégies envisagées :

Sélection des covariables

D’après Brookhart et al. (2006)

Z9

Z1, Z2, Z4 & Z5

Z3 & Z6Z7 & Z8

X Y

Introduction

Méthodes

Simulation

Application

Discussion

Conclusion

8/16


– Meilleure pour PS



Z9

Z1, Z2, Z4 & Z5

Z3 & Z6Z7 & Z8

X Y

ÉvènementIntroduction

Méthodes

Simulation

Application

Discussion

Conclusion

8/16




Z9

Z1, Z2, Z4 & Z5

Z3 & Z6Z7 & Z8

X Y

TraitementIntroduction

Méthodes

Simulation

Application

Discussion

Conclusion

8/16




Z9

Z1, Z2, Z4 & Z5

Z3 & Z6Z7 & Z8

X Y

Évènement et TraitementIntroduction

Méthodes

Simulation

Application

Discussion

Conclusion

8/16




Z9

Z1, Z2, Z4 & Z5

Z3 & Z6Z7 & Z8

X Y

ToutesIntroduction

Méthodes

Simulation

Application

Discussion

Conclusion

8/16

• Traitement binaire (oui/non)

• Au total : 96 scénarios

• 10 000 réplications

Simulation - Design

H0/H1

Tailles d’échantillon

(100, 300, 500 & 2000)

Stratégies de sélection des covariables

Méthodes :

GC, IPTW, PSM

Introduction

Méthodes

Simulation

Application

Discussion

Conclusion

9/16

Simulation - Résultats

10/16

Introduction

Méthodes

Simulation

Application

Discussion

Conclusion

• GC > PS

• Sélection sur l’évènement

– Correct sur « vrais facteurs de confusion » pour PS

Simulation - Résultats

Introduction

Méthodes

Simulation

Application

Discussion

Conclusion

11/16

• Contexte : Barbituriques suggérés pour HTIC ⇨ effetssecondaires ?

• Objectif : Impact des barbituriques sur le statutfonctionnel à 3 mois des patients en réanimation

• Évènement : Statut favorable

– Favorable : bonne récupération ou handicap modéré

– 72 patients / 252 ont un statut favorable à 3 mois

• Traitement : Barbituriques vs Contrôle

– 30% des patients ont eu des barbituriques

• Sélection des variables sur la p-value (< 0.25)

Application

12/16

Introduction

Méthodes

Simulation

Application

Discussion

Conclusion

Application

13/16

Introduction

Méthodes

Simulation

Application

Discussion

Conclusion

GC : Barbituriques ⇨ impact négatif sur le statutfonctionnel

Application

Introduction

Méthodes

Simulation

Application

Discussion

Conclusion

13/16

GC : Barbituriques ⇨ impact négatif sur le statutfonctionnel

IPTW et PSM : résultats discordants entre les différentesstratégies de sélection (manque de puissance)

Application

Introduction

Méthodes

Simulation

Application

Discussion

Conclusion

13/16

Discussion

Biais estimé

VarianceErreur de

type IPuissance

Estime ATT et ATE

Standardisation possible

Modélisation multivariée complexe

GC

IPTW

PSM

Introduction

Méthodes

Simulation

Application

Discussion

Conclusion

14/16

• Utilisation PS > GC parce que :– Idée que seul le PS peut estimer des effets marginaux*

– Plus de tutoriels disponibles pour PS‡

• Étude sur les méthodes les plus usitées (≠ les plus efficaces)

• PSM < autres car appariement incomplet– Population appariée non-représentative†

– Reste la plus usitée en pratique

• Perspectives :– Extension aux données censurées

– Méthodes doublement robustes combinant GC et IPTW$

– Implémentation dans Plug-Stat®

Discussion

15/16* : Nieto et Coresh (1996)‡ : Snowden et al. (2011)

† : Austin (2014b)$ : Hernan et Robins (2018)

Introduction

Méthodes

Simulation

Application

Discussion

Conclusion

• Favoriser GC si évènement binaire

• Favoriser IPTW si GC impossible

• Sélection des covariables sur l’évènement

– Évènement et traitement acceptable

Conclusion

16/16

Introduction

Méthodes

Simulation

Application

Discussion

Conclusion

• Ali MS, Groenwold RHH, Belitser SV, Pestman WR, Hoes AW, Roes KCB, et al. Reporting ofcovariate selection and balance assessment in propensity score analysis is suboptimal: asystematic review. J Clin Epidemiol. févr 2015;68(2):112-21.

• Austin PC. Type I Error Rates, Coverage of Confidence Intervals, and Variance Estimation inPropensity-Score Matched Analyses. Int J Biostat [Internet]. 14 avr 2009 [cité 28 août 2018];5(1).Austin PC. A comparison of 12 algorithms for matching on the propensity score. Stat Med. 15 mars2014;33(6):1057-69.

• Austin PC. The use of propensity score methods with survival or time-to-event outcomes:reporting measures of effect similar to those used in randomized experiments: Propensity scoresand survival analysis. Stat Med. 30 mars 2014;33(7):1242-58.

• Austin PC, Stuart EA. Estimating the effect of treatment on binary outcomes using full matching onthe propensity score. Stat Methods Med Res. déc 2017;26(6):2505-25.

• Brookhart MA, Schneeweiss S, Rothman KJ, Glynn RJ, Avorn J, Stürmer T. Variable selection forpropensity score models. Am J Epidemiol. 2006 Jun 15;163(12):1149–56.

• Gayat E, Pirracchio R, Resche-Rigon M, Mebazaa A, Mary J-Y, Porcher R. Propensity scores inintensive care and anaesthesiology literature: a systematic review. Intensive Care Med. 1 déc2010;36(12):1993-2003.

• Hernan M, Robins J. Causal Inference [Internet]. Boca Raton: Chapman & Hall/CRC; 2018 [cité 2août 2018]. Disponible sur: https://www.hsph.harvard.edu/miguel-hernan/causal-inference-book/

Références 1/2

https://www.hsph.harvard.edu/miguel-hernan/causal-inference-book/

• Imbens GW. Nonparametric Estimation of Average Treatment Effects Under Exogeneity: A Review.The Review of Economics and Statistics. 1 févr 2004;86(1):4-29.

• Le Borgne F, Giraudeau B, Querard AH, Giral M, Foucher Y. Comparisons of the performance ofdifferent statistical tests for time-to-event analysis with confounding factors: practical illustrationsin kidney transplantation. Stat Med. 30 mars 2016;35(7):1103-16.

• Morgan SL, Todd JJ. A Diagnostic Routine for the Detection of Consequential Heterogeneity ofCausal Effects. Sociological Methodology. août 2008;38(1):231-82.

• Nieto FJ, Coresh J. Adjusting survival curves for confounders: a review and a new method. Am JEpidemiol. 15 mai 1996;143(10):1059-68.

• Robins JM. A new approach to causal inference in mortality studies with a sustained exposureperiod—application to control of the healthy worker survivor effect. Mathematical Modelling. 1janv 1986;7(9):1393-512.

• Robins JM, Hernán MA, Brumback B. Marginal structural models and causal inference inepidemiology. Epidemiology. 2000 Sep;11(5):550–60.

• Rosenbaum PR, Rubin DB. The central role of the propensity score in observational studies forcausal effects. Biometrika. 1 avr 1983;70(1):41-55.

• Snowden JM, Rose S, Mortimer KM. Implementation of G-Computation on a Simulated Data Set:Demonstration of a Causal Inference Technique. Am J Epidemiol. 1 avr 2011;173(7):731-8.

Références 2/2

Annexes

• Vraisemblance conditionnelle (VC) :– Dans la paire k

• 𝑃(𝑦1𝑘 = 1|𝑥1𝑘)𝑃(𝑦0𝑘 = 0|𝑥0𝑘) = 𝑒𝑥𝑝𝑖𝑡(𝛼𝑘 + 𝛽𝑥1𝑘)𝑒𝑥𝑝𝑖𝑡[−(𝛼𝑘 + 𝛽𝑥0𝑘)]

• 2 configurations possibles :

– Celle observée et celle où le cas et le témoin sont permutés

– Proba de l’ensemble de ses observations :

» 𝑃(𝑦1𝑘 = 1|𝑥1𝑘)𝑃(𝑦0𝑘 = 0|𝑥0𝑘) + 𝑃(𝑦1𝑘 = 0|𝑥1𝑘)𝑃(𝑦0𝑘 = 1|𝑥0𝑘)

» 𝑒𝑥𝑝𝑖𝑡(𝛼𝑘 + 𝛽𝑥1𝑘)𝑒𝑥𝑝𝑖𝑡[−(𝛼𝑘 + 𝛽𝑥0𝑘)] + 𝑒𝑥𝑝𝑖𝑡(𝛼𝑘 + 𝛽𝑥0𝑘)𝑒𝑥𝑝𝑖𝑡[−(𝛼𝑘 + 𝛽𝑥1𝑘)]

»𝑒− 𝛼𝑘+𝛽𝑥0𝑘 + 𝑒−(𝛼𝑘+𝛽𝑥1𝑘)

[1+𝑒− 𝛼𝑘+𝛽𝑥1𝑘 ][1+𝑒−(𝛼𝑘+𝛽𝑥0𝑘)]

• D’où 𝑉𝐶𝑘 =𝑒−𝛽𝑥0𝑘

𝑒−𝛽𝑥0𝑘 + 𝑒−𝛽𝑥1𝑘/!\ ne dépend plus de α

– 𝑉𝑟𝑎𝑖𝑠𝑒𝑚𝑏𝑙𝑎𝑛𝑐𝑒 𝑡𝑜𝑡𝑎𝑙𝑒 = ς𝑘 𝑉𝑘

Annexes

D’après « Epidémiologie : Principes et méthodes quantitatives » J. Boyer et al. Édition Lavoisier. 2009 p. 284-287

• « Doubly robust method »

1. Calcul du pi et des poids ωi

1/pi si Xi=1

1/(1-pi) si Xi=0

2. Q-Model pondéré par les poids ωi

3. OR marginal

Annexes

Vansteelandt S, Keiding N. Invited Commentary: G-Computation-Lost in Translation? American Journal of Epidemiology.2011 Apr 1;173(7):739–42.

IPTW

GC

La G-computation et les méthodes basées sur la théorie du...

Documents

Transcript of La G-computation et les méthodes basées sur la théorie du...