Concevoir des applications SharePoint basées sur la recherche
La G-computation et les méthodes basées sur la théorie du...
Transcript of La G-computation et les méthodes basées sur la théorie du...
La G-computation et les méthodes basées surla théorie du score de propension dans le cadred'un critère de jugement binaire : une étudecomparative afin d'évaluer leurs performances.
A. Chatton, F. Le Borgne, Y. Foucher et al.
Journées GDR Statistique et Santés 2018 – 28 septembre 2018
UMR Inserm 1246 – SPHERE, Université de Nantes, Nantes, France
LabCom RISCA, Nantes, France
Études observationnelles
Contexte
1/16
Facteur de confusion
ÉvènementTraitement
biais
Introduction
Méthodes
Simulation
Application
Discussion
Conclusion
• Variable qui résume les caractéristiquesinitiales (Z) liées à l’indication du traitement(X) d’un individu i*
pi = P(Xi = 1|Zi = zi)
• Estimé à partir d’un modèle logistique
logit(pi) = βζi
Avec ζi = (1,z1i,…,zpi) dont p covariables
Score de propension (PS)
2/16* : Rosenbaum et Rubin (1983)
Introduction
Méthodes
Simulation
Application
Discussion
Conclusion
• 2 effets marginaux (populationnels)‡ :
– ATE ⇨ population entière
– ATT ⇨ patients traités
• 4 méthodes possibles :
– Appariement
– Pondération
– Stratification
– Ajustement
Score de propension (PS)
3/16‡ : Imbens (2004)
Gayat et al. (2010)
Introduction
Méthodes
Simulation
Application
Discussion
Conclusion
• Meilleure méthode pour estimer effetmarginal ?
Focus sur ATT ici
• Quelles variables prendre en compte dans la G-computation ?
4/16
Objectifs
Introduction
Méthodes
Simulation
Application
Discussion
Conclusion
• Principe :
– Pondérer la contribution de chaque sujet
– Obtenir un pseudo-échantillon où la distribution descovariables est équilibrée entre les groupes
• Plus techniquement :
– Utilisation de poids stabilisés* : 𝜔𝑖 = 𝑥𝑖 +1−𝑥𝑖 × 𝑝𝑖
1 − 𝑝𝑖
– Utilisation d’un estimateur robuste de la variance‡
𝑙𝑜𝑔𝑖𝑡 𝑃 𝑌𝑖 = 1 𝑋𝑖 = 𝑥𝑖 = 𝛼0 + 𝛼1𝑥𝑖
• En pratique :
– Méthode basée sur le PS avec les meilleures performances†
Pondération (IPTW)
5/16
* : Morgan et Todd (2008)‡ : Robins et al. (2000)† : Le Borgne et al. (2015)
Introduction
Méthodes
Simulation
Application
Discussion
Conclusion
Appariement (PSM)
6/16
• Principe :– Apparier chaque individu traité à un autre non-traité selon
leur βζ
• Plus techniquement :– Méthode des plus proche voisins 1:1 sans remise*
– Seuil à 0.2 écart-type de βζ *
– Régression logistique conditionnelle‡
𝑙𝑜𝑔𝑖𝑡(𝑃 𝑌𝑖 = 1 𝑋𝑖 = 𝑥𝑖 ) = 𝛼0 + 𝛼1𝑥𝑖
• En pratique :– Seul l’ATT est estimable ici†
– Méthode basée sur le PS la plus usitée§
* : Austin (2014a)‡ : Austin (2009)
† : Austin et Stuart (2014)§ : Ali et al. (2015)
Introduction
Méthodes
Simulation
Application
Discussion
Conclusion
• Basée sur une régression « traditionnelle »
• Estime aussi un effet marginal* :
1. Q-Model : 𝑙𝑜𝑔𝑖𝑡(𝑃 𝑌𝑖 = 1 𝑋𝑖 = 𝑥𝑖 , 𝑍𝑖 = 𝑧𝑖 ) = 𝛾𝑥𝑖 + 𝛽ζ𝑖
2. Probabilités prédites d’être traité ou non :
• ො𝜋1 = 𝑛−1 σ𝑖 𝑒𝑥𝑝𝑖𝑡( ො𝛾 ∗ 1 + መ𝛽ζ𝑖)
• ො𝜋0 = 𝑛−1 σ𝑖 𝑒𝑥𝑝𝑖𝑡( ො𝛾 ∗ 0 + መ𝛽ζ𝑖)
3. OR marginal = ෝ𝜋1 ∗ (1−ෝ𝜋0)
ෝ𝜋0 ∗ (1−ෝ𝜋1)
G-Computation (GC)
7/16* : Robins (1986), Snowden et al. (2011)
Introduction
Méthodes
Simulation
Application
Discussion
Conclusion
• 4 stratégies envisagées :
Sélection des covariables
D’après Brookhart et al. (2006)
Z9
Z1, Z2, Z4 & Z5
Z3 & Z6Z7 & Z8
X Y
Introduction
Méthodes
Simulation
Application
Discussion
Conclusion
8/16
• 4 stratégies envisagées :
– Meilleure pour PS
Sélection des covariables
D’après Brookhart et al. (2006)
Z9
Z1, Z2, Z4 & Z5
Z3 & Z6Z7 & Z8
X Y
ÉvènementIntroduction
Méthodes
Simulation
Application
Discussion
Conclusion
8/16
• 4 stratégies envisagées :
Sélection des covariables
D’après Brookhart et al. (2006)
Z9
Z1, Z2, Z4 & Z5
Z3 & Z6Z7 & Z8
X Y
TraitementIntroduction
Méthodes
Simulation
Application
Discussion
Conclusion
8/16
• 4 stratégies envisagées :
Sélection des covariables
D’après Brookhart et al. (2006)
Z9
Z1, Z2, Z4 & Z5
Z3 & Z6Z7 & Z8
X Y
Évènement et TraitementIntroduction
Méthodes
Simulation
Application
Discussion
Conclusion
8/16
• 4 stratégies envisagées :
Sélection des covariables
D’après Brookhart et al. (2006)
Z9
Z1, Z2, Z4 & Z5
Z3 & Z6Z7 & Z8
X Y
ToutesIntroduction
Méthodes
Simulation
Application
Discussion
Conclusion
8/16
• Traitement binaire (oui/non)
• Au total : 96 scénarios
• 10 000 réplications
Simulation - Design
H0/H1
Tailles d’échantillon
(100, 300, 500 & 2000)
Stratégies de sélection des covariables
Méthodes :
GC, IPTW, PSM
Introduction
Méthodes
Simulation
Application
Discussion
Conclusion
9/16
Simulation - Résultats
10/16
Introduction
Méthodes
Simulation
Application
Discussion
Conclusion
Simulation - Résultats
10/16
Introduction
Méthodes
Simulation
Application
Discussion
Conclusion
Simulation - Résultats
10/16
Introduction
Méthodes
Simulation
Application
Discussion
Conclusion
Simulation - Résultats
10/16
Introduction
Méthodes
Simulation
Application
Discussion
Conclusion
Simulation - Résultats
10/16
Introduction
Méthodes
Simulation
Application
Discussion
Conclusion
Simulation - Résultats
10/16
Introduction
Méthodes
Simulation
Application
Discussion
Conclusion
Simulation - Résultats
10/16
Introduction
Méthodes
Simulation
Application
Discussion
Conclusion
Simulation - Résultats
10/16
Introduction
Méthodes
Simulation
Application
Discussion
Conclusion
Simulation - Résultats
10/16
Introduction
Méthodes
Simulation
Application
Discussion
Conclusion
Simulation - Résultats
10/16
Introduction
Méthodes
Simulation
Application
Discussion
Conclusion
• GC > PS
• Sélection sur l’évènement
– Correct sur « vrais facteurs de confusion » pour PS
Simulation - Résultats
Introduction
Méthodes
Simulation
Application
Discussion
Conclusion
11/16
• Contexte : Barbituriques suggérés pour HTIC ⇨ effetssecondaires ?
• Objectif : Impact des barbituriques sur le statutfonctionnel à 3 mois des patients en réanimation
• Évènement : Statut favorable
– Favorable : bonne récupération ou handicap modéré
– 72 patients / 252 ont un statut favorable à 3 mois
• Traitement : Barbituriques vs Contrôle
– 30% des patients ont eu des barbituriques
• Sélection des variables sur la p-value (< 0.25)
Application
12/16
Introduction
Méthodes
Simulation
Application
Discussion
Conclusion
Application
13/16
Introduction
Méthodes
Simulation
Application
Discussion
Conclusion
GC : Barbituriques ⇨ impact négatif sur le statutfonctionnel
Application
Introduction
Méthodes
Simulation
Application
Discussion
Conclusion
13/16
GC : Barbituriques ⇨ impact négatif sur le statutfonctionnel
IPTW et PSM : résultats discordants entre les différentesstratégies de sélection (manque de puissance)
Application
Introduction
Méthodes
Simulation
Application
Discussion
Conclusion
13/16
Discussion
Biais estimé
VarianceErreur de
type IPuissance
Estime ATT et ATE
Standardisation possible
Modélisation multivariée complexe
GC
IPTW
PSM
Introduction
Méthodes
Simulation
Application
Discussion
Conclusion
14/16
• Utilisation PS > GC parce que :– Idée que seul le PS peut estimer des effets marginaux*
– Plus de tutoriels disponibles pour PS‡
• Étude sur les méthodes les plus usitées (≠ les plus efficaces)
• PSM < autres car appariement incomplet– Population appariée non-représentative†
– Reste la plus usitée en pratique
• Perspectives :– Extension aux données censurées
– Méthodes doublement robustes combinant GC et IPTW$
– Implémentation dans Plug-Stat®
Discussion
15/16* : Nieto et Coresh (1996)‡ : Snowden et al. (2011)
† : Austin (2014b)$ : Hernan et Robins (2018)
Introduction
Méthodes
Simulation
Application
Discussion
Conclusion
• Favoriser GC si évènement binaire
• Favoriser IPTW si GC impossible
• Sélection des covariables sur l’évènement
– Évènement et traitement acceptable
Conclusion
16/16
Introduction
Méthodes
Simulation
Application
Discussion
Conclusion
• Ali MS, Groenwold RHH, Belitser SV, Pestman WR, Hoes AW, Roes KCB, et al. Reporting ofcovariate selection and balance assessment in propensity score analysis is suboptimal: asystematic review. J Clin Epidemiol. févr 2015;68(2):112-21.
• Austin PC. Type I Error Rates, Coverage of Confidence Intervals, and Variance Estimation inPropensity-Score Matched Analyses. Int J Biostat [Internet]. 14 avr 2009 [cité 28 août 2018];5(1).Austin PC. A comparison of 12 algorithms for matching on the propensity score. Stat Med. 15 mars2014;33(6):1057-69.
• Austin PC. The use of propensity score methods with survival or time-to-event outcomes:reporting measures of effect similar to those used in randomized experiments: Propensity scoresand survival analysis. Stat Med. 30 mars 2014;33(7):1242-58.
• Austin PC, Stuart EA. Estimating the effect of treatment on binary outcomes using full matching onthe propensity score. Stat Methods Med Res. déc 2017;26(6):2505-25.
• Brookhart MA, Schneeweiss S, Rothman KJ, Glynn RJ, Avorn J, Stürmer T. Variable selection forpropensity score models. Am J Epidemiol. 2006 Jun 15;163(12):1149–56.
• Gayat E, Pirracchio R, Resche-Rigon M, Mebazaa A, Mary J-Y, Porcher R. Propensity scores inintensive care and anaesthesiology literature: a systematic review. Intensive Care Med. 1 déc2010;36(12):1993-2003.
• Hernan M, Robins J. Causal Inference [Internet]. Boca Raton: Chapman & Hall/CRC; 2018 [cité 2août 2018]. Disponible sur: https://www.hsph.harvard.edu/miguel-hernan/causal-inference-book/
Références 1/2
• Imbens GW. Nonparametric Estimation of Average Treatment Effects Under Exogeneity: A Review.The Review of Economics and Statistics. 1 févr 2004;86(1):4-29.
• Le Borgne F, Giraudeau B, Querard AH, Giral M, Foucher Y. Comparisons of the performance ofdifferent statistical tests for time-to-event analysis with confounding factors: practical illustrationsin kidney transplantation. Stat Med. 30 mars 2016;35(7):1103-16.
• Morgan SL, Todd JJ. A Diagnostic Routine for the Detection of Consequential Heterogeneity ofCausal Effects. Sociological Methodology. août 2008;38(1):231-82.
• Nieto FJ, Coresh J. Adjusting survival curves for confounders: a review and a new method. Am JEpidemiol. 15 mai 1996;143(10):1059-68.
• Robins JM. A new approach to causal inference in mortality studies with a sustained exposureperiod—application to control of the healthy worker survivor effect. Mathematical Modelling. 1janv 1986;7(9):1393-512.
• Robins JM, Hernán MA, Brumback B. Marginal structural models and causal inference inepidemiology. Epidemiology. 2000 Sep;11(5):550–60.
• Rosenbaum PR, Rubin DB. The central role of the propensity score in observational studies forcausal effects. Biometrika. 1 avr 1983;70(1):41-55.
• Snowden JM, Rose S, Mortimer KM. Implementation of G-Computation on a Simulated Data Set:Demonstration of a Causal Inference Technique. Am J Epidemiol. 1 avr 2011;173(7):731-8.
Références 2/2
Annexes
Annexes
Annexes
Annexes
Annexes
Annexes
Annexes
Annexes
Annexes
Annexes
Annexes
Annexes
• Vraisemblance conditionnelle (VC) :– Dans la paire k
• 𝑃(𝑦1𝑘 = 1|𝑥1𝑘)𝑃(𝑦0𝑘 = 0|𝑥0𝑘) = 𝑒𝑥𝑝𝑖𝑡(𝛼𝑘 + 𝛽𝑥1𝑘)𝑒𝑥𝑝𝑖𝑡[−(𝛼𝑘 + 𝛽𝑥0𝑘)]
• 2 configurations possibles :
– Celle observée et celle où le cas et le témoin sont permutés
– Proba de l’ensemble de ses observations :
» 𝑃(𝑦1𝑘 = 1|𝑥1𝑘)𝑃(𝑦0𝑘 = 0|𝑥0𝑘) + 𝑃(𝑦1𝑘 = 0|𝑥1𝑘)𝑃(𝑦0𝑘 = 1|𝑥0𝑘)
» 𝑒𝑥𝑝𝑖𝑡(𝛼𝑘 + 𝛽𝑥1𝑘)𝑒𝑥𝑝𝑖𝑡[−(𝛼𝑘 + 𝛽𝑥0𝑘)] + 𝑒𝑥𝑝𝑖𝑡(𝛼𝑘 + 𝛽𝑥0𝑘)𝑒𝑥𝑝𝑖𝑡[−(𝛼𝑘 + 𝛽𝑥1𝑘)]
»𝑒− 𝛼𝑘+𝛽𝑥0𝑘 + 𝑒−(𝛼𝑘+𝛽𝑥1𝑘)
[1+𝑒− 𝛼𝑘+𝛽𝑥1𝑘 ][1+𝑒−(𝛼𝑘+𝛽𝑥0𝑘)]
• D’où 𝑉𝐶𝑘 =𝑒−𝛽𝑥0𝑘
𝑒−𝛽𝑥0𝑘 + 𝑒−𝛽𝑥1𝑘/!\ ne dépend plus de α
– 𝑉𝑟𝑎𝑖𝑠𝑒𝑚𝑏𝑙𝑎𝑛𝑐𝑒 𝑡𝑜𝑡𝑎𝑙𝑒 = ς𝑘 𝑉𝑘
Annexes
D’après « Epidémiologie : Principes et méthodes quantitatives » J. Boyer et al. Édition Lavoisier. 2009 p. 284-287
• « Doubly robust method »
1. Calcul du pi et des poids ωi
1/pi si Xi=1
1/(1-pi) si Xi=0
2. Q-Model pondéré par les poids ωi
3. OR marginal
Annexes
Vansteelandt S, Keiding N. Invited Commentary: G-Computation-Lost in Translation? American Journal of Epidemiology.2011 Apr 1;173(7):739–42.
IPTW
GC