尊敬的各位读者:
根据当前疫情防控要求,我馆部分原文传递服务可能会有延期,无法在24小时内提供,给您带来的不便敬请谅解!
国家工程技术图书馆
2022年11月29日
摘要: 倾向性评分(Propensity Score,PS)方法是目前常用的在真实世界研究中控制混杂因素的方法,其中PS加权方法也已得到越来越多的应用。PS加权的分析步骤为:1.估计PS值;2.根据PS值进行加权;3.均衡性检验;4.效应估计。目前常用的估计PS值的方法为logistic回... 展开 倾向性评分(Propensity Score,PS)方法是目前常用的在真实世界研究中控制混杂因素的方法,其中PS加权方法也已得到越来越多的应用。PS加权的分析步骤为:1.估计PS值;2.根据PS值进行加权;3.均衡性检验;4.效应估计。目前常用的估计PS值的方法为logistic回归模型,但是当混杂因素和处理因素之间的关系复杂且未知时难以完全正确设定它们之间的关系,因此PS值会估计不准确,导致效应估计不准确。广义增强模型(Generalized Boosted Models,GBM)是一类自适应的回归模型,无需人为设定自变量与因变量之间的关系。将GBM应用于PS值的估计中,模型即可通过迭代找到混杂因素与处理因素之间的关系,从而得到更加准确的PS值估计。目前常用的加权方法为逆概率加权(Inverse Probability Weighting,IPW),但是极端权重的出现会影响效应估计,尤其是当处理组和对照组之间PS值重叠程度小的情况下,而重叠权重加权(Overlap Weighting,OW)则可避免重叠程度低导致极端权重产生的问题。 研究目的:联合GBM和倾向性评分重叠权重构建GBM-OW模型,解决在处理因素为二分类变量的情况下PS值估计不准确和极端权重的问题,从而得到更加准确的效应估计,为真实世界研究控制混杂因素提供新的统计分析方法。 研究方法:根据混杂因素的均衡性联合广义增强模型和倾向性评分重叠权重,构建GBM-OW模型。通过多种场景的模拟数据对模型进行评价,设计包含7种不同混杂因素与处理因素之间的关系、4种不同PS值重叠程度、2种处理组比例、6种样本量以及3种结局类型共1008种场景的模拟数据,每种场景模拟1000次。利用Kolmogorov-Smirnov(KS)值和绝对标准均值差(Absolute Standardized Mean Difference,ASMD)评价GBM-OW模型在均衡混杂因素方面的表现,利用相对偏倚(Relative Bias,RB)、均方根误差(Root Mean Squared Error,RMSE)、95%置信区间覆盖率(95%Confidence Interval Coverage Rate,95% CICR)评价模型在效应估计方面的表现,并与多因素回归模型(adjusted)、基于logistic回归的IPW模型(logistic-IPW)、基于logistic回归的OW模型(logistic-OW)、基于GBM的IPW模型(GBM-IPW)四种模型进行比较。然后将GBM-OW模型应用于美国重症监护医疗信息中心数据库(Medical Information Mart for Intensive Care,MIMIC-Ⅳ)中,分析使用他汀类药物是否与重症监护室中急性肾衰竭病人的临床结局有关。并基于实例数据进行了进一步的模拟研究。 研究结果:在模拟数据中,加权前与 logistic-IPW、logistic-OW、GBM-IPW、GBM-OW四种模型加权后的平均KS值分别为:0.3687、0.1584、0.0728、0.1402和0.0160;平均ASMD值分别为0.9312、0.2668、<0.0001、0.3648和0.0315。当结局为连续型变量时,adjusted、logistic-IPW、logistic-OW、GBM-IPW 和 GBM-OW 五种模型的平均 RB 分别为:24.43%、26.21%、13.40%、107.09%和 6.68%;平均 RMSE 分别为:0.2694、0.6100、0.1688、1.0947 和 0.1167;平均 95% CICR 分别为 38.57%、83.42%、80.75%、32.52%和 97.56%。当结局为二分类变量时,adjusted、logistic-IPW、logistic-OW、GBM-IPW和GBM-OW五种模型的平均RB分别为:56.51%、极端值、27.65%、88.58%和 24.02%;平均 RMSE 分别为:0.3811、极端值、0.2396、0.5411和 0.2374;平均 95% CICR 分别为 55.02%、85.69%、77.04%、53.07%和 85.11%。当结局为生存资料时,adjusted、logistic-IPW、logistic-OW、GBM-IPW 和 GBM-OW 五种模型的平均 RB 分别为:87.60%、24.52%、27.10%、89.21%和 24.99%;平均RMSE 分别为:0.4021、0.2895、0.1513、0.3868 和 0.1473;平均 95% CICR 分别为26.64%、37.42%、77.43%、27.59%和 94.45%。在实例研究中,adjusted、logistic-IPW、logistic-OW、GBM-IPW和GBM-OW五种模型对住ICU天数的分析结果(均值差及95%CI,使用他汀组vs.未使用他汀组)分别为:-0.51(-0.79 ~-0.24)、-0.41(-0.84 ~ 0.03)、-0.49(-0.77~-0.20)、-0.30(-0.71 ~ 0.12)和-0.38(-0.67 ~-0.09);五种模型对30天内ICU死亡风险的分析结果(HR及95% CI,使用他汀组vs.未使用他汀组)分别为:0.68(0.59 ~ 0.79)、0.72(0.56 ~ 0.93)、0.74(0.64 ~ 0.87)、0.73(0.58 ~0.92)和0.82(0.70 ~ 0.96)。基于实例数据的模拟研究结果与前述模拟研究结果类似。 研究结论:通过在模拟数据与实例数据中的应用,构建的GBM-OW的模型顺利运行并输出结果。在模拟研究中,综合各方面的指标,GBM-OW模型总体表现优于其它模型,特别是当数据场景复杂其它模型表现不佳时,GBM-OW模型仍能有较好的表现。在实例研究中,GBM-OW模型能够很好地均衡混杂因素,并顺利进行效应估计,所得结论与其它常用模型基本一致,即使用他汀类药物的AKI患者临床结局要好于未使用他汀类药物的患者。在基于实例数据的模拟研究中,GBM-OW模型在RB、RMSE、95%CICR等指标上的总体表现优于其它模型。综上,GBM-OW模型在均衡混杂因素、效应估计等评价指标方面均有较好的表现,可解决在倾向性评分加权中PS值估计不准确以及极端权重影响效应估计的问题,尤其是数据场景复杂的情况且样本量足够的情况下,相较于其它模型更有优势。通过实例应用及基于实例数据的模拟研究验证,GBM-OW模型可作为一种在真实世界研究中控制混杂因素的分析方法。 收起
系统维护,暂停服务。
根据《著作权法》“合理使用”原则,您当前的文献传递请求已超限。
如您有科学或教学任务亟需,需我馆提供文献传递服务,可由单位单位签署《图书馆馆际互借协议》说明情况,我馆将根据馆际互借的原则,为您提供更优质的服务。
《图书馆馆际互借协议》扫描件请发送至service@istic.ac.cn邮箱,《图书馆馆际互借协议》模板详见附件。
根据《著作权法》规定, NETL仅提供少量文献资源原文复制件,用户在使用过程中须遵循“合理使用”原则。
您当日的文献传递请求已超限。