本文介绍了利用MSTATA软件,根据 JAMA 子刊最近发表的新套路方法,一键完成治疗组和连续性变量交互作用的立方样条图分析、寻找最佳治疗效果的人群,寻找治疗效果不佳的人群,一键发现阈值,一键完成阈值分析/亚组分析、一键生成亚组分析森林图
中国学者喜欢为了文章而科研,因此喜欢套路化的内容,从二十年前的meta分析开始,到现在的公共数据库挖掘、机器学习预测、孟德尔随机,一开始很困难,需要编程,因此都可以发得影响因子很高,但是一旦有自动化分析工具出现,临床医生不被方法学实现困扰时,这些套路的门槛马上被降低,套路变成垃圾,带来就是内卷,导致现在这些套路非常难发高分。因此需要不停地挖掘热点,不停地出新的自动化分析套路工具,同时,也要抢时间,知道的人多了,就不值钱了。
本次我们带来一个比较新的套路,这个套路刊登在 2022 JAMA 子刊,相应的高分文章也有一些,但不多,且没有中国人。同时也将相应的开源 R 包做成了一个自动化傻瓜分析工具,基本可以一键到底了,大家需要抢时间,一年后这样的套路也不值钱了。
软件在 www.mstata.com ,点击 MSTATA 医学统计机器人 VIP 版进入后下拉菜单选“疗效分析” - “连续性变量和治疗分组的交互作用立方样条图” 即可进入:
治疗组和一个连续性指标的交互作用限制性立方样条图
交互作用立方样条图是一种在统计分析中用于探索和解释变量之间相互作用的可视化工具,特别是在处理治疗组(如药物治疗与否)与一个连续性变量(如年龄、血压等)之间的交互作用时。这种方法通过使用限制性立方样条(restricted cubic splines,RCS)来灵活建模连续变量,从而允许研究者准确估计治疗效果如何随连续变量的不同水平而变化。
在医学研究中,理解和解释治疗效果如何受到其他连续性生物标志物或临床指标的影响是至关重要的。例如,在研究某种新药对高血压患者的效果时,研究者可能需要考虑药物效果如何随患者年龄的不同而改变,因为年龄可能会影响药物的代谢和效能。通过使用交互作用立方样条图,研究者能够直观地展示出治疗效果随着年龄变化的趋势,进而为个性化医疗提供依据。
具体来说,这种分析方法可以帮助解决如下问题:
确定某一治疗是否对不同子群体有不同的效果;
研究连续性变量如何调节(即加强或减弱)治疗效果;
为临床决策提供更精细化的指导。
案例 1:
在一项关于新型心血管疾病药物治疗的研究中,研究者可能专注于探讨药物对降低心血管事件(如心肌梗死或中风)发生风险的效果,特别是这种效果如何随着患者的胆固醇水平变化而变化。在这个例子中,治疗的结局是二分类的:心血管事件的发生(是/否),而胆固醇水平是一个重要的连续性变量,可能会影响药物的疗效。
研究的目标是确定在哪个胆固醇水平区间内,患者从药物治疗中获得的心血管保护效果最大。通过构建一个包含药物治疗与胆固醇水平交互作用的逻辑回归模型,并利用限制性立方样条(RCS)来灵活描述胆固醇水平的影响,研究者可以评估心血管事件风险随胆固醇水平变化的趋势。
研究结果可能表明,对于中等胆固醇水平的患者,新型药物显著降低了心血管事件的风险;然而,在非常高或非常低的胆固醇水平中,药物的保护作用减弱。这表明胆固醇水平在药物疗效中扮演了调节作用,且存在一个最优的胆固醇水平区间,使得心血管保护效果最大化。
通过绘制交互作用立方样条图,研究者可以直观地展示药物预防心血管事件的效果如何随胆固醇水平的不同而变化,从而为医生提供了一个有力的工具来判断在何种胆固醇水平下推荐该药物治疗,以最大限度地减少患者心血管事件的风险。这种方法促进了针对特定胆固醇水平患者群体的个性化治疗策略的发展,有助于更精确地定位治疗效果,提高临床治疗的整体效能。
案例 2:
在心血管疾病的预防研究中,研究者可能会关注一种新的生活方式干预措施(如定期运动)对于不同血压水平人群的效果。这项研究的目的是探索血压这一连续性变量的特定取值范围内,哪些人群在接受干预后能获得更显著的健康效益。使用交互作用立方样条图,可以灵活地描绘出干预效果随着血压不同水平的变化趋势。
具体而言,研究可以建立一个模型,将参与者分为接受生活方式干预的组和未接受干预的对照组,同时考虑血压作为连续性变量的影响。通过应用限制性立方样条(RCS),模型能够灵活地捕捉干预效果随血压变化的非线性关系。
例如,研究结果可能显示,在正常血压和轻度高血压的人群中,生活方式干预能显著降低心血管疾病的风险;而在已经有严重高血压的人群中,干预的效果减弱。这种分析不仅揭示了哪一范围的血压水平下干预最有效,也为针对特定血压水平的人群设计更个性化的预防策略提供了依据。
此外,通过绘制交互作用立方样条图,研究者可以直观地展示干预效果如何随着血压水平的不同而变化,从而为医生和患者提供更明确的指导,帮助他们理解在何种血压水平下采取生活方式干预措施能获得最大的健康益处。这样的研究不仅有助于优化干预策略,还能促进个体化医疗的发展。
本软件功能:
一键计算交互作用 p for interaction。
一键绘制交互作用限制性立方样条图。
一键标记干预有效范围的拐点。
一键拆分亚组做阈值分析。
一键绘制亚组分析森林图。
支持 线性/Logistic/Cox 回归
交互作用RCS:
阈值/亚组分析:
亚组分析森林图:
方法学来源:
2022年的一篇 JAMA 子刊:
另外的文献举例:
准备自己的研究时,可以参考一下几篇文章,照猫画虎很快就模仿出来高分 SCI 了:
Marston NA, Pirruccello JP, Melloni GEM, et al. Predictive Utility of a Coronary Artery Disease Polygenic Risk Score in Primary Prevention. JAMA Cardiol. 2023;8(2):130–137. doi:10.1001/jamacardio.2022.4466
Patel KK, McGhie AI, Kennedy KF, Thompson RC, Spertus JA, Sperry BW, Shaw LJ, Bateman TM. Impact of Positron Emission Tomographic Myocardial Perfusion Imaging on Patient Selection for Revascularization. J Am Coll Cardiol. 2023 Oct 24;82(17):1662-1672. doi: 10.1016/j.jacc.2023.08.027. PMID: 37852696.
软件使用方法:
准备数据
首先务必按照下面的格式准备数据(网站上可下载,下载后在此基础上修改):
下载csv样例数据(右击另存为)
打开如下图:
本样例数据的规则:
一个患者一行(这是准备数据最重要的前提)。
每个患者准备两大类数据,影响因素变量和结局变量:
如图所示,hospital, treatment, age, age2, sex, obstruct, prfor, adhear, differ, extent 为影响因素(自变量),而blood, effect, status, time, occurrence在本例中是结局变量。
影响因素变量有两种,连续性变量(值是连续数据,它可以在变量值所属区间内任意进行取值,如年龄[岁]、血糖值、人的身高、智商等)以及分类变量(是说明事物类别的一个名称,其取值是分类数据。如”性别”就是一个分类变量,其变量值为”男”或”女”;“行业”也是一个分类变量,其变量值可以为”零售业”、“旅游业”、“汽车制造 业”等),在本例中 age是连续性变量(numeric), 其他的是分类变量(factor)。age单位为”岁”时为连续变量,而age2为年龄段分组,这时候为分类变量。
以上概念很重要,后面有一个页面专门设置连续变量和分类变量。
结局变量在本工具中分为几类:
连续型结局变量
如本例中的blood(某血液检测指标)
二分类结局变量
如本例中的effect(疗效)为二分类变量(Good,Bad)
生存型结局变量
需要用两个变量组合来表示,如本例中的status和time。
status代表患者在研究结束时的状态,在本工具中只能取0和1两个数字,不要用字符文本,否则会出错。0 代表没观察到事件发生(如没死或者失访),1 代表观察到了事件发生(如已经死亡且录入了死亡日期)。
time代表从开始日期(开始日期的定义由你的研究目的决定,如随机对照研究往往取随机化入组的那一天为开始日期,而观察性研究可以取首次诊断日期或首次治疗日期等等根据研究目的而定)到结局日期的时间差。当status=1时,结局日期为发生事件(如死亡)的日期,当status=0时,结局日期为最后一次活着的日期(如研究结束日,或随后一次随访日)。
总之,time是一个数值型变量,您需要填入患者从开始到死亡或者随后一次随访时,一共活着的天数。如time为56,status为1时代表患者从开始到死亡活了56天;当time为56,status为0时代表患者没观察到死亡,从开始到最后一次随访,活了56天。
准备数据时,time填入一个非负的整数,status填入0或1,time和status都不能为空,每个患者都必须填入数字。time或status不确定(缺失)时,该患者最好不要放入本数据库。
第一步:生成交互作用限制性立方样条图
1. 选择结局变量的类型
首先,用户需要选择研究的结局变量类型,包括:
二分类变量(例如,Logistic回归分析,结果以OR(Odds Ratio)值表示)
连续性变量(例如,线性回归分析,结果以组间差值表示)
生存变量(例如,Cox回归分析,结果以HR(Hazard Ratio)值表示)
2. 选择结局变量/应变量
根据您选择的结局变量类型,软件将提示您从数据中选择相应的变量。例如,对于二分类变量,您需要选择一个有两个取值的变量(如“有效/无效”)。
3. 选择代表治疗组别的字段
用户需要选择代表治疗组别的字段。该字段应为二分类,仅支持两个治疗组别的区分。
4. 设置参照组与观察/试验组
接下来,选择参照组(在分析中将被设置为0)和观察/试验组(将被设置为1)。
5. 选择连续性变量
根据您的研究需要,选择与治疗组别可能存在交互作用的连续性变量(将用于作图的横轴)。
6. 选择需要调整的协变量
用户可以选择需要在分析中调整的协变量。可以选择多个变量,但为避免共线性,建议先进行变量筛选。
7. 配置图像选项
根据需要,调整图像的配置选项,包括Knot数、横坐标的上下限、图像的宽度和高度、颜色风格等。
8. 生成/更新交互作用立方样条图
在确认所有选择无误后,点击“生成/更新交互作用立方样条图”按钮,软件将根据您的配置生成相应的分析图像。
第二步:阈值分析/亚组分析
如何在我们的软件中进行人群的阈值分析/亚组分析,以便探讨不同人群在特定阈值下的疗效差异。以下是详细的操作步骤:
1. 选择亚组数量
用户首先需要决定将总人群分割成几个亚组进行阈值分析。软件提供了一个滑块,允许选择从2到5个亚组。请根据您的分析需求,移动滑块以选择合适的亚组数量。
2. 输入分割点的值
根据您选择的亚组数量,软件将要求输入相应数量的分割点值。例如,如果您选择将人群分割成3个亚组,则需要输入2个分割点的值,这些值将用于划分人群。
为每个分割点提供一个输入框,用户需要在每个输入框中填写分割点的具体值。
3. 生成/更新回归分析结果
在输入所有分割点的值之后,点击“生成/更新回归分析结果”按钮。软件将根据您提供的分割点值将总人群划分为指定的亚组,并对每个亚组进行独立的回归分析。
分析完成后,软件将展示每个亚组的回归分析结果,包括疗效指标(如OR值、HR值或组间差异)及其统计显著性。
注意事项
选择分割点时,请参考之前生成的交互作用立方样条图,以确定合理的分割点,这些点应该反映出潜在的人群疗效差异。
分割点的选择对分析结果有重大影响,请根据专业知识和数据特性谨慎选择。
确保输入的分割点值在数据的有效范围内,并考虑到分割后每个亚组中应有足够的样本量,以保证分析的可靠性。
通过遵循上述步骤,用户可以有效地进行人群的阈值分析/亚组分析,识别出在特定阈值下疗效差异显著的人群,从而为临床决策和个体化治疗提供有力的数据支持。