BMJ指南:P<0.05统计意义还要加临床意义MCID

文摘   2024-11-21 11:22   上海  

最近收到小伙伴的一个SCI返修意见,审稿人要求提供MID:My main suggestion is to compare groups according to minimally important difference as well as statistical difference on the VAS, using categories defined by https://erj.ersjournals.com/content/56/2/1902202.full. (我的主要建议是,除了在VAS量表上进行统计差异的比较,还应根据最低临床显著差异对组间进行比较,使用定义在https://erj.ersjournals.com/content/56/2/1902202.full中的分类)。

下面我们一起看看MID指标来龙去脉是什么。

一、MID是什么

MID=MCID,Minimal clinically important difference,同时也可能叫一些冷门的概念CID、MDD、DIC、MDC、SRD、SDD、SID。MCID(最小临床意义差值)是衡量治疗效果临床意义的重要指标,它指的是患者认为的在无副作用和成本负担下感知到的最小获益变化值。MID概念和定义的演变如下表。MID最初来源生存质量量表和临床疗效问卷分值变化临床意义解释的问题,后来慢慢演变为CONSORT中RCT需要报道的指标。MID的提出为结果临床意义的判断提供了依据,可在指南制订过程中协助证据质量判断、为临床试验提供样本量估算依据和指导临床决策等。简而言之,此类患者报道的临床研究结果判读不光要考虑统计意义的P<0.05,还应考虑临床意义MCID,RCT和队列研究均可报道https://pmc.ncbi.nlm.nih.gov/articles/PMC10013657/。

二、患者自报MCID

可能小伙伴们和我一样,被MCID庞大的别名搞的晕头转向。其实,核心在于隐藏在诸多文字中的核心词,患者自报结局测量PROM。BMJ2023年发文https://www.2374.top/content/381/bmj-2022-073822, 详细解释了MID的定义与最佳MID选择过程。

2.1 PROM

患者自身经历健康状况时,患者自报测量RPOM比生理测量和临床医生估计局限性更低。PROM 可以用来衡量患者的体验,包括症状状态、身体功能、心理健康、社会功能、幸福感和生活质量等(注意,全都不是硬终点!)。PROM的使用增强了对旨在影响疾病状态和病程的干预措施对患者生活的影响的理解。因此,诸多学者建议在评价治疗或护理干预效果的RCT中使用PROM作为结局指标:比如VAS疼痛评分、SF-36生活质量评分等,都属于PROM。然而,PROM结果很难解释,且如果样本量足够大,组内或组间PROM分数的微小差异可能对患者的临床意义不重要,但是可以达到统计学意义(P<0.05)。其实,只要样本足够大,就容易有统计学差异。那临床意义如何判断?本文的MID,就是对解释RCT中组间差异的最小界值:组间差异相对于MID越小,说明干预措施产生重要和实质性临床影响的可能性越小,与MID差异越大,则干预效果可能性越大。

三、MCID四种常用估算方法

3.1 MCID四种常用估算方法

方法包括效标法(锚法)、分布法、文献分析法和专家共识法。

3.2 中文杂志中MCID的确定

中文文章介绍,基于分布法的估算结果对应的是数据上的最小可测变化值(MDC),而不是 MCID。MDC 是测量工具可以检测到的最小变化,是对测量工具的可靠性评价。而MCID 是对临床效果的真实性评价。简言而之,MCID没有共识,需综合考虑多种方法,并结合具体的临床情境,案例举例了SCI最后采用meta分析中的pool 效应量。

3.3 BMJ中最佳MID过程

BMJ文章内推荐方法链接是个广告!https://www.promid.org/methods。但是里面method部分,图示非常好类似meta过程。有理有据,是中文杂志介绍中没有涉及到系统评价与最佳选择MID的详细补充。BMJ指出指导委员会成立后,选择方法的制定分为三个阶段:进行系统调查,以确定与选择MID 相关的问题;收集专家对总体选择框架的意见;就遴选框架下的细节达成共识;并制定系统的、逐步的选择方法。简而言之,就是像系统评价一样制作MCID池子。

四、MCID案例

4.1 Bmj 案例

WOMAC示例中,只有一小部分 MID 具有高可信度(例如,在 45 个已发布的 WOMAC-pain 估计中,只有 5 个具有高度可信度)。这一发现强调需要进行更多高质量的研究来建立新的可信的 MID 估计值并更好地报告 MID 研究。这也是BMJ系列发了很多篇严格的方法学文章的意义,要求更科学系统。

4.2 ERS案例

看完BMJ系列大作,发现太多方法学和问答细节了,整个流水线和meta分析差不多,看的很心烦,反而不利于小文章的落地。再看ERS范文,流畅的多,没那么系统评价的jjyy,我觉得更适合普罗大众。


五、发散思维

1.MCID用于患者自报结局和中间指标。对硬性终点如死亡率等的临床意义解释不适用。包含不限于患者的体验,包括症状状态、身体功能、心理健康、社会功能、幸福感和生活质量等都是软终点。

2.BMJ提出系统流程太复杂,需要用文章专业软件。其他文章推荐,MCID为统一度量后的效标法/锚法的均值或中位数。

3.除了MCID外,也有LCA = latent class analysis, SWE = smallest worthwhile effect等替代方法,优劣性见下面。自己计算MCID比较复杂和费时,可以查找既往文献中有描述MCID值,例如脊柱外科通用VAS评分MCID大致在2-3分,ODI在10左右,NDI在6左右,而JOA在2.5左右。

4.涉及PROM结局文章的时候,我们不应只看P值,还要看MCID。当然,还有其他CIOV拓展指标,SCB、PASS、MOI等等。

六、R实现

网络已有的MCID包、MRQoL包奇奇怪怪的都不是文献报道的指标体系,没演示案例解释不详。下面提供智荟MCID计算过程。

七、智荟小结

1.MCID主流还是简单锚法,锚=点估计指标,MCID为统一度量后的效标法/锚法的均值、中位数、pooled 值;辅助分布法(描述变化、趋势),分布=分布相关指标;再加点样本量分析。

2.MCID用于患者自报指标(硬终点不适合),统计分析做P<0.05的时候要报道MCID。队列中,疗效评价可报道MCID。

3.MCID各个方法差异巨大,感觉比样本量还容易人为操控,可能毕竟对应的结果也是主观的患者自报原因吧。



本公众号建立了学术交流群(群6),仅供SCI学术交流,人数有限需要实名制。入群请加笔者微信 popnie请备注说明:姓名-学校(单位)-专业。 


临床研究与医学统计
传播和普及临床试验与医学统计方法学知识
 最新文章