常用效应指标 |《系统评价与Meta分析论文撰写规范PRISMA解读》新书抢先看

学术   健康   2024-08-13 16:14   北京  


编者按:虽然受到了一些质疑,但是循证医学仍然是现代医学不可动摇的基石。根据循证医学的理论,系统评价和Meta分析具有极高的证据等级,因此对临床决策的影响也极大。纵观各个权威学会制定的疾病诊疗指南,无不把系统评价和Meta分析的结论置于显著位置。规范化撰写系统评价和Meta分析类论文,以增强论文的临床影响力和穿透力,是每个从事系统评价和Meta分析的临床医生、研究人员不得不面对的问题。但是,系统评价和Meta分析的撰写情况却令人堪忧。尽管很多期刊编辑部和审稿人不遗余力推广系统评价和Meta分析的报告规范PRISMA声明,报告质量低下的系统评价和Meta分析仍然俯拾皆是。究其原因,很大程度上源于作者对PRISMA声明的理解不够深入。

为了加深临床医生和研究人员对PRISMA声明的理解,从而进一步提升系统评价和Meta分析类论文的报告质量,AME出版社广邀国内多位在该领域颇具造诣的中青年专家共同编写《系统评价与Meta分析论文撰写规范PRISMA解读》一书。有别于官方发布的释义文件,本书对声明的解读多是基于经典的案例,同时辅以个人的心得体会,力争以读者喜闻乐见、通俗易懂的方式呈现。

在本书正式出版发售之际,AME科研时间特推送图书内容以飨读者。今天分享的是“常用效应指标”。


第八章 效应指标的选择与统计学分析


第一节 常用效应指标


PRISMA声明中,对于系统评价效应指标部分的写作,只涉及一个条 目,即条目12:为每个结果指定用于综合或呈现结果的效应指标(如风险比、平均差异)。


Meta分析得出的证据需要通过一定的效应指标来表示,但是目前很多发表的Meta分析在选择效应指标时存在很多误用或者错误的解释。正确地选择和使用效应指标对于理解和解释统计出的结果至关重要。


一、常用效应指标简介[1]


常用效应指标包括分类变量的优势比(OR)、相对风险(RR)和危险差(RD),以及结局为连续性变量时的加权均数差(WMD)和标准化均数差(SMD)。


相对风险(RR)的英文全称可为rate ratio,risk ratio或relative risk,其是反映暴露与疾病关联强度最有用的指标。RR仅可以用于随机对照试验和队列研究中。在随机对照试验中,RR=1,表示两组结局事件的发生率无差异;RR<1,表示试验组发生率较低;RR>1,表示试验组发生率较高。在队列研究中,RR值越大,表示暴露与结局关联强度越大,暴露的效应越大。


优势比(OR)也称比值比,英文全称为odds ratio,是测量疾病与暴露联系强度的一个重要指标。OR主要用于病例−对照研究,而不推荐用于队列研究和随机对照试验,这主要是因为病例−对照研究是“由果索因”的回顾性研究,根据结局(是否发生疾病)对患者进行分组,无法计算疾病在人群中的发病率,因此不能直接计算RR。OR=1,表示疾病组与对照组在暴露因素的比例上无差异;OR<1,表示暴露因素在疾病组发生率较低,是疾病的保护因素;OR>1,表示暴露因素在疾病组发生率较高,是疾病的危险因素。


危险差(RD)英文全称为risk difference,也被称为归因危险度(attributable risk, AR)、绝对危险差(absolute risk difference,ARD)和绝对危险降低率(absolute risk reduction,ARR),是指试验组与对照组事件率的差值,即RD是率的差。RD仅可以用于随机对照试验和队列研究中。RD=0,表示试验组(暴露组)事件发生率无差异;RD<0,表示试验组事件发生率较低;RD>0,表示试验组发生率较高。


加权均数差(WMD)英文全称是weighted mean difference,用于Meta分析中所有可比性的连续性结局变量(如体重)的合并,反映试验组(暴露组)均值与对照组均值的差值。MD可用于各个研究类型中。MD=0,表示两组无差异;MD<0,表示试验组的均数较小;MD>0,表示试验组均数较大。在临床研究中,部分变量是具有“可比性”的,比如体重、血糖等,全世界都是采用可以溯源的系统进行检测的,不同实验室、仪器之间的结果具有可比性。此时应采用WMD进行合并。但某些指标的检测,完全没有“溯源性”可言,比如血清IL−2的检测,来自不同厂家的试剂盒之间采用的方法、原理、反应条件、单位、检测抗体等可能不同,结果完全不具备可比性,此时就应该是标准化均数差进行合并了。标准化均数差(SMD)为两组估计均数差值除以平均标准差而得,消除“单位”或“检测方法”的影响,可以简单将其理解为将连续变量进行“标准化”或“归一化”的过程。SMD可用于各类型研究中,其解读与SMD相同。


不同效应量的区别见表8−1。

二、Meta分析中效应尺度指标的选择


Meta分析中没有一个效应尺度指标可以应用于所有情形的最佳合并统计量。选择合并统计量时,常常需要综合考虑各种因素。


(一)连续性变量合并统计量的选择


对于相同干预措施效应的测量方法或单位完全相同时,推荐选择WMD。对于相同干预措施效应采用不同的测量方法或单位,或者不同研究间均数差异过大时,宜选择SMD作为合并统计量。对于差异大小需要结合临床实际进行综合评估。


(二)二分类变量合并统计量的选择


根据OR、RR和RD的各种特征,对于随机对照试验的Meta分析,效应指标推荐首选RR。当结局事件发生率极低时(事件发生率低于10%[2]),RR和OR具有较好的一致性,两个指标均可采用。对于某些发生率较低的结局事件,如并发症或不良反应,推荐使用OR值进行合并。随着结局事件发生率的不断升高,OR夸大效应的现象越来越明显,可能伴有结局性质的不一致。根据纳入文献的质量选择合适的效应指标。当研究质量较低可能导致较大的结论偏倚时,推荐RR,以尽量减少假阳性。


三、如何撰写效应指标


示例1 [3]


小肝细胞癌患者的立体定向全身放射治疗与射频消融:一项系统综述和荟萃分析。


Statistical analysis We analyzed the patients who received SBRT or RFA after PSM. We calculated event rates of the outcome (the proportion of patients who developed relevant outcomes) from the included cohorts for those two therapies. We pooled log-transformed event rates and assessed heterogeneity using the Mantel-Haenszel test (16,23). A statistical test with a P < 0.05 was considered significant. To account for the potential effect of publication bias, the methodological quality of literature was assessed by the risk of bias table from Cochrane Collaboration. To measure overall heterogeneity across the included cohorts, we calculated the I2 statistic, with I2 > 50% indicating high heterogeneity. We performed the statistical analyses in RevMan 5.3 software (RevMan Web, Cochrane Collaboration, USA).


该文的统计方法部分并未交代选择什么样的效应指标,因此本文在书写方面存在一定缺陷。这也是很多Meta写作中常见的问题。很多Meta分析统计分析部分只有简单几句话,很多重要问题并没有描述清楚。根据结果的图标,我们了解到该研究选择的是OR作为效应指标。根据二分类变量合并统计量的选择原则,本文的事件数较多,选择OR作为效应指标有夸大效应的倾向。


示例2[4]


肝移植术后复发性乙型肝炎病毒感染预防方案的网络Meta分析。


Statistical analysis First, we conducted pair-wise meta-analyses with a random-effects model to synthesize studies comparing the same pair of treatments. The results were reported as pooled risk ratio (RR) with the corresponding 95% confidence interval (CI). Statistical heterogeneity across studies was assessed with a forest plot and the inconsistency statistic (I2). Statistical significance was regarded as P < 0.05. All calculations were performed using REVIEW MANAGER (version 5.0 for Windows; the Cochrane Collaboration, Oxford, UK).


Second, we built a random-effects network within a Bayesian framework using Markov chain Monte Carlo methods in ADDIS 1.15 (Drugis.org) (16). We networked the translated binary outcomes of HBV recurrence rates within studies and specified the relations among the RRs across studies making different comparisons as previously reported (17), with which, direct and indirect evidences for any given pair of treatments were combined. We used P < 0.05 and 95%CI beyond the null value to assess significance.


We also estimated the probability of each treatment being as the best regimen, the second best, the third best and so on, by calculating the RR of each treatment group compared with arbitrary common controls, and counting the proportion of iterations of the Markov chain of the RR ranking in treatments. We ranked treatments in terms of the risk of HBV recurrence with the same methods.


A variance calculation and a node-splitting analysis provided by the software ADDIS 1.15 were applied to evaluate the inconsistency within the network meta-analysis. Significant inconsistency existed if the difference between random effects variance and inconsistency variance was large or a P < 0.05 of disagreement between direct and indirect evidences was met. We would adjust the study included and ultimately obtain an ideal network with consistency according to quantitative estimation.


该文的统计部分写得比较好。作者描述了首先进行两两对比的Meta分析,使用RR作为效应指标。这部分写作难度不大,只要求简洁明了,明确所使用的效应指标。


示例3[5]


机器人和腹腔镜下阴道−骶骨固定术治疗盆腔器官脱垂:一项系统综述和Meta分析。


Statistical analysis Statistical analysis was performed with Cochrane Review software [Review Manager (RevMan) version 5.3 for Windows] and Stata 12 (version 12.0, StataCorp, College Station, TX, USA). Weighted mean difference (WMD) was used for continuous variable data, and the odds ratio (OR) was calculated for dichotomous variables. Both WMD and OR were expressed by 95% confidence interval (95%CI). The heterogeneity was presented by using I2 values. If P > 0.1, I2 ≤ 50%, it was considered that there was no obvious heterogeneity among the included studies, and the fixed effect model was used to calculate the combined statistics. If it was considered that there was heterogeneity (P  0.1, I2 > 50%), the random effect model was used to calculate the combined statistics. A significant statistical difference was considered if P < 0.05. Mean, median, and the ratio was performed for the single-arm studies to act as simple descriptive analysis parameters.


本文选择了WMD和OR分别作为连续性变量和二分类变量的效应指标。效应指标表述明确。


四、总结


这部分写作不是难点,只需要在统计学分析部分用一句话直截了当地说明合并的效应量即可,但选择什么样的效应指标需要作者仔细斟酌。在撰写此部分时可参考一些比较规范的文章,常用的表达方式为:The results were reported as pooled RR/OR/RD/SMD/WMD等。


(魏飞龙)


参考文献

[1] 文进,李幼平. Meta分析中效应尺度指标的选择[J]. 中国循证医学杂志,2007,7(8):606-613.

[2] Cummings P. The relative merits of risk ratios and odds ratios[J]. Arch Pediatr Adolesc Med, 2009,163(5):438-445.

[3] Hong J,Cao L,Xie H,et al. Stereotactic body radiation therapy versus radiofrequency ablation in patients with small hepatocellular carcinoma:a systematic review and meta-analysis[J]. Hepatobiliary Surg Nutr,2021,10(5):623-630.

[4] Zhang Y,Kang S,Fang W,et al. Network meta-analysis on prophylactic regimens against recurrent hepatitis B virus infection after liver transplantation[J]. Hepatobiliary Surg Nutr, 2013,2(6):297-303.

[5] Yang J,He Y,Zhang X,et al. Robotic and laparoscopic sacrocolpopexy for pelvic organ prolapse:a systematic review and meta-analysis[J]. Ann Transl Med,2021,9(6):449.


更多精彩解析,可移步购买纸质书查阅&扫描下方二维码,阅读电子书!








资讯





AME旗下19本期刊最新影响因子|2024年6月
责任编辑:李欣燃  AME Publishing Company
排版编辑:陈   童  AME Publishing Company

b.02.2024.08.13.02

点击
阅读原文

了解AME

AME科研时间
欲穷千里目,快乐搞学术。
 最新文章