异质性探索 |《系统评价与Meta分析论文撰写规范PRISMA解读》新书抢先看

学术   健康   2024-08-20 16:36   北京  


编者按:虽然受到了一些质疑,但是循证医学仍然是现代医学不可动摇的基石。根据循证医学的理论,系统评价和Meta分析具有极高的证据等级,因此对临床决策的影响也极大。纵观各个权威学会制定的疾病诊疗指南,无不把系统评价和Meta分析的结论置于显著位置。规范化撰写系统评价和Meta分析类论文,以增强论文的临床影响力和穿透力,是每个从事系统评价和Meta分析的临床医生、研究人员不得不面对的问题。但是,系统评价和Meta分析的撰写情况却令人堪忧。尽管很多期刊编辑部和审稿人不遗余力推广系统评价和Meta分析的报告规范PRISMA声明,报告质量低下的系统评价和Meta分析仍然俯拾皆是。究其原因,很大程度上源于作者对PRISMA声明的理解不够深入。

为了加深临床医生和研究人员对PRISMA声明的理解,从而进一步提升系统评价和Meta分析类论文的报告质量,AME出版社广邀国内多位在该领域颇具造诣的中青年专家共同编写《系统评价与Meta分析论文撰写规范PRISMA解读》一书。有别于官方发布的释义文件,本书对声明的解读多是基于经典的案例,同时辅以个人的心得体会,力争以读者喜闻乐见、通俗易懂的方式呈现。

在本书正式出版发售之际,AME科研时间特推送图书内容以飨读者。今天分享的是“异质性探索 ”。



第三节 异质性探索

一、条目阐释


PRISMA声明中,仅有一个条目涉及了系统评价异质性(heterogeneity)分析(条目13e):描述为评价Meta分析中不同研究间的异质性所开展的分析。条目13e是整个PRISMA声明中数据合成部分的第一个条目,与其他数据的预处理和合成有关的条目相比,条目13e关注的是数据合成后对结果的解释。


二、异质性介绍


(一)异质性探索的目的


在开展Meta分析的过程中,纳入的各个研究之间不可避免地存在变异。我们将Meta分析中不同研究间的变异称之为异质性。这些变异主要表现为研究对象、研究设计、干预措施、结果测量上的差异。Cochrane协作网对异质性的定义包括两个层面:①广义上描述受试者、干预措施和一系列研究间的测量结果的差异和多样性,或那些研究中内在真实性的变异;②专指统计学异质性,用来描述多个研究间效应量的变异程度,也用于表示研究间存在的、不能用随机误差来解释的差异。通常情况下,人们所讨论的异质性指后者,即统计学异质性。


异质性总体包括临床异质性、方法学异质性及统计学异质性。临床异质性是指受试者、干预措施的差异及研究的终点指标不同所导致的变异。方法学异质性是指由于试验设计和质量方面的不同引起的差异,包括试验过程中对结局的定义、测量方法,数据收集方式(前瞻性设计还是回顾性设计)等。统计学异质性是指不同试验间被估计的治疗效应的变异。统计学异质性的计算是基于数据和一定的统计学方法,一般由统计软件计算得出[1]。各研究效应量的置信区间的重合程度越大,存在统计学异质性的可能性越小;反之,置信区间重合程度越小,各研究之间存在统计学异质性的可能性越大。


高质量Meta分析位于证据金字塔的顶层,对临床决策和卫生政策的影响不容忽视。质量较高的Meta分析往往纳入较多的原始研究,这些研究之间难免存在异质性。由于异质性的大小在很大程度上可以影响结果的可信度,因此,准确识别异质性并对其来源进行分析和讨论,是确保Meta分析结果可信的一个重要环节。


(二)统计学原理


分析异质性来源的前提是准确地评估异质性的大小或程度,即异质性检验[2]。异质性检验的统计学方法包括统计量法和图示法两种。


1. 统计量法


(1)Q检验


Q检验是异质性检验的常用统计方法,可以回答各个研究间效应量的分布是否具有同质性这一关键问题。如果各个研究间效应量的分布是同质的,则每个原始研究的样本都可以视为“来自同一总体的随机抽样样本”,因此,效应量间的变异就不应该大于抽样误差引起的变异。如果Q检验的结果显示研究间存在明显的异质性,即表明各研究效应量间的变异并不能完全由抽样误差引起,可能还来源于研究质量、干预措施、测量方法、研究对象等非随机抽样因素。


需要注意的是,Q检验对于纳入研究的数量较为敏感,其值可随着自由度(纳入研究的数量−1)的增加而增加。当纳入研究的样本量较小或纳入Meta分析的研究数目较少时,Q检验的效能较低,不能准确地探测出研究之间存在的差异。此时,若Q检验的结果具有统计学意义(P<0.05),可提示纳入研究的效应量之间存在异质性;但若Q检验不具有统计学意义(P>0.05),也不能排除纳入研究的效应量之间无异质性。


(2)I2检验


I2检验统计量用于描述非抽样误差因素引起的变异占总变异的百分比。I2检验克服了Q统计量对纳入研究个数的依赖,可以更好地反映多个研究结果间异质性程度大小。其计算公式为I2=100%×(Q−df)/Q,其中Q为Cochrane ’s Q异质性统计量;df为自由度。由于I2为负值时都取0,所以I2的取值为0~100%,I2值越大则异质性越大[3]。当I2=0时,表明研究之间无异质性。Cochrane手册中依照I2值大小将异质性分为4个等级:I2为0~40%,表明研究之间存在轻度异质性;I2为30%~60%,表明研究之间存在中度异质性;I2为50%~75%,表明研究之间存在较大异质性;I2为75%~100%,表明研究之间存在很大的异质性。在Cochrane系统评价中,I2>50%需要用随机效应模型,反之则用固定效应模型。


(3)H检验


H检验的本质是通过自由度对统计量Q进行校正,因此也在一定程度上克服了纳入研究数量对异质性的影响。一般情况下,若H>1.5提示研究间存在异质性;H<1.2则提示各研究同质;当H值介于1.2和1.5之间时,若H值的95%置信区间包含1,则说明在0.05的检验水准下无法确定研究之间是否存在异质性;若H值的95%置信区间未包含1,则可认为研究之间存在异质性。


2.图示法


图示法是通过视觉观察对异质性进行判断,所采用的图片包括森林图(forest plot)、星状图(radial plot)、拉贝图(L ’ Abbe plot)、加尔布雷斯图(galbraith plot)等。图示法的评判受主观因素影响较大,限制了其实际的应用价值,因此,大多数Meta分析对异质性的评判主要基于统计量法。


(三)异质性的处理


为确保Meta分析结果的准确性和研究深度,系统评价员需要在识别出异质性后对异质性的来源进行探讨。若纳入研究之间存在异质性,系统评价员可按照以下方法探讨异质性的来源。


1.亚组分析


顾名思义,亚组分析就是按照一定的特征(如年龄、性别、病情严重程度、设计方案、治疗或随访时间等)对研究进行归类,并对每种类别的研究(亚组)单独进行Meta分析。若亚组分析时每组得到的异质性参数(I2、H值和Q值)降低,则提示亚组分析的变量(划分亚组的依据)就是异质性的来源之一。


2.Meta回归


Meta回归是通过建立回归方程,同时研究一个或多个解释变量与结果变量之间的关系。在Meta回归中,每个原始研究都可以视为一个独立的“样本”,这些研究具备的特征(受试者国别、研究方案、测量方法、随访时间等)就是潜在的异质性解释变量。Meta回归的本质就是采用多参数回归模型探讨这些解释变量与合并效应的关系。倘若某一变量与结局变量独立相关(P<0.05),则证明该变量是异质性的潜在来源之一。需要指出的是,Meta回归实用的前提是纳入分析的研究数量在10个及以上。


3.敏感性分析


敏感性分析主要用于分析单个或多个研究对Meta分析结果的影响程度。详细内容请参阅下一节。


4.随机效应模型


Meta分析合并效应量的方法包括固定效应模型和随机效应模型。当异质性来源不能用临床异质性和方法学异质性来解释时,应用随机效应模型合并效应量。随机效应模型以研究内方差与研究间方差之和的倒数作为权重,调整的结果是样本量较大的研究给予较小的权重,而样本量较小的研究则给予较大的权重,这样可以部分消除异质性对合并效应量的影响。


三、示例[4]


此处选用的示例文章是一篇发表在ACS上的文献。这是一篇比较机器人手术与传统二尖瓣手术治疗退行性二尖瓣疾病的系统评价和Meta分析。文章的方法、结果以及讨论部分对异质性大小的评估以及潜在来源进行了较为详细的描述,我们在撰写论文时可以借鉴文中的一些经典的写作模式。


“The relative risk was used as a summary statistic and the random effects model was tested , as it was assumed there were variations between studies and the calculated ratios had a more conservative value. χ2 tests were used to study heterogeneity between trials. I2 statistic was used to estimate the percentage of total variation across studies , due to heterogeneity rather than chance. An I2 value of greater than 50% was considered substantial heterogeneity. If there was substantial heterogeneity , the possible clinical and methodological reasons for this were explored qualitatively.”


这是文章方法学部分中对异质性评估和来源分析的描述。作者首先说明了需要合并的效应量以及合并效应量时所运用的统计学方法(随机效应模型)。随机效应模型对效应量的分布形式没有具体要求,但结果较为保守,得出的结果置信区间较宽,在Meta分析中的应用较为广泛。随后,作者说明了异质性检验的方法(卡方检验)以及反映异质性大小的指标(I2),同时还说明了判断异质性等级判断的依据(I2>50%就认为是存在巨大的异质性)。最后说明如果存在较大的异质性,作者会如何考虑异质性的来源。美中不足的一点是未说明所采用的软件。此外,笔者认为,Cochrane Q检验和I2检验在统计方法学上可以互补,能较好地反映多个研究结果间异质性大小。因此,作者其实可以同时使用这两种检验方法来评价纳入队列研究的异质性。


“Meta-analysis identified a significantly longer duration of cross-clamp time [standardized mean difference ( SMD ), 2.05 ; 95% CI , 1.23-2.87 ; P < 0.00001 ; I2 = 94%] and cardiopulmonary bypass time ( SMD , 3.03 ; 95% CI , 0.84-5.23 ; P = 0.007 ; I2 = 98% ) for patients who underwent robotic surgery vs. conventional approach. These results are presented in Figures 5 , 6 , respectively. The lengths of hospitalization ( SMD , –1.07 ; 95% CI ,–2.83-0.70 ; P = 0.24 ; I2 = 96% ) and ICU stay ( SMD , –1.58 ; 95% CI , –3.45-0.29 ; P = 0.10 ; I2 = 97% ) were not significantly different between the two approaches.”


以上是文章结果部分中对异质性的描述,由于异质性与合并效应量之间是一一对应关系(即每次数据合并都会产生一个异质性),所以多数Meta分析的作者都同时交代合并的效应量以及对应的异质性大小(I2)以及检验结果(P值)。从中我们可以看出,大部分合并结果的异质性较为显著。Meta分析中的异质性无处不在,这主要是因为异质性的来源甚为广泛,读者在撰写时只需要如实报告异质性的大小即可。这篇文章美中不足的一点是,只说明了异质性的大小(I2),未说明统计学检验结果(P值)。


“Finally , significant heterogeneity was detected for the analysis of stroke and secondary outcomes such as cross-clamp time , cardiopulmonary bypass duration and length of hospitalization. This may reflect the limited number of studies and different surgical techniques and clinical practices , respectively.”


“In conclusion , the present meta-analysis identified a statistical survival benefit for robotic mitral valve surgery vs. the conventional sternotomy approach. However , this was largely a reflection of the heterogenous patient cohort between the two treatment arms within the identified retrospective studies. Without randomization and adequate patient matching , the existing evidence for robotic surgery is not robust , and limited conclusions can be drawn from the current literature.”


这是文章的讨论部分关于异质性的描述。讨论部分的篇幅虽然不长,但作者也对研究中潜在异质性的来源进行了分析。作者认为组间的异质性可能与有限的研究数量、不同的手术方案和手术医生的个人技术有关。由此可见,作者在写作过程中要做的就是尽可能分析异质性的来源并进行讨论。


需要说明的是,临床异质性、方法学异质性和统计学异质性三者是相互关联而又独立的。临床或方法学上存在异质性,并不意味着统计学上会表现出异质性,反之亦然。此外,若方法学上存在异质性,往往提示部分研究可能存在一定程度的偏倚。


四、撰写策略


PRISMA 2020版对异质性描述涉及方法、结果、讨论的写作部分。方法部分的撰写要点:首先描述用于结果合成的方法,并说明选择相应方法的理由。如果进行了Meta分析,应描述用于探索统计学异质性的模型、指标、方法及软件包。此外,还需要描述探索异质性来源的方法(如亚组分析、Meta回归分析等)。


结果部分的撰写要点:首先需要呈现每个效应量的合并值、精度(如可信区间)等,紧接着介绍每个合并效应量对应的异质性大小,以及统计检验结果(P值)。其次,如果采用统计学方法探讨了异质性来源,需要通过表格或图片来展示潜在的异质性来源。


讨论部分的撰写要点:分析研究异质性对合并效应量的影响,对已经明确的异质性的来源进行解释和分析。在文章“局限性”部分说明在异质性探讨方面的不足,并且指出将来的研究方向。


总之,作者在撰写Meta分析论文时,应严格按照PRISMA 2020版的要求交代异质性相关的内容。特别需要注意的是,方法部分和结果部分是一一对应的。在方法部分,作者应对异质性的可能来源进行罗列,便于后续的异质性来源分析。在结果部分应首先将所有合并结果全部展现出来,然后再重点分析其中的阳性结果或比较感兴趣的阴性结果,同时再清晰地说明在合并每个效应量时存在的异质性。如果正文对图表数量的限制较为严格,可以将亚组分析、Meta回归和敏感性分析的具体方法以及结果放在补充材料中。在讨论部分也建议将有临床意义的一些亚组分析和Meta回归分析的结果单独拿出来讨论,以延伸文章的结论。


(李晓科,王斌)

参考文献

[1] 张天嵩,钟文昭,张素,等. Stata在Meta分析时异质性评价中的应用[J]. 循证医学, 2008,8(4):231-234.

[2] 何寒青,陈坤. Meta分析中的异质性检验方法[J]. 中国卫生统计,2006,23(6):486-487.

[3] 王丹,翟俊霞,牟振云,等. Meta分析中的异质性及其处理方法[J]. 中国循证医学杂 志,2009,9(10):1115-1118.

[4] Cao C,Wolfenden H,Liou K,et al. A meta-analysis of robotic vs. conventional mitral valve surgery[J]. Ann Cardiothorac Surg,2015,4(4):305-314.

更多精彩解析,可移步购买纸质书查阅&扫描下方二维码,阅读电子书!








资讯





AME旗下19本期刊最新影响因子|2024年6月
责任编辑:李欣燃  AME Publishing Company
排版编辑:陈   童  AME Publishing Company

b.02.2024.08.20.02

点击
阅读原文

了解AME

AME科研时间
欲穷千里目,快乐搞学术。
 最新文章