小贴士
临床研究疗效评价的结局指标选择是一个很重要的科学问题。通常,由于终点结局指标(例如死亡、残疾、功能丧失、某种重要临床事件的发生)的随访周期长,花费大,很多临床医生和研究者倾向于采用实验室或影像学检查结果等生物学指标或症状、功能评分等来代替,进行疗效评价。在循证医学中,这类指标被称为替代指标或中间指标,一般只作为次要结局指标。主要结局指标倡导采用终点结局指标,只有随访时间足够长,才有可能观察到终点结局事件。在随机对照试验的偏倚风险评价标准中,随访时间是否充分和完整也是重要的考量因素之一。因此,这就容易让人产生“临床研究的随访时间越长,研究越高质量、越可靠”的误区。
笔者以前对这个问题也没有过多关注和较深的认识。直到最近看了柳叶刀发表的中药复方中风醒脑液治疗脑出血的随机对照试验,才发现这个问题值得研究者的高度重视。该研究是国际顶刊柳叶刀创刊以来发表的第一篇中药临床试验,加之又是阴性结果,因此引发了很广泛的关注(羽衣草医学笔记公众号也第一时间发布解读文章:意难平!首个登上《柳叶刀》的中药多中心临床试验,未得到阳性结果,原因可能是?)。然而,仔细阅读原文和附件所报告的数据可以发现,结果并不是中药与安慰剂效果无差异那么简单,而是:在65岁及以上的老年人中,在治疗第28天时,中药对终点结局指标的疗效,是显著优于安慰剂的(差异有统计学意义)。我们看原文附录文件(Supplementary appendix)第89页的截图:
结果显示:在65岁及以上的老年亚组中,中风醒脑液组第28天的死亡或残疾率(mRS 4-6)为193/354(54.5%),安慰剂组为206/325(63.4%)。这两组数据有差异吗?我用统计软件算了一下,结果如下:
结果有统计学意义,P=0.019。中药治疗组第28天的死亡或残疾率比安慰剂组低8.9%。这说明:中药中风醒脑液在脑出血急性期的应用,加快了65岁及以上老年患者的康复,延长了生存时间。因为该研究是在西医常规干预基础上所开展的,以安慰剂组为基准,说明西医常规治疗老年人脑出血,在第28天的死亡或残疾率(mRS 4-6)为63.4%,在加载了中风醒脑液后,这一数值降到了54.5%,这意味着:中药的应用,在现代医学现有医疗技术水平的基础上,提高了14.0%(1-54.5%/63.4%)的疗效。在当前现代医学治疗脑出血缺乏突破的情况下,这14%的疗效提高,难道不是一个令人鼓舞的成就吗?
但死亡或残疾率(mRS 4-6)指标在第90天测量时,却未呈现出明显效果。我接着把两组数据做卡方检验,p值为0.313(图略)。中药组和安慰剂组此时已经没有统计学差异了。两个不同的测量时点,结果相反,一正一负,这该如何解读呢?
让我们以常见的感冒治疗场景来类比吧。当我们评价一种感冒药(西药或中药均可)的效果,与安慰剂对比。如果我们把测量时点定在用药后第3天,比较两组感冒症状积分的大小,只要这个感冒药真能管用,第3天跟安慰剂相比,两组疗效数据肯定是有差异的。但如果我们把测量时点定在第7天,不管这个感冒药有没有用,跟安慰剂比,到第7天很有可能都没有差异了,因为按照感冒自然病程,即使不治疗一般7天也就好了。那我们显然不能依据第7天的数据就说该感冒药没有效果。
以上说明,结局指标的测量时点直接决定了研究结果的解释方向。对结局指标的随访时间,并不是越长越好。随着随访观察时间的不断延长,干预措施最初产生的显著影响,会逐渐被时间这一因素所稀释。时间在疾病的发生发展转归中,扮演着不可忽视的角色,恰如人们常说的“时间是最好的良药”,它深刻反映了生命和疾病最终的自然进展结局。
回到柳叶刀这个中药研究,中药中风醒脑液从患者脑出血发病48小时内开始用,总共连续用了28天,后面就停药了。再过2个月后去测量主要结局指标。在这两个月里,病情的进展预后,主要是由时间(患者的整体健康状况、病情本身严重程度决定了病情的走向和时间)、后续的治疗来决定。两个月前的中风醒脑液治疗,其效果早就被时间和患者当下所接受的干预措施所稀释了。
写到这里,我想读者可能有以下两个疑问:
一是,就柳叶刀这个研究本身来说,如果干预措施继续用,甚至用到第90天,那会和安慰剂有差异吗?
我认为答案是否定的。羽衣草在前一篇公众号文章里就提到,这个研究没有中医辨证,而中风醒脑液是针对气虚血瘀型脑出血的。这就解释了为什么65岁以上老年人能有一定效果(因为老年人病情多气虚,所以对症),而其他年龄段人群没那么对症,就算延长干预时间也不会有效。而且,脑出血的病情本来就是变化的,中医治疗需要辨证论治动态调整,即便是针对气虚型的患者,在急性期过后,痰、热、阴虚、胃气不足等因素也会逐渐凸显,有时甚至成为主要矛盾,只针对气虚血瘀,其他重要病机不处理,结局肯定是难以改善的(可参考文末笔者治疗的两个脑出血案例)。
二是,照前文的说法,中药就没有远期效应、不能用终点结局来评价疗效吗?
自然不是的。干预措施的远期效应,是因病而异的。干预措施停用后,远期效果如何,主要取决于这3个因素:一是要看原干预措施是否有足够的效力,二是看疾病本身的自然史特征和患者的自身状态,三是看后期有无其他的干预。时间越长,原干预措施的影响最小,而后两者的影响越大。因此,评价一个药物的远期效应,无论该药物是中药还是西药,用安慰剂来对照显然都是不合适、不公平的,这只能用阳性药物来对照,而且要在符合伦理的情况下尽量减少其他人为干预措施的应用。
柳叶刀这个案例给了我们深刻的启发:临床研究选择恰当的结局测量时点,是一项重要的决策。测量时点设置得过晚,药物的直接治疗效果可能已被其他多种因素所掩盖,从而导致真正有效的药物被错误地判定为无效。研究设计要充分综合考虑疾病本身的病理生理特征、所研究药物的具体作用机制和预期治疗效果的大致持续时间等多方面因素,以此来确定最合适的结局测量时点,才能够准确、客观地评估干预措施的疗效。
来源:羽衣草医学笔记