在临床研究领域,开展一项高质量的临床研究至关重要。国内已经有很多课题组都开展了很不错的临床研究,也构建了很完善的数据。但是,不少数据库发了1-2篇文章之后便被搁置起来了,然后课题组另起炉灶,再搞一个研究,这其实是一个巨大的浪费。那么,已经发表文章的研究数据库如何再进行“二次利用”呢?今天,我们就和大家分享一个成功案例:PRIDE研究,这个研究的主文章JACC发表之后,研究团队对这项研究的599例患者的数据进行二次挖掘,最终解锁了28篇SCI论文(不完全统计),真正实现了把一个数据库压榨到了极致。▋PRIDE研究简介PRIDE研究由麻省总医院心脏科发起,研究目的是探讨NT-proBNP在呼吸困难人群中诊断心力衰竭的价值。研究者在 2003 年 5~9 月招募了599例因呼吸困难而就诊于急诊科的患者,包括209例心力衰竭患者和390例非心力衰竭患者。2005年,PRIDE研究在JACC上发表了一篇文章:对于大多数人而言,在发表了主论文之后,就可以开香槟,然后开启新的研究了。而PRIDE研究团队则继续利用这599例患者的数据进行二次研究,陆续发表了20多篇高水平的论文,比如次年在欧洲心脏病杂志,发表了一篇关于超声心动图的substudy(亚研究)。我们从pubmed.pro文献库中以“ ProBNP Investigation of Dyspnea in the Emergency Department”为关键词,检索到了20余篇相关论文(不排除有遗漏),感兴趣的小伙伴可以扫描下方二维码一键获取原文。▋一项研究如何产出这么多?相信大家也发现问题的关键了,为什么同样一个研究数据库,在这个团队可以产出这么多篇文章,在其他团队则不行呢?这个问题没有标准答案,我们只能管中窥豹,猜测一二。我们总结的原因有以下几点:1.完善的顶层设计一项研究能做出这么多的文章,没有完善的顶层设计是不可能的。本研究虽然例数不多,但是收集了血液和标本,这些标本才是后期发表多篇文章的关键,当我们想去验证A和B的关系的时候,就可以使用冻存的标本进行二次验证和分析。2.高质量的数据库建设研究团队在后续几年内能高效的产出SCI,和数据库质量也密不可分。数据是文章的原材料,如果没有高质量的数据收集和管理。课题组是不可能完成后续的“二次研究”的。3.以数据挖掘为导向的统计分析 我们不难发现,本研究后续的20篇文章基本上都是围绕NT-proBNP和各种指标/症状的关系,比如心衰、预后、BMI等等。这些关系没办法提前预判,只能是通过后期的数据挖掘慢慢发现,然后再次验证。因此,通过对数据库数据的二次挖掘,可以让我们发现“潜在阳性结果”,然后通过统计分析进行验证,就是一个很好的科研发现。这些因素共同作用,使得PRIDE研究在完成初步目标后,仍能持续产出有影响力的科研成果。对于未来的临床研究,PRIDE研究提供了一个值得借鉴的范例。▋我们如何学习PRIDE研究?通过了解PRIDE的前因后果,我们可以从中获得的经验是:在研究之初,要做好顶层设计,而建设一个高品质的数据库则是整个研究的基础。顶层设计需要PI的经验和阅历,这个只能逐步学习。而构建一个高品质的数据库,则是我们最容易学习和执行的。那么有没有上手简单、功能强大的工具可以帮我们建好一个高品质的数据库呢呢?今天也借这个机会向大家推荐一款工具:易侕EDC系统。易侕EDC临床科研数据库包含以下功能: