真实世界大数据研究:传统与新锐之辩
——唐金陵教授在第九届全国流行病学学术会议上的演讲PPT
在过去一百多年里,流行病学发展了一整套在人群中进行医学研究的理论、原则和方法。其重要理论基础是因果关系,其核心原则是控制偏倚和误差。流行病学这个传统学科在人类认识和防控传染病上曾做出过巨大贡献,在认识和防控慢性病上也正在显示着巨大潜力。
21世纪,得益于计算机的普及,医学在实践中产生和累积了大量的数据,利用这些数据展开的研究通常被称作真实世界研究(real world study, RWS),一个新锐的研究理念由此被隆重推出。RWS宣称具有样本量大、可代表总体、可反映真实世界等诸多优势,而且RWS还认为只需关注相关,无需纠结因果,暗示流行病学的设计理念以及控制误差的措施是多余的。RWS对传统的流行病学提出了挑战。
传统流行病学方法和真实世界大数据方法谁优谁劣?判断研究方法的优劣,需要的是理论上的论证,而不是经验的证明,更不是武断的否定。因此,欲建立新方法,就必须对老方法进行理论上的驳斥和否证。这是解决这个重要科学争议唯一可靠的方法。然而,RWS宣称的相对传统流行病学的优势并没有经过严谨的科学论证。而且,RWS挑战RCT,本质上是观察性研究对实验性研究的挑战,二者孰优孰劣,早有争论,而且也早有定论。
进一步讲,因果关系以及在其基础上建立起来的时间顺序、对照、可比、准确测量等流行病学原则,也是生物医学实验室研究的一般准则,否定它们谈何容易。如果不能从理论上否定它们,那么RWS宣称的诸多优势就不复存在了,RWS就必须遵循一百多年来发展起来的流行病学研究的一般理论和原则。
从流行病学的角度看,RWS属于观察性研究,在产生假设和研究罕见病及交互作用时有特殊的价值。RWS的真正优势是变量多,因此可研究的问题多,且方便、快捷、节省资源。但RWS也存在明显的缺点:设计框架不明,抽样框架模糊,变量信息不准、不全、不一致,混杂因素可能缺失、误导的稀释的结果,因此研究结果偏倚多、真实性低,做RWS时应特别注意。
讲者介绍
唐金陵,北京医学院(现北京大学医学部)预防医学本科、英国UCL大学流行病学博士、牛津大学博士后。现任深圳理工大学长江讲席学者教授、计算生物与医疗大数据系主任。香港中文大流行病学荣休教授,曾任公共卫生及基层医疗学院副院长、署理院长、流行病学系主任。英国医学杂志高级临床研究编辑,2003年教育部长江学者、北京大学特聘教授,北京大学循证医学中心主任。在高影响医学杂志(IF>40)发表论文逾40篇,培养硕士、博士逾百名。