基于医院HIS/LIS开展临床研究的关键环节和要点

文摘   2024-11-18 12:06   上海  

作者简介:王瑞平,博士,主任医师、副教授,研究生导师。研究方向:临床流行病学、生物统计学在临床研究中的应用

通信作者:李斌,博士,主任医师、教授,博士生导师。研究方向:中医药防治皮肤病的基础和临床研究

引文格式:王瑞平, 李斌. 基于医院HIS/LIS开展临床研究的关键环节和要点[J]. 上海医药, 2024, 45(9): 19-22; 36.

摘  要  近年来,真实世界研究作为重要的临床研究类型逐渐引起广大医务人员的关注。医院健康信息系统(health information system, HIS)/实验室信息系统(laboratory information system, LIS)中储存着海量的患者真实诊疗数据信息记录,因此如何基于HIS/LIS中的临床诊疗和实验室检查数据开展规范的临床研究是一个热门话题。本文从真实世界研究的概念入手,重点阐述医院HIS/LIS数据的特点,以及基于其开展真实世界临床研究关键环节和注意要点,以期为临床工作者和研究人员提供参考依据。

关键词  医院健康信息系统/实验室信息系统  真实世界研究  数据架构  核心环节


真实世界研究(real world study, RWS)是运用流行病学方法,在真实无偏倚或偏倚较少的人群中,对某种或某些干预措施(包括诊断、治疗、预后)的实际情况进行临床研究。作为临床试验和药品上市后药物疗效再评价的一种医学研究新方法,RWS逐渐引起广大医务人员的关注和认可。医院的健康信息系统(health information system, HIS)和实验室信息系统(laboratory information system, LIS)中分别记录了每一位就诊患者的真实诊疗和实验室检查数据信息,是开展真实世界临床研究的重要数据来源。因此,如何基于医院的HIS/LIS开展规范的临床研究是一个热门话题。本文阐述医院HIS/LIS数据的特点,重点介绍基于其开展真实世界临床研究的关键环节和注意要点,以期为临床工作者和研究人员提供参考依据。


1 医院HIS/LIS数据特点

(上下滑动  查看更多)

医院的HIS和LIS分别记录了来院就诊患者的真实诊疗信息和实验室检查数据。近年来,随着信息技术的迅猛发展,医院HIS/LIS记录数据的结构化越来越好,数据的完整度和数据质量也得到了大幅度提升,这为开展临床研究奠定了良好的基础。医院HIS/LIS的数据具有能够反映临床诊疗客观实际、获取数据快速便捷、数据量大、开展临床研究成本低等优势,但也存在一定的局限性。其中包括:①因数据来源于真实的临床诊疗环境,数据采集以满足临床诊疗需要为主,开展临床研究时存在核心研究变量未采集或记录不完整的风险;②HIS记录了大量文本信息,如患者的临床表现、既往病史、临床诊断、治疗方案等内容;③如果医院未开展数据治理和质量控制,那么HIS/LIS数据质量一般较差,会存在非核心字段变量缺失、数据异常值等问题;④开展多中心研究时,如果各家医院的HIS/LIS数据库未进行统一的结构化处理和设置时,数据库将不能进行拼接整合,数据治理和清洗便需要花费较多的时间精力。因此,临床医务人员在应用HIS/LIS数据开展临床研究前应知晓医院HIS/LIS系统中数据的优点和可能存在的缺陷,并在此基础上进行合理应用,才能提升基于HIS/LIS数据开展临床研究的质量。


2 基于医院HIS/LIS数据开展临床研究的关键环节

(上下滑动  查看更多)

如前所述,医院HIS/LIS数据能反映临床诊疗客观实际,具有数据量大,获取数据便捷、开展研究成本低等优势;但同时也存在核心变量未采集、记录不完整、文本信息需结构化处理、数据异常值等问题。因此,临床医务工作者或研究人员基于医院HIS/LIS数据开展真实世界临床研究时需提前规划和设计,注意此类研究的关键环节,可以提升HIS/LIS数据规范,提高研究数据质量。

2.1 医院HIS/LIS的结构化治理

尽管医院HIS/LIS记录了海量的临床诊疗信息和实验室检查数据,但要将这些数据用于临床研究,须提前对HIS/LIS进行规划和设计。首先,研究团队应开展长期研究规划,明确研究病种,同时确定需采集数据的变量集和采集时间节点,变量名及对应选项的设定要遵照国际临床数据交换标准协会(Clinical Data Interchange Standards Consortium, CDISC)编码规范,以提高今后多中心研究数据库的可比性和可合并性。然后,在此基础上,将确定好的数据变量集与HIS/LIS中的变量进行比对,在医院信息部门协助下对不符合CDISC编码规范的变量进行修改;同时根据编码规范添加HIS/LIS中缺少的变量。须注意的是,研究人员不可过多地增加HIS/LIS中的变量,以防止影响临床诊疗速度,增加门诊医生的负担。最后,根据制定的变量集合,建立“文本数据”治理规则,将HIS/LIS中“文本信息”数据结构化为“数值型”数据,提高数据的可利用度。例如,对于银屑病的临床特征分型,可以建立治理规则“‘寻常型银屑病’=1;‘关节病型银屑病’=2;‘脓疱型银屑病’=3,‘红皮病型银屑病’=4”。当临床医师在HIS中给出“寻常型银屑病”文本格式诊断时,系统将依据事先制定的结构化规则,将该病例的银屑病临床分型变量设定为“1”;同理,当临床医师在HIS中给出“脓疱型银屑病”文本格式诊断时,系统将依据事先制定的数据结构化规则,将该病例的银屑病临床分型变量设定为“3”。通过上述的结构化数据治理,可以提高HIS/LIS数据架构的规范性,增强数据的可利用度,为真实世界临床研究奠定基础。

2.2 HIS/LIS诊疗数据完整度

在完成医院HIS/LIS数据结构化治理的基础上,医院应采用结构化改造后的HIS/LIS采集临床诊疗数据。为保证临床数据采集的完整度,医院应将HIS/LIS中的核心字段变量设置为“必填项”,并在医院全体医务人员中开展培训,强调数据采集的原则和要求,提高一线医生填写数据的完整度。此外,医院临床研究中心须联合信息科定期开展HIS/LIS数据完整度的质量控制工作,发现问题应及时解决,以提高医院HIS/LIS整体数据的质量和完整度。

2.3 HIS/LIS诊疗数据的纵向拼接

医院HIS/LIS的结构化治理和数据完整度保障了开展真实世界临床研究的数据质量。但是医院HIS/LIS对临床诊疗数据和实验室检查数据的存储形式是“单次个案式”记录。如图1所示,每个患者的就诊信息在HIS/LIS中为一条记录,占据数据库中的一行。如果同一名患者存在多次就诊(复诊)记录,那么该患者的就诊信息在HIS/LIS中记录为平行的多条记录,图中的“白力强”“鲍沈欢”和“蔡晓琦”3位患者,分别在2023年度就诊了2次,4次和5次,因此在医院HIS/LIS的原始数据库中便分别有2条、4条和5条记录。这些原始数据是无法进行直接分析的,需要将同一个患者不同时间点的就诊记录按照就诊的时间先后顺序纵向拼接起来,建立一个类似前瞻性“队列”数据库,才能为后续的统计分析奠定基础。

医院HIS/LIS数据的纵向拼接方法和过程如图2所示。首先,研究者需将目标数据库(原始数据库)按照“患者姓名”为主要排序字段和“就诊时间”为次要排序字段进行排序,排序后以“身份证号码”为关键唯一字段变量,标注出可能存在重名的患者,防止在后续数据库信息纵向合并时出现错误。其次,在目标数据库中找出非重复变量名,如上述银屑病示例数据库中的“就诊时间”“PASI”和“BSA”评分。再次,将上述确定的非重复变量名按照患者中的“最多就诊次数”进行必要的变量名扩展。如上述数据库中,“白力强”“鲍沈欢”和“蔡晓琦”3位患者在2023年度分别有2次,4次和5次就诊次数,因此将“最多就诊次数”确定为“5”,随后将“就诊时间”“PASI”和“BSA”3个变量扩展为“就诊时间”“PASI”和“BSA”;“就诊时间2”“PASI2”“BSA2”;“就诊时间3”“PASI3”“BSA3”;“就诊时间4”“PASI4”“BSA4”和“就诊时间5”“PASI5”“BSA5”5组新的变量名。最后,将存在多次就诊的患者相关信息按照就诊时间先后顺序纵向“腾挪”到相应的新变量名下面,同时删除其他重复的记录信息。如图2所示,“白力强”患者有2次就诊记录,按照时间顺序,将第2次的就诊信息纵向合并到“就诊时间2”“PASI2”“BSA2”3个新变量名下。“鲍沈欢”患者共有4次就诊记录,按照就诊的先后顺序,将“鲍沈欢”的第2次就诊信息纵向合并到“就诊时间2”“PASI2”“BSA2”3个新变量名下;第3次就诊信息纵向合并到“就诊时间3”“PASI3”“BSA3”3个新变量名下;第4次就诊信息纵向合并到“就诊时间4”“PASI4”“BSA4”3个新变量名下,以此类推。

2.4 HIS/LIS诊疗数据的逻辑核查

医院HIS/LIS中患者的诊疗信息和实验室检查结果按照就诊顺序纵向拼接后,还须开展数据库变量之间的逻辑性核查。重点核查数据间的逻辑关联是否正确,例如男性患者不应出现“月经”“孕产史”等信息内容;女性患者不应该有“睾丸癌”“前列腺炎”等类似的内容出现;不吸烟的患者不应该填写“每日吸烟量”“吸烟持续年限”“开始吸烟年龄”等信息,这些可以通过计算机软件建立逻辑核查程序来实现。此外,研究者在使用HIS/LIS数据前,还应核查身高、体质量、年龄等一般人口学特征是否存在不符合逻辑的异常数据(比如:新生儿体质量3 500 kg,成年男性身高1.70 cm,孕妇年龄6岁等),以及时间数据间的逻辑性(比如:就诊时间“2023年5月12日”早于发病时间“2023年4月29日”,烟龄大于年龄)等。数据逻辑核查可以直接在HIS/LIS系统中设置逻辑核查程序完成,也可以在数据导出后由人工完成。


3 基于医院HIS/LIS数据开展临床研究的实施要点

(上下滑动  查看更多)

尽管开展基于医院HIS/LIS数据的真实世界临床研究是对患者临床诊疗数据和实验室检查数据的二次利用,但仍需要符合临床研究的基本原则和实施规范。

首先,研究团队应撰写一份临床研究方案,在研究方案中明确本研究如何基于HIS/LIS获取研究数据,同时在研究设计时遵从循证医学的PICO原则,明确研究中的研究对象(participants)、干预措施(intervention)、对照(comparisons)和结果/结局(outcomes);同时在研究方案的研究设计部分,应同时参考随机对照试验报告统一标准(consolidated standards of reporting trials, CONSORT)声明,在方案下细化临床研究的“研究对象”“纳入标准和排除标准”“样本量估算”“研究对象分组”“干预措施”“疗效指标评价”“数据质量控制”“数据集”和“统计学分析”等内容,保障研究方案的规范性。

其次,研究方案需要递交医院的“临床研究学术委员会”进行学术评审,请专家审议基于医院HIS/LIS数据开展的真实世界临床研究是否具有科学价值和临床应用价值。当研究方案获得医院学术评审立项后,该研究方案及相关材料还须进一步递交医院“伦理委员会”进行伦理审查,获取伦理委员会的“免知情同意”或“泛知情同意”支持意见(图3)。

最后,研究团队将经过学术评审和伦理审批的研究方案在中国临床试验注册中心进行注册登记,获得注册码和批号后,方可导出数据进行数据统计分析、图表制作和文章撰写的临床研究工作(图3)。

全文链接:点此查看原文

投稿须知:《上海医药》来稿须知

官方网址:www.上海医药杂志.com

临床研究与医学统计
传播和普及临床试验与医学统计方法学知识
 最新文章