大型人群队列的开展和数据聚合平台的构建

企业   科学   2024-07-31 09:59   湖北  

大家好,今天和大家聊一聊我比较熟悉,也很喜欢的一个话题:大型人群队列。我毕业于同济医学院公共卫生学院,上学的时候参与过几个队列研究,真正拿着问卷去现场进行调查,这些经历让我对“现场”有了一个更加清晰的认识,工作之后越来越发现那段经历的宝贵之处。很多事情,在办公室思考和现场调查是完全两个概念,如果没有现场的经验,很多想法都是纸上谈兵。

所谓大型人群队列,是指对大量人群进行长期跟踪调查,收集他们的生物样本、生活习惯、环境暴露等多种信息,以探究疾病发生、发展的规律,为制定预防策略和治疗方案提供科学依据。大型人群队列是开展公共卫生研究、疾病研究的重要形式。

想要做好一个人群研究,除了研究的顶层设计之外,在执行层面,研究者也需要考虑好以下几个问题:

1.构建一个清晰的现场操作流程和规范。比如我们要在一个工厂里面对职工进行批量的问卷调查和体检。作为研究者,首先要考虑的是,如何能够步骤清晰、高效的完成整个操作流程。比如在哪个空间开展这个研究,研究对象到场地之后,第一步是干什么,先做问卷,还是先抽血?不同的流程之间,用什么进行唯一识别,是用条形码,还是身份证?这些现场的流程不设计清楚,到现场就会是一锅粥,调查对象也会很难配合。

因此我们建议在正式大规模调查前,先开展一个小规模的预调查,并且一定是要去真实的现场,真实的人群,进行真实的调查。很多问卷设计,如果不亲自去问一遍,后期调查的时候会千奇百怪,并且效率非常低下。现场的流程也需要完整的走一遍,找到流程中的限速步骤和不合理的地方,进行更正,这样正式项目才会比较顺利。

2.做好不同数据源的聚合和管理工作。不同于医院内开展的小型的疾病队列,大型人群队列研究一般是针对健康人群,例数往往超过5000例,甚至到十万级别。更重要的是,人群队列的数据来源一般非常复杂,可能包括:问卷调查数据、生物样本数据、医院实验室检查数据、第三方送检数据、后期随访数据。这些维度的数据来源不同、格式不同,因此要做好这么多数据的聚合和管理工作并不简单。

我接触的大型人群队列一般都是由公共卫生团队主导,或者深度参与。即便面对这些专业人士,没有好的工具,想要做好这么多的数据管理也不是一件容易的事儿。

3.做好团队管理和质量把控。大型人群队列的参与者需要比较多的研究者和参与者,比如现场调查员、现场协调员、数据管理员、项目质控员等。其中现场调查员需要的人数最多,一个现场往往需要十几名调查员,如果有多个现场,人数就更多了。这个时候只靠自己课题组的力量往往不够,还需要借助兼职学生的力量,这么多人员的培训、管理就是一项大工程。更重要的是,还要想办法让这些团队外部的人高质量的完成项目。

由此可见,想要开展好大型人群队列,并不是一件容易的事,没有丰富的经验很难做好,有经验,没有好的工具也很难做好。我自己是一个比较追求高效率的人,也喜欢思考如何用好的工具解决工作中的问题,因此我们团队专门开发了一套面向大型人群队列的数据采集和聚合平台--易侕人群队列平台

我们团队开发的易侕人群队列数据聚合平台主要有以下几个功能:

1.电子问卷调查。问卷调查是现场流调的主要途径之一,很多团队目前使用的是纸质问卷,调查之后再进行人工录入。这种方法最大的问题是从纸质问卷到最后的数据周期过长,等录入者发现了填写的问题,想再找到调查对象就来不及了。电子问卷就可以彻底解决这个问题,我们内置了质控模块,调查员在现场进行询问的时候,发现可疑问题,就可以及时处理。同时,因为是电子问卷直采,所以从询问到获得数据实时同步,研究者很快就可以得到最及时的数据,提高研究效率。

还有另外一些团队采用的是问卷星、腾讯问卷等量表网站,这类工具最主要的问题是它们并不是针对流调设计,针对同一个调查对象的不同问卷、不同随访时期的数据,无法直接串联管理,需要进行数据拼接和合并,查看起来也不方便,也无法进行质控。

术业有专攻,如果有经费支持,还是推荐使用专业的流调软件进行问卷数据的采集和管理。

2.现场问卷录音。问卷的质控也是很重要的一个环节。我接触过一些比较高规格的流调项目,现场的调查过程,都是需要拿着录音笔进行录音保存的。这样的好处是方便进行质控,同时对于录入员遗失或填错的内容,可以溯源追回,而不用再次麻烦调查对象。

为了实现这个目的,我们团队研发了问卷的现场录音,不管是使用IPAD,还是笔记本电脑,都可以自动开启问卷的背景录音,无需额外的录音笔,所有的录音文件会自动关联到指定的问卷中,后期抽查和追溯都非常方便。

3.不同数据源聚合。人群队列的数据源可能非常复杂,包括了生物样本数据、问卷调查数据、实验室检查数据、历史数据、随访数据等。这些数据因为来自不同的机构、途径,因此数据结构也大不相同,针对这个问题,我们研发了数据聚合平台,系统支持以excel的形式进行数据导入,导入后,系统按照ID号进行调查对象的数据关联。同时,支持在前端进行数据的筛选和查看,这样全部的数据源都可以在一个平台中进行展示汇总和导出,底层实现了整个人群数据的集中化管理

4.微信+电话随访。人群队列的随访也是一项很重要的工作,针对大规模的人群随访,我们开发了基于微信+电话的随访系统,调查对象进入队列之后,可以关注微信号,后期系统可以根据随访周期或者统一随访时间点,批量自动发送随访提醒的消息。调查对象可以根据自己的情况反馈是否能按时参加随访,这样对研究团队就可以根据预约的人数合理的安排调查工作。

同时,我们的随访系统现在也支持了电话随访,调查员可以直接通过系统的网页端,用自己的笔记本电脑拨打电话,使用平台自带的电话通知调查对象,所有的电话录音也会自动保留。管理者可以收听所有的录音,方便质控和追溯。

5.电子体检报告。很多人群队列项目都是和体检结合在一起,体检往往是调查对象参与项目的一个最大吸引力,因此调查对象会希望能够得到体检的数据结果。针对这个场景,我们开发了一套电子体检报告和查询系统,我们会为项目提供一个体检报告的发送网站,或者微信号,体检数据结果出来之后,调查对象可以通过微信直接收到PDF版本的报告,或者登录网站查询自己的报告。这样可以避免了人工发送纸质报告的麻烦,大大提高了调查对象的满意度和参与感。

6.在线统计分析。能够执行大型人群队列的团队一定都有数据分析人员,那么为什么我们还在系统里面做了统计分析的功能呢?其实主要目的是方便大家进行描述性统计,这样研究者不需要导出数据,就可以快速看到目前已经收集的数据基本情况,包括有效例数、缺失数、数据分布情况,均值标准差等等。如果想要进行进一步的分析,可以按照要求筛选、拼接导出。我们的平台支持按照问卷、变量进行导出,而非每次全部导出,最大化的降低数据外传的范围。

好啦,以上就是这套工具的核心功能,还有非常多的功能没办法一一罗列,大家如果感兴趣,可以联系我们的团队,了解更多详情。联系电话:15007152536 (同微信)

既往参与的人群队列项目

以下是我们既往参与的部分大型人群队列项目:

1.中国疾控中心环境所“我国大气污染的急性健康风险研究”,全国50余个点位,1万余人,多次随访。

2.国家心血管病中心、中国医学科学院阜外医院、国家心血管疾病临床医学研究中心发起的“高血压前期人群动态血压监测和心血管疾病风险因素评估(AMEC-Pre)”项目。

3.广东省人民医院发起的“血压正常高值合并2型糖尿病人群降压干预研究(IMPACT研究”,计划入组1万例。

4.武汉大学公共卫生学院开展的“广场舞人群营养与健康队列研究”,涉及到多种外部数据的聚合和历史数据的整理。

除此之外,还有更多中小型的疾病队列,以下是部分合作单位名单:

关于斯录欣Solution
易侕科研隶属于斯录欣(上海)信息科技有限公司,公司成立2014年,是一家高新科技企业。斯录欣由临床研究专家、统计学家组建,公司聚焦于临床/药物研究,为临床/药物研究提供一整套科研数据解决方案。如果您想了解更多关于队列数据聚合平台,欢迎和我们联系。
电话:15007152536 (同微信)
邮箱:bp@yunedc.com
官网:http://www.siluxintech.com

长按识别,添加小助手微信

易侕科研
专注于临床科研数据管理+数据分析。定期分享一些研究设计、数据分析的内容,也会推荐一些好用的科研工具和网站。每天10min,让科研更简单!(本账号原名为:易侕统计。本账号为斯录欣公司旗下产品,2018年更名为:易侕科研)
 最新文章