临床肿瘤科室如何哪些常见的公共数据库可以写文章?今天来个初步汇总
健康
科学
2024-07-24 11:30
浙江
想发论文但没数据,又没时间,没条件做试验,临床医生,肿瘤方面的专家学者,公卫、生信、遗传方面的学者都可以用这些公共数据库分析癌症人群数据,做到零试验发文!说到癌症人群的公共数据库,诸位最熟悉的不过是SEER数据库了吧!其实我们常见的,常用的数据库也包含了癌症人群的数据。今天我们就为大家做一个含有癌症人群数据的公共数据库汇总,当然这是不完全汇总,还请大家见谅。SEER(Surveillance, Epidemiology, and End Results)数据库是美国国家癌症研究所(NCI)创建并维护的一个综合性癌症统计数据库。它于1973 年建立,旨在收集关于癌症发病率、治疗和生存率等方面的详细信息,里面包括了各式各样的肿瘤类型,如肺癌、乳腺癌、胃癌等;还提供了各式各样的临床资料,如性别、年龄、TNM 分期等,以用于癌症流行病学研究和临床医学研究。近10年发文量:pubmed检索发文量高达22462篇官网链接:https://seer.cancer.gov/MIMIC(Medical Information Mart for Intensive Care)数据库是由麻省理工学院(MIT)与贝斯以色列女执事医疗中心(Beth Israel Deaconess Medical Center)合作开发的一个公开可访问的大型医疗数据库。该数据库包含了在贝斯以色列女执事医疗中心重症监护病房(ICU)患者的详细健康数据。尽管MIMIC数据库的主要目标是记录ICU患者的综合医疗信息,而非专门针对某一类疾病,如癌症,但由于它包含的数据量庞大且覆盖面广,包含了大量癌症患者的相关数据。获取:MIMIC数据库的数据是免费的,但是研究人员必须通过认证培训、签署并提交数据使用协议、提交访问申请获得批准即可下载数据官网链接:https://mimic.mit.edu/TCGA(The Cancer Genome Atlas,癌症基因组图谱)是由美国国立卫生研究院(NIH)和国家癌症研究所(NCI)资助创建的一个庞大的癌症基因组项目,关注与癌症的发生和发展相关的分子突变图谱,集成了多种肿瘤类型的基因数据、临床数据和图片数据。TCGA数据库汇集了来自多种癌症的DNA测序(包括全基因组测序和外显子组测序)、RNA测序、甲基化分析、拷贝数变异、单核苷酸多态性(SNP)基因分型、蛋白质表达等多种类型的数据。下载链接:https://portal.gdc.cancer.gov/近10年发文量:pubmed检索发文量26223篇GEO(Gene Expression Omnibus,基因表达数据库)是由美国国家生物技术信息中心(NCBI) 维护的公共基因表达数据资源,收录了世界各国研究机构提交的基因表达数据,主要包括肿瘤、非肿瘤、芯片、NGS、差异分析、分子验证等各种公开数据。官网链接:https://www.ncbi.nlm.nih.gov/geo/近10年发文量:pubmed检索发文量13275篇NHANES(National Health and Nutrition Examination Survey,国家健康与营养检查调查)是由美国疾病控制与预防中心(CDC)的国家健康统计中心(NCHS)开展并管理的一项重要的健康相关调查。调查的目的是评估美国成年人口和儿童的健康与营养状况,为公共政策、科研及公众健康倡议提供基础数据。NHANES始于1960年,是一项基于人群的横断面调查,自1999年以来每年对美国境内15个县约5000人各个年龄段人群进行调查。数据库内容涵盖人口学、社会经济学、膳食、健康相关的问题,以及体格检查(医学检查、口腔检查、身体测量和实验室检测)。NHANES数据库中包含针对癌症人群的数据。这些数据可以用于研究癌症的流行率、风险因素以及与其他健康指标的关系。官网链接:https://www.cdc.gov/nchs/nhanes/index.htmNHIS(National Health Interview Survey,国家健康访谈调查)是由美国国家健康统计中心(NCHS)组织执行的,自1957年开始对全美国人群进行健康相关指标的调查,目前每年发放一轮数据,每轮的人群数目在3万左右。其涵盖了社会学基础参数、健康/疾病状况、健康相关行为、医疗服务使用史等内容。对于癌症人群,有癌症类型、诊断时间、治疗方法以及癌症对健康和生活质量的影响等数据,但没有过于具体的临床指标(例如肿瘤具体分期、亚型)。官网链接:https://www.cdc.gov/nchs/nhis/HRS(Health and Retirement Study,健康与退休研究)是由美国密歇根大学社会研究所(Institute for Social Research, ISR)负责实施的一项长期纵向研究,旨在调查美国50岁及以上人群的健康、经济状况、退休和家庭结构等多个方面的信息。该研究自1992年开始,每两年进行一次数据收集。调查内容包括收入和财富、健康、意识和医疗服务使用、工作和退休以及与家人联系等内容。2006年以来数据收集扩展至生物标志物、遗传学、以及心理学和社会背景等相关内容。HRS数据库中,有癌症人群健康状况的数据,包括癌症诊断、治疗和其它健康相关信息。获取:注册后免费使用,而限制性数据需单独应用程序获取。官网链接:https://hrs.isr.umich.edu/中国健康与养老追踪调查(China Health and Retirement Longitudinal Study, CHARLS)旨在收集一套代表中国45岁及以上中老年人家庭和个人的高质量微观数据,用以分析我国人口老龄化问题,推动老龄化问题的跨学科研究。CHARLS全国基线调查于2011年开展,覆盖150个县级单位,450个村级单位,约1万户家庭中的1.7万人。这些样本以后每两到三年追踪一次,调查结束一年后,数据将对学术界展开。目前已有5期数据2011(wave 1)、2013(wave2)、2015(wave 3)以及2018(wave 4),2020(wave 5)。官网链接:https://charls.pku.edu.cn/我们团队提供“公共数据库挖掘”服务了
①公共数据库数据下载
②挖掘出具有发表级的结果
③包括SEER、NHANES、老年健康数据库、GBD数据库等
④提供规范的统计分析报告
⑤提供写作建议
联系李老师咨询(微信号sas555777)