临床肿瘤科室如何哪些常见的公共数据库可以写文章?今天来个初步汇总

健康   科学   2024-07-24 11:30   浙江  

本周末直播预告

欢迎报名!2024年郑老师“孟德尔随机化”直播课

“MR方法撰写SCI论文”课程链接



想发论文但没数据,又没时间,没条件做试验,临床医生,肿瘤方面的专家学者,公卫、生信、遗传方面的学者都可以用这些公共数据库分析癌症人群数据,做到零试验发文!
说到癌症人群的公共数据库,诸位最熟悉的不过是SEER数据库了吧!其实我们常见的,常用的数据库也包含了癌症人群的数据。
今天我们就为大家做一个含有癌症人群数据的公共数据库汇总,当然这是不完全汇总,还请大家见谅。

癌症人群公共数据库汇总

1.SEER数据库
2.MIMIC数据库
3.TCGA/GEO数据库
4.NHANES数据库
5.NHIS数据库
6.HRS数据库
7.CHARLS数据库
......
一、SEER数据库
SEER(Surveillance, Epidemiology, and End Results)数据库是美国国家癌症研究所(NCI)创建并维护的一个综合性癌症统计数据库。
它于1973 年建立,旨在收集关于癌症发病率、治疗和生存率等方面的详细信息,里面包括了各式各样的肿瘤类型,如肺癌、乳腺癌、胃癌等;还提供了各式各样的临床资料,如性别、年龄、TNM 分期等,以用于癌症流行病学研究和临床医学研究。
获取:通过数据库申请许可后免费使用
10发文量:pubmed检索发文量高达22462
官网链接:https://seer.cancer.gov/
看两篇文献:
二、MIMIC数据库
MIMIC(Medical Information Mart for Intensive Care)数据库是由麻省理工学院(MIT)与贝斯以色列女执事医疗中心(Beth Israel Deaconess Medical Center)合作开发的一个公开可访问的大型医疗数据库。该数据库包含了在贝斯以色列女执事医疗中心重症监护病房(ICU)患者的详细健康数据。
尽管MIMIC数据库的主要目标是记录ICU患者的综合医疗信息,而非专门针对某一类疾病,如癌症,但由于它包含的数据量庞大且覆盖面广,包含了大量癌症患者的相关数据。
获取:MIMIC数据库的数据是免费的,但是研究人员必须通过认证培训、签署并提交数据使用协议、提交访问申请获得批准即可下载数据
官网链接:https://mimic.mit.edu/
10发文量:pubmed检索发文量94
文献:
三、TCGA/GEO数据库
TCGA(The Cancer Genome Atlas,癌症基因组图谱)是由美国国立卫生研究院(NIH)和国家癌症研究所(NCI)资助创建的一个庞大的癌症基因组项目,关注与癌症的发生和发展相关的分子突变图谱,集成了多种肿瘤类型的基因数据、临床数据和图片数据。
TCGA数据库汇集了来自多种癌症的DNA测序(包括全基因组测序和外显子组测序)、RNA测序、甲基化分析、拷贝数变异、单核苷酸多态性(SNP)基因分型、蛋白质表达等多种类型的数据。
获取:公开免费下载
下载链接:https://portal.gdc.cancer.gov/
10发文量:pubmed检索发文量26223篇
文献:
GEO(Gene Expression Omnibus,基因表达数据库)是由美国国家生物技术信息中心(NCBI) 维护的公共基因表达数据资源,收录了世界各国研究机构提交的基因表达数据,主要包括肿瘤、非肿瘤、芯片、NGS、差异分析、分子验证等各种公开数据。
获取:公开免费下载
官网链接:https://www.ncbi.nlm.nih.gov/geo/
近10年发文量:pubmed检索发文量13275篇
文献:
四、NHANES数据库
NHANES(National Health and Nutrition Examination Survey,国家健康与营养检查调查)是由美国疾病控制与预防中心(CDC)的国家健康统计中心(NCHS)开展并管理的一项重要的健康相关调查。调查的目的是评估美国成年人口和儿童的健康与营养状况,为公共政策、科研及公众健康倡议提供基础数据。
NHANES始于1960年,是一项基于人群的横断面调查,自1999年以来每年对美国境内15个县约5000人各个年龄段人群进行调查。数据库内容涵盖人口学、社会经济学、膳食、健康相关的问题,以及体格检查(医学检查、口腔检查、身体测量和实验室检测)。
NHANES数据库中包含针对癌症人群的数据。这些数据可以用于研究癌症的流行率、风险因素以及与其他健康指标的关系。
获取:数据库完全开放免费下载,且每两年更新一次。
官网链接:https://www.cdc.gov/nchs/nhanes/index.htm
10发文量:pubmed检索发文量4986篇
文献:
五、NHIS数据库
NHIS(National Health Interview Survey,国家健康访谈调查)是由美国国家健康统计中心(NCHS)组织执行的,自1957年开始对全美国人群进行健康相关指标的调查,目前每年发放一轮数据,每轮的人群数目在3万左右。
其涵盖了社会学基础参数、健康/疾病状况、健康相关行为、医疗服务使用史等内容。对于癌症人群,癌症类型、诊断时间、治疗方法以及癌症对健康和生活质量的影响等数据但没有过于具体的临床指标(例如肿瘤具体分期、亚型)。
获取:数据库完全开放免费下载
官网链接:https://www.cdc.gov/nchs/nhis/
近10年发文量:pubmed检索发文量1650篇
文献
六、HRS数据库
HRS(Health and Retirement Study,健康与退休研究)是由美国密歇根大学社会研究所(Institute for Social Research, ISR)负责实施的一项长期纵向研究,旨在调查美国50岁及以上人群的健康、经济状况、退休和家庭结构等多个方面的信息。
该研究自1992年开始,每两年进行一次数据收集。调查内容包括收入和财富、健康、意识和医疗服务使用、工作和退休以及与家人联系等内容。2006年以来数据收集扩展至生物标志物、遗传学、以及心理学和社会背景等相关内容。
HRS数据库中,有癌症人群健康状况的数据,包括癌症诊断、治疗和其它健康相关信息。
获取:注册后免费使用,而限制性数据需单独应用程序获取。
官网链接https://hrs.isr.umich.edu/
10发文量:pubmed检索发文量1113篇
文献:
七、CHARLS数据库
中国健康与养老追踪调查(China Health and Retirement Longitudinal Study, CHARLS)旨在收集一套代表中国45岁及以上中老年人家庭和个人的高质量微观数据,用以分析我国人口老龄化问题,推动老龄化问题的跨学科研究。
CHARLS全国基线调查于2011年开展,覆盖150个县级单位,450个村级单位,约1万户家庭中的1.7万人。这些样本以后每两到三年追踪一次,调查结束一年后,数据将对学术界展开。目前已有5期数据2011(wave 1)、2013(wave2)、2015(wave 3)以及2018(wave 4),2020(wave 5)。
获取:申请许可后免费使用
官网链接:https://charls.pku.edu.cn/
近10年发文量:pubmed检索发文量42篇
文献:

本文分享到这里了,由郑老师团队统计师撰写

本公众提供公共数据库挖掘服务!

我们团队提供“公共数据库挖掘”服务了


①公共数据库数据下载

②挖掘出具有发表级的结果

③包括SEER、NHANES、老年健康数据库、GBD数据库等

④提供规范的统计分析报告

⑤提供写作建议

联系李老师咨询(微信号sas555777)





医学论文与统计分析
本号为高校统计学老师所设,介绍医学论文进展与统计学方法,SPSS分析方法、真实世界研究、R语言与数据挖掘。关注后,发送关键词“33”到公众号就可以获取常见的统计软件比如Spss,sas,PASS(绝对无毒)等
 最新文章