Nature：机器学习构建基于DNA甲基化的中枢神经肿瘤分型

企业 2024-11-03 10:01 浙江

英文标题：DNA methylation-based classification of central nervous system tumours

发表期刊：Nature

影响因子：50.5

发表时间：2018年3月

研究机构：德国海德堡大学附属医院

涉及组学：illumina 450k DNA甲基化芯片等

涉及算法：随机森林

摘要

准确的病理诊断对癌症患者的最佳治疗至关重要。对于大约100种已知的中枢神经系统肿瘤类型，诊断过程的标准化极具挑战性——许多肿瘤类型的组织病理学诊断存在很大的观察者间差异。

本文提出了一种基于DNA甲基化的全面诊断方法，用于对所有实体和年龄组的中枢神经系统肿瘤进行分类，并展示了其在常规诊断环境中的应用。与标准方法相比，该方法的可用性可能对诊断准确性产生重大影响，导致多达12%的前瞻性病例诊断发生变化。为了更广泛的可及性，作者还设计了一个免费的在线分类器工具，其使用不需要任何额外的现场数据处理。该结果为基于机器学习的肿瘤分类器在其他癌症实体中的生成提供了蓝图，有可能从根本上改变肿瘤病理学。

在线网址为：http://www.kitz-heidelberg.de/molecular-diagnostics

1、中枢神经系统肿瘤参考队列

为建立全面的中枢神经系统肿瘤参考队列，使用illumina 450k DNA甲基化芯片生成了全基因组DNA甲基化图谱，涵盖了几乎所有WHO定义的神经外胚层和鞍区肿瘤，以及间充质肿瘤、黑色素瘤等多种肿瘤类型，共91个类别，2801个样本。

通过无监督聚类分析，确定了82个具有不同DNA甲基化特征的中枢神经系统肿瘤类别，分为5类，各类别与WHO分类的关系不同。

参考队列的t-SNE降维分析表明甲基化类别的分离具有高度稳定性，且未发现明显的批次效应。对参考队列中的星形细胞瘤、少突胶质细胞瘤和胶质母细胞瘤，根据TCGA泛胶质瘤DNA甲基化模型进行额外分类，发现与参考队列中定义的特定类别有很强的关联。

2、分类器开发

使用随机森林算法开发分类器，整合了来自所有2801个参考样本和91个甲基化类别的全基因组信息通过10,000个决策树对样本进行分类，产生原始分数。

为使分数可用于诊断决策，拟合多项式逻辑回归校准模型将原始分数转换为校准分数，以衡量分类的置信度。

交叉验证结果显示，原始分数和校准分数的错误率较低，区分能力高。定义了八个“甲基化类别家族”，将校准分数相加得到单一分数，降低了临床相关分组的交叉验证错误率。确定了预测匹配类别的阈值，对于甲基化类别家族内的亚类，也定义了相应的阈值。

3、临床应用

前瞻性分析1155例诊断性中枢神经系统肿瘤，与标准组织病理学分析并行。

4%的样本因材料不适合开展后续的甲基化分析，对其余1104例进行甲基化分析，88%的样本匹配到既定的DNA甲基化类别，76%的结果与病理诊断一致。

12%的病例通过甲基化分析建立了明确的分子分型的亚群体，改变了初始诊断，其中71%的病例WHO分级发生变化。

五个外部中心队列的结果与本研究相似，12%的病例建立了新诊断。12%的肿瘤无法分配到具体的DNA甲基化类别，可能代表新的分子分类群体。

4、技术和实验室间测试

通过实验室间比较研究随机森林分类器的技术稳健性，结果高度相关。

计算拷贝数图谱在不同实验室间也有稳定的表现。使用该分类器研究新的甲基化芯片（EPIC）和WGBS测序数据，具有很好的相关性，表明该DNA甲基化方法在检测技术上有很强的拓展性和适应性，适用于DNA甲基化芯片以及DNA甲基化测序如WGBS以及RRBS等。

5、在线分析平台的全球应用

作者还创建免费的在线平台（http://www.kitz-heidelberg.de/molecular-diagnostics ），用于数据上传、自动归一化、随机森林分类和PDF报告生成，提供DNA拷贝数图谱和启动子甲基化状态分析。

自2016年12月推出以来，已有超过15个中心上传了4500多例病例。预期该平台能作为全球合作中枢神经肿瘤研究的枢纽，持续识别和追踪罕见的中枢神经肿瘤类别。

相关阅读

NC：机器学习+DNA甲基化锁定FFPE样本转移癌的原癌部位

Gut：机器学习+DNA甲基化区别胰腺癌和慢性胰腺炎队列研究

一文告诉你肠道菌群+机器学习发现生物标志物研究思路

联川特色|机器学习特征筛选适配大样本差异分析（内含讲座回放）

本文系联川生物公众号原创文章，未经授权禁止转载，侵权必究！


扫描下方二维码

点分享

点点赞

点在看

http://mp.weixin.qq.com/s?__biz=MjM5MzIwNTI4OA==&mid=2650340328&idx=1&sn=d4ee4ddc038eebe6bd91b791e8dbf81b

联川生物

一个提供科研入门学习资源、经验的平台。分享前沿测序技术资讯、实用生信绘图技巧及工具。发布高质量的科研论文精度、精炼科研思路。我们的目标是持续提供“干货”，滋润您的科研生涯。

最新文章

单细胞转录组和单细胞ATAC-seq联合分析案例解析

【联川苍穹-宏基因组云分析】玩转beta多样性分析

第五届新型生物标志物前沿技术与肿瘤精准治疗新进展——钱塘论坛顺利召开

【联川苍穹】如何使用联川苍穹平台开展alpha多样性分析？

NC：机器学习构建小鼠DNA甲基化非线性年龄预测分类器

2025国自然热点：一站式理清Xenium探针定制

宏基因组——物种组成分析

Nat Genet：迄今最大规模的人类DNA甲基化QTL（meQTL）图谱

国自然2025|单细胞ATAC-seq能够实现的分析内容都有哪些？

国自然2025|抗生素与微生物，同一健康，研究思路解析助力国自然申报

【联川苍穹】如何使用联川苍穹平台开展unigene分析?

【科研新利器】CellChat：一键解锁单细胞互作之谜，让复杂数据变得触手可及

多组学和机器学习概念篇-备战国自然2025

2025国自然热点：空间组学平台如何选择？

会议预告|联川生物邀您第五届新型生物标志物前沿技术与肿瘤精准治疗新进展

项目经验分享|关于流式细胞阴选，你还需要知道哪些信息？

热烈祝贺联川生物成功举办博士后开题报告会

双十一感恩回馈| 联川生物工具书零元购！！！名额无上限

2025国自然热点：Flex+空转神仙组合怎么开展研究

联川生物2024版10x单细胞转录组分析报告重磅发布

如何使用Loupe Browser在Visium HD数据中圈选目标区域展开差异分析

基因在说话！看TWAS如何捕捉性状背后的秘密

国自然2025没思路？组蛋白乳酸化CUT&Tag考虑下!

STM：机器学习+DNA甲基化区分原发性肺鳞癌和头颈转移瘤

国自然热点2025：时空组学实验流程和样本如何准备？

国自然2025热点：7个实用的植物单细胞研究数据库 | 单细胞专题

“他”就像是夜空中的星座，创造出无尽的动人故事，让我们一起走进“他”的世界---技术工程师

备战国自然2025|微塑料与微生物，一网打尽，研究思路解析助力国自然申报

精准分选：揭秘流式细胞阴选与阳选的关键影响因素

强势来袭 | 联川生物华大时空转录组V1.3震撼上线，正式开启项目服务——2025国自然热点

Olink蛋白质组学医学课题设计思路-备战国自然2025

AJHG：meQTL揭示DNA甲基化对双胞胎皮肤疾病的影响

2025国自然热点：空间组学迈入单细胞分辨率

单细胞+时空原位分析探索早期人类胎儿肺上皮细胞可塑性的时间动态∣时空原位研究范式

做肿瘤微生物组，不注意这个设计，你铁定要后悔！|备战国自然2025

从肠道菌群到生物标志物：医学微生物大队列研究应该怎么做|备战国自然2025

2025国自然热点——科研新宠Xenium空间原位组学不了解下？

14种比对算法在哺乳动物全基因组亚硫酸氢盐测序DNA甲基化分析中的基准测试

AJHG：meQTL揭示DNA甲基化对双胞胎皮肤疾病的影响

基础医学与生化篇-表观多组学技术应用场景解析-备战国自然2025

2025国自然热点：单细胞文章有哪些下游验证方式

DNA甲基化技术该如何选择，这篇文章告诉你答案

ERJ：GWAS+meQTL鉴定DNA甲基化影响气管中的哮喘风险

Nature：机器学习构建基于DNA甲基化的中枢神经肿瘤分型

NC：机器学习构建肉瘤DNA甲基化分类器队列研究

NC：GWAS+meQTL/孟德尔随机化揭示DNA甲基化影响儿童身高

肠道菌群+机器学习：双剑合璧，助力国自然基金申报突破重围！|备战国自然2025

做肿瘤微生物组没思路，那是你没看过这些工作|备战国自然2025

NC：meQTL+eQTL揭示视网膜黄斑病DNA甲基化与转录互作事件

乳酸化修饰蛋白组在心血管疾病中的研究思路∣修饰蛋白组学专题

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉