科学通报|清华大学鲁志团队综述复杂疾病中多组学多模态数据的生物信息学研究进展

学术科学 2024-09-19 16:30 北京

在当今生物医学研究的世界中，高通量测序技术的快速发展为复杂疾病的研究带来了前所未有的机遇。

近日，清华大学鲁志教授团队在《科学通报》发表题为“复杂疾病中多组学多模态数据的生物信息学研究进展”的评述文章，期望为广大研究者提供一幅多组学和多模态数据整合的全景图，助力研究者在精准医疗的道路上迈出坚实步伐。

在文章开篇，作者以详实的笔触介绍了各种类型的组学数据的概念及其在复杂疾病研究中的重要性。不同组学数据各展所长，共同揭示了疾病的多个层面。基因组学通过分析基因序列揭示了与疾病相关的遗传背景和突变；转录组学通过研究表达模式揭示了与疾病相关的基因调控关系；蛋白质组学关注蛋白质的表达、修饰和相互作用；代谢组学通过代谢物变化反映了疾病前后代谢途径的调整；放射组学通过医学成像展示了疾病的诱导性变化。整合和分析这些组学数据，不仅弥补了单一组学研究的不足，更为研究者理解疾病的发病机制和发展过程提供了全新视角。接下来，作者详细介绍了与复杂疾病相关的多组学数据库的构建和应用，这些数据库涵盖了癌症、心脑血管疾病、器官纤维化、慢性肾病、阿尔茨海默病和炎症性肠病等多种复杂疾病，为研究者提供了宝贵的数据资源。通过对这些数据库的深入分析，研究人员能够更有效地挖掘和利用多组学数据，为疾病的诊断和治疗提供科学依据。

图1 复杂疾病研究中多组学方法

文中，作者对多组学整合方法进行了系统分类，将现有的多组学整合方法系统地分为两类：基于关联分析和网络以及基于数据矩阵和机器学习方法。基于关联分析和网络的方法使用关联分析或复杂网络分析来识别不同组学之间的内在联系，从而发现与表型相关的生物标志物。基于数据矩阵和机器学习方法是指利用统计分析、机器学习和深度学习模型实现数据融合，以进行聚类或分类任务，同时揭示多组学数据之间的固有关系，识别与疾病相关的生物标志物。基于数据矩阵和机器学习方法进一步分为早期整合、中期整合和后期整合。早期整合方法是指将多组学数据合并成一个联合矩阵，然后应用机器学习或深度学习模型进行分类。中期整合方法是指对每个组学数据单独建模，然后整合转换后的矩阵或模型。后期整合方法是指每个组学数据单独建模，然后合并模型输出结果。作者不仅阐述了这些方法的原理和特点，还通过具体案例展示了它们在实际研究中的应用。作者对多组学整合方法的整理为研究者提供了清晰的研究路径，有助于更好地挖掘多组学数据中的深层次信息。

图2 多组学整合工作流程

在讨论实际应用时，作者列举了多组学整合模型在疾病筛查、亚型分类、预后评估和药物反应预测等多个方面的应用，展现了多组学整合技术在临床实践中的广阔前景。这些应用案例不仅证明了多组学整合技术的有效性，也为未来的研究方向提供了启发。

图3 多组学整合方法概述

最后，作者从样本、数据和模型三个层面对多组学整合过程中面临的挑战进行了深入剖析。作者指出，在样本层面，数据的匹配不一致性问题严重制约了整合策略的实际应用效果。在数据层面，面对数据的超高维度、噪声干扰以及异质性问题，迫切需要采用更为高效的深度学习技术来实现数据的有效融合。而在模型层面，我们面临的主要挑战包括模型的解释性不足、计算效率有待提升以及隐私保护方面的难题。尽管存在诸多难题，但研究人员正通过不懈努力，开发新的算法、优化数据处理流程、提高模型的可解释性，以期在保证数据安全的前提下，提升多组学整合技术的应用效果。

清华大学生命科学学院鲁志教授为本文的通讯作者，刘晓帆博士为本文的第一作者。

文章链接：

https://www.sciengine.com/CSB/doi/10.1360/TB-2024-0416

点击“阅读原文”查看原文信息

欢迎转发朋友圈

转载、投稿请留言

长按二维码关注我们

| 关注科学通报 | 了解科学前沿

http://mp.weixin.qq.com/s?__biz=MzA3ODgxMzc1Ng==&mid=2650457144&idx=1&sn=0ab4bac1cdb4405859eecd1132533f62

科学通报

《科学通报》是由中国科学院和国家自然科学基金委员会共同主办的自然科学综合性学术刊物, 致力于快速报道自然科学和应用研究的最新研究动态、进展, 点评研究动态和学科发展趋势。关注《科学通报》，了解科学前沿。

最新文章

嫦娥六号玄武岩揭秘月背岩浆活动

科学通报|三元有机太阳能电池光电转换效率超过20%

《科学通报》2024年10月下旬刊|清华大学生物系复系40周年专辑

科学通报 | 清华大学生物系复系40周年专辑

科学通报|清华大学吝易团队综述生物大分子相分离最新研究进展

科学通报|开启智能化科研新纪元 —— AI for Science引领材料科学变革

科学通报|探秘银河系的三维消光图

科学通报|X射线双星爆发中的黑洞吸积

科学通报|“2023年度中国科学十大进展解读”之“玻色编码量子纠错”

科学通报|炎症性肠病：新型功能化口服给药治疗方式

2024中关村论坛系列活动——北京石墨烯论坛在京开幕

会议通知|金秋十月，与您相约BGF2024

科学通报|综述：中高熵合金的异构设计及其强韧化机理

【开讲啦】地球科学与人类文明和国家发展 | 科学通报 & Science Bulletin大讲堂

厦门见！——金秋十月，与您相约中国地球科学联合学术年会

《科学通报》2024年10月上-中旬刊(含“固体高功率和短波激光前沿技术专题”| 文章速递

科学通报|颉伟团队综述多维度ZGA重编程景观及分子机制

科学通报|冰纳米线拉伸的分子动力学模拟

科学通报|陈柱成团队综述染色质重塑领域最新研究进展

科学通报|新型深紫外非线性光学晶体“氟驱动”材料设计

科学通报|智能物质的创制与应用

《科学通报》2024年9月下旬刊| 文章速递

科学通报|聚合物发泡与多孔功能材料的研究与应用进展

《科学通报》2024年9月中旬刊| 文章速递

科学通报|绝缘衬底上二维单晶材料制备研究进展

科学通报|清华大学刘玉乐教授团队综述细胞自噬在植物生物胁迫中的作用

科学通报|引力波与引力检验

《科学通报》2024年9月上旬刊(含“能源电催化专题(I)”)| 文章速递

【招聘】科技期刊助理编辑

科学通报|清华大学鲁志团队综述复杂疾病中多组学多模态数据的生物信息学研究进展

科学通报|中山大学付俊教授团队综述：热致变色智能窗户材料研究进展

科学通报|先进磷酸铁锂正极高效储锂设计与调控

科学通报|利用功能化聚合物清除游离核酸，拓展炎症和肿瘤转移治疗新途径

《科学通报》2024年8月下旬刊|发展人口神经科学: 拥抱多样性专辑

科学通报|医用同位素177Lu的辐照生产、分离纯化、螯合标记及临床应用

[会议预告]第二届数据驱动与地学发展全国学术研讨会即将召开

科学通报|金属镁催化高张力三元环系的不对称开环反应

科学通报|清华大学李坤教授团队综述焦虑和抑郁障碍的性别差异及相关神经机制

科学通报|人-地系统动力学耦合模型研究的评述与展望

《科学通报》2024年8月中旬刊(含“元素化学专题(I)”)| 文章速递

科学通报|类液体表面的特性、构建与应用

科学通报|西秦岭造山带晚中生代-新生代陆内构造演化

科学通报|锌基液流电池储能技术研究进展

科学通报|高极性、低模量介电弹性体的合成及力电耦合性能研究

科学通报|嗜盐菌合成生物学为基础的新型生物制造：生物制造2.0

科学通报|南京大学马海波课题组强关联分子体系电子结构方法研究进展

科学通报|高熵超导体研究进展

《科学通报》2024年8月上旬刊| 文章速递

“医”食无忧—大健康与农业发展|《科学通报》& Science Bulletin大讲堂第三讲成功举办

科学通报|柔性触觉传感电子皮肤研究进展：颠覆触觉体验的未来科技

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉