清华大神发布Nat commun，代码大方公开，复现so easy！机器学习 “巅峰” 时刻！双诺奖护航，速速冲！

文摘 2024-10-26 18:00 陕西

诺奖的颁布结果都看了吧，化学、物理学奖今年都盯上了人工智能、机器学习领域，都这么火了，怎么说咱们也得蹭上这波热度，抓紧上车啊~

上车的门找不着咋上车啊？来来来，阿星今天又挖到了一篇代码全公开的14分+的牛文！利用机器学习，给大家打开思路设计，懂得小伙伴们已经收藏抓紧复现啦~

清华大学药学院团队在《Nature Communications》发表研究论文，提出了一种基于代谢组学和机器学习的胃癌诊断和预后预测模型，其准确性和敏感性上超越了传统的基于蛋白质标志物的方法。特别是，研究团队开发了一个包含10种代谢物的诊断模型（10-DM模型）和一个包含28种代谢物的预后模型（28-PM模型），这些模型在外部测试集上显示出了高灵敏度和优越的性能。

前面9月份，阿星还发过一篇厉害的文章：牛掰啊！本科生一作0实验发Top纯生信！“代谢重编程+机器学习”就这点东西做完直接毕业！，这2篇一下就能看出来“代谢组学+机器学习”组合屡试不爽，不仅本科生轻松拿捏5分+，就连NC也能顺利拿下！这等好方法，想发文的朋友。跟着阿星速速看下去！PS：诺奖这波机器学习东风，肯定还会吹一阵，发文量也会上涨，想复现的朋友，可要抓紧时间实操了，想学习方法找阿星了解课程呀！还缺选题和创新，阿星也能帮你精准解决~快来试试吧！

定制生信分析

云服务器租赁

(加微信备注99领取试用)

题目：代谢组学机器学习预测胃癌的诊断和预后

杂志：Nature communications

影响因子：IF=14.7

发表时间：2024年2月

研究背景

胃癌（GC）是全球癌症相关死亡的主要原因之一，早期诊断和预后预测对于改善临床结果至关重要。非侵入性生物标志物的识别用于早期诊断和患者风险分层仍然是一个未充分探索的领域，研究旨在开发基于代谢组学和机器学习的胃癌诊断和预后预测模型。

数据来源

数据来源：多中心采集的702例血浆样本，包括389例胃癌患者和313例非胃癌对照

数据类型：血浆样本的代谢组学数据

研究思路

从多中心采集血浆样本，采用液相色谱-质谱（LC-MS）技术进行靶向代谢组学分析，检测147种代谢物。引入机器学习算法，使用LASSO回归和随机森林算法进行特征选择和模型构建，包括诊断模型（10-DM模型）和预后模型（28-PM模型）。

研究结果

1.胃癌代谢重编程

通过主成分分析（PCA）区分胃癌和非胃癌样本，发现45种代谢物在胃癌中存在显著差异。这些差异代谢物呈现出3种不同的趋势，与疾病进展相关。KEGG通路富集分析显示，谷胱甘肽代谢和半胱氨酸及蛋氨酸代谢等通路在胃癌中受到显著影响。

2.诊断模型

基于10种代谢物构建的10-DM模型在测试集1和测试集2中均表现出良好的诊断性能，AUC分别为0.967和0.920。该模型在区分早期胃癌（IA和IB期）方面也具有较高的准确性，优于传统的肿瘤标志物（如CA19-9、CA72-4和CEA）。

3.预后模型

基于28种代谢物构建的28-PM模型在预测胃癌患者预后方面表现出良好的性能，AUC为0.832，C-index为0.83。该模型优于传统的临床参数（如TNM分期、大体形态和血管肿瘤栓子），能够有效将患者分为不同的风险组。

文章小结

常规的预测模型是基于关键基因做的，而该研究的创新之处在于利用关键代谢物构建诊断/预后模型，揭示了胃癌的代谢景观，确定了两个不同的生物标志物组合，分别用于早期检测和预后预测。机器学习在分析代谢组学数据和开发潜在生物标志物方面具有独特优势，为胃癌的精准医学提供了新的工具和方法。这么一篇NC，思路、分数兼得，还不快冲？PS：热点知道了，该怎么结合还没想法？贴心的阿星一直在线等你来评估哦~在做数据分析前，记得要把自己的电脑硬件准备到位哦，比如试试阿星的服务器？一步到位！

阿星有话说

生信星持续为大家带来最新生信思路，更多创新性分析思路请点击下方链接。想复现这种思路或者定制更多创新性思路欢迎直接call阿星，生信星团队竭诚为您的科研助力!

往期精选

http://mp.weixin.qq.com/s?__biz=Mzk0NjY4MDAwMA==&mid=2247489945&idx=1&sn=5be6a858eba1db2bcfc56e56d28290fe

生信星

生信星提供专业生信分析服务，助您把握科研最新动态；思路设计、生信分析，就来找阿星~

生信大神都在用的生信服务器，好东西值得试试，双十一入手超划算！

谁说机器学习玩烂了？那是你没学到精髓！学会这波操作，亮瞎审稿人双眼！毕竟机器学习一出手，Lancet子刊你就有！

“药食同源”一出手，1区top你就有！河南中医药大学：小众疾病+网络药理学+分子对接+简单实验，干湿结合真的顶！

纯生信修回，审稿人要求补充验证实验，我该怎么办？

中山大学这篇cell是要冲“诺奖”！？领军人才+人工智能领域，太帅辣！生信人不要错过“神仙导师”！数据挖掘发顶刊！

生信大神都在用的生信服务器，好东西值得试试，双十一入手超划算！

中医药“梦中情刊”：双一区Top，最快1个月接收！天津中医药大学：网络药理学+分子对接+简单实验，可复现性MAX！

分高不卷，这才是临床科研该有的样子！李兰娟院士团队都在用的NHANES数据库“老树开新花”~发文就是这么简单！

机器学习又“杀疯了”，0实验登顶IF27.7分！恭喜香港中文大学于君等拿下Cell Metabolism！纯分析快来学！

老师，我是某科室的，我们能做生物信息学研究吗？

十投九中的神刊，有它嘎嘎晋升！孟德尔随机化点睛思路到位，Top文章不在话下！

人类对孟德尔随机化这匹黑马的开发不足1%！中山大学3图2表喜提10+，临床做“孟德尔”是大趋势吗？

生信人的“梦中情刊”！一区Top（IF=7.7），闭眼投中！“机器学习+0实验纯生信分析”就能直接拿下！你不来试试？

生物信息学：一把未来科研的金钥匙

万物皆可孟德尔随机化！不会选题，不会创新？双细胞孟德尔随机化了解下？亮瞎审稿人双眼！

“泼天富贵”又被“中医药”接到了！上海中医药大学：中药复方+网药+多组学，拿下国自然指日可待！

纯生信修回，审稿人要求补充验证实验，我该怎么办？

“水刊之王”惨遭SCI除名！多本神刊接连on hold？“及时雨”来啦！这本“亲民”毕业神刊请查收！

靠谱”师弟的逆袭：如何租大容量服务器点燃生信之梦

不黑也是神话，传统中医药发扬光大！暨南大学：网络药理学+机器学习+分子对接，0实验斩获一区SCI，可复现性MAX！

分高不卷，这才是临床科研该有的样子！李兰娟院士团队都在用的NHANES数据库“老树开新花”~发文就是这么简单！

天呐！这还卷什么实验啊！学霸的“上分神器”孟德尔随机化又在“嘎嘎乱杀”！“蛋白组MR+共定位+单细胞”一招拿下23分Gut！

又被坑了，生信后续怎么做啊

硬扛！官宣不拒稿的“顶刊”eLife霸气回应被“On Hold”：不支持影响因子也从不想要！你是支持eLife还是WOS？

太老实的人发不出SCI？浙江大学医学院附属第二医院1年内连中2篇Lancet大子刊！三甲主任：那是你没上车临床医生的科研福利！

1个多月接受的0实验中医药发文思路请查收！大连医科大学：网络药理学+机器学习+分子对接+分子动力学模拟，套路够全乎，复现很轻松！

独享服务器拼团，优惠力度空前，立即行动！

顶刊中的“水刊”？飞上1区Top的综合“毕业神刊”，堪称Advanced Science平替！1个月接受的NHANES了解下？

分高不卷，这才是临床科研该有的样子！李兰娟院士团队都在用的NHANES数据库“老树开新花”~发文就是这么简单！

清华大神发布Nat commun，代码大方公开，复现so easy！机器学习 “巅峰” 时刻！双诺奖护航，速速冲！

生信分析结果用qPCR或WB验证不出来，我该怎么办？

0实验17天接受的“网络药理学”文章深度拆解！用对这个方法，临床医生3个月就发一篇SCI！

25年国自然基金申请倒计时，如何用生信分析和服务器租赁提升成功率？

中医药几乎不退稿的“神仙”期刊找到了！云南中医药大学“网络药理学+干湿结合”2个月拿下，做完直接毕业，爽歪歪！

纯生信修回，审稿人要求补充验证实验，我该怎么办？

0实验轻松复刻！“孟德尔随机化＋机器学习”才是最佳搭档！中国中医科学院3张图交出1区7＋答卷，堪称临床医生发文标杆案例！

样本量爆棚？分析深度加码？选对服务器，省心科研无忧！

顶刊中的水刊：飞上1区Top的综合“毕业神刊”，堪称Advanced Science平替！浙江中医药大学“硕士生”先上车为敬！

太老实的人发不出SCI？浙江大学医学院附属第二医院1年内连中2篇Lancet大子刊！三甲主任：那是你没上车临床医生的科研福利！

IF=16.6！天降福音！只为不会分析的你！重庆医科大学开发的孟德尔随机化数据库—DMRdb震撼登场！傻瓜式操作，吃定这MR红利

靠谱”师弟的逆袭：如何租大容量服务器点燃生信之梦

这难道就是“中医药”的天花板思路？清华大学：网络药理学+分子对接+干湿结合，中药经方再现，可复现性超强！

人类对孟德尔随机化这匹黑马的开发不足1%！中山大学3图2表喜提10+，临床做“孟德尔”是大趋势吗？

国人巨友好的高性价比综合“神刊”！中科院最新分区从2区升至1区Top！国人友好，暴雷风险小，晋升/毕业必看！

独享服务器拼团，优惠力度空前，立即行动！

所有药学人的福利，网药又有新花样！印度团队6.9分点睛之作，网络药理学+分子动力学模拟，老树开新花~纯生信发文就靠它了！

纯生信修回，审稿人要求补充验证实验，我该怎么办？

一招鲜吃遍天，机器学习+microRNA，0实验拿下13分都是小意思！这热点把控度绝绝子！

靠谱”师弟的逆袭：如何租大容量服务器点燃生信之梦

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉