南京医科大团队开发乳腺癌预后模型纯生信发11分+,一作是本科生,现在都这么卷了吗?

文摘   2024-11-11 19:00   上海  


大麦今天发现一篇纯生信文章发了11.4分,揉了揉眼睛,没看错,乳腺癌预后模型+纯生信,再仔细一看,一作还是本科生!看到这里大麦心中不由有了至少三个疑问:
1.这期刊11分+还收纯生信,是何方神圣?
2.纯生信发这么高,还是做的常见肿瘤的预后模型,这篇文章有何过人之处?
3.这篇文章的工作量有多大?
带着这三个疑问,让我们一一来看看。
我们先看期刊,然后看文章吧!
Journal of Advanced Research由开罗大学2010年开始出版,被划为中科院一区Top,属于综合性期刊。国人发文量排第一,国人友好,不过普遍反馈速度较慢,平均四个月左右接受,发文量也不高,OA期刊版面费3500刀。发文难度不算特别高。
然后看文章亮点有哪些?
1.数据量:         

 

    
研究涵盖了来自9个独立乳腺癌队列的1,450个肿瘤样本和222个邻近正常组织样本的DNAmethylation数据,涉及11,114个CpG探针。
经过严格的质量控制和差异methylation分析后,筛选出8,126个具有显著差异的CpG探针用于后续分析。
研究最终包括了1,142名患者(来自TCGA、GSE37754、GSE72245和GSE75067队列)用于ARTEMIS模型的开发和验证。
2.分析方法创新:
开发了ARTEMIS模型,这是一个结合了表观遗传生物标记物主要效应和基因-基因相互作用的预后预测模型。
采用了前向逐步回归策略,结合训练集数据,从候选的表观遗传预测因子中筛选出最终的模型变量。
创新性地整合了临床信息(如年龄、病理分期、淋巴结状态等)与表观遗传生物标记物,提高了模型的预测准确性。
3.验证完备:
在训练集(TCGA)和多个独立测试集(GSE72245、GSE37754、GSE75067)中进行了内部和外部验证,确保了模型的稳健性和普适性。
通过Kaplan-Meier生存曲线和Cox比例风险模型评估了ARTEMIS评分的风险分层能力。
使用决策曲线分析(DCA)评估了模型的临床效用,包括净收益(NB)和净降低(NR)。
开发了交互式在线工具,允许用户上传数据来预测个体化的生存率,提高了模型的临床应用性。
总的看来该研究还是非常棒,整合数据分析发高分又有了一篇参考呢!虽然预后模型发的有点太多,但是做的好还是可以发高分的!思路已经送达,下一步就是实践!还等什么,找大麦来帮忙,专业团队为您提供方案设计和个性化分析!

 

定制生信分析

云服务器租赁

(加微信备注99领取试用)

题目:ARTEMIS: An independently validated prognostic prediction model of breast cancer incorporating epigenetic biomarkers with main effects and gene-gene
interactions
杂志:Journal of Advanced Research
影响因子:IF=11.4
发表时间:2024年8月


研究背景

乳腺癌是一种异质性疾病,受多种遗传和表观遗传因素的影响。大多数乳腺癌预后模型仅关注预测因子的主要效应,忽略了基因-基因相互作用对预后的重要作用。使用来自九个独立乳腺癌队列的DNAmethylation数据,开发了一个独立验证的乳腺癌预后预测模型,该模型结合了具有主要效应和基因-基因相互作用的表观遗传生物标记物(ARTEMIS)
研究思路    
1.数据收集:
从9个独立数据集中收集了1,450个乳腺癌肿瘤样本和222个邻近正常组织样本的DNAmethylation数据。
涉及11,114个与泛癌相关的CpG探针。
2.差异methylation分析:
对比肿瘤组织和正常组织,进行差异methylation分析。
通过非配对Student's t检验筛选出8,126个CpG探针,这些探针在肿瘤和正常组织间的methylation水平有显著差异(FDR≤0.05)。
3.生物标记物筛选:
⚪发现阶段:
使用TCGA中的774名乳腺癌患者数据。
对8,126个泛癌CpG探针进行主效应分析和基因-基因(GxG)交互作用分析。
通过Cox模型筛选出25个具有主要效应的CpG探针和10,044对具有显著交互作用的CpG探针(q-FDR≤0.05)。
⚪验证阶段:
使用GSE72245中的118名乳腺癌患者数据。
进一步验证了4个具有主要效应的CpG探针和260对具有交互作用的CpG探针(P≤0.05),并且效应方向一致。
4.模型构建与验证:
⚪训练阶段:
利用TCGA中的774名乳腺癌患者数据。
采用前向逐步回归筛选,构建了包含年龄、病理T分期、淋巴结状态、病理M分期、雌激素受体(ER)等临床信息以及2个主要效应探针和6对交互作用探针的ARTEMIS评分模型。    
⚪测试阶段:
在3个独立的人群(GSE72245、GSE37754、GSE75067)中进行内部和外部模型验证。
⚪系统评估:
检索PubMed、MEDLINE、Web of Science、Cochrane Library等数据库,根据PRISMA和CHARMS指南进行系统评估。
最终纳入209篇满足条件的文献进行分析。
5.在线工具开发:
为了方便使用ARTEMIS模型,研究团队开发了一个在线工具,用户可以通过上传表观遗传生物标记物和临床变量的值来预测个体化的生存率。
图1技术路线
主要结果
1.ARTEMIS的风险分层能力
ARTEMIS 根据每个队列计算出的中位数评分将患者分为低风险和高风险组。
在训练集和内部测试集中,与低风险组相比,高风险组的患者生存率显著降低,且具有更高的危险比。
在两个外部测试集中也观察到ARTEMIS具有很好的风险分层能力。    
当根据ARTEMIS评分将患者分为5个不同的组时,随着评分百分位数的增加,患者的预期生存时间显著减少,同时死亡风险增加。
这一分层方法能够显著地区分不同风险级别的患者,为临床治疗决策提供了重要的预后信息。
图2按ARTEMIS评分分层的乳腺癌患者的Kaplan-Meier生存曲线
2.ARTEMIS的模型辨别能力
ARTEMIS 在训练集和内部测试集中准确预测了3年和5年生存率,并在所有测试集中展现了良好的预测能力。
在荟萃分析中,ARTEMIS 在训练集、外部测试集和合并数据中均展现了令人满意的准确性。
ARTEMIS 在训练集和测试集中展现了令人满意的C指数,这表明了模型整体的预测准确性。
综合C指数为0.803,进一步证实了ARTEMIS 在多个独立数据集中的预测性能和辨别能力。
图3ARTEMIS用于3年和5年总体生存预测的时间依赖性接收者操作特征曲线
3.ARTEMIS的模型校准    
ARTEMIS 在训练集和测试集中展现出了良好的校准性能,即模型预测的生存概率与实际观察到的生存概率非常接近。
不同数据集中的E/O比率都接近1,这进一步证明了模型的校准性能良好。
在合并数据中,3年和5年预测的E/O比率也都接近1,且在统计学上具有显著性,这表明ARTEMIS 在多个独立数据集中的预测结果具有高度的一致性和可靠性。
4.ARTEMIS的临床效果
ARTEMIS 在预测3年和5年生存率方面,比仅考虑临床和人口统计因素的基础模型具有更高的临床效用。
ARTEMIS 在3年和5年生存预测中,与基础模型相比,能够额外识别出更多的真阳性患者。
ARTEMIS 在所有干预方法中呈现更高的净降低率,意味着它能够减少不必要的临床干预,同时确保高死亡风险的患者不被忽视。
为了提高预测个体预后和识别高风险患者的能力,开发了一个列线图,用于估计3年和5年时间点患者生存。
    
图4决策曲线分析和ARTEMIS的列线图用于临床应用
5.ARTEMIS性能的敏感性分析
ARTEMIS 在多个亚群中展现了良好的风险分层能力,危险比跨越了一定范围,显示了模型的稳健性。
ARTEMIS 在不同亚群中3年和5年生存预测的AUC值均表现满意,进一步证实了其在不同患者群体中的适用性。
ARTEMIS plus 相比于ARTEMIS,在性能上没有显著提升,表明增加的替代内在亚型并没有提供额外的预测价值。
ARTEMIS plus 相比于基础模型plus表现更佳,强调了表观遗传生物标记物在预测中的重要性。
考虑到模型的性能和简洁性,原版的ARTEMIS 被认为是最优的选择。
6.通过系统评价比较ARTEMIS与现有模型
通过系统评价,研究者从多个数据库中筛选并分析了50,119项研究,最终确定了209篇适合数据提取的文章。    
大多数现有模型基于mRNA,而较少数基于lncRNA、miRNA或DNAmethylation。
许多研究未将临床信息纳入最终模型,这可能影响模型的临床适用性。
样本量在一些研究中不足,可能导致模型过拟合。
大多数研究使用传统的Cox比例风险模型构建预后预测模型。
几乎所有模型都在独立数据集上进行了外部验证,但只有少数模型在亚洲人群中进行了验证。
报告的预测准确性指标显示,不同模型在3年和5年生存预测的准确性上有较大差异。
图5使用四个数据库进行文献检索和选择的系统评价流程图
文章小结
该研究提出了一个独立验证的乳腺癌预后预测模型,该模型结合了具有主要效应和基因-基因相互作用的表观遗传生物标记物(ARTEMIS),并通过系统评价确认了其在预测乳腺癌患者总生存方面的优越性、可行性和实用性。将来,ARTEMIS需要在模型复杂性和成本之间取得平衡,通过简化其在临床环境中的实施来提高临床应用性,以增强乳腺癌的个性化治疗。这个模型构建稍有难度,复现路上有困难可以随时联系大麦!专业生信分析团队,十年分析经验,思路设计、个性化分析都不在话下,助力你的科研一路畅行!
大麦将持续为大家带来生信思路,满足您的花式需求!有课题设计或其它疑问都可以加微直接咨询!免费思路评估、 付费生信分析和方案设计以及付费投稿选刊等统统不在话下!

推荐阅读


大麦有话说

大麦还提供服务器租赁、思路设计、定制生信分析、文献思路复现、临床数据库挖掘;有需要的小伙伴欢迎直接扫码咨询大麦,竭诚为您的科研助力!

尔云间meta分析
分享meta分析学习方法、医学统计基础知识、meta分析软件操作技巧、SCI论文发表经验等精彩内容。
 最新文章