还在靠传统meta分析思路发文章?新套路更容易赢!

文摘   2024-11-01 19:02   上海  

         

 


大家好,小伙伴们最近有没有发现大麦给大家分享的高分文章都不仅仅单纯的meta分析思路。没错,大麦最近发现meta分析+其他分析方法逐渐成为了近两年的爆点。今天大麦分享的这篇文章采用公共数据库中获取相关基因和数据,进行Meta分析、代谢表型分析以及转录组学相结合的方法,对代谢标志物能否提高早期肝细胞癌的诊断效果进行了研究。PS:如果你也有想利用Meta方法发表高分文章的想法,但不知道如何入手,快来扫码联系大麦吧!大麦这里有无数高分文章套路可复现!)

定制生信分析

云服务器租赁

(加微信备注99领取试用)

l题目:Metabolic phenotyping combined withtranscriptomics metadata fortifies the diagnosis ofearly-stage Hepatocellular carcinoma

l代谢表型分析与转录组学元数据相结合,可强化早期肝细胞癌的诊断    

l杂志:J Adv Res

l影响因子:IF=11.4

l发表时间:2024年9月  

公众号回复“123”领取原文PDF,文献编号:20241101

       

 

研究背景

肝细胞癌(Hepatocellular carcinoma,HCC)是一种原发性恶性肿瘤,占所有原发性肝癌的75%以上,然而,对早期HCC(early-stage HCC,eHCC)的检测方法尚未形成统一标准。由于肝癌的特征是代谢相关基因改变,肝硬化等慢性肝病(病毒性、酒精性和非酒精性肝病)是HCC发病率的主要驱动因素,因此需要很好地解决代谢物水平变化与HCC发展之间的相关性检查。因此研究人员通过将基于多种液相色谱-质谱的代谢组学平台应用于肝硬化和eHCC患者的血清,以及一组没有肝病临床病史的正常对照来全面分析和量化代谢物,通过对来自公共来源的非常早期HCC的转录水平表达进行meta分析,然后寻找所选代谢物中疾病相关改变的证据。最后,使用交叉验证来评估相关代谢物的诊断潜力,然后对验证队列进行检查。

数据来源

1.公共数据库

数据集/队列

数据库

数据类型

GSE6222

GEO

RNA-seq数据

GSE62232

GEO

RNA-seq数据

GSE6764

GEO

RNA-seq数据

GSE14520        

GEO

RNA-seq数据

GSE99807

GEO

RNA-seq数据

GSE101685

GEO

RNA-seq数据

GSE19665

GEO

RNA-seq数据

GSE76427

GEO

RNA-seq数据

GSE89377

GEO

RNA-seq数据

GSE36376

GEO

RNA-seq数据

MTBLS8764

MetaboLights

代谢组学数据

2.个人数据

训练集基于一项正在进行的鉴定HCC生物标志物的研究,包括2014年2月至 2017年6月期间在首尔国立大学医院(韩国首尔)诊断的34名eHCC患者和47名肝硬化患者。此外,它还包括2014年4月至2014年5月期间在首尔大学医院医疗保健系统江南中心(韩国首尔)接受体检的37名健康对照。

验证集包括50名eHCC患者和59名肝硬化患者,这些患者来自一项独立研究,该研究评估了2011年9月至2017年11月期间HCC的蛋白质组学分析。

研究思路

通过应用基于多重液相色谱-质谱( LC-MS )的代谢组学平台对肝硬化和eHCC患者以及一组没有临床肝病史的正常对照( NC )的血清进行了全面的代谢轮廓和定量。然后通过对公共来源的极早期HCC转录本水平表达的meta分析,寻找与疾病相关的代谢物变化的证据。最后,采用交叉验证评估相关代谢物的诊断潜力,并对验证组进行检验。             

 

主要结果

对照组和早期HCC组之间的转录组学数据集的meta分析

为了研究转录组在HCC中的表达,研究人员将HCC的GSE6222,GSE62232,GSE6764,GSE101685和GSE89377与非HCC对照的肝组织进行了比较,而GSE99807,GSE19665,GSE14520,GSE76427和GSE36376与配对的邻近非肿瘤组织进行了比较。对预处理后的数据进行Meta分析,得到每个基因的合并效应量(ES),作为合并效应量的估计值。当合并ES的绝对值大于1.000且log大于2.000时,该基因显著过表达或低表达。     

 

图1A 显示了7个Affymetrix微阵列GEO数据集meta分析数据的火山图,在Affymetrix合并效应估计中,951个基因显著富集(结合ES > 1和σ logFDR > 2),而在极早期HCC组中,702个基因显著缺失(结合ES < - 1和Λ log FDR > 2) (图1A )。图1B显示了三个Illumina微阵列GEO数据集meta分析数据的火山图。在Illumina中,1712个基因在极早期HCC组中显著富集,而382个基因在极早期HCC组中显著下调(图1B )。         

 

图1C显示了meta分析数据中得到的差异表达基因的数量。两个合并效应估计共享了464个富集基因和260个缺失基因(图1C )。         

 

    

没有一个基因在相反的方向上显示出明显的倍数变化。通过Affymetrix混合估计的所有DE基因的网络分析确定,大多数途径与内源性代谢物的代谢有关(图1D )。同样,Illumina混合估计显示了一致性,强调了代谢物水平变化的可能性(图1E)。         

 

过表达分析中代谢相关通路(p值小于0.05)在Affymetrix中为26个,在Illumina混合估计中为18个。

转录组元分析所用数据集的特点总结

         

 

 

A.7个Affymetrix微阵列GEO数据集meta分析数据的火山图。B.三个Illumina微阵列GEO数据集meta分析数据的火山图。C.从meta分析数据中得到的差异表达基因的数量。红色表示在癌症组中表达增加,而蓝色表示表达减少。D.从7个Affymetrix微阵列GEO数据集的meta分析数据中通过差异表达基因进行网络分析。E.从三个Illumina微阵列GEO数据集的meta分析数据中通过差异表达基因进行网络分析。对于D和E,粉红色的循环表明与内源性代谢物代谢相关的途径。         

 

文章举例:Machine learning-driven blood transcriptome-based discovery of SARS-CoV-2 specific severity biomarkers

这篇文章也是采用在SARS-CoV-2感染患者转录组数据集中,通过meta分析区分健康个体和患者的基因标志物。    

         

 

文章小结

甲胎蛋白的低敏感性使其不适合作为早期肝细胞癌监测的独立标志物,这篇文章的选题为肝癌早期,角度贴合临床,采用meta分析代谢表型分析以及转录组学相结合的方法,结合自己的样本,干湿结合,本身就是将科研方法进行了模块化,不同的方法进行组合,数据量也很充实,真的是套路满满啊,拿下了11.4分+的高分真是实至名归。感兴趣的朋友,码住这个思路行动起来吧!(如果你也有meta分析问题需要解决,记得找大麦哦,尔云间meta分析团队提供技术解答、分析、选题等服务,有需要扫码找大麦哦~)

推荐阅读


大麦有话说

大麦还提供服务器租赁、思路设计、定制生信分析、文献思路复现、临床数据库挖掘;有需要的小伙伴欢迎直接扫码咨询大麦,竭诚为您的科研助力!

尔云间meta分析
分享meta分析学习方法、医学统计基础知识、meta分析软件操作技巧、SCI论文发表经验等精彩内容。
 最新文章