之前我们反反复复提到过,差异分析如果想要看到泾渭分明的上下调基因,其实主要是靠生物学背景,比如癌症和正常组织那么肯定是有全局表达量差异,还有不同单细胞亚群之间的差异也很大,药物处理前后差异就具体情况具体分析了。
但是肯定是有很多场合,大家想找差异就会得到一定会非常的不明显的结果,比如病人按照治疗结局的好坏分组,再比如神经退行性疾病和正常人取血液看转录组差异就很小很小,这样的情况比比皆是,比如这个新鲜出炉的研究:
December 27, 2024《 Coupling of response biomarkers between tumor and peripheral blood in patients undergoing chemoimmunotherapy》 https://www.cell.com/cell-reports-medicine/fulltext/S2666-3791(24)00653-0
完美的说明了,免疫治疗的疗效分组在转录组表达量全局pca无法体现,那么按照疗效分组去找差异,也是非常勉强的!
但是最近学员反馈了一个明显是应该差异很小的实验设计,就是结直肠癌的取样部位的差异,居然在文献里面体现出来了一个很厉害的变化倍数!
其实早在2021就有一个单细胞转录组文献做了类似的实验设计,标题是:《Resolving the difference between left-sided and right-sided colorectal cancer by single-cell sequencing》,寄希望于3个病人的小样品数量的实验设计就想发现统计学显著的左右取样部位的差异,实在是有点“痴人说梦”了:
那么,扩大样品数量,就能发现统计学显著的左右取样部位的差异吗,让我们一起看看2020的数据挖掘文章:《Molecular Pathway Analysis Indicates a Distinct Metabolic Phenotype in Women With Right-Sided Colon Cancer》,针对4个公共的表达量芯片数据集,分别是:SE41258, GSE39582, GSE37892, and GSE14333,做差异分析,这样的话样品数量就很可观了 :
right-sided colon cancers (RCCs) (tumors arising between the cecum and proximal transverse colon) left-sided colon cancers (LCCs) (tumors arising between the distal transverse colon and sigmoid colon, excluding the rectum).
文献里面的作者给出来的差异分析基因信息如下所示,给人家的感觉是这些差异基因在两个分组的变化倍数都好厉害啊:
实际上,是一个迷惑人的科学计数法而已,一种表示非常大或非常小的数字的方法,它由两部分组成:一个介于1和10之间的实数(不包括10),以及一个10的整数次幂。这种表示法的一般形式为 ( a X 10^n ),其中 ( a ) 是尾数(mantissa),( n ) 是指数(exponent)。比如上面的表格里面的几个变化倍数值,科学计数法的表示如下:
如果你在处理数据时遇到科学计数法,可以按照上述方法将其转换为常规数字。在许多编程语言和电子表格软件(如Microsoft Excel或Google Sheets)中,科学计数法是默认的显示方式,用于处理非常大或非常小的数字。这些工具通常允许你更改显示格式,以便更直观地查看数字。
学徒作业
在GSE14333数据集里面,就有记录CRC病人的Left 和 Right 信息,可以做差异分析,如下所示的病人临床信息
> table(group_list)
group_list
Colon Left Rectum Right
1 3 122 39 125
需要大家提前CRC病人的Left 和 Right 两分组,然后针对表达量矩阵做一下差异分析,理论上就可以跟文章里面的基因的差异变化情况对比:
> tmp = deg[cg,c(1,2,4)]
> tmp
logFC AveExpr P.Value
DDX3Y -0.966001 6.009 0.01086
EIF1AX -0.008923 10.958 0.83996
EIF1AY -0.896070 5.745 0.02507
KDM5D -0.456692 6.377 0.05577
PRKX 0.200408 7.096 0.01245
PRKY 0.068115 5.742 0.29471
RPS4X -0.001388 12.669 0.93179
RPS4Y1 -0.928750 8.302 0.01148
TTTY15 -0.188674 5.407 0.15600
TXLNGY -0.672571 6.319 0.01919
USP9Y -0.342780 4.546 0.14667
UTY -0.009230 6.233 0.90776
XIST -0.146269 4.935 0.34220
ZFX 0.069649 7.703 0.25134