赛尔,你好。
这是生信家书的第二十七封。惟草木之零落兮,恐美人之迟暮。年末一天一天逼近,四季度的日子,总是紧巴巴的,不知道是不是天变短的缘故。工作之后,每一个四季度都与“冲刺”联系在一起,每个人都像拿着2024的接力棒,完成2024年的任务,看谁快速交到2025手上。这接力棒里面似乎隐藏着,我们关于2024年的所有答案,所有努力,所有进步,以及所有的不甘。
然而,每一年似乎都有一些待完成项,我们带着这样的未完待续走进新的季节。
单细胞测序自开发出来之后,不断拓展自己的边界,单细胞转录组、单细胞基因组、单细胞表观组、单细胞蛋白组,似乎bulk的所有组学,有可能:
用单细胞测序把bulk测序重新做一遍。
这两年单细胞测序技术的一个很大的变化是多组学:也就是在一个细胞内同时捕获不同的组学信息,如单细胞转录组+单细胞免疫组、单细胞转录组+单细胞表观组学,等等。多组学把单细胞技术带向了一个新的阶段,随之而来的生物信息学挑战是:如何将单细胞不同组学整合在一起。这个问题之前是:如何把不同样本的单细胞数据整合在一起。
如果单细胞测序能做的只是把bulk测序做一遍,得到大量的细胞类型特异的基因表达调控网络。那么,单细胞测序的革命性就没那么强了。在单细胞测序技术出现的早期,还有一种观点,认为:
把类似TCGA这样bulk的数据库,用解卷积的方式得到里面的单细胞比例,这样就不用做单细胞测序。
尽管解卷积作为一种方法,确实能从bulk的数据中解卷积出细胞类型的比例,但是更多的分析是解卷积做不了的,如,拟时序分析、细胞类型特异的基因调控网络分析、细胞通讯分析等。
在这个角度上,尽管单细胞数据分析借鉴了很多bulk的数据分析方法,但是单细胞测序出现之后,确实出现了很多单细胞数据独特的数据分析方法,丰富了我们看待数据的视角。与此同时,单细胞的高级或个性化分析越来越标准化,让我们不得不再次思考单细胞测序的核心价值。
单细胞测序到底有什么用?
这个问题之前在不同的科普作文中,经常借用生态学的概念:
who is there 细胞类型注释与发现 what are they doing 细胞轨迹与通讯 what have really happened 通路与调控
为什么要回答这三个问题?这个是细胞生物学的基本问题之一。离开单细胞测序能不能回答这三个问题,能,但是单细胞测序也可以很好地回答之。
那么,到现在这三个问题被完全回到了么?还没有,所以,细胞生物学依然需要单细胞测序。
领略单细胞测序的美,然后超越它,单细胞测序的边界,不应该是bulk。单细胞测序可以把bulk能做的全做一遍,但是他还能做bulk做不了的事情。这是单细胞测序,除了分辨率之外的,对bulk测序的超越。其中一个是单细胞测序数量上对bulk的超越:这为大模型应用于细胞生物学提供了新的可能。
抱着不断突破的心态,我想单细胞测序在如下几个方面还可以进一步拓展:
单细胞与结构生物学。现在的单细胞多组学,基本上是做定量的,对不同组学信息计数定量,分析结构的很少,如全长转录本。 单细胞与基因扰动。尽管有零星的方法学文章发表,单细胞的CRISPR在实验室中使用的门槛还比较高。 单细胞的QTL。单细胞测序本身是把表型与基因表达机制联合在一起,但是高通量的单细胞数量遗传性状方案,从样本方案设计到数据分析都不完善。
单细胞泛癌,这个在2020年以前感觉还是遥不可及,这两年已经如雨后的春笋了。
坊间有传闻,单细胞测序已经是“旧时王谢堂前燕,飞入寻常百姓家”了,似乎已经从阳春白雪,变成了下里巴人。那么,在这个单细胞计数框架内,还有没有新的“堂前燕”和“阳春白雪”呢?
这里借用《论语,子张》谬聊一番。
叔孙武叔语大夫于朝曰:“子贡贤于仲尼。”子服景伯以告子贡。子贡曰;“譬之宫墙,赐之墙也及肩,窥见室家之好。夫子之墙数仞,不得其门而入,不见宗庙之美,百官之富。得其门者或寡矣。夫子之云,不亦宜乎!”
翻译成白话文是这样的。
有人说:“子贡比孔子还要贤达”。子贡说:“我的贤达只是如普通小院围墙那么高的水平,所以大家能看得到院子里面的花坛草坪,以为很好。孔子老人家的水平是皇宫高墙,如果找不到门进去,只能站在墙根,你就看不见里面宗庙的富丽堂皇,和房屋的绚丽多彩。”
玩高阶的,才能体会到高阶玩法的乐趣。不玩,自然是不好玩的。
你的运来
20241114
于南京