话廿二 | 生物信息,再不AI就老了

学术   2024-10-10 22:42   江苏  


赛尔,你好。

这是生信家书的第二十二封。2024年诺奖周比以往来的晚一些,过去两年都是在国庆期间。虽然此生无缘诺奖,但是每年到这个时候,还是不免有一些小波澜,小期许:花落哪个领域、哪个方向、他/她怎样的英雄故事?

记忆中我和诺奖最近的一次是在南师大随园校区听丁肇中先生将他的宇宙不对称故事,当时给我留下最深刻的印象就是他说的:不知道。这让我对专注有了新的理解,他说:你要让我介绍我团队的工作,我可以滔滔不绝,知无不言,但是对于物理学的未来或其他物理学家的研究方向,我不知道,也没必要知道。

然后是在念大学的时候,国庆附近在学校门口的花圃廊街发香辣虾传单,路过旧书摊,刚好刷到当年的诺贝尔文学奖发布,就近买了一本她的《逃离》。

逃离,或许是旧的结束。或许是新的开始。或许只是一些微不足道的瞬间,就像看戏路上放松的脚步,就像午后窗边怅然的向往。一次次逃离的闪念,就是这样无法预知,无从招架,或许你早已被它们悄然逆转,或许你早已将它们轻轻遗忘。——2013诺贝尔文学奖得主艾丽丝·门罗

我们总是在此处,想着彼岸,在某个瞬间想象人生的另一种可能,尽管这种可能性很小。就像今年诺贝尔理综三门有两门,物理和化学办法给了人工智能在该领域的应用,一时间大家说:

  • 物理学不存在了
  • 诺贝尔重新定义了物理
  • 一百年前定义的学科范畴,已经不适用了
  • 今年是诺贝尔AI元年
  • AI for Science,Nobel for AI
  • 诺贝尔有数学奖了

等等,调侃归调侃,人工智能确实给科学带来了巨大的变化,这种变化不仅是人工智能在对应学科的应用上,也同步改变了物理、化学、生物学研究的范式。

之前我们做生物信息讲的是,走出还原论,在大数据时代下需要用数据驱动,从数据中学习。就拿单细胞生物信息分析来说吧,先测够数量的细胞,然后降维聚类,从数据中聚出来的簇中鉴定新的细胞类型。在我们做单细胞实验之前,可能根本不知道这里面有这个细胞类型。

让我们再进一步,当单细胞数据极大丰富的时候,数据驱动发现的力量就有限了。在有了大量数据垫底,人工智能算法就显得比较重要了,它不仅可以从数据中发现新的模式,还可以训练数据,学习数据,生成新的模式。

这将改变科学发现的传统过程。再结合生物信息本身是一门生物学、数学、计算机融合的学科,可以说在日常生物信息分析工作中,加入人工智能的时候到了。

当我们谈论生物信息的时候,一方面是生物信息的开发,这一部分人工智能的应用并不少,如单细胞的女娲模型、scGPT等,开发的课题组毕竟是少数。对大部分的生物信息分析团队来说,是用已经开发好的工具包。这一方面,对人工智能的应用是远远不够的,甚至对人工智能的到来感到恐惧:以后是不是要被人工智能替代了?

翻翻过去十年生物信息的基本培训和学习路径,从基因组到转录组到表观组到微生物组,从整体测序到单细胞测序,应用生物信息学的内容还是linux、R、Python、基于小样本量的生物统计,很少染指机器学习算法。可以说,我们对人工智能的拥抱是不够的,或者说,还在抱着侥幸心理,觉得人工智能比较高大上,目前还与我无关。

生命科学团队,从没有实验室到有实验室;从没有专职的生物信息人员,到有干湿分工;服务器从无到有;生物信息团队中是需要配备相应比例的人工智能选手了。

你的运来
20241010
于南京

单细胞天地
对应生信技能树论坛›研究热点›单细胞测序版块,力求全方位收集整理分享单细胞测序数据的应用,涵盖多种组学,多种疾病,发育机理,药物开发等等
 最新文章