![]()
由于近期公众号推送机制改变,欢迎您在公众号首页将Boom Health设为🌟“星标”🌟,第一时间获取数字医疗行业的最新趋势和专家洞见!
以下内容整理自中国科学院杭州医学所人工智能首席科学家李晓林于2024远见数字健康年度大会的演讲目前,大模型技术已被广泛应用于各个领域。我将人工智能的发展定义为三个阶段:AI 0.1、AI 1.0和AI 2.0。50年代萌芽的人工智能是AI 0.1,80 年代的专家系统有真实的落地,而AI 2.0则是10多年前深度学习的兴起,大数据驱动的自编程自学习。大语言模型突破后,AIGC时代到来了,我们预测2024年才是AI 3.0。根据我们观察,人工智能的突破大约30年一个周期,刚好与计算平台的突破周期匹配, 50年代的大型机、80年代的PC、2010年左右的云计算和GPU。现在还是GPU时代,新一代的计算平台没有出来,估计要到 2040 年,可能是量子计算或神经计算平台,可控核聚变提供能源,所以我们把AI 3.0定在2040年,大约达到通用人工智能 AGI的水平。大模型出现 仅仅 5年的时间有了特别迅猛的变化,特别是ChatGPT诞生后,其影响力在生命科学领域尤为显著。![]()
在生命科学领域,我们遵循从基因到蛋白质的中心法则,每一步都有可以成药的机制。我们每个环节都做了一点工作,特别是核酸药物、个性化肿瘤疫苗和小分子、蛋白质等方面。今年,诺贝尔物理和化学奖授予了在AI领域做出杰出贡献的科学家们。这也预示了科学范式的转变,称之为“第五范式”,前四大范式是:实验、理论、计算、大数据,下一个就是 AI驱动的科学范式,尤其是生命科学。大语言模型是新一代人工智能的基石,人类的智商有创造力、有灵感,传承的载体都是语言,包括绘画、音乐、数学都是某种抽象的语言。在大模型出现之前具身智能根本不可能实现,有了大模型之后,具身智能也有了希望。第五范式完全是人工智能驱动的,就像AlphaFold一样,如果不是AI进入设计步骤,是不可能实现的。AI必须要深入到全流程的领域机制里面,才有可能充分创新。我们在做的AI驱动的大模型,可能需要10年时间来实现读懂生命的天书,把生命的每个阶段,从DNA到蛋白质建立生命科学的多模态超级大模型LifeStory。![]()
过去十年,我们在多个领域取得了一系列成果。2016年,我牵头在美国创立了首个深度学习中心 NSF CBL,两年前,我全职加入了中国科学院杭州医学所,之前是兼职,第九号员工。我们开展了一系列工作,我们做的 FoldingZero 零数据自折叠和AlphaFold时间差不多, DeepFolding 比 AlphaFold 早两年。我们的 CBL 中心是几个学校联盟,其中核心 PI 之一 Russ在2006年与深度学习之父今年诺奖得主Hinton 一同发表了第一篇深度学习文章。今年经济学人把中国说成科技超级大国,而且超过美国,高质量文章数量超过美国,虽然在很多领域高质量文章数量上遥遥领先,但是中国的生命科学还是相对落后的。在人工智能领域,生命科学几乎是最具挑战性的领域。人脑是一个超级模型,比目前最大的模型的参数量大约高 3-5 个数量级,要达到人脑的的复杂度还需要5-10年时间。目前,我们面临的一个紧迫问题是癌症和高死亡率,我们需要解决这些问题。其中,个性化肿瘤疫苗是一个重要的解决方案,它通过探索新抗原再设计mRNA 及递送的方法激活免疫系统来治疗肿瘤。还有CAR-T疗法是一个有效的方法但是局限于血液系统肿瘤。过去十年,我们也一直持续进行一系列工作,从靶点发现,结构预测到设计分子、做虚拟筛选、做临床,这是漫长而复杂的过程。![]()
个性化肿瘤疫苗的开发是一个复杂的过程,涉及到为每个人定制药物,包括递送、串联等多个步骤。一个mRNA疫苗上都是新抗原,新抗原复杂度非常高,我们想把将这些技术融合起来,以提高成功率。我们还做了抗菌肽、miRNA、Aptamer等工作。蛋白质设计涉及到了RNA、DNA,可以做探针、做药。我们能够预测RNA的二级结构和结合位点,对制药和成药性研究具有重要价值,并且已经达到了最佳精度,超过AlphaFold的效果,这在制药领域具有重要意义。多模态大模型将更有效释放Al解读单细胞的能力,我们做了单细胞多模态大模型,可以用于辅助诊断和治疗。我们还做了学术俱乐部生成式社交智能体,通过智能体的共创、共赢,提升全国的科研实力。![]()