超越人类科学家!OpenAI推出首个生物模型,效率提升50倍,携手清华干细胞大佬逆转衰老!

文摘   2025-01-20 18:45   四川  


人工智能将蛋白质研究推进到了新的阶段,摘下诺贝尔奖桂冠的Alphafold,更是成为AI for Science的代名词。


就在上周,OpenAI也推出了自己的蛋白质大模型,向着AGI又进了一步。


该模型名为GPT-4b micro,基于大语言模型(LLM),在来自许多物种的蛋白质序列和互作信息上训练,重新设计蛋白质以增强其功能,是OpenAI首个专注于生物数据的人工智能模型。


虽然该模型尚未正式发布,但在与抗衰老公司Retro Biosciences的合作中表现优异,研究人员称其改造后的特定蛋白的效率提升了50倍以上,“比科学家产出的蛋白质更好”。


从入场时点来看,OpenAI明显晚了很多,不过从实际效果来看,这一后来者的首秀颇为惊艳。


利用AI破解生命科学难题,是AI应用领域中想象空间最大、商业价值最高的细分赛道之一,吸引黄仁勋、比尔盖茨、扎克伯格等一众科技界大佬投身其中。


而OpenAI的入局,再次验证了AI在生物领域的广阔潜力,掌舵人Sam Altman也早已押下重注,以个人身份投资多家AI制药公司。


站在人工智能与生物科技的交汇点,一场技术创新的激烈角逐已然拉开帷幕,在科技巨头们的持续推动下,AI引领的生物学革命正在加速进行。


Alphafold劲敌?GPT4立大功


从命名上不难看出,OpenAI推出的生物模型正是GPT4的衍生版本,基于大语言模型结构。


不同的是,GPT-4b micro被设计用于处理特定数据集的专门任务,它输入的不是一般人类的语言,而是“蛋白质语言”。


如果我们把蛋白质序列当作一段话,那么氨基酸就可以类比为其中的单词,与人类语言具有规律一样,具有特定性质的蛋白质,其序列也表现出相关性。


这就使得蛋白质序列也成为LLM的绝佳分析样本,由此发展出蛋白质语言模型(PLM)。



与DeepMind的Alphafold所依赖的多序列比对(MSA)方法相比,PLM往往在预测效率上具有很大优势,更适合大规模预测任务。


此前,一些蛋白质语言模型已崭露头角,例如Meta推出的ESM-1、ESM-2,被认为是Alphafold的有力竞争者。


实际上,作为 OpenAI 倾力打造的最新一代语言模型,GPT-4 在蛋白质预测领域展现出的潜力,也早已进入科学家们的视野。


2023年11月,微软研究院的AI4Science部门和Azure量子计算部门发表了一篇长达230页的报告,其中提到GPT-4对“蛋白质语言”的理解和推理能力。


去年8月,一篇发表在Nature上的文章指出,GPT-4能够对氨基酸、多肽和蛋白质结构进行一定程度上的建模。


在GPT-4的基础上,GPT-4b micro进行了进一步开发,尤其是针对大量蛋白质序列以及蛋白质互作信息进行了训练。


随后,科学家通过提供一系列带有答案的示例来向聊天机器人提问,这一策略类似少样本学习(Few-shot Learning),能够引导任务模式、增强准确性。


结果发现,区别于理性设计和突变库筛选等效率低下的传统方法,GPT-4b micro能够帮助改造和设计更加理想的蛋白质提供有效指导。


在与Retro Biosciences的合作,科学家就根据GPT-4b micro的建议成功对‌Yamanaka 因子‌(一种关键的抗衰蛋白质)进行了重新设计,改造后的蛋白效率提升了50倍以上。


对于这一结果,研究人员惊叹道:“总体而言,这些蛋白质似乎比科学家自己设计的蛋白质更好。”


据悉,GPT-4b micro的主要开发人员有三人:OpenAI的John Hallman、Aaron Jaech以及Retro Biosciences的Rico Meinl


图:从左到右分别为ohn Hallman、Aaron Jaech、Rico Meinl

John Hallman本科毕业于普林斯顿大学,曾就职于谷歌、AKASA(A16z投资的一家AI医疗公司,用大语言模型自动化管理医疗保健文书),去年3月刚加入OpenAI。


Aaron Jaech博士毕业于华盛顿大学,曾就职于苹果,后来加入OpenAI,是OpenAI o1模型的贡献者之一。

Rico Meinl则是Retro Biosciences的应用人工智能主管,曾为时尚科技初创公司dresswell的联合创始人兼首席技术官,之后在多家公司担任机器学习工程师。


不过,OpenAI目前还没有想好以什么形式发布GPT-4b micro。“是以单独的模型面世,还是融入到我们主要推理模型中,这还有待确定。


清华大牛创立抗衰公司


GPT-4b micro的破圈,让Retro Biosciences再一次进入到公众视线之中。


对于国人而言,对Retro Biosciences的第一印象,往往与清华大学药学院前院长丁胜联系在一起。



作为干细胞与再生医学领域的顶尖科学家,丁胜曾为加利福尼亚大学旧金山分校药物化学系教授,于2015年回国筹建清华大学药学院并担任创院院长。


如何创造生命、维护生命、延长生命,是丁胜数十年的科学生涯来最重要的科研工作。


2022年6月,丁胜团队首次发现了全能干细胞的体外定向诱导及其稳定培养的药物组合,这种以非自然方式创造生命起点的发现,是生物学领域的一个“圣杯”。


这项成果有多震撼,也许清华大学给出的描述更为生动形象:“在未来,不止像小说中孙悟空身上的毫毛,动物身上的血液、皮肤等任何一处体细胞,都能通过重新编程为多能干细胞,进而‘用药’后成为能够独立形成生命的全能干细胞。”


这一发现成为再生医学领域的里程碑事件,对于实现人体器官的体外再生以及创造或复原生命有着重大意义。


后来丁胜在一次公开演讲中表示,“为什么制药领域没有诞生万亿市值的公司?一个原因在于这个领域的产品(药物)不可连续迭代。”


他进一步表示,对通用型的诱导的多能或者全能细胞作为单一原料进行底层的基因编辑,使得细胞产品出现了可以迭代的场景,未来10—20年或许会出现万亿市值的医药公司。


2022年,丁胜与Joe Betts-LaCroix 、Matt Buckley共同创立了Retro Biosciences,这家位于加州的生物科技公司,致力于将人类健康寿命延长10年。



与一般的生物科技公司不同的是,Retro Biosciences并不专注于一个特定平台或目标,而是布局了造血干细胞重编程(HSC Reprogramming)、自噬增强(Autophagy Enhancement)、小胶质细胞治疗(Mcroglia Therapeutics)、组织重编程(Tissue Reprogramming)四大路径。


公司成立之初,便获得了来自Sam Altman的慷慨解囊——1.8亿美元的投资。


而这笔大额投资,也让Sam Altman顺理成章地具有极大话语权,据悉,Retro Biosciences董事会只有Sam Altman和Joe Betts-LaCroix两个人。


Joe Betts-LaCroix表示,他每周都会与Altman会面一次,讨论Retro Biosciences的得失并制定策略,而Altman也总是能为此抽出时间。


也正是Sam Altman的身影,让此次OpenAI与Retro Biosciences的合作并不让人惊讶,信息显示,针对GPT-4b micro的开发,双方合作已有一年之久


针对公司未来运营计划,Joe Betts-LaCroix表示,将利用Altman的资金撑到2030年左右。然后考虑上市或者寻找更多的投资者。



—The End—

推荐阅读

智药局
了解和投资中国合成生物、AI制药的重要信源
 最新文章