昨天,哈佛医学院Marinka Zitnik通讯在《Cell》发布perspective“Empowering biomedical discovery with AI agents”,对生物医学人工智能(AI)智能体提出了全面的观点,设想它们是能够增强生物医学研究的系统。
生物医学AI智能体分为基于大型语言模型(LLM)的智能体和多智能体系统。基于LLM的智能体,例如用单个LLM编程以执行各种角色的智能体,可以访问工具并模拟人类专业知识。例如,在临床医学问答中,给GPT-4赋予特定角色可以在多项选择题基准测试的准确性方面优于特定领域的LLM。另一方面,多智能体系统由异构智能体组成,对整个生物医学更具适用性。其中包括产生广泛研究思路的头脑风暴智能体、收集并提供专业知识的专家咨询智能体、呈现对比观点的研究辩论智能体、做出协作决策的圆桌讨论智能体以及优化发现工作流程的自动驾驶实验室智能体。
生物医学中的AI智能体被分为四个自主水平等级。在0级时,机器学习模型提供辅助但不形成假设。1级智能体作为助手,形成简单假设并使用有限的工具集。2级智能体作为协作者,根据数据趋势生成假设,并使用更广泛的工具进行假设检验。3级智能体作为科学家,可以生成创造性的、全新的假设,并开发实验方法以实现持续学习。
AI智能体的构建涉及几个关键模块。感知模块使智能体能够理解并与环境交互,整合了诸如文本、图像和视频等各种数据模式。对话模块允许自然语言交互,促进与科学家的沟通。多模态感知模块通过将不同的数据类型与LLM对齐,进一步增强对环境的理解。交互模块支持智能体-人类、多智能体以及工具使用交互。记忆模块,包括长期和短期记忆,对于存储和检索信息至关重要,而推理模块则有助于规划实验和对假设做出决策。
这些智能体有可能影响生物医学研究的各个领域。在虚拟细胞模拟中,它们可以预测基因修饰或药物治疗对细胞行为的影响。在表型的可编程控制方面,它们可以设计精确的基因修饰。在细胞信号回路设计中,它们可以优化基因组件的排列。此外,它们还可以为新疗法的开发做出贡献。
然而,有几个挑战需要解决。稳健性和可靠性问题,例如不可靠的预测以及对输入的敏感性,构成了进一步发展的障碍。评估协议需要考虑准确性之外的多个因素,并且数据集生成需要大型、开放和全面的数据集。AI智能体的治理很复杂,涉及伦理、监管和安全考虑。尽管存在这些挑战,生物医学AI智能体的前景是有希望的。通过确保符合情境和用户特定的行为,并通过适当的治理和负责任的人类-AI伙伴关系,这些智能体可以在生物医学研究中释放其变革潜力,最终改善人类健康和福祉。
https://doi.org/10.1016/j.cell.2024.09.022