主题
Future of Agent:基础模型与智能体的前沿探索
时间
北京时间 2024.12.21 10:30-12:00
纽约时间 2024.12.20 21:30-23:00
分享
为数字智能体构建未来的游乐场 - Shuyan Zhou 语言智能体: AI智能体的新范式 - 谷雨 融合基础模型与符号计算实现自动规划 - 陈勇超
讨论
目前academia对智能体的研究有哪些方向? 关于什么是智能体和什么是多智能体感觉一直有些争议, 什么是智能体,什么是大模型多智能体系统?比如 MoE 这种算不算,Reward Model+MCTS 这种算不算? 目前的很多智能体的工作都是基于role play和prompt的,未来的技术突破会是什么?我们需要的技术突破是什么? 大模型的落地应用看好什么样的场景?落地的技术瓶颈是什么?
1. 为数字智能体构建未来的游乐场
个人简介
Shuyan Zhou,将于2025年秋季加入杜克大学计算机科学系,担任助理教授。她在卡内基梅隆大学(CMU)师从Graham Neubig完成了博士学位。目前,她是Meta GenAI的一名研究科学家,致力于多模态智能体的研究。
主页:https://shuyanzhou.github.io
摘要
虽然能够代表人类使用计算机完成任务的大型语言模型(LLM)智能体令人振奋,但一个核心问题仍然存在:“它们到底有多好?” 一个主要挑战是缺乏包含多样化复杂任务并具备功能正确性验证的现实基准测试。
在这次简短的演讲中,我将讨论我们在构建此类基准测试并将其扩展到更广泛场景方面所做的努力。最后,我将重点介绍该领域的一些开放性问题,特别是关于评估方法和数据稀缺性的问题。
2. 语言智能体: AI智能体的新范式
个人简介
谷雨,俄亥俄州立大学博士生,曾任微软研究院(MSR, Redmond)研究实习生。主要研究方向为语言智能体,尤其关注语言能力对通用智能的塑造和影响。以第一作者身份获得过ACL及COLING的杰出论文奖(Outstanding Paper Award)。
主页:https://entslscheia.github.io
摘要
一直以来,能够自主与环境交互并完成决策,从而协助人类应对各种复杂任务的通用智能体(generalist agents),始终是人工智能研究的终极愿景之一。从最早基于人工专家规则的智能体,到能够通过强化学习自主适应环境的智能体,均体现了研究者们在这一方向上的持续探索。然而,传统方法在通用性和泛化能力方面始终存在显著局限性。近年来,大模型凭借其卓越的通用性和强大的语言能力,为通用智能体的发展带来了全新的研究范式。在本次报告中,我们将深入探讨语言智能体(language agents)这一新范式的潜力和实现路径。同时,我们也将从更广阔的视角探讨语言能力在人类认知和人工智能演进中的特殊地位及影响。
3. 融合基础模型与符号计算实现自动规划
个人简介
陈勇超,哈佛大学工程与应用科学学院(SEAS)和麻省理工学院信息与决策系统实验室(MIT LIDS)电气工程专业的博士生。他在麻省理工学院师从Chuchu Fan教授和Nicholas Roy教授,研究基于基础模型的机器人规划,并由哈佛大学的Na Li教授共同指导。他还在进行物理与材料领域的人工智能研究,特别关注将机器人技术和基础模型应用于AI科学领域。陈勇超于2024年夏季在微软研究院实习,自2023年春季起与MIT-IBM Watson AI实验室展开合作。
主页:https://yongchao98.github.io/YongchaoChen
摘要
尽管最先进的语言模型(如GPT-4o和O1)在解决涉及逻辑、几何、迭代和优化等复杂约束的任务时依然面临挑战,单纯依靠文本输出生成规划的做法较为常见,但我们强调融合符号计算以提升通用规划能力的重要性。通过将大型语言模型(LLMs)与符号规划器和求解器结合,或引导LLMs生成规划代码,我们使其能够解决真实与虚拟机器人中的复杂决策任务。这一方法可应用于多种场景,包括无人机和机械臂的任务与运动规划、旅行行程规划、网站智能体设计等。
主持人
华文越,UCSB博后在读,主要和William Wang老师合作,Rutgers-New Brunswick博士毕业,师从张永锋老师。曾任百度研究院、腾讯AI Lab,Amazon AWS和Microsoft Research的research scientist实习生。主要科研方向包括llm agent的safety、efficiency、multi-agent interaction,和llm reasoning。在NLP和ML顶会上发表多篇论文,
主页:https://wenyueh.github.io
NICE国际主页
https://nice-intl.github.io
入群
欢迎加入NICE每周分享交流群,可与NICEer唠嗑,以及第一时间收到后续NICE分享报告的通知。加群通过小助手认证,群内无广告。