a16z:AI伴侣的崛起

财富   2024-11-22 11:20   上海  

新一代人工智能 NPC 正在兴起。我们请教了三位最前沿的开发人员,以帮助我们了解未来发展方向。

自视频游戏行业诞生以来,游戏开发商一直在努力创造更令人信服的 AI 伙伴和敌人以供玩家互动。
太空侵略者让玩家大吃一惊,因为一波波外星敌人的行动方式难以预测。吃豆人的每个幽灵追击者都有不同的运动逻辑,引发惊心动魄的追逐。
到了 80 年代,游戏开发商开始将特别困难的敌人 AI 包装成人类形象,例如 1987 年 NES 游戏《迈克泰森的拳击!》中的最终 Boss 就是迈克泰森。

2014 年,迈克·泰森在《今夜秀》直播的迈克·泰森拳击赛中试图击败自己。他没能打满八个回合。

随着行业的发展,人工智能变得越来越复杂。在《光晕》(2001 年)中,玩家与人工智能士兵一起冲锋陷阵,这些士兵可以驾驶车辆、寻找掩护并大声喊出他们的计划。在《半条命 2》(2004 年)中,Alyx Vance 不仅凭借她的对话赢得了玩家的心,还凭借她对玩家动作和周围环境中发生的事件的可信和动态反应赢得了玩家的心。
但即便是最逼真的游戏敌人、同伴和中立 NPC 也总是有局限性。无论角色变得多么复杂,他们最终还是要受制于预先编写的脚本、行为树和触发器。
“这些系统是基于规则的,” Inworld AI的人工智能游戏工程总监 Brian Cox 说,“这意味着它们依赖于预定义的模式,这些模式使得交互感觉一致,但有时会限制其深度。”
但现在,由于生成式人工智能和LLM的进步,我们有机会制造出更加智能、更具互动性的人工智能伴侣。
这是我们 A16Z GAMES 团队在过去一年中着迷的一个趋势——我们在Substack的首版介绍过了Altera 的博士和他们的下一代 Minecraft AI,可以再翻阅一下。看来我们正走向一个数字世界充满令人信服的类人角色的未来。
我们已经开始在《天鹅座企业》等游戏中瞥见这样的未来,这是网易游戏最近推出的一款游戏,为玩家提供了一个由 LLM 驱动的俏皮、搞笑的机器人伙伴 PEA。
PEA 能够响应玩家的语音命令,随意聊聊游戏中的传说,甚至观察环境以告知或警告玩家游戏状态。
“我喜欢与机器人伙伴一起工作,因为它们让我们能够探索古怪、夸张的个性,同时又不超出可信度的范围,”天鹅座企业号的首席程序员考克斯说道
Cygnus Enterprises是一个令人印象深刻的开始,但考克斯对他未来在 Inworld AI 的工作寄予更高的期望。
真正的人工智能同伴应该感觉自己有自己的目标和意图,而不仅仅是玩家的延伸,”考克斯说。“目前,很多脚本都是为了创造自主的幻觉,但有了生成式人工智能,我希望我们能看到真正让玩家感到惊讶的同伴,它们会采取独特的方法解决问题,甚至挑战玩家的行为。”

下一个层次:可通用的人工智能代理

如果游戏中下一代人工智能代理的下一个里程碑是令人信服的角色,那么超越这一水平的水平就是人工智能代理能够像人类一样学习如何玩任何游戏。
这是nunu.ai联合创始人 Jan Schnyder 目前正在追求的雄心勃勃的目标之一(披露:nunu.ai 是 A16Z GAMES SPEEDRUN 旗下公司)。
正如施奈德所说,他们的目标是建立一个由多个模型组成的框架,该框架可以读取诸如“去最近的树并砍树”之类的文本指令,并将该指令转换为任何游戏中的动作。
这听起来相当困难,施奈德也承认这是一个挑战。
“由于我们的代理像人类一样玩游戏(通过查看屏幕并按下键盘和鼠标按钮),因此它能够采取的行动受到限制,”施奈德说。例如,他说,这些模型目前在空间推理方面存在困难,比如理解物体的相对位置或阅读地图。
“我们目前的代理就像我们的小弗兰肯斯坦怪物,由针对每个任务的各种特定领域的子代理组成,”Schnyder 说。“未来,随着基础模型的不断完善,我们相信(希望)人工智能将实现端到端,从而实现更简单的架构。”
Schnyder 说,他的团队在训练 AI 玩游戏时经常会遇到意想不到的功能障碍。“代理行为在很大程度上取决于底层模型,”他说。“我们看到的最有趣的例子之一是当我们试图让基于 Claude 的代理玩 Minecraft 时:一项任务是杀死一只羊以获取羊毛,但它会直接拒绝。它总是坚持使用剪刀,因为它认为杀羊获取羊毛是不道德的。”
但其他实验的进展更好。
例如,nunu.ai 的代理在游戏世界中接受训练后,在实体机器人身体中表现得出奇地好。(请观看“抢劫机器人”的视频。)
nunu.ai 团队将他们的一个 AI 代理(仅在虚拟环境中接受过训练)转移到现实世界的机器人身上,它能够成功导航。来源:X 上的 Jan Schnyder

“从游戏入手让我们领先一大步,”Schnyder 说道。“游戏环境让我们能够创建代理并执行操作,而这些操作在现实世界中还得等上几年才能实现。这是因为我们可以‘调整’物理和环境,从而帮助代理解决它们目前还不够好的领域。”

施奈德希望,通过这种从虚拟到现实的训练过程,机器人技术(例如复杂物体操纵)等领域能够很快取得更多进展。

“在游戏中拾取物体非常简单——你只需按下交互按钮即可,”Schnyder 说,“但在现实生活中拾取物体非常困难。目前还没有足够强大的低级操纵策略可以为机器人拾取某种物体。这是机器人许多轨迹的巨大瓶颈。”

SideBar:拍马屁!和即兴表演吸血鬼

通过将游戏中的 NPC 连接到大型语言模型,他们摆脱了老式对话树的限制,并出现了更多的即兴可能性。

也许没有比Suck Up!更好的例子了,在这款游戏中,你扮演一个吸血鬼,试图欺骗无辜的 LLM 镇民,让他们欢迎你进入他们的家。游戏使用玩家的声音作为输入方式,对于你能说什么没有任何真正的限制。相反,你只能边玩边想。结果,创作者们在 YouTube 上发布了大量玩这款游戏的搞笑视频

“我亲自观看或加入过一千多个直播,每次直播都给我留下深刻印象,” Suck Up!的开发者 Proxima 的创意和游戏设计主管 Nick Zak 说道。 “无论是他们的服装选择方式,还是他们的开场白,还是他们在游戏中遇到的邻居的古怪个性,正是这种‘是而又’的即兴元素带出了游戏的内在幽默,让每一次体验都感觉新鲜。”

nunu.ai 团队取得进展的另一个领域是 AI 可解释性——让玩家或观众更容易理解 AI 代理的“思维过程”。

正在播放和流式传输《Pokémon Emerald》的 nunu.ai 代理会保存一份清晰的日志,显示其当前目标以及支持其游戏内行为的“推理”。

对于人类目击者来说,下一代人工智能的行为可能会让人感到困惑,甚至不安。他们为什么要采取他们选择的行为?幕后到底发生了什么?

这是施奈德充满希望的领域。如果智能体能够扮演不同的角色,并恰当地传达模拟情绪,而不是简单地解释其推理,那会怎样?

施奈德表示,未来“代理将能够告诉你游戏的某些部分是令人恐惧、沮丧还是有趣。游戏就是关乎感觉的。”

至少,这是我们希望的:人工智能技术越先进,游戏就越能给我们带来更深层次的感受,而不是机器人角色。


Tips:什么是NPC

共识流通处
与真知灼见共鸣,于流通之处达共识
 最新文章