Part 1
引言
6月19日,《永劫无间》手游在“定胜终测”中引入了全新的“游戏Copilot”功能。这项创新由24工作室与网易伏羲实验室合作开发,依托先进的AI大模型推理技术,为玩家提供一个能够实时交流、理解指令,并在战斗中自主执行任务的全能AI队友。这一突破不仅丰富了单机游戏体验,也为SOLO玩家解决了寻找队友的难题。
7月25日,《永劫无间》手游正式开启公测,公测版本新增3V3团队论剑等娱乐模式,以及新武器和新角色,丰富游戏内容。AI队友也进行了升级,不仅能智能响应玩家命令,还能进行沟通和趣味对话,配合独特音色,提供更加优秀的游戏体验。
通过这一功能,玩家不仅能够享受到更加智能化的游戏体验,还能在没有真人队友的情况下,获得强大的辅助支持。
其实,AI Copilot借鉴了飞行中副驾驶员的概念,旨在让AI作为副手,辅助人类在各种场景中完成任务。近年来,随着AI技术的迅猛发展,特别是大型语言模型和深度学习技术的应用,使得AI Copilot能够更深入地理解和模拟人类行为,并在游戏场景中实现智能化辅助。许多研究机构也在尝试将AI Copilot与游戏相结合。
从《永劫无间》AI Copilot的实际落地出发,本文将探讨AI游戏助手在游戏领域的实际应用,从单一垂类游戏的AI训练到多模态和泛化游戏能力的AI模型,深入了解AI如何成为玩家的得力助手,成为游戏世界的“最强辅助”。
Part 2
永劫无间的AI Copilot
《永劫无间》"游戏Copilot”新功能的推出,无疑是AI+游戏的一大创新。从亮点到挑战,再到未来的发展前景,AI队友如何颠覆传统游戏AI的固有印象,通过高度智能语音交互系统与丰富角色个性设定,为玩家带来新的沉浸式体验?
《永劫无间》在AI应用上的尝试与创新
《永劫无间》端游早在2023年3月推出了AI智绘时装共创企划,玩家可以利用AI绘画生成时装并投票选出最受欢迎的作品,同时通过众包平台优化游戏中的拟人化机器人,这项活动成功点燃了玩家对游戏的积极性。
手游公测前夕推出的AI捏脸功能也成为了爆款话题,不论是仙气飘飘的形象还是另类搞怪的风格,都可以根据玩家的想法个性制作。游戏激励玩家进行创作并上传至平台,迅速在各大平台获得了不小的关注。
传统的AI系统通常只能执行一些简单的任务,例如路径规划、目标锁定或基本的攻击防御操作,缺乏对复杂战局的理解和判断能力。而《永劫无间》手游的Copilot通过先进的算法和深度学习技术,能够分析战局中的每一个细节。从敌人的动向到队友的状态,再到地形和资源的分布,统统纳入考量范围。因此,Copilot能够在瞬息万变的游戏环境中做出最优决策,为玩家提供精准的支持。
《永劫无间》的AI表现
《永劫无间》的AI队友相较于其他游戏的AI队友,最大的亮点在于其高度完善的语音交互功能。目前,游戏推出了6个AI队友,每个队友都有独特的性格和音色。
玩家需要打开麦克风,通过语音指挥AI队友。从实测结果来看,这些AI队友不仅能够自主进行战斗,还能识别玩家发出的语音指令,执行包括跟随、战斗、支援、搜索和提供物资、指导玩家、表扬和鼓励玩家等多种任务。此外,AI队友还能与玩家进行展现自身性格特点的聊天互动。
游戏实战中,当玩家在野外突然遭到敌人埋伏,情急之下连忙打断AI的暖场言论,呼叫队友前来帮助增援自己。(实况内容取自网络)
(来源:Bilibili-企鹅带带北极熊)
可以看到,原本与另一名敌人缠斗的AI队友果断回头支援玩家,毫不犹豫地放弃了当前的战斗任务。
同时基本上,AI能够满足你提出的所有物资需求(如果AI队友有的话)。
当然,AI队友也会根据当前的战况自行判断是否需要前来支援,不会完全盲从玩家给出的指令。这里玩家给出了急迫的汇合指令。
然而AI根据自身的实际情况和对战局的判断,有时也不会呼应玩家的要求。
技术的进步,也带来了性能和体验的挑战。AI队友的语音识别目前仅部分高端机型支持本地计算,其余机型通过云端计算。搭载高通骁龙8 Gen 3旗舰平台的机型使用芯片集成的NPU在端侧运行语音相关AI模型推理,AI队友响应速度更快,不过实际使用上,游戏的优化还有改进空间,8 Gen 3机型的发热控制也并不理想。
目前AI队友已经在公测版本内实装,仅支持战鬼讨伐和自定义房间2人模式中使用。体验下来整体的战斗能力非常强力,比起偶尔匹配到断联、配合差的糟糕队友,能够听你指挥并且操作在线的AI十分适合新人熟悉游戏,也适合想找个稳定搭子的老鸟大杀四方。
官方承诺将在后续版本中迭代和优化,未来AI队友将根据玩家风格提供个性化建议和陪伴方式,如进攻型玩家的激进战术配合、防守型玩家的稳健操作,或担任1V1练技和分析局势的AI教练。
《永劫无间》手游中的AI队友设计,相较于市面上多数游戏中的机器人角色 ,在体验上完全不同。该游戏的AI队友功能具有智能化、可执行任务广泛、新手友好和技术领先等优势,但也面临系统优先级判断、有限模式支持、识别和响应、性能和功耗等挑战。
亮点凸显:AI队友的四大优势:
● 无缝语音交互:玩家可直接通过自然语音指令与AI队友互动,并且AI会在输入后能够迅速根据指令反馈信息且执行。
● 全面任务执行能力:AI队友不仅能够自动跑图、搜集物资,还能参与战斗、执行救援任务,无论你有什么样游戏相关的需求与指令,AI都能够尽力满足你。
● 战术智囊与情感伴侣:它们不仅提供战术分析和战场信息反馈,辅助玩家做出更明智的决策,还能进行简单的情感交流,趣味性也得到了提升。
● 新手友好型教学助手:针对新手玩家,AI队友通过游戏指导和战术建议,帮助他们快速融入游戏,减少初期的迷茫和挫败感。
挑战并存,持续优化之路:
然而,任何创新都伴随着挑战。《永劫无间》手游的AI队友功能在展现其强大优势的同时,也面临着一些亟待解决的问题。
● 行为合理性优化:在某些复杂情境下,AI队友可能因优先级判断不当而做出不合理行为。未来需通过算法优化和机器学习技术,提升AI的决策能力和适应性。
● 指令多样性与个性化:目前AI队友的行为相对单一,为满足不同玩家的个性化需求,AI队友的行为模式需更加灵活多变。这要求开发者不断探索新的交互方式和AI训练方法,以实现更加个性化的游戏体验。
● 性能与功耗平衡:目前版本在高端机型上运行时性能和功耗较高,需进行深度优化,以确保游戏在保持高性能的同时,降低对设备资源的消耗。
● 语音识别精准度提升:针对部分机型存在的语音识别延迟或不准问题,需加强与云端计算技术的融合,提升识别的准确性和实时性。
● 应用范围拓展:目前AI队友功能仅支持“人机模式”和"4V4论剑模式”,未来需逐步拓展至更多场景。
小结
《永劫无间》手游中的Copilot玩法不仅在移动端取得了显著成效,其技术潜力也为未来在端游中的应用铺平了道路。尽管AI队友尚未达到大家所期望的全智全能的水平,但从目前玩家们的评价来看,这一创新玩法无疑赢得了广泛的好评。
此外,公测版本的AI也增加了人格化的认知设定,对于一些情感和趣味性的话题,也能够有更好的回应。
(图片来源:抖音-呼叫网管)
多元化的AI表现为玩家带来了丰富的情感体验,提升了游戏的沉浸感和互动性。这种设计不仅增强了玩家的游戏体验,还为直播观众提供了更好的观感,激发了大量的话题讨论和社交互动。这些因素共同为《永劫无间》的全新玩法带来了海量的自然流量,进一步巩固了其在游戏市场中的地位。
Part 3
单一垂类游戏的AI模型
《永劫无间》的AI助手带给了游戏界不少的震撼。放眼市面上,AI Copilot技术正逐步渗透到各类游戏之中,成为连接玩家与游戏世界的智能桥梁。在探讨AI游戏助手在多模态和泛化游戏中的应用之前,有必要了解单一垂类游戏中的AI模型。单一垂类游戏指的是专门针对某一种游戏类型进行优化和训练的AI系统,这类模型通常能在特定领域表现出色,OpenAI Five就是一个典型的例子。
OpenAI Five
Paper:https://arxiv.org/pdf/1912.06680
OpenAI Five是由OpenAI团队专为Dota 2这款复杂的电子竞技游戏设计的AI对战系统。2017年,它在Dota 2国际邀请赛上首次亮相,以一场精彩绝伦的1v1 Solo战胜了乌克兰顶级职业选手Dendi。
在OpenAI Five之前,AI领域已经见证了多项与人类对战的突破性成就,如IBM的Deep Blue在国际象棋上战胜世界冠军,以及Google DeepMind的AlphaGo在围棋上的卓越表现。然而,与这些相对结构化和规则明确的游戏相比,复杂的电子竞技游戏展现了更接近现实世界的复杂性和动态连续性。
2019年4月,OpenAI Five卷土重来,在旧金山的一场活动中与前一年的国际冠军OG战队进行了三局两胜的较量,并最终获胜,成为电子竞技史上首个战胜人类冠军的AI。同月,在为期四天的在线公开挑战赛中,OpenAI Five在超过 7000 局游戏对战中交出了一份胜率高达99.4%的答卷,轻松碾压了业余和半职业玩家的队伍。这表现,简直可以用“无敌”来形容!
OpenAI Five选择Dota 2作为研究对象,意在攻克更高维度的难题,以期探索机器学习在处理不可预测性和连续性方面的潜力,构建出更加通用的问题解决系统。《MIT Technology Review》的访谈中,AI专家们对OpenAI Five系统给予了高度评价,认为鉴于Dota 2的极高复杂度,OpenAI Five即便击败非职业玩家,也是一项令人印象深刻的成就。OpenAI Five的表现不仅证明了其技术实力,更是在电子竞技领域树立了新的里程碑,其在游戏中的卓越表现,确实可以用“王炸”来形容。
Part 4
多模态AI模型
在了解了单一垂类游戏中的AI模型后,我们进一步探讨多模态AI模型。这类模型不仅能处理单一类型的游戏任务,还能在多种游戏场景中表现出色。多模态AI模型结合了视觉、语言和行动等多种能力,使其在复杂的游戏环境中能够自主决策和执行任务。
OmniJARVIS:指令驱动
项目介绍
OmniJARVIS是由北京大学、BIGAI和加州大学洛杉矶分校的研究人员推出新型人工智能模型,能够在开放世界环境中(《我的世界》),让AI按照玩家的指令行动。只需设定一个中长期目标,OmniJARVIS便能自主寻找实现目标的路径。
地址:https://omnijarvis.github.io/
实例演示
在实机演示中,研究团队在此处提出要求:开采铁矿石
OmniJARVIS通过视觉分析自身的资源以及场景信息
OmniJARVIS根据游戏画面得出结论,自己拥有铁镐,木铲,和一些食物,所以可以用铁镐来挖矿,从而达成研究团队的指示。
核心技术特点
OmniJARVIS的主要技术特点有如下三点
多模态交互
OmniJARVIS结合了视觉、语言和行动三种能力。它能够观察游戏中的环境(视觉),理解玩家的指令和对话(语言),并在游戏世界中进行实际操作(行动),实现了全方位的智能互动。
自监督学习
OmniJARVIS采用自监督学习的方法,通过行为编码器将行动转化为离散的标记。这些标记随后可以用来控制游戏中的各种操作,使得AI能够自主学习和适应不同的任务需求。
高效的决策能力
通过统一的标记化处理多模态交互数据,OmniJARVIS能够进行高效的决策和规划。无论是面对复杂的游戏环境还是多变的任务需求,它都能做出最佳选择,确保玩家的游戏体验更加顺畅和愉快。
分析总结
简而言之,OmniJARVIS 就像是虚拟世界中的智能助手,能够理解你的指令,并在游戏中协助你完成各种任务。无论是简单的日常任务,还是复杂的工程项目,它都能轻松应对。
OmniJARVIS突破了过去需要逐步指令AI完成任务的局限,带来了全新的智能体验。现在,用户只需设定一个中长期目标,OmniJARVIS便能自主寻找实现目标的最佳路径。
通过先进的算法和深度学习技术,OmniJARVIS能够分析和理解复杂的任务需求,制定出详细的行动计划,并在执行过程中不断优化和调整策略,以确保目标的高效达成。
Voyager:自主探索
项目简介
Voyager是开放世界游戏我的世界中第一个由大型语言模型驱动的嵌入式终身学习代理,能够在没有人类干预的情况下,不断探索世界、获取各种技能并做出新发现。
地址:https://voyager.minedojo.org/
核心技术特点
它由三个关键部分组成:
最大化探索的自动课程
通过自动化的课程设计,Voyager 能够最大化地探索游戏世界。
Voyager可以通过自我驱动的探索不断发现新的Minecraft物品和技能,大大超过了其他AI模型的基准值。
不断增长的可执行代码技能库
Voyager 存储和检索复杂行为的技能库不断扩展,提升其执行能力。
全新迭代提示机制
结合环境反馈、执行错误和自我验证,Voyager 能够改进其程序。
Voyager 通过黑盒查询与 GPT-4 进行交互,从而避免了对模型参数进行微调的需要。它所开发的技能具有时间扩展性、可解释性和组合性,能够迅速增强代理的能力,减少灾难性遗忘。
分析总结
Voyager具备在无需人类干预的情况下自动探索游戏的卓越能力,其表现远超其他现有模型。通过先进的算法和深度学习技术,Voyager能够自主理解游戏环境、制定策略并执行复杂的任务,从而在游戏中展现出非凡的智能和适应性。
这种高度智能化的AI不仅能够提升游戏的可玩性和挑战性,还能为开发者提供宝贵的数据和反馈,帮助他们优化游戏设计和用户体验。
Part 5
泛化游戏能力的AI模型
在单一垂类和多模态AI模型的基础上,接下来会探讨具备更高泛化能力的AI模型。以下的模型和项目能够适应不同类型的游戏场景,展现出广泛的应用潜力和适应性。
G-Assist:个性化辅助
项目介绍
G-Assist是由英伟达打造的一个AI游戏助手项目,旨在成为玩家在PC游戏世界中的智能顾问。这个RTX驱动的AI助手通过分析玩家的语音或文本指令以及游戏界面截图,提供实时、上下文相关的帮助。
G-Assist的核心技术在于其AI视觉模型,这些模型结合大型语言模型(LLM),不仅提供上下文感知,还理解特定应用程序,连接到一个丰富的游戏知识数据库。基于玩家当前的游戏情况,G-Assist能够生成个性化的洞察力响应。
开发者可以针对特定游戏或应用定制 G-Assist 的视觉和语言模型,从而提供高度的准确性和洞察力。
应用实例
为了演示 G-Assist 所带来的各种可能,NVIDIA与Studio Wildcard合作,以“方舟:生存飞升 (ARK: Survival Ascended)”为例,展示了G-Assist的实际应用。
玩家在游戏探险中遇到的挑战,如寻找稀有物品或对抗Boss,只需要按下热键或使用唤醒词激活后都可以通过G-Assist得到即时帮助。此外,AI助手还可以推荐初期优选武器和材料收集方法。
通过集成先进的AI视觉模型,G-Assist能够实时分析游戏窗口中的视觉信息,比如识别屏幕上出现的恐龙或其他敌对生物,并据此提供策略性建议。
得益于上下文感知能力,G-Assist的AI助手能够根据玩家的游戏进度和经历,提供个性化的建议。它能够分析玩家的技能点、制作菜单和当前解锁状态,然后给出下一步行动的建议,助力玩家”打怪升级”以征服更高级别的区域和更强大的敌人。
英伟达官方表示G-Assist未来可能在多种游戏类型中发挥广泛的应用潜能。从角色扮演类(RPG)到即时战略(RTS),再到第一人称射击(FPS),AI 助手不仅能够揭示游戏秘密、优化策略布局,还能提升装备配置效率,确保玩家在多样化的游戏环境中获得更加丰富和个性化的辅助体验。
分析总结
以上举例仅是G-Assist 可以带来的部分可能。G-Assist的核心优势在于其个性化和高效能的辅助能力。通过融合AI技术、游戏数据与玩家互动为每种游戏类型开启全新的辅助时代,不断拓宽游戏体验的新边界。随着技术的持续精进与更多游戏厂商的接入,G-Assist有望引领游戏互动与体验的未来趋势。
SIMA:行为模仿
项目介绍
谷歌DeepMind实验室推出的SIMA是一种通过模仿人类玩家在游戏中行为来学习的AI模型,旨在训练AI适应各种类型的游戏,包括非线性路径和开放世界游戏。然而,SIMA 目前处于研究阶段,表现尚不理想,现阶段仅能自主完成一些简单的操作(基本的移动、物品拾取和简单任务执行)。
地址:
https://www.theverge.com/2024/3/13/24099024/google-deepmind-ai-agent-sima-video-games核心技术特点
SIMA 的组件包括预训练好的视觉模型,以及一个包含内存并输出键盘和鼠标操作的主模型。
作为一种 AI 智能体,谷歌的 SIMA 可以感知和理解各种环境,然后采取行动来实现指定的目标。
重要的是,SIMA 既不需要访问游戏的源代码,也不需要定制的 API。它只需要两个输入:屏幕上的图像以及用户提供的简单自然语言指令。SIMA 使用键盘和鼠标输出来控制游戏中的核心角色来执行这些指令。人类可以使用这个简单的界面,这意味着 SIMA 可以与任何虚拟环境进行交互。
在谷歌的评估中,SIMA 在多个3D游戏上进行了训练,其表现显著优于仅在单个游戏上训练的模型。更为重要的是,SIMA在未见过的游戏上表现几乎与专门训练的智能体一样出色,这显示了 SIMA 的强大泛化能力。
(如图所示,谷歌与三种类型的通用 SIMA 智能体进行了比较,每种智能体都经过多个环境的训练)
应用实例
当前版本的 SIMA 通过 600 项基础技能进行评估,涵盖导航(例如「左转」)、对象交互(「开车」)和菜单使用(「打开地图」)。
分析总结
总的来说SIMA是一种通过模仿人类玩家在游戏中行为来学习的AI模型,旨在适应各种类型的游戏,包括那些具有非线性路径和开放世界特性的复杂游戏。该模型的设计初衷是通过观察和学习人类玩家的操作和决策过程,从而在游戏中自主执行任务和解决问题。然而,目前SIMA的表现尚未达到预期的理想水平。
Multi-Game Decision
项目介绍
Multi-Game Decision Transformers通过收集大量与特定任务无关的数据来构建通用模型,并成功应用于强化学习领域。该系统通过自我推理和分析来完成游戏中的各种行动,其效果显著优于单纯依赖克隆玩家行为的学习模式。
地址:https://sites.google.com/view/multi-game-transformers
核心技术特点
Multi-Game Decision Transformers通过自我推理与分析来完成游戏中的行动,其效果显著优于单纯通过克隆玩家行为的学习模式。研究者发现,在41个游戏中,Transformer在31个游戏中的决策性能优于行为克隆。
分析总结
Transformer在处理复杂游戏环境和动态变化时,能够更有效地做出优化决策,展现出更强的适应能力和策略水平。
Copilot+PC:实时交互
项目介绍
在2024年5月的Build开发者大会上,微软公司推出了Copilot+ PC,一款为AI时代而生的个人计算机。它采用创新的系统架构,融合了CPU、GPU,以及特别引入的高性能神经处理单元(NPU)。NPU的加入,专为AI工作负载而设计,能够高效驱动如OpenAI的GPT-4o模型,提供实时语音识别、语言翻译、图像生成等先进的AI功能。
应用实例
尤为引人注目的是Copilot+在游戏领域的辅助应用展示。在《我的世界》视频演示中,通过集合Open AI 的 GPT-4o模型,Copilot不仅具备图像、声音、文字的多模态理解能力,还支持自然流畅的实时语音交互。它能够实时分析游戏画面内容,根据玩家的问题提供即时建议。
演示开始时,微软员工以轻松的口吻与Copilot进行寒暄,Copilot以同样风趣的语气回应,展现了其流畅及时的交互能力。随后玩家询问copilot如何在《我的世界》游戏中制作一把剑,Copilot 便立刻回答需要玩家按下键盘 E 打开仓库来检视所拥有的素材,并帮助选择可用于制作剑的物品。在见到仓库只有用于制作剑柄的树枝后,便建议玩家开始收集木头或石块用于制作刀片。
当游戏中出现僵尸攻击时,玩家向 Copilot 询问这是什么敌人,Copilot AI立即以紧张的语气提供应对策略,无论是逃跑还是搭建石墙躲避,都给出了明确的指导和安全地点建议。成功躲避攻击后,AI还发出喘气声并祝贺玩家成功找到庇护处,增强了游戏的互动性和沉浸感。
分析总结
Copilot在实时语音互动方面表现出色,具有较低的延迟和自然流畅的对话体验,这使得它在模拟真实交流场景时显得尤为逼真。将这种技术应用于游戏助手,无疑能够显著提升玩家的沉浸感和游戏体验。
目前,微软选择《我的世界》作为展示AI游戏辅助功能的第一个案例,尽管未明确后续游戏扩展计划,其展现的自然语言处理和即时响应能力,已构建出一个与玩家高度互动的数字伙伴雏形。虽然目前还处于初期阶段,但Copilot已显示出其在未来游戏和其他应用领域中的潜力。
它有望极大缩短新玩家的学习曲线,即时解惑以减少查阅攻略的繁琐,同时,作为游戏内的“陪伴者”,Copilot增添了单人游玩的社交维度,有效缓解玩家孤独感。随着技术迭代,Copilot对玩家意图的理解、个性化指导及沟通互动将愈发精准高效,以期为玩家解锁更深层次、个性化的游戏享受。
Part 6
结论
在这一波AI游戏进化浪潮中,诸多前沿研究机构已纷纷亮剑,展示了他们在AI Copilot模型上的深厚积累与创新思维。然而,理论之花能否结出实践之果,尤其是这些前沿模型如何在具体游戏情境中生根发芽,仍是业界内外共同瞩目的焦点。
网易作为游戏行业的先行者,将AI Copilot嵌入《永劫无间》之中并推向市场,无疑是在探索之路上迈出了坚实的一步,这不仅是对传统游戏范式的勇敢超越,更是对AI技术应用广度与深度的一次有力拓展。然而,这项创新功能是否能显著优化玩家体验,进而推动游戏产业的正向发展,尚需时间的验证与市场的反馈。
同时,我们也必须认识到,AI游戏助手的发展和应用仍然面临诸多挑战,包括技术实现的难度、玩家接受度的不确定性以及伦理和隐私的问题。如何平衡AI辅助与玩家自主性之间的关系,如何确保AI助手带来的隐私问题,这些都是需要行业深入思考和解决的问题。
关于LitGate
大家好,我是LitGate,一个专注于AI创作的游戏社区。我们的新版官网已经上线✨你可以在里面找到各种AI创作的实操案例,以及已经沉淀的AI游戏创意demo,相信一定能让你大开眼界!
我们还有一个讨论群📣,如果你对AI创作感兴趣,或者有什么问题想要咨询,欢迎加入我们的讨论群,和大家一起交流学习!(PS:目前群内人数较多,为了有一个优质的讨论环境,请各位添加社区管理员企业微信账号邀请入群
更多精彩活动和功能筹备上线中,敬请期待~
关注我们,一起探索AI创作的无限可能吧!
新版官网地址:www.litgate.ai