AI Agent正在改变我们叙述故事的方式 ——Kylan Gibbs(Inworld CPO)
Inworld的AI技术对游戏的意义如同从 2D 游戏到 3D游戏的巨大飞跃 ——IGN
Inworld的AI模型将开发出以前难以想象的新游戏机制,从而释放出人工智能在游戏中的真正潜力 ——Inworld
Beyond 2024
近日,“AI+游戏”头部初创公司Inworld召开Webinar「Beyond 2024」,并发表长文构想了未来AI技术影响下游戏的新世界。
这家成立刚满三年的AI公司,在一年前刚刚获得了来自光速创投、联想、三星、斯坦福等六家投资机构的5000万美元,一举成为AI+游戏领域资金最充足的初创公司。
在「Beyond 2024」中,Inworld连用多个超越(Beyond),直接将其产品定义为“超越第一代的游戏AI应用(Beyond first-generation applications of AI in gaming)”,并从超越LLMs、超越对话、超越效率三个部分描绘了Inworld在AI游戏行业的领先性。
这到底是一家什么样的AI公司,能够获得各大资本的青睐,并且竟然敢放下豪言要超越大语言模型?
Inworld成立于2021年7月,专注于AI NPC与数字虚拟人领域,为游戏开发者提供体系化的AI NPC和虚拟角色的游戏引擎与平台。Inworld创始团队几乎都来自Google,其中灵魂人物,也就是Inworld的现任CEO llya Gelfenbeyn,更是一位拥有连续创业者、Google高管、风险投资人等诸多标签的传奇人物,关于llya Gelfenbeyn的传奇经历和Inworld的发展历程我们将在下一篇文章详细展开。
2022年,Inworld推出核心产品——角色引擎(Character Engine),一个由30多个AI模型构成的开发引擎,可以让用户开发出具有个性、情感、执行力的NPC角色。Inworld也因此成为OpenAI的官方宣传案例,直到现在依然可以在OpenAI的官网上找到当时宣传Inworld合作的文章。同年,Inworld获得了来自英特尔资本、Section 32等十多家机构高达5000万美元的巨额A轮投资。至此,仅仅一年时间之内,Inworld就完成了三轮融资,融资金额高达7000万美金,投资机构高达16家,其中,Meta、CRV等多家投资机构甚至连投三轮。
2023年,Inworld不断发布更多AI组件与功能,并很快获得5000万美元的A+轮投资,估值飙升至5亿美元。
那么,让我们一探究竟,受到各路资本看好与追捧的Inworld为什么能够有底气说出”超越LLM“的豪言。
超越LLMs?
实际去看Inworld发布的内容就会发现,Inworld所谓的“超越LLMs”并非是越过LLMs使用全新的AI模型,Inworld产品的核心部分也仍然使用了多个LLM模型。
“超越LLMs”的真正含义是,通过一系列标准化的基于LLM与其他机器学习模型的AI组件构成一套工作流,并由多个工作流组成一个AI引擎或平台,这样模块化的AI开发平台所具备的能力将远远超越传统单个或简单架构下LLM拥有的能力。
在LLM出现以前,游戏中的NPC只能依据提前编写的脚本,以预定义的方式与玩家和游戏世界交互。LLM的出现显著增强了NPC的自主性与交互能力,但是许多AI NPC基于单个或简单架构的LLM,关于游戏世界和NPC自身的大量的信息都以Prompt形式输入。而这往往会导致NPC没有突出与稳定的性格,容易出现幻觉与遗忘,并且在人物一致性上的维持度较差。
针对这一点,Inworld为NPC的构造设立了一个复杂而又精细的架构。
每一个NPC都拥有身份信息、动机、弱点、说话风格、声音、性格、知识、目标、记忆、关系、推理能力等多达16个可设置的属性,每一个属性背后都是由不同模型构建成的独立的子系统。每一个子系统负责一个属性,子系统之间再进行协同以构成一个统一的NPC。
不仅如此,Inworld的角色引擎还是一个低代码开发平台,子系统背后的代码与子系统之间的协同全部被封装起来,与用户的交互界面基本以自然语言为交互方式,绝大多数的功能均能通过自然语言的文字输入方式完成。用户只需要在各个属性界面的对应的位置输入相应文字描述,Inworld即可自动完成NPC的创建。
所有创建NPC都会在Characters板块中展示,方便用户进行调整与控制
Inworld的超越性不仅体现于架构的设计上,更是体现在属性与功能的子系统或组件之中。本文将着重介绍记忆、知识、行动、测试四个模块的特色与创新。
01
知识子系统(Knowledge & Cognition)
知识管理的是除了Identity中所包含的基本信息以外的信息,包括对NPC自己、其他角色和游戏世界的认知。
NPC知识的难点主要在两个方面,其一是单个LLM接收或读取的信息长度是有限的,过多的信息容易导致幻觉与遗忘。而游戏中存在大量不同类别的知识信息,仅游戏的世界观和不同角色的背景就可能已经超过单个模型的上下文能力。
另一大难点则在于对不同NPC知识掌握程度的控制。不同NPC对知识的掌握程度根据其人物设定应该是不一样的,对每一个NPC都单独设定知识不仅耗时耗力,如何严格控制NPC知识的边界也是一大问题。
针对第一个问题,Inworld设计了Core Description, Motivations, Flaws三个模块与知识子系统并行的架构。前者的三个模块负责存储关键知识,即NPC回答大部分问题都需要参考的知识,这些知识将时刻提供给NPC。而知识子系统中存储的知识并不会一直提供给NPC,只有在与对话相关时才会提供。
针对第二个问题,Inworld则设计了知识过滤器组件进行知识分层与控制。知识过滤器将所有信息分为四个类别,并提供None、Mild、Strict三层筛选级别。None条件下,NPC能够知道所有信息,适合构建全知全能的助手等角色;Mild条件下,允许NPC使用前三个类别中的信息,适合构建大多数普通角色;Strict条件下,只允许NPC使用开发者对NPC直接输入的相关信息,适合侦探推理游戏等场景下必须具有限定知识库的角色。除此之外,知识子系统为所有知识和NPC都提供了标签,用户可以对每一个知识条目与NPC进行打标,系统将自动对标签匹配的NPC开放相应的知识条目。通过标签系统,用户可以方便地管理多个NPC与不同知识库的对应,而无需手动一个个调整NPC的知识。
Demo链接:https://www.youtube.com/watch?v=WkPovRAfoI4
02
记忆子系统(Memory)
与知识不同,记忆的来源并非游戏本身提前设计的信息,更多是和玩家或其他NPC交互过程中,在对话中新获知的信息。传统的LLM往往只能记忆单次对话中的信息,而无法实现跨对话的记忆。而实现跨对话记忆的难点同样在于信息的长度与密度,开发者不能直接将AI所有的对话信息直接扔进一个“记忆文档“,因为记忆完整大量的信息往往会分散模型的注意力,甚至会超出模型的上下文能力。
而Inworld的记忆子系统借助闪存(Flash Memory)与长期记忆(Long Term Memory)的架构解决了这一问题。其中,闪存将存储与玩家或其他角色交流中得到的基于客观事实细节的即时信息,长期记忆则在多个闪存的基础上提炼出基于主题的抽象规律或结论。而这一架构的记忆子系统实际上并非Inworld的新功能,而是早在一年多之前的2023年7月就已经上线。
闪存更接近LLM本身的记忆能力,闪存存储的内容是暂时的,一般只在当前一次或少数几次对话中有效。例如,玩家向NPC描述昨天晚餐吃意面的场景,吃披萨这一事件本身将被NPC的闪存组件存储以与玩家进行流畅的对话。
而长期记忆则像是通过另一个LLM对闪存的内容按照不同主题进行分类,并对每一个类别下针对不同内容的共性进行概括整理,最终总结出抽象的规律或结论放入某个与NPC链接的知识库,作为NPC之后对话的参考。例如,玩家又向NPC提到在网上订购了匹萨,想自己做着吃。这一事实细节将和吃披萨一样成为闪存,但长期记忆组件会将这两个闪存记忆归类为“美食”主题,并总结其共性“喜欢吃意大利菜”作为长期的记忆。在之后的对话中,NPC将会回溯与参考之前的长期记忆,例如,再与玩家聊到“美食”话题时,NPC则有可能主动提起玩家喜欢吃意大利菜的信息,或是主动为玩家推荐意大利菜系的美食。
NPC记忆的核心在于不让NPC直接记忆准确的信息,而是记忆经过LLM总结后的抽象规律和结论。这样的架构在防止大模型注意力被分散而产生幻觉或遗忘的同时,保证了NPC跨对话的记忆能力。
用户可以为每一个NPC一键选择开启或关闭长期记忆功能
Demo链接:https://www.youtube.com/watch?v=i5FAKSULUSs
03
行为子系统(Goal & Action Planners)
在NPC的知识与记忆之外,行为同样是最重要一个方面。NPC的行动一般由预先定义的玩家的某个动作或Dialog Tree触发,开发者需要编写大量的代码以预测玩家不同的行为。但开发者常常也无法预测到玩家的所有行为,因此有时玩家明明做出了类似表意的行为,或说出了类似的话,但NPC仍不为所动。这也很大了影响了NPC与玩家互动的真实感与自然感。
而Inworld的行为子系统不仅实现了更自然的行为触发,也提供了更丰富的可执行行为。行为子系统由Goal和Action两个组件构成,其中Action组件定义AI的行为或动作,Goal组件则定义触发条件。正是通过Goal组件中的意图识别(Intent Recognition)功能,行为子系统实现了对NPC行为更灵活与真实的控制方式。
Goal组件内,专门的LLM通过Few Shot的方式学习用户输入的意图,并在交互中实时对玩家的行为检测是否存在相同的意图,以决定是否触发特定动作。
具体来说,用户可以创建一个或多个可以触发NPC行动的Intent,并提供五个左右的训练词作为例子。输入后,LLM通过用户的例子能够很好地学习何种特征的语句会包含特定的Intent。当NPC与玩家交流时,这一LLM将实时检测玩家说话的意图,当检测到包含相同意图的语句时,就会触发设置的行为或动作。
在行为子系统的作用下,用户不必说出与训练词完全相同的语句,NPC仍然能够执行判断,极大地增强了交互的自然与真实。
意图识别功能需要用户编写简单的YAML格式代码
除了对玩家的响应更灵活之外,而Action组件也同样提供了更丰富的行动。
在最常见的对话行动之外,NPC属性的变化也可以作为行动。在属性变化中,最常见的是情绪的变化,但实际上Action组件也支持NPC的外观、声音、知识、动机等其他所有属性的突变,可以完美地实现小说或影视作品中”突然换了个人一样“的描述。甚至在恐怖游戏中,也能很好地实现正常人形象的NPC突变为怪物或者人格分裂等诸多场景。同时,Action组件支持随机功能,用户可以设定不同概率下NPC执行不同的行动,进一步提升了NPC行动的丰富程度,防止玩家对游戏重复性的感知。
Demo链接:https://www.youtube.com/watch?v=nCWNVFH_l4w
04
测试系统
创建NPC后,对NPC的测试也至关重要,开发者需要确保NPC与自己设定的预期形象相符合,且NPC的行为能够正确地触发和执行。
Inworld的测试系统提供了Chat界面,用户可以直接在平台内与创建的NPC聊天以进行测试。测试系统提供了可自定义的姓名、性别、年龄、角色等字段供用户模拟不同的角色身份。
测试系统还加入了强化学习框架RLHF,用户可以直接通过 Thumbs Up 和 Thumbs Down按钮对AI的输出进行反馈,也可以进一步通过文字进行描述反馈,AI会根据用户反馈调整后续的输出。用户也可以选择直接修改或重写AI的回复,AI将学习用户修改、重写后的回复。所有测试的对话都将以Chat Logs形式存储,以供用户查看。
直接点击大拇指进行反馈
输入具体的文字建议
修改NPC的回答
LitGate:通过将NPC的不同功能与属性拆分为多个独立的子系统,每个子系统中再由各自的LLM进行处理,Inworld精巧细致的角色引擎确实具备了超越普通LLM的能力。
遗憾的是,对于多个子系统之间具体的管线设置与协同模式,Inworld并没有公布相关技术细节,但可以确定的是,相较于仅依靠单一prompt输入指导的方式,Inworld角色引擎下创建出的NPC更像一个复杂的、真实的人。
超越对话?
而Inworld所说的”超越对话“指的是即NPC能够具备多种能力,而不仅仅是ChatGPT式的你问我答。
“对话”是大语言模型最基础与重要的能力,但许多使用LLM创建的NPC能力也往往局限于普通的对话互动,在游戏内的应用也较为有限。而用Inworld自己的话来说,通过Inworld的系统能够构建出真正的智能体AI(Agentic AI),在游戏内实现更多元化的应用。
01
AI伙伴与合作
通过Inworld创建的NPC可以成为玩家的伙伴,为玩家提供实时战术支持与交流,并且能根据玩家的指令实施战术。
在Inworld发布的FPS Demo演示中,Nomad和Zenith为玩家的NPC伙伴,能够通过玩家的视角通过视觉进行实时的环境感知与威胁分析,以语音的方式为玩家沟通或提供战术建议。例如,当玩家侦察到远处的敌人,Nomad会立即用语音主动警示玩家“保持安静,马上找掩护”,当敌人经过时,Nomad能实时对敌人进行分析,以跟随文本框的形式给出敌人的种类、威胁度、距离、弱点等信息和战术建议。
AI伙伴能够实时分析敌人并给出战略建议
更重要的是,玩家不仅能使用语音与Nomad和Zenith一起商讨并制定战术计划,Nomad和Zenith还根据指定的计划进行操作。Demo中,玩家需要与NPC一起快速击倒五个敌人,Nomad询问玩家想要负责射击哪几个敌人,玩家选择了其中两个敌人后,Nomad和Zenith也选择了自己负责的敌人。随着玩家倒数“321”,Nomad和Zenith精准地命中了各自负责的敌人。
玩家与NPC一起制定击倒五个敌人的战术并实施
这一Demo中还能够看到Inworld的许多巧思。例如,为了让Nomad和Zenith能够正确识别玩家是在对敌人说话还是对自己说话,Inworld在Nomad和Zenith的角色引擎中加入了音量逻辑,在除了对玩家的内容进行判断以外,NPC可以更直接地根据玩家的音量判断玩家是在与自己交谈还是对远处的敌人喊话。
可以看到,Inworld的AI NPC的不在只是简单提供与玩家一对一对话的功能。在FPS这样对实时感应与反馈要求极高的场景下,Inworld成功实现了多个NPC与玩家同时的实时沟通与协作,这也得益于决策算法、感知系统、自适应学习、Multi-Agent Director等多个技术与系统协同的作用。
Demo链接:https://www.youtube.com/watch?v=A7iBmND9L-c
02
实时动态对话树
虽然LLM可以实现玩家自由地与NPC进行交流,但是对于不侧重对话的游戏,有时候打字或语音输入对玩家同样也是一种负担,因此对话树在一些游戏中仍然有存在的价值。然而,传统的对话树往往依赖于预置的几个选项,对玩家对话的限制过大。
Inworld将LLM应用于对话树,并创建了实时动态对话树功能,使用 AI 自动生成自适应的对话选项,对玩家的输入做出实时反应。在Demo中,在NPC的回复下方有五个按钮,分别代表Who, Where, What, Yes, No。玩家点击其中一个按钮后,就会为玩家实时生成相关的新的对话选项。例如,NPC自我介绍:“我简单地被称为奥布里,远非像著名的格鲁纳克那样的熟练保护者。我照料村庄及其土地。”玩家点击Who按钮后,AI自动生成提问“你说的著名的格鲁纳克是谁?”
此外,AI还可以为玩家生成关于所经过地点、所接触过的角色等的文字摘要,玩家通过点击先前记录关于某地点或人物的摘要,即可让AI生成有关此地点或人物的问题列表以供提问。
实时动态对话树既实现了对话的自由与流畅,又保证了更加快速便捷的交互。
Demo链接:https://www.youtube.com/watch?v=XraqAyq0hSo
03
多模式行动计划MAP & AI 状态树
对于传统NPC,开发人员通常使用FSM与行为树等技术来实现NPC的行为。虽然FSM与行为树等传统技术对于管理简单且定义明确的行为很有效,但开发人员需要对每一个可能的状态和转换进行编程,整个过程耗时并且缺乏灵活性。更重要的是,FSM与行为树大规模应用后很容易导致游戏感觉可预测和重复。
即使对于Inworld平台,虽然借助行为子系统中的意图识别功能可以实现自然的交互,甚至AI也能和玩家交流并实施战术,但是NPC的行为仍然是被动的,无论是提前编写的Goal与Actions代码,还是听从玩家的指令行动,NPC始终无法规划自身的行为。
因此,Inworld 计划推出多模式行动计划MAP和 AI 状态树解决上述问题,这些系统将使 NPC具备主动实时规划、生成行动与操作,自适应地响应游戏环境和玩家行为。
多模式行动计划MAP
MAP能够创建具有游戏内对象和动作感知能力的 AI 智能体,智能体能够自主推理目标并规划动作序列。MAP 利用游戏状态信息使 NPC 根据Goal与Action的逻辑执行操作,但无需提前编写大量脚本或触发器代码。
MAP下,NPC的行动包括三个阶段:
Perception 系统启用周围感知,智能体识别实体、意图等;
自主驱动的行动;
规划步骤;
通过简化复杂行为的编排,MAP 增强了 AI 的响应能力,促进了更身临其境的交互,并为开发人员在设计动态游戏世界时提供了更大的自定义和创作自由。
AI 状态树
Inworld正在试验从简单的脚本配置状态树,该脚本提供 AI 功能来检测和调整NPC对玩家的行为。此外,Inworld正在试验在运行时生成状态树,以帮助进行适应玩家的目标规划。这种自适应方法将刚性有限状态机转换为能够实时演进的动态响应系统,从而在更少的代码量下,实现更复杂、更细致入微的游戏内行为和对话。
遗憾的是,Inworld尚未发布MAP和AI状态树的Demo演示视频,可以猜测这两大功能可能仍在研发与改进之中。希望在不久的将来, MAP 和 AI 状态树技术的落地能够打造出更加主动与智能的NPC。
LitGate:从让 NPC 成为玩家得力的 AI 伙伴,到革新对话 树让交流更自然灵活,再到对 NPC 行动规划的深度探索,Inworld让NPC与人类交互的方式更加多元与自然。这样的NPC不仅说话的方式像一个真实的人,做事的方式也贴近真实的人。
Demo链接:https://www.youtube.com/watch?v=XraqAyq0hSo
超越效率?
AI 不仅可以打开通往新型体验、叙事和游戏玩法的大门,也可以用作加速游戏开发和设计的工具。Inworld的”超越效率“指的即是通过Inwolrd游戏引擎帮助开发团队节约人力成本、时间成本与资金成本。
01
文档解析工具——Narrative Graph
在正式开发游戏之前,许多团队都已经为游戏世界、各个人物、剧情创作了大量的文本文档,手动将这些文档中已有的内容一个个编写入代码需要花费大量的时间。为此,Inworld与Xbox共同开发了一款名为Narrative Graph的工具,帮助开发者快速将文本文档内容落地成为相应的角色与情节等。
Narrative Graph能够接受用户上传的txt/pdf/docx格式的大纲、脚本等任意本地文件,并自动解析这些文档,将其中设计的场景、人物、知识进行自动化归类整理,包括角色信息、世界观知识等等。解析的所有结果都将直接链接到工作台的Characters, Knowledge, Scenes三个板块,在其中自动生成对应的NPC,场景与知识。
随后,Narrative Graph将生成带有分支叙述的可视化图表,每一个环节都由场景+剧情+人物构成,并根据上传的剧情构建分支关系。用户可以自由编辑任何一个环节,还可以使用 AI 根据游戏中最有效的内容为新的故事情节或对话生成想法,为开发者提供了极大的便利。
Demo链接:https://www.youtube.com/watch?v=RjoRW6yyEsA
02
脚本创作工具——Scriptwriter
并非所有开发团队在开发之前都会创作所有的文本文档,因此,Inworld还开发了另一款工具Scriptwriter,用户可以直接在Inworld平台上以更加便捷与智能的方式创作脚本。
Scriptwriter的核心功能是将LLM创作能力与人类创作能力无缝结合,以人类创作为核心,使用LLM生成为辅助,快速完成脚本的写作。
用户选择新建脚本后,Scriptwriter会要求用户输入场景名与描述,并从Characters板块中选择链接已有的NPC角色,确认后,Scriptwriter会使用LLM自动生成五句对话作为该场景的开头部分。
通过与角色引擎的链接,LLM将完全按照设定的NPC属性来生成内容
此后,用户将以Story Beat为创作单元进行脚本创作。所谓Story Beat,即是情节点,通常是新事件的发生。例如,用户可以新建一个Story Beat,输入“Ren在射击游戏中击中了10发中的8发,赢得了一只巨大的粉色毛绒独角兽”,Scriptwriter即会围绕这一情节点生成新的五句对话,用户可以选择接受或让Scripwriter重新生成。通过这样的模式,所有的Story Beat都由用户决定,保证了脚本的情节走向是由人类控制,而具体对话与细节则由AI来负责。
LLM根据用户输入的Story Beat作为Prompt生成相关的五个对话
Scriptwriter默认以五句话的长度进行生成,用户可以选择增加新的句子,只需要@某个NPC并选择期望的语言风格或语气,例如输入”@Alex”,Scriptwriter会自动生成几个建议的语气或风格,选择“Joke”,Scriptwriter即可自动生成下一句Alex以玩笑方式的回应。
Scriptwriter会给出推荐的语气,用户也可以自行输入
不仅如此,Scriptwriter生成的每一句话都是基于角色引擎中NPC设定的属性完成的,不同NPC的发言都会体现不同的个性。并且,Scriptwriter也支持用户对生成的每一句话进行自由的编辑,每一句话都可以以文本框的形式进行删改或增添。Scriptwriter还内置了AI自动改写的功能,用户只需要点击每一句话下方代表“Rephrase”与“Shorten“的按钮,AI就会自动完成改写或缩减。开发者可以快速调整或修改说话的语气或语言风格。
一键改写
此外,在过去,由于游戏情节走向的复杂性,游戏开发者往往需要同时使用表格文件与文本文件并在这两者间不断来回切换,例如excel与word。针对这一点,Inworld将Scriptwriter设计成了结合两者优点的工具,让开发者只需要使用Scriptwriter,而无需在不同工具之间频繁切换。Scriptwriter支持情节分叉树的设置,用户可以在任一节点新增不同的剧情走向。此外,Scriptwriter支持Jason的输入与输出,所有脚本都可以一键导出为Jason格式。
可以说,Scriptwriter高度融合了人类创作与AI创作,极大提高了开发者的效率,更关键的是,Scriptwriter将与NPC角色引擎的各个子系统协同工作,保证AI生成的所有内容都基于NPC的属性。
Demo链接:https://www.youtube.com/watch?v=rsb3HlavL9Q
Demo链接:https://www.youtube.com/watch?v=sjz9vCS_U14
03
声音工作室 & 多语言支持
除了LLM模型以外,Inworld平台内同样集成了TTS模型,声音工作室提供大量的不同特色的内置语音供用户使用。选择语音后,用户可以进一步调整口音、音高、速度,并为每一个NPC设定对应的声音。此外,Inworld还强调了对中文、韩文等多种不同语言的支持。Inworld 不依赖机器翻译,而是专注于可以用所需语言原生生成对话的 AI 模型。
但相较于Inworld在其他方面的表现,语音与多语言方面,Inworld展现的功能似乎就有些令人失望。无论是从中文语音的表现,还是从文字的表现来看,Inworld在语音与多语言支持方面的表现并不好,中英文的语音都具有很强烈的机械感,NPC的中文语言也会出现奇怪的表达。
中文表达会出现”菜肴表现精美“”幸福味道“”呵呵“等不地道的表达
Demo链接:https://www.youtube.com/watch?v=KYIHR0VXNRM
Demo链接:https://www.youtube.com/watch?v=7efqS7NCjzk
04
NPC批量创建工具——Mass Character Generator
在RPG等游戏中,开发者往往需要大量的NPC以支撑起复杂的剧情,为每一个NPC编码需要耗费大量的人力与时间成本。以《荒野大镖客2》为例,其NPC角色超过1000个,每一个NPC都有各自的代码、歌手、美术作者和配音演员,分布在6个章节的100多个任务中,这也是《荒野大镖客2》研发成本接近5亿美元、耗时8年的原因之一。
针对这一问题,Inworld开发了Mass Character Generator,为开发者提供了大规模批量创建AI NPC的能力。
Mass Character Generator同样通过LLM与用户交互,用户可以通过语音输入一个简短的世界观,Mass Character Generator即可以根据世界观创建出大量不同的NPC大脑,每一个NPC都有自己的名字、对话风格、情绪、关系,并对这个世界的世界观有统一的认识。创建后,Mass Character Generator将自动调用开发者的游戏资产创建NPC与世界的外观形象。
用户输入:想象一个设定在中世纪的世界,那里有骑士、法师、流氓甚至德鲁伊,他们都在为控制王国而战斗
用户输入:这个世界设定在被统治的荒凉荒原上,遭受兽人部落的蹂躏。这个世界完全被兽人所居住,这些兽人可以是兽人战士、兽人首领或兽人萨满
Demo链接:https://www.youtube.com/watch?v=Aev65jeXozY
05
更适合游戏的定价模式
目前OpenAI、ElevenLabs等主流大模型API的定价更适用于交互与生成需求不大或不需要那么快的企业需求。而在游戏场景中,大量的用户实时在与不同AI NPC进行交互,且需要AI NPC很快地完成输出。相较于一般的ToB场景,游戏场景往往需要更多的Token用于大量交互,同时需要模型回复速度较快。
因此,目前主流大模型API的定价模式并不太适用于游戏场景,低估大模型的成本也成为了很多游戏开发团队在游戏爆火后遇到的最大问题。在开发阶段与游戏用户数量较少时,大模型成本相对可控,但一旦游戏爆火,大量用户涌入,每日消耗的token成本也会激增。
而Inworld采用完全针对游戏场景需求的定价模式,通过多种手段优化成本,实现低于海外主流的LLM与TTS模型的定价。Inworld优化成本的主要手段为四种:
优化模型架构:通过quantization、batching、KV-cache优化等来提高吞吐量,同时将质量下降降至最低
小模型与组合模型:许多情况下,较小模型的优化和调整可以使成本降低 2 到 10 倍,而质量则几乎没有下降,Inworld在这些场景下使用小模型或组合模型
推理服务器算法优化:引入 SoTA 方法、部署优化内核、KV-cache优化、改进请求调度/路由等
端侧模型:Inworld致力于将模型移至设备,Inworld正在创建性能更好的小型模型,并在 Computex 上展示了混合的设备和云部署
LitGate:在开发效率与成本上,Inworld确实为开发者提供了许多便捷的开发工具和更低的价格。可惜的是,相较于在其他方面的亮眼表现,Inworld的TTS与多语言的表现有些令人失望,期待Inworld在未来的更新中能够对这方面的功能做出升级。
结语
Inworld通过其角色引擎和多样化的AI工具,为游戏开发者开辟了更广阔的创作空间。Inworld不仅赋予NPC更丰富的个性和智能行为,还通过Narrative Graph和Scriptwriter等工具显著提升开发效率,降低成本,为开发团队提供了更具性价比的解决方案。
展望未来,Inworld计划继续推进多模式行动计划(MAP)和AI状态树技术,让NPC具备更主动的行为规划和情境适应能力。这意味着NPC不仅能够响应玩家指令,还能在复杂场景中自主做出合理决策,提供更细致的策略支持和丰富的互动体验。这些技术的突破有望让NPC在未来成为玩家的智能助手、战术顾问,甚至是虚拟世界中的长期伙伴。
Inworld的探索标志着AI在游戏行业中的深度应用,不仅拓展了游戏的互动可能,也为整个“AI+游戏”行业的发展树立了创新方向,推动了未来更沉浸式、更个性化的游戏体验的实现。后续我们还将对Inworld历史的项目进行研究。Inworld所代表的不仅仅是NPC的发展方向,更可能是整个 “AI + 游戏” 行业未来发展的重要风向标,同时也为游戏开发者开辟更广阔的创作空间和更具性价比的开发路径。
关于LitGate
大家好,我是LitGate,一个专注于AI创作的游戏社区。我们的新版官网已经上线✨你可以在里面找到各种AI创作的实操案例,以及已经沉淀的AI游戏创意demo,相信一定能让你大开眼界!
我们还有一个讨论群📣,如果你对AI创作感兴趣,或者有什么问题想要咨询,欢迎加入我们的讨论群,和大家一起交流学习!(PS:目前群内人数较多,为了有一个优质的讨论环境,请各位添加社区管理员企业微信账号邀请入群
更多精彩活动和功能筹备上线中,敬请期待~
关注我们,一起探索AI创作的无限可能吧!
新版官网地址:www.litgate.ai