谷歌Genie 2代震撼登场:仅靠一张图AI生成3D互动游戏

科技   2024-12-09 23:56   湖北  

「 点击上方"GameLook"↑↑↑,订阅微信 」

今年2月底,GameLook曾报道过谷歌推出的AI图片生成游戏项目“Genie”。在当时Sora等文生视频工具还算新鲜玩意的时候,谷歌这个能够将文本提示、草图或概念想法转化为2D的可交互式环境的项目,目标可以说相当超前。

没想到时隔不到10个月,谷歌就将Genie迭代至了第二代,并带来了更成熟、丰富的功能预览。就比如Genie 2将AI生成的游戏世界的维度从2D生成到了3D,单次生成的时长也从几十秒变成了最大一分钟,整体朝向GameLook当时期待的AI游戏引擎的方向更近了一步。

谷歌官方的博客文章解释道,Genie 2是谷歌DeepMind推出的一款大规模基础世界模型。它能够根据单张图片或文字描述,生成可交互的3D游戏世界。简单来说,就是你给Genie 2一张图片或者一段文字,它就能帮你创造出一个逼真的3D游戏场景,而且你还能在这个场景里进行互动。

项目原理方面,根据官方介绍,Genie 2基于大量的游戏和视频数据进行训练,通过一个自动编码器,将视频帧转换为“潜在帧”,也就是压缩后的核心信息。系统会将这些潜在帧传递给一个大规模Transformer动态模型。这个模型会学习预测下一步会发生什么,就像是大语言模型预测下一个单词一样。基于预测结果,Genie 2就能生成一个连续的、可交互的3D世界。

功能上,目前Genie 2 主要由两部分组成,其一是生成符合风格的、可交互的3D场景。不同于上一代模型,现在Genie2可以记住游戏世界中出现了哪些场景(有了记忆),生成的结果不再是一个像梦境一样随时变化的动态空间了。此外Genie 2还支持3D空间中的重力、光线、反射、烟雾等物理模拟以及特殊效果模拟和生成。

“无论是森林、城市还是外太空,Genie 2都能根据你的描述生成逼真的3D场景。而生成的3D场景不仅仅是静态的图像,你可以在其中进行互动,比如控制角色移动、跳跃、与物体交互等。”

物理效果

实时光影变化

场景记忆

其二Genie 2还可以生成在3D世界行动的智能体(谷歌称为可扩展的可指导多世界智能体Scalable Instructable Multiworld Agent,简称 SIMA),作为游戏中玩家可操作的角色和智能NPC,玩家可以与SIMA智能体,进行复杂交互。

更重要的是,相较于Inworld AI等目前常见的在游戏外通过给予各种条件和限制的AI智能体,谷歌宣称,Genie 2的推出意味着开发者可以直接在AI生成的环境中生成、测试、训练原生的AI智能体。

开发者输入打开红色门的指令,SIMA智能体就能够在游戏中完成相应的操作

对于Genie 2, 谷歌在官方博客文章中表示,该技术的最利好游戏开发者的影响之一就是可以帮助研发团队加快游戏原型测试、迭代的效率。就比如游戏项目早期会绘制的一些概念图,如今通过AI就能迅速变成一个可以有NPC、可互动的虚拟空间。

同一个在天空中飞翔的设计,AI能够快速迭代展示不同的主体呈现的效果

虽然从谷歌目前博客中展示的部分结果来看,类似AI生成图片的那种不连续感、AI感,目前Genie 2 依旧没能去除,1分钟的时长限制更是硬伤,但仅仅10个月就从2D升级到3D、从简单地让画面动起来变为有UI的游戏界面,如此大跨步的跃进其实已经相当了不起了。要知道传统游戏行业从2D升级到3D,可是度过了一段相当漫长且痛苦的过程。

从目前展示的情况来看, GameLook相当期待明年这个时候,Genie或者其他AI工具能有能够展现出怎样令人惊喜的能力。

想要了解谷歌Genie 2的读者可以访问网址:https://deepmind.google/discover/blog/genie-2-a-large-scale-foundation-world-model/


····· End ·····



GameLook每日游戏产业报道

全球视野 / 深度有料

爆料 / 交流 / 合作:请加主编微信 igamelook

广告投放 : 请加 微信:Amyly588

      长按下方图片,"识别二维码" 订阅微信公众号

····· 更多内容请访问 www.gamelook.com.cn ·····

Copyright © GameLook® 2009-2024


        觉得好看,请点这里 ↓↓↓ 

GameLook
揭秘游戏圈:聚焦爆款,热点,趋势。GameLook是中国领先的游戏产业研究媒体,为游戏开发者、投资者、玩家提供高价值的全球游戏业资讯、原创评论与分析、行业数据与技术前瞻。
 最新文章