【AI】香港科技大学与中国科技技术大学联合推出开放世界游戏生成模型

文摘 2024-11-09 15:02 河北

点击上方关注我们吧

近日，香港科技大学、中国科学技术大学等机构联合推出了GameGen-X 模型。

这一模型能够模拟游戏引擎的多种功能，支持创建丰富的虚拟角色、动态环境以及复杂的游戏事件，从而实现高度仿真且可控的开放世界游戏体验。

开放世界游戏视频的生成与交互新探索

在 GameGen-X 的支持下，用户能够生成高质量的游戏视频内容，并以创新的方式与虚拟场景互动。

该模型不仅可以生成创新角色、复杂动作和多样化事件，还能够根据用户的输入来调整游戏场景，实现一种前所未有的“游戏策划”体验，让游戏爱好者在虚拟世界中轻松构建自己的故事情节。

创新性的数据集 OGameData

GameGen-X 的训练依赖于一个庞大的游戏视频数据集 OGameData，这是全球首个专为开放世界游戏生成和控制设计的数据集。OGameData 包含超过 150 款游戏的 100 万个以上视频片段，研究人员还结合 GPT-4o 为每段视频提供了详细的文本描述，提升了模型对多样化内容的生成能力。

该数据集的规模和多样性使 GameGen-X 能够适应不同类型的游戏场景，并提供与传统游戏引擎生成方式相比更加灵活、细腻的画面和场景控制。这种数据集的构建为模型的多模态理解奠定了坚实基础，使其能够基于丰富的游戏情景生成长时间、高质量的视频内容。

双阶段训练：预训练和指令微调

GameGen-X 的训练流程分为两个阶段，即基础模型预训练和指令微调。

在基础模型预训练阶段，GameGen-X 通过文本到视频生成和视频续接任务进行训练，从而掌握了生成开放领域高质量长序列视频的能力。这个过程使得模型能够模拟多样化的游戏内容，包括角色动作和复杂的互动场景。

在指令微调阶段，研究团队引入了 InstructNet 模块，用以处理用户的控制信号并执行相关操作。InstructNet 负责处理用户输入的控制信号，实现对虚拟角色和场景的精细控制，并确保生成视频的多样性和质量不受影响。

该模块通过与基础模型的结合，使 GameGen-X 能够根据用户输入实时调整潜在表示，将交互性引入到生成的视频内容中。

游戏视频生成与交互控制的突破

GameGen-X 的设计结合了游戏视频生成与交互控制的需求，在开源与商用模型中具有显著优势。相比传统生成模型，GameGen-X 在生成视频内容时能够实现高水平的角色控制和场景控制，其生成的内容更贴近真实游戏场景，使用户能够在虚拟世界中更自由地互动和探索。

模型不仅能够生成多样化的环境，还可以根据用户的指令实时调整，满足了游戏策划和个性化生成的双重需求。

未来，游戏设计师和玩家将能够利用GameGen-X 等模型，在虚拟世界中构建出更为丰富和动态的内容。

对此，各位读者有什么想说的？

欢迎留言，一起交流你的观点与看法！

合作与交流

您的支持 · 我们的动力

诚邀投稿:

欢迎各位粉丝、朋友们提供稿件（前沿科技进展、科技产品动态、经典文献解读、技术原理科普、行业市场分析、科研生活感悟、社会民生观察等）。联系微信号：133 9674 1340，并请注明详细联系信息，对入选推送稿件者，我们会及时联系您，以微信红包形式给予报酬。

对前沿科技感兴趣的朋友，可以点击关注公众号，订阅感兴趣的话题专栏！

也可添加下述小编微信！小编邀请您一起加入“前沿科技观察”群聊！

让我们每天下午4点，一起探索全球最前沿的科技资讯！开启你的科技之旅，与志同道合的伙伴一同品味科技发展带来的时代红利，创新型的未来！

编辑|前沿科技观察

供稿|科创产业观察

审核|前沿科技观察

http://mp.weixin.qq.com/s?__biz=MzI3NzYyNjIzOQ==&mid=2247497935&idx=4&sn=ac89b53551bf4fad9ec4c8a695347421

前沿科技观察

聚焦科学前沿、着眼科技热点！理工博士，用最接地气的文字，传递最“好玩”的科技讯息！

最新文章

【新能源】长安汽车与宁德时代签署深化合作备忘录

【比亚迪】比亚迪全新MPV“夏”即将上市，官方图曝光！

【小米】小米15系列销量迅速破百万：极致性能助推热卖

【AI】服装设计师的福音！TryOn Labs 推出 FLUX.1-dev LoRA服装生成器

【红旗】红旗超豪华行政轿车“国雅”亮相在即，彰显大国风范

【字节跳动】轻松玩转表情包，字节跳动推出单图视频驱动模型 X-Portrait 2

【AI】ChatGPT新推出的搜索功能，对谷歌的影响有多大？

【亿航智能】把客运搞到天上！亿航智能在泰国首次载人飞行成功

【荣耀】荣耀Magic 7 Pro系列手机正式开售，起售价5699

【AI】珠海航展亮相最新国产自研四足机器人，代号“机器狼”

【北理工】创纪录！74.8%光能利用率，北京理工大学成功研发全球首款高性能光谱成像器件

【AI】香港科技大学与中国科技技术大学联合推出开放世界游戏生成模型

【大疆】第一视角操控无人机？大疆发布全新 DJI 飞行眼镜 N3，打造沉浸式飞行体验

【阿里巴巴】精准预测！阿里巴巴达摩院发布“八观”气象大模型

【中兴】中兴通讯发布星云 AI+ 战略

【东方蓝通】东方蓝通旗下Unihertz Jelly Max小屏手机国行版发布

【小鹏】已经投入工厂生产的小鹏AI机器人Iron终于亮相，到底长啥样？

【腾讯】高质量3D生成能力，腾讯开源Hunyuan3D-1.0大模型

【京东】快递拣货也要无人化了？京东物流“智狼”系统发布

【铭凡】铭凡 UM870 Slim 迷你主机开售：小体积，大性能

【小米】小米15钻石限定版已被抢购一空，雷军表示短期不能到货

【极氪】新车型亮相：2025款极氪X五座后驱版和长续航版发布，起售价13.5万元起

【中兴】中兴发布 5G AI CPE G5 Pro路由器，速度可达4.29Gbps

【AI】会模拟人类思维？昆仑万维发布了这款AI高级搜索

【荣耀】一句话点咖啡？荣耀YOYO智能体有多实用？

【华为】中国移动与华为发布“智网慧城”计划：推动5G-A与人形机器人创新

【小米】小米发布新款 Redmi G24 IPS 显示器：高刷新率与色彩体验的提升

【AGM】内置AI智学系统，深圳这家公司的学习机有多强悍？

【比亚迪】比亚迪10月销量突破50万辆大关，创下新纪录

【苹果】小体积，大性能，苹果2024款 Mac mini 正式发布

【一加】一加 13 正式发布：性能与设计的全新提升

【微软】微软开源OmniParser：突破性视觉基础GUI自动化工具

【vivo】iQOO 13正式发布发布：性能之光

【华西医院】将AI引入医疗！华西医院与华为联合发布“华西黉医”医学大模型

【联想】联想智能手表开售：时尚科技兼具

【AI】ElevenLabsAI推出AI语音生成工具Voice Design

【荣耀】荣耀Magic 7系列手机发布，搭载骁龙8至尊版处理器

【科大讯飞】灵巧轻便，科大讯飞翻译机 4.0 星火版上市

【华为】华为2024年前三季度财报出炉，营收持续增长

【AI】完美复刻，香港中文大学与国内联手的AI声音克隆模型来了！

【小米】小米澎湃 OS 2 正式发布：全新性能优化与生态互联体验

【小米】搭载澎湃OS 2系统的小米手表 S4 正式发布

【字节跳动】音画完美同步！抖音母公司推出了这款AI配音模型

【百川智能】百川智能发布Baichuan 4，专为企业打造

小米新旗舰终于来了，小米15有多强？

【比亚迪】比亚迪营收首次超越特斯拉

【小米】首发价格159元，Redmi 手环 3 正式发布

【众擎】真正意义适用于工业环境，国产全尺寸人形机器人来了

【荣耀】荣耀手表 5已上架：智慧升级，亮点满满

【苹果】苹果发布2024款24英寸M4 iMac，带来显著性能升级

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉