图森未来 投稿
量子位 | 公众号 QbitAI
宣布转型AIGC的图森未来正式宣布启用全新品牌CreateAI,并公布多个业务进展:
将基于武侠IP《金庸群侠传》开发一款大型开放世界RPG游戏。而此前公布的《三体》项目将与“超时空要塞之父”、著名动画导演河森正治和顶级动画制作公司株式会社白组合作。
更为重要的是,图森未来还正式发布首个大模型产品Ruyi,该模型定位于开源图生视频领域。
作为其自研AI基础设施的底层核心,图森未来将基于Ruyi大模型,打造多个针对游戏和动画制作的AI生成式工具。
这距离图森未来宣布转型仅半年时间,并且由单一的AI游戏开发上升至生态战略:
一是将大模型聚焦游戏动漫制作领域。
二是通过自研游戏,让大模型从流程上开始真正参与游戏及动画制作,从而让大模型具备更多商业价值,同时缩短其自研游戏IP的开发周期。
“我们希望通过生成式AI技术重新定义数字化娱乐内容的制作。”图森未来董事长陈默表示,“我们的目标是5年内将制作成本和开发周期降70%。”
△Ruyi大模型生成效果演示
转型的决心
根据图森未来公开披露的商业计划书,其AIGC核心业务分为两部分:
一是游戏与动画内容制作。
二是自研生成式AI技术。
游戏与动画内容制作方面,图森未来披露2025年将上线AVG与SLG游戏,《金庸群侠传》开放世界RPG游戏将于2027年上线,《三体》影游融合动画电影和游戏,将于2027年同步上线。
自研生成式AI技术方面,其已经发布的Ruyi图生视频大模型将持续针对动漫和游戏场景进行深度学习,将在2025年进行多次叠代和升级,Ruyi还将作为底层设施,推出一系列的定制化游戏开发平台。
虽然无人驾驶概念再次火热,昔日竞争对手中也有成功上市的,但图森未来在无人驾驶业务方面,依然决定保持轻资产运营,主要专注于专利和数据的对外授权。
对于陈默而言,这是一个决定生死不得不做的选择,无论是自身情况还是外部环境,无人驾驶业务都难以持续。
内部元气大伤的原因在于,2022年图森未来董事长陈默、前任CEO吕程被请出公司后的一年里,研发人员超过1000人,运营总成本接近4亿美元,并且已下订单的重卡合作伙伴Navistar和Scania全部终止合作。
2022年11月陈默与吕程重返公司后,发现已经陷入绝境:
如果按照此前进度推进L4级别无人驾驶,账上的钱仅能支撑2年,而生态链合作伙伴的崩盘,以及内忧外患的诉讼、调查,则让规模化收入和融资遥遥无期。
外部环境同样不容乐观。在陈默看来,L4级别无人驾驶领域依然有3个难题无法解决:
一是无论传感器、执行器还是刹车转向、计算器,都没有做好L4的准备。
二是短时间内看不到机器开车比人更便宜。
三是无人驾驶研发成本很高,依然需要大量的资金投入。
在此背景下,即使面对外界的巨大质疑,陈默及吕程也依然决定不再烧钱继续做L4级别的无人驾驶,而是一边收拾前任CEO留下的烂摊子,一边寻找新的发展机会。
为什么是大模型+游戏
2024年国产游戏大作《黑神话·悟空》验证了优质游戏的吸金能力。
根据贝恩咨询公司数据,在全球大部分产业增长乏力情况下,游戏和动漫行业依然蓬勃发展。其中2023年全球视频游戏市场规模超过2000亿美元,而全球动漫市场年复合增长率达到10%,预计2030年将达到600亿美元。
然而高制作的成本和漫长的开发周期,限制了高质量内容的供应。根据行业数据和经验,动画电影/电视剧制作成本约占总承包的60-70%,平均制作周期4-6年。视频游戏开发成本则占总预算的50-70%,开发周期约5-7年。
生成式AI技术将彻底改变这一现状,这意味着巨大的商机。就连埃隆马斯克旗下的人工智能公司xAI,也在不久前宣布进军游戏领域,成立一家AI驱动的游戏工作室。
图森未来显然也看到了这个蛋糕,经过公司内部和董事会的多次评估,最终踏上数字化内容娱乐转型之路。
据陈默介绍,在图森未来之前他曾创办过游戏公司,多年来一直保持对游戏和动漫行业的关注。而图森未来作为一家技术基因公司,能够以边际成本最小的方式快速进入大模型领域。
当然最重要的是,新的方向给了图森未来 “翻身”的机会:
此前因无人驾驶产生的高额成本已经降低,现有业务架构下有至少3年的资金储备,游戏具有成熟的商业化模式,叠加AI能力将加快游戏推出的进度,能够更快的形成规模收入和利润。
根据陈默的规划,新业务乐观能在2026年实现收支平衡,他也希望通过最终的成绩来给市场和投资人“一个交代”。
技术复用和经验思考
图森未来于12月17日上线图生视频模型Ruyi,用户提供一张图片作为输入,选择输出时长、分辨率、运动幅度等参数,就会得到不超过5秒的视频。
虽然相较于可灵、海螺等国内第一梯队的图生视频大模型,Ruyi还具有一定的差距,且存在手部畸形、多人时面部细节崩坏、不可控转场等问题,但能够在不到半年时间内从训练数据到发布模型,图森未来展示了其作为一家技术公司的实力和水平。
据图森未来COO郝佳男介绍,虽然无人驾驶和图生视频模型是两个不同的领域,但依然有非常多的技术可以复用。
首先是技术人才方面,虽然因业务调整自动驾驶算法的技术人员已经离开,但感知算法的技术骨干依然留任,而大模型与此前无人驾驶的感知算法较为接近,技术人员能够在很短时间内上手。
在数据积累和处理层面,复用了此前无人驾驶非常多的数据处理基础设施工具和流程,基本没有边际成本:比如高质量的数据清洗和打标签,如何大规模处理视频和数据,如何把视频保存下来,如何调动上千块的GPU,如何快速发现问题并进行迭代,如何快速部署代码和更新。这些是非常复杂和琐碎的工作,但非常依赖于经验,决定着开发的效率。
事实上,无人驾驶的数据模型虽然体量小,但数据处理训练要比图生视频大模型复杂太多,因为无人驾驶涉及安全问题,必须保证100%不能出错。
而外界对于图生视频模型的交付效果容忍度较高,对于图森未来而言,这甚至是“有点轻松”的工作。
郝佳男表示,在Ruyi推出的过程中也踩了很多算力算法的坑,目前已发布的也是7B的小体量模型,还需要做很多调整的实验,去解决一致性、流畅性以及审美等问题。
图森未来的目标是尽快追赶第一梯队,根据内部评估,以现有发展速度,2025年下半年有希望达到第一梯队水平。
既然图森对大模型如此有信心,为何还要大费力气自研游戏和动画电影?
郝佳男表示,目前已有导演或博主通过市面上的大模型工具完成短片,但在落实到工业电影的实际生产中,依然存在不小的困难。因此做大模型最大的挑战,其实是如何让大模型真正参与或融入现有的制作流程,这不是一个技术问题,而是商业和流程的问题。
这也是图森未来做无人驾驶业务获得最深刻的教训:
与生态方密切合作共建生态,一方面配合度达不到最佳状态,另一方面太受制于人风险过高。“因此最好的解决方案就是自己研发游戏,内部游戏团队和大模型团队去磨合,双方不断进行交互数据反馈,才能让大模型真正成为制作的一环。” 郝佳男说。
郝佳男预计,内部的游戏与大模型团队的磨合至少还需要1年时间,不过一旦解决了这个难题,不仅有利于图森缩短开发游戏的时间,也能够赋予大模型真正的商业价值,并实现图森转型后的愿景——用生成式AI技术重新定义数字化娱乐内容的制作。
*本文系量子位获授权刊载,观点仅为作者所有。
— 完 —
量子位 QbitAI
վ'ᴗ' ի 追踪AI技术和产品新动态