图森未来转型6个月：推出AI大模型，布局游戏生态，思考和底气是什么？

科技 2024-12-21 03:38 北京

图森未来投稿
量子位 | 公众号 QbitAI

宣布转型AIGC的图森未来正式宣布启用全新品牌CreateAI，并公布多个业务进展：

将基于武侠IP《金庸群侠传》开发一款大型开放世界RPG游戏。而此前公布的《三体》项目将与“超时空要塞之父”、著名动画导演河森正治和顶级动画制作公司株式会社白组合作。

更为重要的是，图森未来还正式发布首个大模型产品Ruyi，该模型定位于开源图生视频领域。

作为其自研AI基础设施的底层核心，图森未来将基于Ruyi大模型，打造多个针对游戏和动画制作的AI生成式工具。

这距离图森未来宣布转型仅半年时间，并且由单一的AI游戏开发上升至生态战略：

一是将大模型聚焦游戏动漫制作领域。

二是通过自研游戏，让大模型从流程上开始真正参与游戏及动画制作，从而让大模型具备更多商业价值，同时缩短其自研游戏IP的开发周期。

“我们希望通过生成式AI技术重新定义数字化娱乐内容的制作。”图森未来董事长陈默表示，“我们的目标是5年内将制作成本和开发周期降70%。”

△Ruyi大模型生成效果演示

转型的决心

根据图森未来公开披露的商业计划书，其AIGC核心业务分为两部分：

一是游戏与动画内容制作。

二是自研生成式AI技术。

游戏与动画内容制作方面，图森未来披露2025年将上线AVG与SLG游戏，《金庸群侠传》开放世界RPG游戏将于2027年上线，《三体》影游融合动画电影和游戏，将于2027年同步上线。

自研生成式AI技术方面，其已经发布的Ruyi图生视频大模型将持续针对动漫和游戏场景进行深度学习，将在2025年进行多次叠代和升级，Ruyi还将作为底层设施，推出一系列的定制化游戏开发平台。

虽然无人驾驶概念再次火热，昔日竞争对手中也有成功上市的，但图森未来在无人驾驶业务方面，依然决定保持轻资产运营，主要专注于专利和数据的对外授权。

对于陈默而言，这是一个决定生死不得不做的选择，无论是自身情况还是外部环境，无人驾驶业务都难以持续。

内部元气大伤的原因在于，2022年图森未来董事长陈默、前任CEO吕程被请出公司后的一年里，研发人员超过1000人，运营总成本接近4亿美元，并且已下订单的重卡合作伙伴Navistar和Scania全部终止合作。

2022年11月陈默与吕程重返公司后，发现已经陷入绝境：

如果按照此前进度推进L4级别无人驾驶，账上的钱仅能支撑2年，而生态链合作伙伴的崩盘，以及内忧外患的诉讼、调查，则让规模化收入和融资遥遥无期。

外部环境同样不容乐观。在陈默看来，L4级别无人驾驶领域依然有3个难题无法解决：

一是无论传感器、执行器还是刹车转向、计算器，都没有做好L4的准备。

二是短时间内看不到机器开车比人更便宜。

三是无人驾驶研发成本很高，依然需要大量的资金投入。

在此背景下，即使面对外界的巨大质疑，陈默及吕程也依然决定不再烧钱继续做L4级别的无人驾驶，而是一边收拾前任CEO留下的烂摊子，一边寻找新的发展机会。

为什么是大模型+游戏

2024年国产游戏大作《黑神话·悟空》验证了优质游戏的吸金能力。

根据贝恩咨询公司数据，在全球大部分产业增长乏力情况下，游戏和动漫行业依然蓬勃发展。其中2023年全球视频游戏市场规模超过2000亿美元，而全球动漫市场年复合增长率达到10%，预计2030年将达到600亿美元。

然而高制作的成本和漫长的开发周期，限制了高质量内容的供应。根据行业数据和经验，动画电影/电视剧制作成本约占总承包的60-70%，平均制作周期4-6年。视频游戏开发成本则占总预算的50-70%，开发周期约5-7年。

生成式AI技术将彻底改变这一现状，这意味着巨大的商机。就连埃隆马斯克旗下的人工智能公司xAI，也在不久前宣布进军游戏领域，成立一家AI驱动的游戏工作室。

图森未来显然也看到了这个蛋糕，经过公司内部和董事会的多次评估，最终踏上数字化内容娱乐转型之路。

据陈默介绍，在图森未来之前他曾创办过游戏公司，多年来一直保持对游戏和动漫行业的关注。而图森未来作为一家技术基因公司，能够以边际成本最小的方式快速进入大模型领域。

当然最重要的是，新的方向给了图森未来 “翻身”的机会：

此前因无人驾驶产生的高额成本已经降低，现有业务架构下有至少3年的资金储备，游戏具有成熟的商业化模式，叠加AI能力将加快游戏推出的进度，能够更快的形成规模收入和利润。

根据陈默的规划，新业务乐观能在2026年实现收支平衡，他也希望通过最终的成绩来给市场和投资人“一个交代”。

技术复用和经验思考

图森未来于12月17日上线图生视频模型Ruyi，用户提供一张图片作为输入，选择输出时长、分辨率、运动幅度等参数，就会得到不超过5秒的视频。

虽然相较于可灵、海螺等国内第一梯队的图生视频大模型，Ruyi还具有一定的差距，且存在手部畸形、多人时面部细节崩坏、不可控转场等问题，但能够在不到半年时间内从训练数据到发布模型，图森未来展示了其作为一家技术公司的实力和水平。

据图森未来COO郝佳男介绍，虽然无人驾驶和图生视频模型是两个不同的领域，但依然有非常多的技术可以复用。

首先是技术人才方面，虽然因业务调整自动驾驶算法的技术人员已经离开，但感知算法的技术骨干依然留任，而大模型与此前无人驾驶的感知算法较为接近，技术人员能够在很短时间内上手。

在数据积累和处理层面，复用了此前无人驾驶非常多的数据处理基础设施工具和流程，基本没有边际成本：比如高质量的数据清洗和打标签，如何大规模处理视频和数据，如何把视频保存下来，如何调动上千块的GPU，如何快速发现问题并进行迭代，如何快速部署代码和更新。这些是非常复杂和琐碎的工作，但非常依赖于经验，决定着开发的效率。

事实上，无人驾驶的数据模型虽然体量小，但数据处理训练要比图生视频大模型复杂太多，因为无人驾驶涉及安全问题，必须保证100%不能出错。

而外界对于图生视频模型的交付效果容忍度较高，对于图森未来而言，这甚至是“有点轻松”的工作。

郝佳男表示，在Ruyi推出的过程中也踩了很多算力算法的坑，目前已发布的也是7B的小体量模型，还需要做很多调整的实验，去解决一致性、流畅性以及审美等问题。

图森未来的目标是尽快追赶第一梯队，根据内部评估，以现有发展速度，2025年下半年有希望达到第一梯队水平。

既然图森对大模型如此有信心，为何还要大费力气自研游戏和动画电影？

郝佳男表示，目前已有导演或博主通过市面上的大模型工具完成短片，但在落实到工业电影的实际生产中，依然存在不小的困难。因此做大模型最大的挑战，其实是如何让大模型真正参与或融入现有的制作流程，这不是一个技术问题，而是商业和流程的问题。

这也是图森未来做无人驾驶业务获得最深刻的教训：

与生态方密切合作共建生态，一方面配合度达不到最佳状态，另一方面太受制于人风险过高。“因此最好的解决方案就是自己研发游戏，内部游戏团队和大模型团队去磨合，双方不断进行交互数据反馈，才能让大模型真正成为制作的一环。” 郝佳男说。

郝佳男预计，内部的游戏与大模型团队的磨合至少还需要1年时间，不过一旦解决了这个难题，不仅有利于图森缩短开发游戏的时间，也能够赋予大模型真正的商业价值，并实现图森转型后的愿景——用生成式AI技术重新定义数字化娱乐内容的制作。

*本文系量子位获授权刊载，观点仅为作者所有。

— 完 —

量子位 QbitAI

վ'ᴗ' ի 追踪AI技术和产品新动态

一键三连「分享」、「点赞」和「在看」

科技前沿进展日日相见 ~

量子位

追踪人工智能新趋势，关注科技行业新突破