对话生数科技CEO唐家渝：AI视频到了“普及”节点，提升时长不是产品化的重点

财富 2024-09-12 21:23 四川

9月11日，生数科技举办媒体开放日活动，发布“主体参照”（Subject Consistency）功能，意在破解视频模型生成主体的“一致性”难题。

活动上，生数科技联合创始人、CEO唐家渝在回应《每日经济新闻》记者关于商业模式的提问时表示，目前行业内有SaaS（软件即服务）订阅和MaaS（模型即服务）两种，7月30日Vidu上线以来，在全球范围内已收到数万个API接入申请。

就底层架构，唐家渝表示旗下产品“VIDU”所用的“U-ViT架构”与Sora所用的“DiT架构”几乎一模一样，差别在于U-ViT作了更多面向落地的设计。在技术路线上，大家现在处于底层架构收敛的状态，但同质化并不代表大家所有进展、能力相同，唐家渝举例说：“例如现在的语言模型，（虽然）大家都使用Transformer架构，但从现实来看，OpenAI还是明显领先的。”

目前，AI视频的主要使用者还是专业用户，如电影工作者等，但唐家渝认为，AI视频已经来到了“普及”的节点。

此外，从当前阶段的收入来说，生数科技在B端市场获得的收入更多，C端的增长曲线则在Vidu产品上市这一个月以来非常“陡峭”。

唐家渝图片来源：每经记者李少婷摄

“最终的目标还是做通用大模型”

唐家渝是清华大学自然语言处理实验室硕士，此前曾任瑞莱智慧副总裁、腾讯优图实验室高级产品经理等。唐家渝目前所在的生数科技于2023年3月成立，今年3月初宣布完成新一轮融资。今年4月底，该公司与清华大学联合研发的原创视频大模型Vidu面向全球发布，7月底正式上线，全面开放使用。

Vidu问世即被称为“中国版Sora”。这种称呼一方面是因为外界对中国视频大模型充满期待，另一方面，从技术架构上说，二者也有异曲同工之处。

据介绍，Vidu的底层基于自研的U-ViT架构，而Sora是基于DiT架构。关于U-ViT与DiT架构的区别，唐家渝介绍：“一句话总结来说，几乎一模一样。”二者都是Diffusion和Transformer的融合，甚至底层一些技术细节也是相同的。不同之处在于，U-ViT架构“做了更多面向落地的优化设计”，简单概括下来，就是在训练同一模型时，相同时间下，U-ViT所需的算力更少。

从整体的技术路线来看，当前国内几家视频大模型都走的是“类Sora路线”，那大家未来是否会愈加同质化？

对此，唐家渝介绍，当前大家是处于底层架构收敛的状态中，“但同质化并不代表大家所有进展、能力都相同”。他以语言模型为例分析道，大家都会使用Transformer架构，但从现实情况来看，OpenAI还是明显领先，这是因为在这一架构基础上仍有诸多环节需要技术技巧、实践经验帮助破解难点，这就导致了不同语言模型在能力上的差距。

当前，业内也在探索新的架构路线，例如将多模态的生成和多模态理解结合起来，但目前仍没有特别好的方案出现。

“我们最终的目标还是做通用大模型，视频生成是多模态生成大模型中间的一个阶段。”唐家渝坦承了开发通用大模型的雄心。

他还表示：“这并不意味着我们完全只在做这一个事情（指视频大模型），我们除了视频以外也有其他模态的生成能力。”

“目前B端市场收入更多”

技术底层逻辑的趋同，也或多或少低导致了市场开发思路相近。

“大家的商业选择上还是比较类似的，即便是像Sora、Runway，都在积极地拥抱好莱坞或者广告合作等方向。”唐家渝认为，AI生成视频领域总的来说还处在发展前期，国际头部玩家在齐头并进，或者叫“共同扩大市场”。

以生数科技为例，唐家渝将落地商业模式分为两个方向：其一是SaaS订阅模式，Vidu每个月有一些免费的额度，但是如果有更多的需求或想使用更高级的能力，就需要支付订阅费用，Vidu也会不断丰富产品功能，以满足用户的创作需求；其二是模型能力输出模式（MaaS），当前不少客户需要视频生成能力，以此作为工作流程的一个环节或者来衍生出有意思的玩法，这些客户希望可以直接调用模型。

从收入角度来看，B端市场在目前这个阶段获得的收入更多。不过Vidu上线一个月来，C端的增长曲线也非常“陡峭”。“我们目前判断下来的话，B端（的需求）是比较明确、比较直接和比较稳定的，所以B端是我们的一个长期、重点方向。C端我们也在不断探索。”唐家渝表示。

当前，国内的视频生成模型和工具已形成“出海潮”，并且表现亮眼，但唐家渝认为：“还不能说国内已经完全领先，国内外头部玩家都属于第一梯队。”

“AI视频来到了一个节点”

视频大模型的受众群体中，影视、动漫从业者居多，他们多被视为“专业受众”，那对“普通人”来说，AI视频何时能成为他们可以驾驭的工具？

唐家渝以摄影为例，从胶片机时代到手机摄影普及，就是一个不断降低创作者门槛的过程。“现在的AI视频来到了一个节点。”唐家渝介绍，9月11日，生数科技发布的“主体参照”功能，正是为降低创作者门槛或者加速创作过程所作的努力。

“技术仍是关键因素，目前的视频生成只是初步符合物理规律，还有很高的天花板需要突破，比如更强的模型能力以及更多模态的协同生成。”唐家渝介绍，这次发布的“主体参照”能力在一致性生成方面确实有了很大提升，但是还有很多地方需要进一步提升。“例如要大模型从生成一个商品变成生成一个工艺品，而这个工艺品上面有繁复花纹和镂空部分，面对如此复杂的结构，目前的生成成功率依旧不高。场景生成包含很多组成因素，例如运动鞋，我就希望它能在更复杂、更动态化的场景中有更好的表现。这些都需要不断提升模型能力。”

这个过程中，技术的原创性和突破性需要与良好的商业化齐头并进，因为商业公司毕竟不是科研机构。

以视频生成的时长为例，拓展生成时长需要提升模型对世界抽象理解的能力、信息压缩和放大的双向能力。当前Vidu最长可以生成32秒的视频，生数科技计划将其扩展得更长，不过，时长还不是生数科技现在重点产品化的部分。

“在实际创作中，粗略地来说，90%以上的片段都是几秒钟。因此，从实用角度来看，我们还没有将时长作为我们的优先发布考虑。”唐家渝强调，但从模型能力角度，公司实际上在持续提升。

记者|李少婷可杨

编辑|段炼文多杜恒峰

校对|王月龙

｜每日经济新闻 nbdnews 原创文章｜

未经许可禁止转载、摘编、复制及镜像等使用

如需转载请向本公众号后台申请并获得授权

http://mp.weixin.qq.com/s?__biz=Mzg3NTA5MjkyNQ==&mid=2248364062&idx=5&sn=c9ce5af3f6b7ad3d22464f9790331a2d

每日经济新闻

中国主流财经全媒体。互联网新闻信息服务许可证编号：51120190017 。

全球首个电动汽车保有量超燃油车的国家，去年13%的新车从中国进口！每经专访挪威前副首相

上海，大消息！

多家银行宣布：限额提升！有银行从单月60万元提至600万元

中国恒大突发！取消！

同时公告！重要股东要减持“券商一哥”，套现或达46亿元！“券商一哥”子公司也要减持知名影视公司

热搜！2025年元旦放1天不调休，以后除夕都放假！多了2天假，调休怎么排？相关负责人解答→

唐山市委书记调整

新机场来了，对东北经济第一城意味着什么

“一户最多自掏约100万元”，居民自筹4.7亿推倒重建危旧小区有了最新进展！“每天选房8小时，明年3月竣工”

历史性一刻！黄金之后不再是白银，是比特币！逼近9万美元/枚，特斯拉也爆赚近40亿元

广东：全力以赴做好伤员救治和调查处置工作，举一反三开展问题排查整治

珠海11日晚发生驾车冲撞市民重大恶性案件：35人死亡 43人受伤

无代码应用秒哒、智能体……百度AI新旗舰如何重塑商业版图

突发！人民币汇率下破7.25，A股3700多只股票下跌，亚太股市全线跳水！发生了什么？专家解读→

离婚综艺带火熏鸡，厂家：销量增长100倍！《再见爱人》霸屏热搜，这家A股公司也成大赢家

李子柒，复出！

惊喜！国务院定了：春节和劳动节假期各增1天！2025年放假安排也来了

集体下架！抖音还贴出截图，网友：大快人心！

超越雷军，他首次“登顶”！已捐53亿元股票建大学，旗下芯片公司营收创历史新高

“00后”女生被判刑！她利用“七天无理由退货”薅羊毛，薅了13万元！法官提醒

“很无语”！张艺谋呼吁观众进电影院：别在手机上看！三季度全国观影人次、总票房跌超40%，超半数影视上市公司亏损

A股少见！四大国有银行共同出手，“盯上”这家公司！

家电以旧换新两月后：新兴小家电“占领”北上广，小城拥抱智能化

俄乌双方发动大规模无人机攻击！泽连斯基做出这一决定......

4天巨亏370亿元，马斯克“打爆”对冲基金空头！特朗普胜选后他身家大涨，已达3200亿美元

以色列财长称“希望将主权扩展至约旦河西岸”，以外长：“目前巴勒斯坦建国‘并不现实’”

重要报告！央行行长潘功胜最新发声

财经早参丨美股三大指数收涨续创新高，特斯拉市值升至美股第七位；比特币升破8.8万美元；深圳证监局：严禁直播荐股

突传噩耗！前亚洲首富逝世，享年95岁，生前在广东老家捐资赞助多项教育文化事业

癌症患者筹款后晒新房，称“总价70多万”！平台出手：27.8万元全部退还，拉入黑名单、永久禁止

楼龄30多年、同意率超90%，四个多月项目仍停滞！深圳首个自拆自建项目，堵在哪里？

房地产大消息！关于回收开发商闲置土地，办法刚刚明确了

非法收受财物，对抗组织审查！70岁艾书琴已被查

特朗普新任命！他将主管边境事务，曾称“百分之百支持修墙”！美国“非法移民”达1260万，被驱逐对经济影响多大？

失联的4名大佬，3人遗体已找到！洪灾已致220多人死亡，13万人上街抗议西班牙政府抗灾不力

日本突发！海上自卫队一扫雷艇沉没，一名艇员失踪

刚刚，石破茂在日本参议院首相指名选举投票中胜出

被曝成交16亿元，退货率达95%……知名品牌成“凑单神器”？网友吵翻

从80元1个到36.9元8个！“明星水果”，价格跳水

A级航空灾难！海南航空深夜通报

大部分省市遭受暴雨袭击！这国总统宣布：国家进入灾难状态

“终结美联储”？马斯克表态：支持

“金融为民”系列之4——邮储银行特色网点，金融服务与人文体验的双重奏

刚刚，支付宝致歉！

广西烂尾轻轨“幻想柱”被拆除！知情人士：单根墩柱拆除费用约10万元，房屋中介：部分“轻轨房”房价腰斩

突发重磅！券商巨头宣布：“降息”！业内人士解读→

突发！日本石破内阁集体辞职

以色列承认了！

财经早参丨中国政府就黄岩岛领海基线发表声明；证监会召开机构座谈会，吴清出席；海航一航班遭遇鸟击返航

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉