分析师洞察|“中国版Sora”诞生记国产AI多模态加速中

文摘 2024-05-21 15:51 湖南

易观分析：抛去喧嚣表象，Sora在视频模型领域成为ChatGPT之后新的追赶标的。尽管Sora显示出远超同行的能力，但它并没有选择像Pika、Runway一样，开放给大众使用，而是采取与Google、Meta类似的保守策略，先官宣，慢慢内测，等待一个合适的时机再向大众开放。

易观分析研究合伙人陈晨认为，Sora没有对外开放主要基于几方面原因：一是考虑到文生视频技术是否会被滥用以及由此引发的安全性问题，OpenAI也许还需要进行一系列的安全性测试与优化调整；二是出于商业策略的考量，之前GPT在逐步开放之前也经过了4-6个月的内测，这可能都是由于OpenAI需要对模型实际运行的成本问题做前期评估。目前ChatGPT的运营成本已经非常高了，如果再加上Sora，成本恐怕会提升一个量级，所以OpenAI需要在产品开放前制定好相应的商业化路线。

目前国内很多企业都在相继布局视频大模型，主要分为三类：第一类是传统大厂，如字节跳动在视频领域布局已久，此前发布了高清文生视频模型MagicVideo-V2，此外像阿里云、腾讯、百度、讯飞等，除了在通用技术上继续向多模态大模型发力之外，也在面向行业开发一些应用于垂直领域的大模型。第二类是专门做视觉分析的厂商，比如海康威视等，已经开始投入到视频大模型的研发中。第三类包括一些专注内容开发、创意营销的厂商，比如昆仑万维、万兴科技等也研发了自己的视频大模型。

陈晨表示，“从生成效果看，Vidu对语义的理解，视频的时长、质量、一致性等方面在国内文生视频领域已经做到了领先，另外Vidu在技术路线上和Sora类似，都采用单一模型端到端的生成方式，这也是视频流畅度和视觉表现看起来比较好的原因。”

但需注意的是，与Sora相比，目前Vidu的时长、画面元素的丰富度、细节表现方面仍然有差距。不过，Vidu是一个阶段性的产物，模型能力的突破只是时间问题。至少Sora到现在还没有开放，原因可能是对实际任务的处理能力仍需要融合，以及资源、商业模式等多方面的问题。从这个角度上看，比起大语言模型，国内做视觉模型的起步是比较早的，技术和经验都有较深的积累，需要的是发挥国内产业链协同方面的优势，能够将多模态的能力落到B端和C端丰富的应用场景当中去。

对于国内AI企业寄希望于通过多模态实现弯道超车的问题，陈晨对记者表示，视频大模型在技术上的突破必定加速了AGI的进程，但AGI的关键还在于是否能自发地处理无限多任务，以及是否具备与人类一致的认知架构。此外，最近针对Sora也出现了不同的声音，有一部分专家并不认为Sora是真正可以通往AGI的道路。不过现在相对独立的技术路线在未来未必不会出现融合的情况，创造出真正智能且灵活可控的AGI模型。

至于到底谁先谁后，以现在的模型迭代速度来看，谈谁超越谁其实都是暂时性的，AI的发展不是此消彼长，一定会是共同进步的结果。

文章摘录：第一财经•04-28 作者：吕倩责编：李娜；

文链接：https://m.yicai.com/news/102088224.html

易观分析内容速览

易观分析：中国人工智能产业应用发展图谱2023（行业合集）

易观分析：中国制造业人工智能行业应用发展图谱2023

易观分析：中国零售业人工智能行业应用发展图谱2023

联系我们

商务合作

老没：13262228281（微信同号）

媒体采访

易观分析媒介：ygfxmkt（微信号）

文章转载

Lisa：18874170483（微信同号）

声明须知

声明须知：易观分析在本文中引用的第三方数据和其他信息均来源于公开渠道，易观分析不对此承担任何责任。任何情况下，本文仅作为参考，不作为任何依据。本文著作权归发布者所有，未经易观分析授权，严禁转载、引用或以任何方式使用易观分析发布的任何内容。经授权后的任何媒体、网站或者个人使用时应原文引用并注明来源，且分析观点以易观分析官方发布的内容为准，不得进行任何形式的删减、增添、拼接、演绎、歪曲等。因不当使用而引发的争议，易观分析不承担因此产生的任何责任，并保留向相关责任主体进行责任追究的权利。

http://mp.weixin.qq.com/s?__biz=MzI1ODEyOTAzMw==&mid=2247560606&idx=1&sn=4c87c6a65377dfdaaed9c0929b5f57b9

易观分析

中国数智化领域专业的科技和市场分析机构。经过20多年行业积累，形成以行业、企业、技术与产品数据为核心的订阅服务，通过专业分析师，帮助客户在数字化商业模式和技术方面，有效进行选择、评估和实践导入，从而提升企业数字业务能力，改善市场竞争力

最新文章

分析师洞察| 如何高效布局企业数字员工，持续为企业提效

分析师洞察| 开发者在AI崛起时面临的挑战与机遇

中国AI开发者应用生态调研报告

易观董事长CEO于揚，智慧院院长李智受邀参加“赢在大模型时代”2024未来发布论坛丨能否直接出结果是判断AI应用价值的重要标准

2024中国AI内容创作生态：新机遇？新挑战？

AI+医疗—数智医疗服务时代营销机遇洞察

AI+母婴：儿童需求与行为洞察

中国AI内容创作类应用生态研究2024

中国数字员工市场发展及企业数字员工落地建议

AI推动金融业数智化转型变革——中国金融业人工智能行业应用发展图谱

AI加速数字员工智能化落地——中国数字员工市场发展及企业数字员工落地建议

AI+汽车，推动行业创新变革

AI助力，市场回暖—中国在线旅游市场年度报告2024

中国传媒业人工智能应用发展图谱2024

《企业AI应用行动指南2024》：全面指导企业部署AI大模型，提升效率与创造价值

中国人工智能行业应用发展图谱2023（行业合集）

中国传媒业人工智能应用发展图谱2024

分析师洞察| AI短剧创作与消费的时代正在到来

中国文娱业人工智能行业应用发展图谱2023

中国电信业人工智能行业应用发展图谱2024

AI+医疗：营销机遇洞察2024

分析师洞察| 人工智能绽放浪漫之都，AI 技术如何引领体育赛事新纪元？

数字文娱市场规模达1.21万亿元《中国文娱产业人工智能行业应用发展报告》正式发布

生成式AI如何推动输入法行业变革

分析师洞察|AI网文作者权益如何保障

AI+医疗：营销机遇洞察2024

于揚：重温2016，人类机械化，智能体竟会是自己？

市场加速回暖，AI逐步应用—中国在线旅游市场年度报告2024

中国汽车业人工智能行业应用发展图谱2024

易观创始人兼CEO于揚：业界应聚焦AI实际应用价值

企业AI应用行动指南2024

易观于揚：大模型是AI的操作系统

分析师洞察|开源还是闭源 “百模大战”谁能胜出

中国人工智能行业应用发展图谱2023（行业合集）

小荷才露尖尖角—中国AI应用开发者生态调研报告

易观联合航天信息发布《中国中小企业数字化发展白皮书2024》

中国金融业人工智能行业应用发展图谱2023

小荷才露尖尖角—中国AI应用开发者生态调研报告

分析师洞察| AI手机浪潮下中国厂商机遇与挑战

中国文娱业人工智能行业应用发展图谱2023

三大工具助力企业AI全速升级

诚邀参与AI开发者现状调研：共绘AI应用未来蓝图

企业AI应用行动指南2024

诚邀参与AI开发者现状调研：共绘AI应用未来蓝图

分析师洞察|AI搜索引擎的崛起与传统巨头的挑战

分析师洞察|“中国版Sora”诞生记国产AI多模态加速中

AI赋能传媒新篇章：成都传媒集团携手易观用“工作坊”深化智媒应用与创新

专访易观创始人于揚：媒体不该是平台的“过客”，亟需建设“超级入口”

中国制造业人工智能行业应用发展图谱2023

中国零售业人工智能行业应用发展图谱2023

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉

分析师洞察|“中国版Sora”诞生记 国产AI多模态加速中

至于到底谁先谁后，以现在的模型迭代速度来看，谈谁超越谁其实都是暂时性的，AI的发展不是此消彼长，一定会是共同进步的结果。

分析师洞察|“中国版Sora”诞生记国产AI多模态加速中