字节跳动推出两款视频生成大模型

文摘   科技   2024-09-26 07:03   广东  
我建了一个AI交流群,由于群已超200人,请在公众号回复“AI应用”,加群主VX,再入群,谢谢!


字节跳动在2024年9月24日的火山引擎AI创新巡展上,发布了两款视频生成大模型,标志着其正式进入AI视频生成领域。

火山引擎发布豆包视频生成模型

火山引擎总裁谭待在巡展上宣布,推出了豆包视频生成-PixelDance和豆包视频生成-Seaweed两款模型。这两款新模型的发布,预示着字节跳动在AI视频生成领域的深入探索。

谭待在活动现场展示了新模型的视频生成效果,展示了其在语义理解、主体运动交互、多镜头切换等方面的领先能力。

商业化应用前景

谭待指出,豆包视频生成模型在设计之初就考虑了商业化应用,其应用领域包括电商营销、动画教育、城市文旅和微剧本等,如音乐MV、微电影和短剧。

火山引擎表示,豆包视频生成模型基于DiT架构,通过高效的DiT融合计算单元,实现了视频与文本的压缩编码,使得视频能够在大动态和运镜中自由切换,具备了变焦、环绕、平摇、缩放、目标跟随等多镜头语言能力。

此外,豆包视频生成模型采用了全新设计的扩散模型训练方法,解决了多镜头切换的一致性问题,并使用了深度优化的Transformer结构,提升了视频生成的泛化能力。

逐步向用户开放

目前,豆包视频生成模型正在即梦AI内测版进行小范围测试,未来计划逐步向所有用户开放。

剪映和即梦AI市场负责人陈欣然提到,AI与创作者的互动能够带来新的创作灵感,即梦AI旨在成为用户的智慧创作伙伴。

AI视频生成领域的竞争

国内AI视频生成领域竞争激烈,各大互联网企业纷纷推出自己的视频生成模型。

今年2月,OpenAI发布了视频大模型Sora,开启了AI视频新时代。随后,国产AI视频大模型也相继问世。

6月,快手推出了视频生成大模型“可灵”,支持文生视频、图生视频、视频续写等功能。

紧接着,LumaAI发布了Dream Machine 1.5,能够快速生成电影级别的视觉效果视频片段。

9月,阿里云发布了全新视频生成模型,美图公司也宣布了美图奇想大模型的视频生成能力全面升级。

业内人士认为,随着技术的进步,AI视频生成领域将迎来新的发展机遇。



推荐阅读

🔥10W+ 教师必备的九个AI工具,很难相信还是免费!

🔥1W+ AI Agent调研--7种Agent框架对比!盘点国内一站式Agent搭建平台,一文说清差别!大家都在用Agent做什么?

🔥AI大模型应用范式:通用大模型 + 少量行业数据 + 微调技术

🔥3W+全网最强kimi用法

🔥1W+推荐几款完全免费且不限次数使用的AI工具

🔥图解Agent的九种设计模式

🔥AI大模型:Agent智能体

🔥AI模型:如何选择合适的 Embedding 模型?

🔥我不忍心您再这么辛苦了!教师必备的4个最全爆火的的AI知识库,看完您也能成为AI提示词大神!

🔥1W+一文搞懂大模型、RAG、函数调用、Agent、知识库、向量数据库、知识图谱、AGI的区别和联系!!...

🔥强烈推荐!2024年你应该知道的20款免费好用的AI工具!包含语言类、图像类、视频类

🔥 华山论剑:文心一言、智谱清言、讯飞星火、通义千问、新华妙笔、 ChatGPT,公文写作哪家强?

🔥 华山论剑:腾讯、商汤、华为、百度、阿里巴巴五大平台,大模型在产品技术能力、战略愿景能力、生态开放能力三个维度的综合竞争力

🔥 4W+ 华山论剑:文心一言、通义千问、智谱AI、百川智能、天工AI、讯飞星火和Kimi七大平台,你怎么选?



    如果你觉得“军哥说AI”公众号或这篇文章对你有帮助,别忘了给我点赞、在看、转发分享给更多的朋友。有任何问题或者想法,欢迎在评论区留言和我一起讨论。




军哥说AI
专注AI应用定制开发15年,欢迎来喝茶洽谈合作! 信息系统项目管理师。 广州市科技入库专家!
 最新文章