快手版Sora「可灵」开放测试：更懂物理，更具创意的国产视频大模型

文摘 2024-06-07 12:09 浙江

6月6日快手发布国内首个效果对标Sora的视频生成大模型“可灵”，现已开放邀测。

可灵大模型 (kuaishou.com)

随着OpenAI的文生视频大模型Sora的发布，国内科技行业也迎来了文生视频大模型的快速发展期。近期又有一家国产视频大模型正式亮相，这就是快手推出的“可灵”视频生成大模型，其官网已正式上线。

与先前各大公司发布的视频大模型主要以展示视频为主不同，快手的“可灵”大模型不仅效果可与Sora相媲美，更重要的是，它已经在快手旗下的快影App中开放邀测体验，为用户提供更加直观和实际的感受。这一进展标志着国产文生视频大模型已经迈入加速阶段，行业内的竞争也日趋激烈。

作为短视频领域的领军企业，快手在短视频技术方面积累了丰富的经验，为其视频生成大模型提供了广阔而天然的应用场景。近期推出的“可灵”视频生成大模型，由快手AI团队自主研发，它采用了类似Sora的技术路线，并结合了多项自研创新技术，展现出显著的优势。

在技术上，“可灵”大模型生成的视频分辨率高达1080p，时长可达2分钟（帧率30fps），同时支持自由的宽高比选择，满足了用户对高质量、多样化视频内容的需求。这些优势使得“可灵”大模型在短视频生成领域具有广泛的应用前景和竞争力。

可灵大模型在生成视频内容时，特别擅长于创造大幅度的合理运动。这一能力得益于其独特的3D时空联合注意力机制，该机制能够精准地捕捉和建模视频中的复杂时空运动。因此，可灵大模型不仅能生成幅度较大的运动，更重要的是，这些运动都遵循着客观的运动规律，让用户的想象力得以在视频中生动展现。

以下是一个具体的例子：在模拟宇航员在月球上奔跑的场景中，可灵大模型展现出了其卓越的运动生成能力。随着镜头缓缓抬升，我们可以看到宇航员跑步的动作流畅而轻盈，每一步的步态以及影子的跟随都显得自然而合理。这一例子充分证明了可灵大模型在生成大幅度合理运动方面的出色表现，真正实现了让想象力在视频中“动”起来。

prompt：一名宇航员在月球表面奔跑，低角度镜头展现了月球的广阔背景，动作流畅且显得轻盈

以下是可灵大模型生成的一段精彩视频：一个小男孩正享受着美味的汉堡。当他一口咬下，汉堡上出现了一个显著的缺口，这个缺口在整个视频中清晰可见。更令人印象深刻的是，小男孩咀嚼汉堡时的享受表情被捕捉得栩栩如生，脸部的肌肉动态非常逼真，仿佛能让人感受到他品尝美食的愉悦心情。这段视频生动地展示了可灵大模型在生成自然、逼真动作和表情方面的卓越能力。

prompt：一个戴眼镜的中国男孩在快餐店内闭眼享受美味的芝士汉堡

可灵大模型拥有出色的概念组合能力和想象力。通过对文本-视频语义的深入理解，以及基于Diffusion Transformer架构的强大学习能力，它能够轻松地将用户的想象转化为生动的视频画面。下面这个视频就是一个例子，它展示了熊猫吉他手坐在湖边弹唱的美好场景，让人感受到创意的无限可能。

一只大熊猫在湖边弹吉他

快影App的AI创作功能中已正式开放文生视频功能的邀测，支持创作者申请并体验可灵大模型最新的文生视频功能。图生视频功能也将在近期开放。

基于可灵大模型，更多应用方向也已经或即将落地。

随着AI大模型时代来临，作为头部短视频公司，快手已展开全面布局。公开资料显示，快手已先后发布通用大语言模型“快意”、文生图大模型产品“可图”，还推出了Direct-a-Video、Video-LaVIT、I2V-Adapter、UNIAA等视频关键技术，引发了广泛关注。据悉，伴随此次可灵大模型的发布，快手将持续加速大模型的研发与应用，带来更加多元的AI创作与互动体验。

END

http://mp.weixin.qq.com/s?__biz=Mzg3MTY5NDAwNw==&mid=2247515082&idx=1&sn=abc195bbd44d1d5c722d81466b51fd7c

杭州文创数字科技研究院

杭州文创数字科技研究院由杭州市科学技术局指导，致力于通过数字艺术品应用与衍生场景研究、数字IP商业化创新和沉浸式场景营造、乡村数字化治理开发、虚拟主播场景应用、数字媒体社群传播、3D数字设计应用等服务推进文化数字科技创新和应用场景有效落地。

最新文章

一文读懂快手首部AI短剧制作的背后故事

推荐五个换脸的AI神器，必须收藏

一文回顾2024年世界人工智能大会

一篇文章搞懂最近爆火的老照片修复和视频怎么做

重磅！Luma AI的Dream Machine关键帧功能震撼发布

建议收藏！3个必须知道的免费AI学习网站，让你快速成为AI大神！

报名丨关于筹备成立“浙江省创意设计协会AIGC产业工作专委会”的通知

报名丨创意引擎（第十七期）文旅融合重塑新质生产力高级人才研修班

RUNWAY发布Gen-3 Alpha，AI视频DiT时代来了

Dream Machine:又一款媲美Sora的AI视频生成大模型，公开免费体验！

快手版Sora「可灵」开放测试：更懂物理，更具创意的国产视频大模型

活动报名丨D20峰会AI+云计算专场限时领票！

报告|大语言模型综合评测报告2023（附下载）

AIGC新神器！Adobe Firefly内测版全方位评测（附内测申请流程）

如何把 ChatGPT 接入 Siri，一篇文章教会你！

教程分享|火爆全网的AI孙燕姿!超详细干货教程，让你也能做出AI声音克隆!

最高补助1000万元！杭州上城发布扶持政策，加速竞逐元宇宙赛道

资讯|清华大学AIGC发展研究报告1.0版震撼发布！192页PPT

观察|浙江省各地元宇宙扶持政策

资讯|还在用外网的Midjourney？国内官方中文版来了！

观察|3分钟，ChatGPT＋剪映即可一键成片！

观察|AI生成表情包，零门槛，小白也能学会！

论著观察 | 元宇宙技术本质、演进机制与其产业发展逻辑

观察「AI孙燕姿」全网沸腾！AI翻唱大爆发，整个华语乐坛都「复兴」了

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉