「声画」精准生成 Meta Movie Gen 太全面了

百科 2024-10-14 17:02 北京

OpenAI起个大早的视频生成模型Sora始终没有完全对公众开放，这给Runway、Pika、可灵、即梦等类似模型留下了市场空间。顶流尚未出现，文本生成视频的大模型赛道已十分拥挤，如今，社交巨头Meta也来了，视频生成器Movie Gen面世。

新鲜出炉的Movie Gen有两大亮点：超高清晰度与分辨率，还能根据视频内容直接生成配乐。

据悉， Movie Gen可根据文本提示生成16fps帧率的1080p视频，最长时长可达16秒；配乐生成能力则是该模型超强自定义功能的体现，用户还可对画面细节、比例展开精细调整。

“高清、超长还能精调”的特长让Movie Gen弥补了“AI视频生成效果不可控”的短板，再加上能生成配音，Movie Gen可以说是AI视频生成“选手”中综合得分最高的一位了。

在AI视频生成这条赛道上，大模型们卷模态、卷效果、卷风格、卷时长、卷清晰度，Meta直接兼容并包玩起了“聚合”，并在视频制作环节中补上了“配乐”这一步。相较其他大模型，Meta Movie Gen似乎更懂得视频制作人们需要什么。

结果不随机 Movie Gen 可精调画面

Movie Gen发布时，Meta CEO扎克伯格很快就在Ins上为自家大模型站台。他发布了一段以自己为主角的视频，画面中，他正在脚推器健身，每一次推动，他周围的场景甚至他的服装都在变化。

这段主体不变、场景或细节变化的视频正是由Movie Gen生成的，而“个性化定制” 能力是该工具的亮点。

尽管其他模型也可以通过文本输入实现个性化定制，但Movie Gen可以用文本精准编辑视频，包括对主体、背景、过渡画面、特定物体的展现要求，比如通过文字提示，用户可以“把空中放飞的灯笼变成一个气泡”。

也可以让“在沙滩上跑步的男人瞬移到沙漠”，甚至可以“给男子换上恐龙套装”。

如果用户想用照片中人作视频主角，上传照片后即可通过文字为你的主角设计动作和身处的环境。比如，上传一张女孩的照片，给出提示词，就能让她“在南瓜地里批着围巾喝咖啡”。

对于视频制作者来说，“声画艺术”不仅得有画面，还得有声音。现在，Movie Gen把配乐这事儿也给解决了，用户可以用文本或者视频作为输入提示词，为目标画面生成符合情境的音频。

按需生成画面，再按画面配上音频，这些功能简直是视频制作者的“神器”，利用Movie Gen，现在我们可以按照自己的想法修改和打磨画面了，小到改变人物的发色，大到替换整个背景。

谁还能记得，最早打开AI视频生成“魔盒”的还是去年横空出世的Runway，主打文本生成视频。哨声一响，赛道上迅速挤满了国内外的竞速者，从输入模态卷到了视频时长。

去年6月，快手旗下的可灵推出了图生视频功能，展现了AI生成视频模型在画面质量和运动表现方面的不俗能力；同期，美图也推出了基于奇想大模型的短片创作平台MOKI，制作出来的视频时长能到2分钟；9月，阿里云通义万相发布视频生成模型，文生视频、图生视频在里面来了个“一锅端”。

AI视频生成模型终究逃不过“聚合”这条路，而Meta Movie Gen 可以说是目前最全能的选手，能做到这一点，依然离不开底层模型的支持。

一声一画俩底层模型撑出「全面」能力

根据公开信息显示，Movie Gen主要基于两个基础模型打造。

一个是Movie Gen Video——拥有300亿参数的Transformer 模型，可根据文本提示生成1080P分辨率、16秒长、每秒16帧的高清视频；另一个是Movie Gen Audio音频模型，其参数共有130 亿，能够生成48kHz的高质量同步电影音效和音乐，为数分钟视频制作出连贯的长音频。

AI视频生成模型发展到现在，“逼真”已经是基操，Movie Gen能做到高清级的逼真，主要是因为Movie Gen Video高达300亿参数的Transformer能力，这让它能够准确理解物理世界的运动规律。

据说，Meta AI团队在数亿个视频和数十亿张图像的基础上，对模型进行了大量预训练，其中包括学习蒙太奇、运镜等专业的影视制作技巧。

在与1000个提示评估集上的模型比较时，Movie Gen Video在生成质量和主体一致性方面优于其他模型。

负责声音部分的Movie Gen Audio 也得到了海量的训练，在Movie Gen Audio的训练中，Meta AI提供了百万小时的音频数据，让模型学习声音和画面之间的对应关系，逐渐训练它理解不同的BGM可能给受众带来的不同感受。

目前，Movie Gen Audio可以生成环境声音、乐器背景音乐和拟音声音，实现视频到音频的对齐和文本到音频的对齐。

从画面与音频的贴合度来看，Movie Gen几乎可以做到专业级。不过，Movie Gen目前还只能支持1080p/16秒/每秒16帧的视频，高保真音频最长也就能到45秒。对于长视频的制作来说，需要大量且多次地生成，成本想必也不会低。

按照Meta的计划， Movie Gen 将于明年正式与公众见面。Meta AI 在官网表示，随着模型技术的改善与发展，他们将会与电影制作人和创作者密切合作，期待它能为视频、影视和 AI行业注入新的可能。

这也意味着，即便Movie Gen开放给公众，它的目标市场大概率不是普通的C端玩家，专业级的B端公司才是具有AI视频生成消费能力的客群。

你用过哪些AI生成视频工具？

元宇宙日爆

在这里，看见未来。

深圳：最高500万元奖励，开通AI算法扶持项目

Grok如果在X上免费，「社交+AI」还能赚啥钱？

天津：最高30万元支持，创办元宇宙未来产业企业

Sam Altman：明年OpenAI将迈入AI系统时代

郑州：最高500万元，支持制造业企业开放大模型应用场景

资讯｜小度AI眼镜计划明年上市；元宇宙相关融资创历史新低

上海徐汇区：最高1000万元，面向全球征集区块链应用场景建设

资讯｜比特币创7.6万美元新纪录；英伟达有意投资马斯克的xAI

广州：运用元宇宙技术打造广府文化新体验

「加密总统」特朗普按下牛市启动键？

南京：最高500万元，支持人工智能专用大模型落地应用

AI Meme成加密市场新宠昙花一现还是真有价值？

北京：利用元宇宙相关技术推出沉浸式文旅体验新空间

资讯｜Google公司25%新代码由AI生成；Meta Reality Labs 又亏损44.3亿美元

元宇宙大厂“退潮”？阿里元境回应裁员

资讯｜工信部：AI大模型注册用户超6亿；Meta发售低配型头显Quest3S

北京经信委：围绕AI芯片等产业征集先进计算的应用案例

「声画」精准生成 Meta Movie Gen 太全面了

CZ与Binance最好的关系：解绑后仍可相互成就

资讯｜Meta新AR眼镜可接收神经信号；通义千问主力模型降价85%

杭州：推动AI在跨境电商应用，最高扶持100万

为合规每年花掉2亿美元，Binance这笔支出流向了哪？

投入30万-5亿元，安徽要打造现代中医药AI场景

美联储松绑加密资产总市值涨6%达2.3万亿美元

资讯｜OpenAI新模型o1自评为「中等风险」；美SEC今年从加密领域罚款达46.8亿美元

AI 投资 | 谁会赢得AI用户之战？

吴恩达：AI离瓶颈期还很远，应用层潜能尚未充分开发

青岛元宇宙上新！科幻、海洋主题项目轮番上线

资讯｜Apple Intelligence被曝安全隐患；Circle拟在iPhone上推出「即拍即付」

厦门：技术创新基金扩至500亿元，加强AI赋能工业

Character.AI组团投身谷歌 AI小厂为何难逃「卖身」宿命？

西安：总额6000亿元，打造「商场+电商+元宇宙」生态链条

资讯｜人形机器人Figure02计算能力翻三番；XR硬件厂商PICO拟发新品？

广州南沙：最高300万元，支持元宇宙技术应用示范项目申报

Gary Marcus：生成式AI泡沫将退，神经符号AI才是未来

北京：最高1000万，支持开发应用AI垂类大模型

资讯｜苹果 iOS18.1 测试版向开发者开放；Meta Reality Labs今年Q2亏损44.8亿美元

最新元宇宙/AI政策（2024年7月）

Sora还在磨叽抢先开放的「可灵」火到了海外

深圳：最高1000万支持，打造“城市+AI”应用场景高地

资讯｜扎克伯格反驳开源模型「会被中企利用」；法拉利将在欧洲接受加密货币购车

山西：最高补贴5000万元，支持打造AI智算项目

加密资产市场的「特朗普交易」还能持续多久？

杭州：2.5亿元算力券，打造全国AI产业发展高地

OpenAI CTO 剧透AGI关键词：十年内出现、极其先进、智能系统

天津：已投产数据中心34个 2026年智算规模目标超10EFLOPS

资讯｜英伟达等公司被曝用YouTube数据训练AI模型；以太坊现货ETF有望7月中在美上市

质疑Binance 成为Binance

Meta押中AI硬件智能眼镜为何脱颖而出？

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉