首页时事民生政务教育文化科技财富体娱健康情感

旅行百科职场楼市企业乐活学术汽车时尚创业美食幽默美体文摘

真·赛博菩萨！最大的开源视频模型来了，我们实测：有点东西，但不多

科技 2024-10-23 17:11 北京

AI好好用报道

编辑：杨文

目前发布的最大的开源视频生成模型。

Genmo 当了一回「赛博菩萨」。

昨晚，AI 视频生成公司 Genmo 推出了最新的视频生成模型 Mochi 1 ，并且大手一挥，直接给开源了。

Genmo 在社交媒体上高调宣布：Mochi 1 在运动质量、提示遵循性和人类渲染方面表现出色，甚至超越恐怖谷。

同时，它还声称，在内部测试中，Mochi 1 已经能与 Runway、Luma 、可灵等领先的闭源竞争者打个平手，甚至略胜一筹。

为了让网友体验一波 Mochi 1 ，Genmo 还提供了一个在线网址。

链接：https://www.genmo.ai/play

不过，每6小时仅有 2 次免费生成机会，且用且珍惜吧。

不少网友得知消息后，已经按耐不住整活的热情。

那么，它的效果到底咋样？

先来瞅瞅官方放出来的视频 demo，稍后我们奉上一手实测。

-1-

一手实测

要说 Mochi 1 最大的优势，就在于其高保真运动和强大的提示遵循能力。

它可以对生成视频中的角色、设定和动作进行精确控制。

科技媒体 VentureBeat 的记者生成了一段老奶奶侧对着镜头说话的视频。

无论是花白的头发，还是面部的皱纹，以及说话时颤动的嘴角，都相当逼真。

不过，如果细看，还是能发现老奶奶的眨眼动作并不自然。

而在下面这段 5 秒视频中，男子正端详瓷器，眼睛没有什么明显的 bug，但手部动幅一大，就会发生轻微扭曲。

X 网友 Heather Cooper 展示了一系列 Mochi 1 生成的作品：

她还对比了两次生成结果的连贯性：

我们也来凑凑热闹，亲自上手试一把。

Prompt：Surreal, cinematic, an astronaut wandering on the desolate moon, with extreme detail.

提示词：超现实，电影效果，一个宇航员在荒凉的月球上漫步，极致细节。

一开始，镜头对准坑坑洼洼的地表，然后缓缓上移，画面中出现了一个身穿宇航服的宇航员。

虽然其镜头运动幅度挺大，但并未体现 Prompt 中宇航员漫步的动作。

Prompt：A little dog was chasing bubbles on the grass.

提示词：一只小狗在草地上追逐泡泡。

这一次，Mochi 1 翻车翻得猝不及防。

视频中，小狗在摇晃脑袋时，出现了大面积的崩坏，而且从修勾的嘴里吐出很多泡泡，这显然不符合客观事实。

尽管官方声称 Mochi 1 的提示遵循和运动质量超过大多数视频模型，但我们发现，Mochi 1 仍然存在瑕疵。

例如，它仅支持 480p 的分辨率，并且在处理复杂运动的场景时，可能会出现轻微的视觉扭曲。

此外，Mochi 1 在模拟照片级真实感方面表现出色，但在处理动画内容时还稍显力不从心。

当然，Genmo 公司已表示，计划在今年晚些时候推出 Mochi 1 HD 版本，届时将支持 720p 的分辨率，并在运动细节上提供更高的精确度。

-2-

目前发布的最大的开源视频生成模型

据介绍，Mochi 1 基于 Genmo 的非对称扩散变换器（AsymmDiT）架构构建，拥有 100 亿个参数，是目前公开发布的规模最大的开源视频生成模型。

该架构专注于视觉推理，处理视频数据的参数量是处理文本数据的四倍。

为了降低终端用户的设备内存需求，让开发者更容易地获取和使用模型，Mochi 1 采用了视频变分自编码器技术，能够将视频数据压缩到原始大小的一小部分。

现在，用户可以在 Hugging Face 平台上免费获取完整的模型权重和代码，不过需要注意的是，要在自己的设备上运行 Mochi 1，至少需要配备 4 块 Nvidia H100 GPU。

Code:
https://github.com/genmoai/models
Preview版本:
https://huggingface.co/genmo/mochi-1-preview

最后，说个题外话。

昨晚，一大堆 AI 公司排队上「新货」。

除了 Genmo 开源自家视频生成模型 Mochi 1 外，Runway 还介绍了新功能 ——Act One，可以把真人表演转化成不同风格。

而在大模型领域，Anthropic 推出了升级版的 Claude 3.5 Sonnet ，以及一款新模型 Claude 3.5 Haiku；OpenAI 在欧洲上线了高级语音功能；Perplexity 引入推理模式，允许用户提出多层问题。

此外，AI 生图领域，Stability AI 发布了自家最强模型 Stable Diffusion 3.5，并一口气祭出三个版本；Ideogram 推出 Canvas，可扩图、局部重绘等。

大洋彼岸的 AI 圈扎堆搞更新，真有一种过年的赶脚。

延伸阅读：

Sora 竞争对手融资数千万美元，目前可免费“薅”

参考链接——

https://venturebeat.com/ai/video-ai-startup-genmo-launches-mochi-1-an-open-source-model-to-rival-runway-kling-and-others/

项目博客：

https://www.genmo.ai/blog?utm_source=ai-bot.cn

在线体验：

https://www.genmo.ai/play

huggingface模型库：

https://huggingface.co/genmo/mochi-1-preview

以后我们会带来更多好玩的AI话题，也欢迎大家进群交流。

© THE END

转载请联系本公众号获得授权

投稿或寻求报道：liyazhou@jiqizhixin.com

http://mp.weixin.qq.com/s?__biz=MzUyODA3MDUwMA==&mid=2247523939&idx=1&sn=179908a7270d296522767da511bfad1b

发现人工智能创新应用

最新文章

好东西！又来个播客界的谷歌NotebookLM，靠记笔记画脑图，月入近5万

马斯克前女友看好的AI玩具生意，在国内卷起来了

好潮！日本又造了个「美丽小废物」，卖926元

一个AI浣熊账号的高开癫走：仅靠82篇帖子、4个月涨粉近14万！

特斯拉卖起机器人玩具！售价40美元被抢光，二手价高达1300美元

谷歌又捣鼓出好东西！有了这款AI学习神器，考试起码多考50分

AI解锁500多年的圣殿，米开朗基罗杰作，你我触手可及

机器人界出了个「达芬奇」，画一幅图灵肖像，卖了108万美元

AI能夺走网文界的一切吗？

实测国内首个AI播客！有点意思，但NotebookLM还是大爷

告别买家秀！一张图就能生成AI穿搭视频，网友：10块钱一套

从文本到屏幕：「Project Jarvis」们能实现 AGI 吗？

实测4大AI搜索：ChatGPT Search频翻车，Perplexity仍是「王者」

美团的这些AI应用，倒把我给整不会了

全球「最轻」人形机器人，成都造！仅25公斤，能换鞋、递药、冲咖啡

养猪、插秧、搬货……这才是机器人该干的活儿

为了口吃的，一群伦敦老铁给谷歌AI「下毒」

波兰小哥花了十年，造了个僵尸机器人

叫好不叫座！2.5万卖不动！苹果Vision Pro或将年底停产

真·赛博菩萨！最大的开源视频模型来了，我们实测：有点东西，但不多

哈工大造了个长轮子的小机器人，卖到2100元

AI大冰嘴替，骂醒「满脑浆糊」的网友

萌化了！日本造了个AI宠物，卖2800元被疯抢

火爆全网、打败王者荣耀的卷饼小游戏，竟是AI造的？

人脸识别的「巅峰」之作！甭管整成啥样，3秒扒出你是谁

曾让Kimi「崩了」的探索版有多厉害？10倍搜索量、精读超500页面，一手实测来了

一副AI耳机卖1200元？端侧AI大模型+硬件= ？这场论坛带你一探究竟

NotebookLM新功能引发网络疯传，AI大神、Altman大赞，一手实测来了

谨以此文，向飞天奖的AI整活视频「致敬」

最新测评！美图大模型提前揭秘，这波风格化美到窒息

不像人也不像狗，腾讯最新家用机器人有点「离经叛道」

留子们用火星文写避雷帖，AI竟看懂了？我们实测：几乎全军覆没

AI在用 | 吵架又没发挥好？7个AI大佬帮你自救

OpenAI大秀肌肉，一口气放出10个新模型Demo，全球网友玩疯了

最全测评！Vidu全球首个新功能，搞定「美女变野兽」难题

AI这个「狗头军师」，教年轻人说「土味情话」贼油腻

看到苹果和华为「互抡大锤」，我不厚道地笑了

世界首例：一位「00后」让人形机器人住进了家

最专业的法律 AI 准确率也只能到 65%？哪些场景下的法律 AI 是靠谱的？

华人小哥搞出一个鸡鸣狗叫GPT，可识别「毛孩子」80%的情绪

这款AI神器登上GitHub热榜第一，它真能革了照相馆的命？

与人类共度一年后，机器人的人生开了挂

一只AI吗喽，单挑《黑神话》，歇菜1000次，终于击败首个Boss

还在死磕镜头？聪明人已经用AI拍时尚广告大片了

a16z 最新 AI 应用 TOP100 榜单公布：消费者最爱用谁家应用？

6小时视频，一键转成PPT，赵晓卉们再也不用发疯了

我有一个「赛博爱人」，拥有超长记忆，还能给足情绪价值

AI在用 |「国乒喜剧人」许昕搞的Logo火了，我用AI整了个

AI在用 | 雷总，我把你的出道曲《Are You OK》搞成了动画MV

科波拉的史诗级巨制还没上映，就被AI搞砸了预告片

分类

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉