首页时事民生政务教育文化科技财富体娱健康情感

旅行百科职场楼市企业乐活学术汽车时尚创业美食幽默美体文摘

AI恐怖体操视频腿脚乱飞、大变活人，LeCun：视频生成模型根本不懂物理

科技 2024-07-03 12:00 浙江

西风发自凹非寺
量子位 | 公众号 QbitAI

一段AI生成的体操视频，引发近百万网友围观，LeCun等一众大佬还因为它吵起来了。

体操表演，emmmm怎么不算呢？

通过视频右上角的水印，此段视频正是由那个一度被认为是“下一代”文生视频的Dream Machine（来自Luma AI）生成的。

大伙儿看后纷纷坐不住，围绕此讨论的，是AI视频领域的一个熟悉的话题：AI是否理解物理规律。

LeCun直接开麦：

视频生成模型不理解基本物理知识。更不用说人体了。

华盛顿大学计算机科学教授Pedro Domingos看后也“摇了摇头”：

AGI可能并不会像一些人预期的那样即将到来。

畸变雀食离谱

自Sora问世以来，“AI是否理解物理规律”这个话题就被越来越多人关注。

下面这段Sora生成的“寄居蟹用灯泡当外壳的夜间场面”是个经典的例子，海浪与沙滩的互动非常细腻，寄居蟹腿上的纤毛也活灵活现。

对比真实拍摄的类似场景照片，也就灯泡没有电源不应该亮这一个明显破绽了。

最近Luma AI的Dream Machine也一样，生成的第一视角探废弃房子真实感拉满：

由此，不少人认为Sora、LUMA等的视频生成模型已经理解了简单的物理规律。

然鹅，这次被放出的视频着实有点太离谱。

不仅腿脚乱飞，频频上演大变活人：

就这高难度的空中悬浮翻跟头，也是牛顿都要被气活了的节奏：

以至于网友看后还表示，说恐怖大可不必，说搞笑还差不多。

如此抽象，LeCun直接评论视频生成模型不会懂物理。

他还进一步解释，Sora或者其它视频生成模型都有类似的问题，视频生成技术无疑也肯定会随时间推移而进步。

但：

真正理解物理的学习系统并不会具有生成性。就像鸟类、哺乳动物等比任何视频生成系统更了解物理。然而，它们都不能生成详细的视频。

类似还有另一种思考：

即使AI视频生成模型之后会进化的很好，生成的视频质量“完美”，那么就意味着它理解物理了？

LeCun等的观点，立马引起网友的质疑：

鸟和哺乳动物也会生成详细的视频，只不过是在大脑中生成无法将其具像化。

然鹅，这种反驳并未说服LeCun。

此外，还有不少人持反对意见。

例如，谷歌DeepMind/Brain团队研究员Lucas Beyer就指出：

这就像是展示一个由几年前的Dall·E mini生成的图像，然后称当前的图像生成方式注定失败一样。

毕竟，之前生图模型生成的图像be like：

至于模型会生成如此离谱的视频？

有网友认为是缺乏体操表演数据，还有网友认为是身体部位的模糊处理，使得模型无法理解人体结构，继而不能保证肢体动作的连贯性。

视频生成在计算上更为复杂，并且具有高度的上下文相关性，对详细标注的训练数据有更大的需求，这些需求现在还未得到充分满足。

前段时间SD 3翻车，同样对人体生成效果不好，网友也讨论过这一问题，过于严格的数据审核，可能误删了一些无害的成人图像，影响了模型对人体结构的理解。

One More Thing

除了Luma AI的Dream Machine生成体操视频大翻车，Runway的Gen-3也……

同款三头六臂：

同款空中悬浮绝活：

参考链接：

[1]https://x.com/ylecun/status/1807497091964449266

[2]https://x.com/giffmana/status/1807511985807908926

[3]https://x.com/EricDai_BioE/status/1807540558216454281

[4]https://x.com/Grady_Booch/status/1807556807982010451

http://mp.weixin.qq.com/s?__biz=MjM5NTEwMTAwNg==&mid=2650328552&idx=1&sn=77574b5767433b61250537d85f286948

SegmentFault思否

SegmentFault 思否 ( sifou.net ) 是中国优秀的开发者社区。我们希望为中文开发者提供一个纯粹、高质的技术交流平台，做科技企业与开发者沟通的桥梁，帮助更多的开发者获得成长与成功。

最新文章

击浪前行！第三届生成式 AI 应用创新挑战赛即日开启

思否有约｜@汝何不上九霄：持续输出，巩固知识经验

寻找榜样的力量！2024 中国开源先锋 33 人评选启动

当前端遇上 AI，代码可以“自我进化”

2024 中国技术先锋年度评选正式启动！6 大奖项即将揭晓

Linus 到底违反了什么？

SegmentFault 思否 Top Writer 榜单｜2024 年第三季度

节日快乐！1024 码力全开

2024 OSCAR 开源产业大会在京召开

中国信通院发布 2024 可信开源系列评估结果

2024 OSCAR 开源产业大会参会指南出炉，与你同走长行之路

vivo 开发者关系实践：更开放，更繁荣

举国欢腾，共度国庆！

2024 OSCAR 开源产业大会完整议程揭晓

拥抱AI时代的工程师文化和技术领导力！CCF CED 2024完整日程和参会指南

ONES 与华为云深度合作，共同打造企业智能研发管理平台

【直播预约中】智能制造企业研发流程管理中的知识共享实践

喜月想伴，中秋安康！

一起“摊”玩！OSCAR 开源市集招募开启

专访王峰：Apache Paimon，在业务中生长

思否有约｜@xindoo：提升技能水平最好的方式

【直播预约中】从《DevData 2024 研发效能基准报告》谈研发效能的实践趋势

持续激发创新潜力，智在畅想黑客马拉松顺利收官

一图读懂 | ONES V6 大版本，助力企业更快更好发布产品

【直播预约中】智能制造 IPD 生产及研发最佳实践分享

可信开源，产业共进——2024 OSCAR开源产业大会正式启动

SegmentFault 思否 Top Writer 榜单｜2024 年第二季度

倒计时 2 天！CommunityOverCode Asia 2024 即将启幕

【直播预约中】从落地实践到拿到结果，详解“平台工程”如何助力企业提效

1079 支队伍齐聚、聚焦三大社会议题，第四届Light技术公益创造营圆满收官

Apache Answer 邀你共赴 CommunityOverCode Asia 2024

AI-Native时代，玩家请上桌

CommunityOverCode Asia 2024 主题演讲豪华阵容 & 精彩议程发布！

从想象到现实，“Innovate for Future 智在畅想”黑客马拉松招募开启

无人车团队跨维进军好莱坞！推出电影级视觉AI特效，“新时代皮克斯”

CommunityOverCode Asia 2024 专题介绍之 Data Lake & Data Warehouse

CommunityOverCode Asia 2024 专题介绍之 DataOps

院士领衔推出大模型的第3种记忆：比参数存储和RAG都便宜，2.4B模型越级打13B

CommunityOverCode Asia 2024 专题介绍之 IoT

CommunityOverCode Asia 2024 专题介绍之 AI

C/C Asia 2024 大会分论坛议程发布！Committer 优惠及学生/无业人员免费门票上线

CommunityOverCode Asia 2024 专题介绍之 AI

“千帆杯”教育生态行业赛圆满收官，用 AI 共筑下一代的千万种未来

黄仁勋：我们不想当行业领导者

AI恐怖体操视频腿脚乱飞、大变活人，LeCun：视频生成模型根本不懂物理

重磅！OpenAI在macOS上推出桌面版ChatGPT！

迄今最快的网络流算法，网友：几乎与数学理论一样快

Sora首部商业片亮相戛纳！300万网友围观

一张顶20张H100！首款大模型专用ASIC挑战英伟达，哈佛辍学华人参与创办

【直播预约中】详解 AI 大模型在软件研发落地中的实效与迷思

分类

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉