首页
时事
民生
政务
教育
文化
科技
财富
体娱
健康
情感
更多
旅行
百科
职场
楼市
企业
乐活
学术
汽车
时尚
创业
美食
幽默
美体
文摘
给马斯克上了瑞士卷大考后,我终于拿捏这个国产 AI 视频模型的最强新功能
科技
2024-11-16 11:59
广东
Vidu 又更新了,懂行的人都知道,这里的门道有多深。
针对主体性、一致性这样存在已久的棘手问题,是 Vidu 一直在持续突破的方向,目标就是「终结炼丹」。
我们试用了一天,对比了官方演示素材和亲测体验,发现一个重点:工程师们的努力只是一部分,真正上手起来,需要一些特殊的打开方式。
关注 AI 第一新媒体,率先获取 AI 前沿资讯和洞察
选取素材大有门道
AI 生成视频已经出来这么久了,基本的使用方式大家也都很熟悉:要么直接输入文字 prompt,要么用已经有的图片素材。
后一种方式主打的就是提高准确度,让生成的过程更可控。
Vidu 更新的 1.5 版本,上线了「多图参考」的功能,也是继续了这个路线:通过上传特定主体的不同角度或不同景别下的图片,Vidu 1.5 能实现 100%精准控制。
好啊,太好了,我跃跃欲试,卷起袖子就是干,别的不会,抄作业还不会吗——没想到,不是把图一股脑丢进去就万事大吉的。
一开始尝试的时候,我看到的案例是这样的:
把这几张图下载下来,再用同样的 prompt 复制一遍之后发现,我得到的是这样的:
眼睛会了,手不是很会。
不过有一说一,无论是海绵宝宝还是派大星,都没有特别明显的崩坏画面,应该还是我的打开方式有问题吧?
接下来我尝试了两个真人照片:梅西和科比。他们两个作为各自领域、各自时代不朽的传奇人物,素材更多——正面、背面、不同动作都可以找到。
动作拆开来看都是对的,就是切换时直接硬切——梅西这也太像拍金嗓子喉宝广告了😂
一定还是哪里没有正确打开。
在 Vidu 首发时,我对它在动画风格上的惊艳表现印象很深,或许它的长处在这呢,来试试看好了:
果然,果然是(偏科的)动画特长生。
这几个动画生成的过程里,我发现了第一个技巧:多图生成的时候,尽量选择同一主体、不同侧面、不同动作,但彼此之间差距不要太大。
梅西和科比的素材,也有不同侧面,但都来自不同的赛场照片,差异还是有的。而在生成动画视频的时候,我灵机一动,找到了设定集素材。
这干净的白底图,同一主体的各个侧面略微变化,简直是素材圣体。像下面亚古兽和太一的拥抱,算是比较稳定的了。
上面的亚古兽喷火也是直接用了设定集里的素材。
必须得说一句:原画师真是伟大,人类的创造力还是独一无二的啊。
另外还有一种素材效果比较好:AI 喂 AI。这是从最开头那只惊艳的演示视频里得到的灵感。
当我原片复现之后,效果也很不错。
素材里,背景的花朵我说不好,可能是实拍的。但烟熏妆女孩和玻璃质感的金鱼大概率是 AI 跑图跑出来的,在视频里却意外地表现稳定。
还有一个小皇子与凤凰,这套素材的原图,AI 感蛮强——没有说 AI 图不好的意思,况且复现出来的效果相当不错。
考虑到这上面的案例,文字 prompt 都很潦草,就那么十来个字,更加说明选取什么样的素材用来生成,非常关键。
舍得花积分最重要
另一个关键要素是:舍得消费。
多图生成一个 8 秒的视频,要花 24 积分,算是 Vidu 里面消耗比较大的。
最早的几个视频,梅西、科比、小新,效果都勉勉强强,一度引发自我怀疑。但是等到十来个视频做完,两三百积分花出去,后续的出品水平越来越在线。
比如,上面是的小新是我在1020积分时跑的,而下面这个是在 600 积分时跑出来的小新:
以及积分 580 时跑出来的海绵宝宝:
同一套皇子和凤凰的材料,在 820 积分的时候,也大变样了。
Vidu 提供「重新创作」,非常方便,图片和 prompt 都直接原样照搬。而且我所有的 prompt 都写得很简单,不过十来个字。
唯一的变化就是积分,还是要舍得花积分,花的越多,效果越好。
「终结炼丹」是这次 Vidu 1.5 的野心:仅靠图片素材就能达到 LoRA 方案的效力。
理论上这是个极大的挑战:LoRA 建立在预训练模型的基础上,通常需要 20~100 段跟主体相关的视频素材,以及大量的时间训练、微调,来追求主体生成时的一致性。这当中还要克服过拟合的问题,各种细节缺失等等。
从 Vidu 1.5 的表现来讲,这个「炼丹」的过程已经被压缩到了一个可以接受的程度:三张图,几十秒,简单的指令。
只不过,用户仍然需要完成「最后一公里」,包括在素材选取上、prompting 上,总之,这都是跟模型磨合的过程。
One More thing
通常,现有素材越丰富,生成的表现越好。而最受欢迎、有着庞大素材量的,当然是那个男人:马斯克。
上面这个融合了「小李子」莱昂纳多经典举杯动作和马斯克的视频,一次生成就到位,无比丝滑。
神奇的是,我尝试了让马斯克分瑞士卷。第一次,他不为所动,一整个静止画面——
好吧,那个时候积分还有 900 多,可能还没和模型混熟。
后来又试了第二次:
为什么还不切?而且为什么那么犹豫?难道也发现分瑞士卷不是那么简单了?
等我又试了一些别的视频,换了一张瑞士卷的图,在只剩 500 积分的时候,又跑了一次:
不对劲,这个 AI 不对劲,这抗拒
的样子是怎么回事,谁给 AI 喂了瑞士卷大考!
http://mp.weixin.qq.com/s?__biz=MjM5MjAyNDUyMA==&mid=2651029493&idx=1&sn=98bcd5a9e2f39d6a8307a4fe07b89e19
APPSO
AI 第一新媒体,「超级个体」的灵感指南。 #AIGC #智能设备 #独特应用 #Generative AI
最新文章
首发体验| AI学会发红包了!国产Agent一句话控制手机电脑,我看到了「摸鱼自由」的未来
字节跳动起诉前实习生并索赔 800 万/华为百万级轿车 48 小时预订量达 2108 台/支付宝上线 「AI 帮找工作」功能
Sora 泄露事件背后,艺术家为什么要集体反抗 OpenAI?
AI 视频巨头重磅更新!提示词都不用费劲写了,从未有过这样的视频创作方式
OpenAI 再获软银 15 亿美元投资 / 比亚迪回应要求供应商降价:非强制要求/《王者荣耀》卫冕 10 月全球手游收入冠军
Sora 遭遇严重泄露!艺术家愤怒「复仇」OpenAI,测试渠道全网疯传
史上最薄 iPhone 或全面取消实体SIM卡/预售价百万起,华为发布尊界S800/英伟达展示AI语音模型
Mate 70 发布!华为最强 AI 手机来了,余承东高呼对得起「那四个字」
网易云音乐怒斥 QQ 音乐「剽窃式创新」/华为Mate70系列支持 AI 手势隔空传送/库克来华:没中国就没苹果今天的成就
国行 iPhone 16 实现 AI 自由,三步就够了
微信内测原图原视频 14 天自动清理功能/iPhone17系列仅Pro机型搭载5倍光学变焦/AI助力,陶哲轩宣布等式理论计划成功
AI 聊天机器人让用户去死,大学生吓到崩溃,官方紧急道歉
AI或成华为Mate70最大卖点/苹果Siri大升级,2026年拟超ChatGPT/可口可乐AI广告翻车|Hunt Good周报
刚刚,黄仁勋获港科大荣誉博士,演讲大秀中文,称 AI 可能是人类历史上最重要的技术
你画 AI 猜,这个开源 AI 图像神器,在玩一种很新的 P 图
小米将承担 SU7 自动泊车异常维修费用/麦当劳和支付宝力推「碰一下点餐」/OpenAI 正考虑推出自研浏览器
国产大模型黑马的首个推理模型来了,和 o1 PK后,我发现了AI深度思考的大问题
《黑神话:悟空》 获金摇杆奖年度游戏/胖东来回应「员工结婚不许要彩礼」/OpenAI 薪酬曝光,奥特曼年薪仅 55 万
农夫山泉钟睒睒炮轰张一鸣,要求道歉/马斯克:AGI最晚2026年实现,人形机器人超100亿/曝华为鸿蒙智行销售车型明年翻倍
初代星舰最后一飞!首次在太空点燃猛禽发动机,马斯克、特朗普现场观看
iPhone 17 Air 厚度曝光,将是苹果最薄手机/余承东展示华为Mate70 细节/阿里通义千问发布新开源 AI 模型
马斯克与 OpenAI 决裂内幕全曝光!这封邮件让他破防,怒斥「我受够了」
从 GPT-2 开始玩 AI 的博士生,把论文做成了上线 Steam 的独立游戏 |AI 新职人
华为Mate70系列开启预售,预约人数超200万/《黑神话:悟空》获TGA年度游戏提名/英伟达AI芯片被曝存在过热问题,交付推迟
马斯克新 AI 破解千年难题却被紧急喊停?这个「玩笑」怎么让 AI 圈一夜未眠
首发 | Kimi 首个多模态功能体验,AI 一键为音乐生成 MV,月之暗面不再只卷长文本
华为 Mate 70 定档海报提前曝光/AI 疑似证明黎曼猜想,已被叫停/vivo X200 系列更新改善炫光
看着这个 AI 奶奶把骗子耍得团团转,可把我高兴坏了
马斯克再谈约架扎克伯格:随时奉陪/传满血版 o1 下月推出/苹果或将推出 AI 智能家居中控屏 | Hunt Good 周报
Kimi 发布新模型对标 OpenAI o1!月之暗面创始人回应近期争议
给马斯克上了瑞士卷大考后,我终于拿捏这个国产 AI 视频模型的最强新功能
17 岁高中生写了个神级 Prompt,直接把 Claude 强化成了满血 o1
余承东曝Mate70将在本月26日发布/美团哈啰单车在郑州停运,哈啰已恢复/OpenAI 拟打造AI 经济区与中国竞争
AI 最可怕的不是取代人类,是已经让我们不相信看到的是真照片
iPhone 15成Q3全球销量最高智能手机/OpenAICEO辟谣AI发展「撞墙」论/B站上市后首次单季度盈利
OpenAI 最新产品全曝光!奥特曼驳斥 AI 发展撞墙,Ilya 认错,秘密寻找下一个重大突破
苹果广告又翻车,给 AI 产品做创意怎么就不能 Think different
OpenAI 下一代模型遭遇重大瓶颈,前首席科学家透露新技术路线
曝小米AI眼镜将于明年发布,雷军预期出货30万台/马斯克新职务官宣,狗狗币大涨/苹果或将推出 AI 智能家居中控屏
黄仁勋最新演讲:每家公司都将成为 AI 制造商 | 万字实录
OpenAI 总裁宣布回归!结束「最长假期」,将专注重大技术挑战
2025 放假安排公布,增加两天假期 / 李子柒恢复更新,播放量破亿 / 百度发布首款 AI 眼镜
百度发布首款 AI 眼镜!比 Meta 爆款更卷,苹果也在押注的智能眼镜正在爆发
支付宝崩了上热搜,官方致歉/字节豆包发布新模型,AI 一句话 P 图/罗永浩发文怒喷餐厅卖预制菜
人类智力锁死在了 2021,OpenAI CEO 预言 AGI 可在 5 年内实现 | 万字专访实录
独家首测:全新 Mac mini 的 Type-C 接口能供电了?实测后,我们发现了苹果的秘密
OpenAICEO :AGI将于2025年到来 / iPhone 部分旧款机型降至半价 / 开封夜骑爆火,官方喊话夜骑大学生
黄仁勋两万字访谈实录:希望英伟达拥有 5 万名员工和 1 亿个 AI 助手
传 Sora 两周内推出/OpenAI 元老、北大校友翁荔宣布离职/Google 版「贾维斯」泄露 | Hunt Good 周报
打败 Midjourney,匿名屠榜的 AI 生图黑马,让人人都能设计海报
分类
时事
民生
政务
教育
文化
科技
财富
体娱
健康
情感
旅行
百科
职场
楼市
企业
乐活
学术
汽车
时尚
创业
美食
幽默
美体
文摘
原创标签
时事
社会
财经
军事
教育
体育
科技
汽车
科学
房产
搞笑
综艺
明星
音乐
动漫
游戏
时尚
健康
旅游
美食
生活
摄影
宠物
职场
育儿
情感
小说
曲艺
文化
历史
三农
文学
娱乐
电影
视频
图片
新闻
宗教
电视剧
纪录片
广告创意
壁纸头像
心灵鸡汤
星座命理
教育培训
艺术文化
金融财经
健康医疗
美妆时尚
餐饮美食
母婴育儿
社会新闻
工业农业
时事政治
星座占卜
幽默笑话
独立短篇
连载作品
文化历史
科技互联网
发布位置
广东
北京
山东
江苏
河南
浙江
山西
福建
河北
上海
四川
陕西
湖南
安徽
湖北
内蒙古
江西
云南
广西
甘肃
辽宁
黑龙江
贵州
新疆
重庆
吉林
天津
海南
青海
宁夏
西藏
香港
澳门
台湾
美国
加拿大
澳大利亚
日本
新加坡
英国
西班牙
新西兰
韩国
泰国
法国
德国
意大利
缅甸
菲律宾
马来西亚
越南
荷兰
柬埔寨
俄罗斯
巴西
智利
卢森堡
芬兰
瑞典
比利时
瑞士
土耳其
斐济
挪威
朝鲜
尼日利亚
阿根廷
匈牙利
爱尔兰
印度
老挝
葡萄牙
乌克兰
印度尼西亚
哈萨克斯坦
塔吉克斯坦
希腊
南非
蒙古
奥地利
肯尼亚
加纳
丹麦
津巴布韦
埃及
坦桑尼亚
捷克
阿联酋
安哥拉