首页时事民生政务教育文化科技财富体娱健康情感

旅行百科职场楼市企业乐活学术汽车时尚创业美食幽默美体文摘

最全测评！Vidu全球首个新功能，搞定「美女变野兽」难题

科技 2024-09-12 19:07 北京

机器之能报道

编辑：杨文

AI「表演」猪八戒送外卖、黑旋风啃鸡腿。

AI 视频圈上演「神仙打架」，全球网友开启花式整活。

然而，摆在创作者面前的第一道槛儿，就是永远不知道下一秒会生成个啥。

例如，上一秒还是美女，下一秒就蹿出个怪物史莱克：

明明是个丑萌的布偶猴子，接着就蹦出个小浣熊：

还有更离谱的，一秒变性：

这类邪门视频层出不穷，究其原因，还是 AI 难以保持主体一致性。

不过就在昨天，生数科技的视频模型 Vidu 上线了新功能 —— 主体参照，仅需一张图片即可实现主体可控。

比如，上传一张猪八戒的照片，通过提示词任意切换场景，而猪八戒样貌不变。

提示词：猪八戒在街上玩滑板

提示词：猪八戒在河里游泳。

提示词：猪八戒骑摩托送外卖

更重要的是，它免费开放，注册邮箱即可使用。

体验地址：www.vidu.studio

-1-

实测：一张图，场景随意换

所谓「主体参照」，就是用户上传任意主体的一张图片，Vidu 就能锁定该主体形象，通过提示词任意切换场景，输出主体一致的视频。

啥叫任意主体？

甭管是人物、动物、商品，还是动漫角色、虚构主体，它都能确保其视频生成的一致性。

Vidu 也是全球首个支持该能力的视频大模型。

接下来，我们就奉上一手实测。

Round 1：人物主体

我们上传一张「黑旋风」李逵的照片。

提示词：一个男子正在海边的沙滩上啃鸡腿。

李逵的硬汉形象在海边沙滩场景中得到了完美保留，动作幅度大且流畅自然。

而且，脸部没有崩坏，也没有出现「六指狂魔」。

我们又上传了一张孙悟空的剧照。

提示词：孙悟空骑着摩托，行驶在路上。

孙猴子立马化身机车手，上演了一出「速度与激情」。

Vidu 对于细节的处理也挺到位。

比如骑摩托时，风将袖子吹鼓起来，毛发微微向后晃动。

再来祸祸一下「硅谷钢铁侠」马斯克。

提示词：一个男子坐在咖啡馆里喝咖啡。

西装革履的马斯克坐在咖啡馆里，缓缓转过头来，端起了咖啡杯，整个过程一气呵成，相当逼真。

值得注意的是，为了防止生成违规视频，Vidu 还在提示词中进行了限制，不能输入暴力、色情以及政治人物的名字等。

Round 2: 动物主体

Vidu 还可以实现动物在不同环境下、大幅运动状态中细节特征保持一致。

这意味着，我们只需上传一张萌宠照片，就能随心所欲生成一段 Vlog。

提示词：一只北极熊在水里游泳。

满是冰川的北极，一只凶猛的北极熊在水里扑腾，周围溅起了圈圈水花。

镜头中北极熊运动幅度很大，画面却很稳定清晰。

提示词：一只兔子在啃胡萝卜。

虽然我们投喂给 Vidu 的是一张兔子的侧面照，但它仍能生成兔子抱着胡萝卜啃的正面大特写。

提示词：一只企鹅在舞台上跳舞

从这则 8 秒视频可以看出，Vidu 基本能遵循提示词的要求，生成的场景就是一个灯光闪烁的舞台。

毛茸茸的企鹅跳着笨拙的舞蹈，还有表情变化。

Round 3: 虚构角色

Vidu 不仅能搞定写实风格的主体，针对虚构的主体，它也可以保持其高度一致。

一只蜗牛在海里冲浪，溅起浪花。

‍这只蜗牛扑闪着眼睛，在海浪里疾驰。

提示词：猫咪坐在电脑前打字。

Round 4 : 动漫主体

动漫风格可以说是 Vidu 的强项，在之前的 7 大 AI 视频神器测评中，Vidu 就凭借着该强大功能备受好评。

而此次「主体参照」功能中，动漫角色仍是拿手好戏。

提示词：蜡笔小新踢球。

提示词：柯南在路上奔跑。

生成的视频中，无论是装扮还是面孔，都是那个熟悉的柯南。而且，整个镜头的画风均保持动漫风格。

不过，它也有些 bug。例如，胳膊摆动时会有些虚化，随着镜头拉远，柯南竟然腾空飞起来了。

Vidu 最让人惊喜的，还得是对于 3D 动画人物的处理。

提示词：男孩站在厨房切菜。

提示词：女孩在花园里跳舞。

Round 5：商品主体

众所周知，广告片的一大关键就是保证多个镜头、不同场景下品牌物形象的一致性。

Vidu 的「主体参照」功能就派上用场。

例如，我们上传一张可口可乐的商品图，并输入提示词：罐子垂直落在水里，溅起水花，Vidu 随即完成产品的动态表现。

上效果：

提示词：食物摆在黑色大理石餐桌上，垂直洒下粉色的樱花花瓣。

效果最明显的，还要数下面的这则跑步鞋广告视频。

这则跑步鞋广告中，仅通过一张商品图，便完成了所有视频画面的生成，无论是不同角度、背景，还是动态表现，跑步鞋的形象在整个视频中都保持了高度一致。

据悉，该广告视频仅由一个人花 6 小时完成的，包含前期策划、素材生成，后期剪辑。

要知道，在传统广告片制作中，高质量的镜头依赖线下实拍和后期制作，时间周期长、成本投入大。

而如今，Vidu 凭一己之力，就可以在广告制作中挑大梁。

-2-

专业名词傻傻分不清？

目前，视频大模型领域已有「图生视频」和「角色一致性」等能力，那么，Vidu 的「主体参照」功能到底强在哪儿？

咱们先来缕缕这几个概念。

所谓「图生视频」（Image to Video），就是基于首帧画面的连续生成。它无法直接输出目标场景，这就限制了视频内容的多样性和场景的自由度。

「角色一致性」（Character to Video），则只限于人物面部特征的一致性，难以保证人物整体形象的稳定。

而 Vidu 的「主体参照」（Subject Consistency），不局限于人物，面向任意主体。其次在人物主体下，可选择保持面部一致，也可选择保持人物整体形象的高度一致，通过输入文字描述灵活输出目标场景。

例如，我们输入一张林黛玉的角色照，输入同样的提示词「在现代咖啡厅喝咖啡」。

图生视频效果：

‍「角色一致性」效果：

Vidu 的「主体参照」效果：

我们能直观看到，在 Vidu 「主体参照」功能下，林黛玉的形象在现代场景中得到了完美保留，场景输出也自然而真实。

现在，你能分清了吗？

OK，今天的 AI 小课堂就到这儿，古德拜！

工具链接——

Vidu官网：www.vidu.studio

以后我们会带来更多好玩的AI应用，也欢迎大家进群交流。

© THE END

转载请联系本公众号获得授权

投稿或寻求报道：content@jiqizhixin.com

http://mp.weixin.qq.com/s?__biz=MzUyODA3MDUwMA==&mid=2247523108&idx=1&sn=a98dfe74801a6fa23b72830bb30c45c3

发现人工智能创新应用

最新文章

好东西！又来个播客界的谷歌NotebookLM，靠记笔记画脑图，月入近5万

马斯克前女友看好的AI玩具生意，在国内卷起来了

好潮！日本又造了个「美丽小废物」，卖926元

一个AI浣熊账号的高开癫走：仅靠82篇帖子、4个月涨粉近14万！

特斯拉卖起机器人玩具！售价40美元被抢光，二手价高达1300美元

谷歌又捣鼓出好东西！有了这款AI学习神器，考试起码多考50分

AI解锁500多年的圣殿，米开朗基罗杰作，你我触手可及

机器人界出了个「达芬奇」，画一幅图灵肖像，卖了108万美元

AI能夺走网文界的一切吗？

实测国内首个AI播客！有点意思，但NotebookLM还是大爷

告别买家秀！一张图就能生成AI穿搭视频，网友：10块钱一套

从文本到屏幕：「Project Jarvis」们能实现 AGI 吗？

实测4大AI搜索：ChatGPT Search频翻车，Perplexity仍是「王者」

美团的这些AI应用，倒把我给整不会了

全球「最轻」人形机器人，成都造！仅25公斤，能换鞋、递药、冲咖啡

养猪、插秧、搬货……这才是机器人该干的活儿

为了口吃的，一群伦敦老铁给谷歌AI「下毒」

波兰小哥花了十年，造了个僵尸机器人

叫好不叫座！2.5万卖不动！苹果Vision Pro或将年底停产

真·赛博菩萨！最大的开源视频模型来了，我们实测：有点东西，但不多

哈工大造了个长轮子的小机器人，卖到2100元

AI大冰嘴替，骂醒「满脑浆糊」的网友

萌化了！日本造了个AI宠物，卖2800元被疯抢

火爆全网、打败王者荣耀的卷饼小游戏，竟是AI造的？

人脸识别的「巅峰」之作！甭管整成啥样，3秒扒出你是谁

曾让Kimi「崩了」的探索版有多厉害？10倍搜索量、精读超500页面，一手实测来了

一副AI耳机卖1200元？端侧AI大模型+硬件= ？这场论坛带你一探究竟

NotebookLM新功能引发网络疯传，AI大神、Altman大赞，一手实测来了

谨以此文，向飞天奖的AI整活视频「致敬」

最新测评！美图大模型提前揭秘，这波风格化美到窒息

不像人也不像狗，腾讯最新家用机器人有点「离经叛道」

留子们用火星文写避雷帖，AI竟看懂了？我们实测：几乎全军覆没

AI在用 | 吵架又没发挥好？7个AI大佬帮你自救

OpenAI大秀肌肉，一口气放出10个新模型Demo，全球网友玩疯了

最全测评！Vidu全球首个新功能，搞定「美女变野兽」难题

AI这个「狗头军师」，教年轻人说「土味情话」贼油腻

看到苹果和华为「互抡大锤」，我不厚道地笑了

世界首例：一位「00后」让人形机器人住进了家

最专业的法律 AI 准确率也只能到 65%？哪些场景下的法律 AI 是靠谱的？

华人小哥搞出一个鸡鸣狗叫GPT，可识别「毛孩子」80%的情绪

这款AI神器登上GitHub热榜第一，它真能革了照相馆的命？

与人类共度一年后，机器人的人生开了挂

一只AI吗喽，单挑《黑神话》，歇菜1000次，终于击败首个Boss

还在死磕镜头？聪明人已经用AI拍时尚广告大片了

a16z 最新 AI 应用 TOP100 榜单公布：消费者最爱用谁家应用？

6小时视频，一键转成PPT，赵晓卉们再也不用发疯了

我有一个「赛博爱人」，拥有超长记忆，还能给足情绪价值

AI在用 |「国乒喜剧人」许昕搞的Logo火了，我用AI整了个

AI在用 | 雷总，我把你的出道曲《Are You OK》搞成了动画MV

科波拉的史诗级巨制还没上映，就被AI搞砸了预告片

分类

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉