首页时事民生政务教育文化科技财富体娱健康情感

旅行百科职场楼市企业乐活学术汽车时尚创业美食幽默美体文摘

首发 | Kimi 首个多模态功能体验，AI 一键为音乐生成 MV，月之暗面不再只卷长文本

科技 2024-11-18 12:00 广东

在闭着眼睛听一首歌的时候，你有没有在脑海里想象过，应该搭配什么画面？

Kimi 内测的最新功能「创作音乐视频」，就是奔着当 MV 导演去的。长文本领先的 Kimi，默不作声地「跨界」了。APPSO 也受邀首批体验了这一新功能。

给 Kimi 一首歌，然后等待几首歌的时间，它就还你一个短视频，能踩点，懂分镜，审美也不错。

关注 AI 第一新媒体，率先获取 AI 前沿资讯和洞察

当 MV 导演，Kimi 真的有点懂行

懂王入场曲、川普战歌《YMCA》，谁上头了？每当音乐响起，特朗普握紧双拳，上下挥动，没有人比他更懂怎么搓澡。

不妨试试拿 Kimi 做个同款。我上传了一段 11 秒的《YMCA》片段，并用提示词描述了视频的画面和分镜。

其中有个高难度的要求：帽子写上「MAGA」，应援的牌子更是要写一整个句子：「Make America Great Again」。

Kimi 理解了，它为每个镜头扩写了提示词，短短的 11 秒，有 6 个片段，同时符合我的提示词里的镜头切换逻辑。

接下来，打开音量，或者戴上耳机，欣赏一下完整视频。

特朗普的脸偶尔会崩，至于文字，缩写很稳，单词也不容易拼错，但就是没有生成符合要求的句子。

不过，舞王的感觉对了，胸前的红领带很鲜艳，特写尤其传神。

除了迪斯科神曲，《青花瓷》这样的经典中国风歌曲，Kimi 也能 hold 住。

近景切全景，特写切远景，有人物，也有空镜，每个镜头都是按照提示词的要求设计的，烟雨江南的意境到位了。

可惜人物的稳定性不够好，这位女主角从头到尾长得都不一样，手指的动作也比较诡异，一眼看出，这是个 AI。

以及 Kimi 可以解释一下吗，为什么她的手上还戴了戒指？为什么青花瓷瓶自己会滑动？

除了自己上传音乐，我们也可以复制粘贴抖音链接。

以后一键 get 同款抖音热歌，变得不费吹灰之力了。

我选择了周传雄在抖音的一段 800 万点赞的吉他弹唱视频，Kimi 可以提取出音乐，画面的提示词还是我们自己来写。

让 AI 也来弹唱一段吧，虽然音乐里包含了歌词，但实践表明，对口型什么的就别想了。

这次主要都是室内的中近景，人物的一致性保持得不错，帽子和 T 恤都不带变的，但场景就不那么完美了。

毕竟，音乐视频还是一个 Kimi 的内测功能，至少从每个片段扩写的提示词来看，这位 AI 导演挺擅长写分镜，将我粗略的指令，细化成了具体的镜头语言，又不偏离原意。

以后我们听歌时脑海里的大致画面，都可以描述给 AI，让它帮我们「剪辑」。

操作新手友好，但 AI 常见的问题也避免不了

自定义的趣味性比较强，因为我们可以自己上传音乐、抖音链接，或者选择 Kimi 提供的背景音乐，创作更加自由。

同时，Kimi 有很多模板可以体验，音乐是固定好的，并且会附加一些文字和特效，对于新手来说更加友好，只需要描述画面。

《哈利波特》重映，经典归来仍是大热 IP，Kimi 也提供了一个哈利波特风格的模板。

那就试试生成哈利·波特和马尔福·德拉科的针锋相对名场面，主要包括，魔法比试、禁林探险、魁地奇球场。

视频的特效和转场酷炫，不过，两位的颜值不太稳定，马尔福有个瞬间特别像他爸，哈利波特的脸时而青春美少年时而方脸大叔。

而且，视频中也有一些错误，让人犯恐怖谷效应，六个手指就不说了，金色飞贼看着像个发光的甲虫，甚至中途冒出一个诡异的人头。

但不得不说，这个模板下有不少漂亮的画面，Kimi 的审美还是可以的。

「布达佩斯大饭店」的模板，则洋溢着对称美学和梦幻色彩。

韦斯·安德森或许也没想过，因为 AI 和我的异想天开，他的风格可以和古典的中国风融合，画面切换还能与音乐节奏完美同步。

不过，舞者的面部和腿部动作看起来有些怪异，像是伪人。怎么把握人体结构，Kimi 还得练习。

不局限在三次元，让 Kimi 这位剪刀手将动漫人物放进好莱坞歌舞电影之中，也未尝不可。

比如，让《火影忍者》的鸣人和佐助，出演一段《爱乐之城》风格的 MV。

出现的问题就比较多了，上一秒，两人的脸部特写都很不错，下一秒，切换到跳舞，鸣人的舞伴莫名其妙地变成了女生。

不用担心，不必从头再来，Kimi 支持片段的微调，哪个片段不满意，就可以针对性地重新生成，或者说，抽卡。

我对不满意的片段重新生成了几次，得到了以下的结果，明明是同一个人，前后的画风仿佛有次元壁。

可以说，差强人意——没有用错成语，大体上还可让人满意。至少，空镜和特写是好看的。

人人生成一段简单的 MV，难度基本等于零。当然，如果模板的选择更多，那就更方便开脑洞，也不担心撞风格了。

我手写我心，我的 AI 创作我的心情

我们可以为熟悉的音乐创作 MV、基于喜欢的模板创作 MV，但从头开始，完全创作独一无二的作品，也不是不行。

方法是，走 AI 一条龙服务——为 AI 音乐，生成 AI 视频。

我之前用一张工作群回复收到的图片，让 Suno 图生音乐，生成了一段 30 秒的 k-pop 风格《收到之歌》。

用这首歌，让 Kimi 生成一段打工人的写实视频，会如何呢？

30 秒的 MV，Kimi 生成用了 15 分钟左右，平心而论，速度不算太慢，毕竟，我们自己把素材一个个搜罗起来再剪辑，时间可能要按小时甚至按天计算。

首先，它给这支 MV 取的名字就够伤人了——《打工人的不眠夜》，凄凄惨惨戚戚。

视频展现了打工人的群像，场景有些复杂，从早上切换到晚上，最后一段旋律的踩点丝滑。

更重要的是，Kimi 把打工人疲惫的精神面貌表现出来了，咖啡不离身，一天对着电脑，在凌乱的工位吃饭，这不就是世另我吗。

音乐视频，可以说是 Kimi 对外公布的第一个多模态功能。

11 月 16 日，Kimi 正式发布新一代数学推理模型 k0-math，对标 OpenAI o1 系列，月之暗面创始人杨植麟在现场回答了媒体提问。

被问到 Kimi 怎么不做多模态，杨植麟表示，「我们也做，几个多模态的能力在内测」。

在他看来，AI 接下来最重要的是思考和交互这两个能力，多模态肯定是必要的，但思考决定了它的上限。

未来，Kimi 的多模态会怎样迭代，把一致性做得更好，还是很值得期待一下的。

每次创作，Kimi 会先欣赏音乐，想象搭配音乐的故事，再根据故事生成画面，然后根据画面剪辑成视频。从前，这个流程让人类来做，可能要花好几天，甚至需要一个项目组。

AI 让任何人都可以讲述自己的故事，围绕我们的生活经验和兴趣爱好，生成非常个人化的内容，虽然现在问题还挺多，但未来可期。

不是所有歌曲都有精心拍摄的 MV，不是每个人都懂剪辑，但有了 AI 之后，我们喜欢的每首歌，或者自己生成的歌，都可以拥有一个专属视频。

一瞬的闪念，私人的心情，美妙的创意，都有了安放之处，和变成现实的权利。问题可以慢慢解决，但我们要先让可能性存在。

http://mp.weixin.qq.com/s?__biz=MjM5MjAyNDUyMA==&mid=2651029723&idx=1&sn=fffb1143ebe183afeb6e0a03c3dd079c

AI 第一新媒体，「超级个体」的灵感指南。 #AIGC #智能设备 #独特应用 #Generative AI

最新文章

首发体验| AI学会发红包了！国产Agent一句话控制手机电脑，我看到了「摸鱼自由」的未来

字节跳动起诉前实习生并索赔 800 万/华为百万级轿车 48 小时预订量达 2108 台/支付宝上线「AI 帮找工作」功能

Sora 泄露事件背后，艺术家为什么要集体反抗 OpenAI？

AI 视频巨头重磅更新！提示词都不用费劲写了，从未有过这样的视频创作方式

OpenAI 再获软银 15 亿美元投资 / 比亚迪回应要求供应商降价:非强制要求/《王者荣耀》卫冕 10 月全球手游收入冠军

Sora 遭遇严重泄露！艺术家愤怒「复仇」OpenAI，测试渠道全网疯传

史上最薄 iPhone 或全面取消实体SIM卡/预售价百万起，华为发布尊界S800/英伟达展示AI语音模型

Mate 70 发布！华为最强 AI 手机来了，余承东高呼对得起「那四个字」

网易云音乐怒斥 QQ 音乐「剽窃式创新」/华为Mate70系列支持 AI 手势隔空传送/库克来华：没中国就没苹果今天的成就

国行 iPhone 16 实现 AI 自由，三步就够了

微信内测原图原视频 14 天自动清理功能/iPhone17系列仅Pro机型搭载5倍光学变焦/AI助力，陶哲轩宣布等式理论计划成功

AI 聊天机器人让用户去死，大学生吓到崩溃，官方紧急道歉

AI或成华为Mate70最大卖点/苹果Siri大升级，2026年拟超ChatGPT/可口可乐AI广告翻车|Hunt Good周报

刚刚，黄仁勋获港科大荣誉博士，演讲大秀中文，称 AI 可能是人类历史上最重要的技术

你画 AI 猜，这个开源 AI 图像神器，在玩一种很新的 P 图

小米将承担 SU7 自动泊车异常维修费用/麦当劳和支付宝力推「碰一下点餐」/OpenAI 正考虑推出自研浏览器

国产大模型黑马的首个推理模型来了，和 o1 PK后，我发现了AI深度思考的大问题

《黑神话：悟空》获金摇杆奖年度游戏/胖东来回应「员工结婚不许要彩礼」/OpenAI 薪酬曝光，奥特曼年薪仅 55 万

农夫山泉钟睒睒炮轰张一鸣，要求道歉/马斯克：AGI最晚2026年实现，人形机器人超100亿/曝华为鸿蒙智行销售车型明年翻倍

初代星舰最后一飞！首次在太空点燃猛禽发动机，马斯克、特朗普现场观看

iPhone 17 Air 厚度曝光，将是苹果最薄手机/余承东展示华为Mate70 细节/阿里通义千问发布新开源 AI 模型

马斯克与 OpenAI 决裂内幕全曝光！这封邮件让他破防，怒斥「我受够了」

从 GPT-2 开始玩 AI 的博士生，把论文做成了上线 Steam 的独立游戏｜AI 新职人

华为Mate70系列开启预售，预约人数超200万/《黑神话：悟空》获TGA年度游戏提名/英伟达AI芯片被曝存在过热问题，交付推迟

马斯克新 AI 破解千年难题却被紧急喊停？这个「玩笑」怎么让 AI 圈一夜未眠

首发 | Kimi 首个多模态功能体验，AI 一键为音乐生成 MV，月之暗面不再只卷长文本

华为 Mate 70 定档海报提前曝光/AI 疑似证明黎曼猜想，已被叫停/vivo X200 系列更新改善炫光

看着这个 AI 奶奶把骗子耍得团团转，可把我高兴坏了

马斯克再谈约架扎克伯格：随时奉陪/传满血版 o1 下月推出/苹果或将推出 AI 智能家居中控屏 | Hunt Good 周报

Kimi 发布新模型对标 OpenAI o1！月之暗面创始人回应近期争议

给马斯克上了瑞士卷大考后，我终于拿捏这个国产 AI 视频模型的最强新功能

17 岁高中生写了个神级 Prompt，直接把 Claude 强化成了满血 o1

余承东曝Mate70将在本月26日发布/美团哈啰单车在郑州停运，哈啰已恢复/OpenAI 拟打造AI 经济区与中国竞争

AI 最可怕的不是取代人类，是已经让我们不相信看到的是真照片

iPhone 15成Q3全球销量最高智能手机/OpenAICEO辟谣AI发展「撞墙」论/B站上市后首次单季度盈利

OpenAI 最新产品全曝光！奥特曼驳斥 AI 发展撞墙，Ilya 认错，秘密寻找下一个重大突破

苹果广告又翻车，给 AI 产品做创意怎么就不能 Think different

OpenAI 下一代模型遭遇重大瓶颈，前首席科学家透露新技术路线

曝小米AI眼镜将于明年发布，雷军预期出货30万台/马斯克新职务官宣，狗狗币大涨/苹果或将推出 AI 智能家居中控屏

黄仁勋最新演讲：每家公司都将成为 AI 制造商 | 万字实录

OpenAI 总裁宣布回归！结束「最长假期」，将专注重大技术挑战

2025 放假安排公布，增加两天假期 / 李子柒恢复更新，播放量破亿 / 百度发布首款 AI 眼镜

百度发布首款 AI 眼镜！比 Meta 爆款更卷，苹果也在押注的智能眼镜正在爆发

支付宝崩了上热搜，官方致歉/字节豆包发布新模型，AI 一句话 P 图/罗永浩发文怒喷餐厅卖预制菜

人类智力锁死在了 2021，OpenAI CEO 预言 AGI 可在 5 年内实现 | 万字专访实录

独家首测：全新 Mac mini 的 Type-C 接口能供电了？实测后，我们发现了苹果的秘密

OpenAICEO ：AGI将于2025年到来 / iPhone 部分旧款机型降至半价 / 开封夜骑爆火，官方喊话夜骑大学生

黄仁勋两万字访谈实录：希望英伟达拥有 5 万名员工和 1 亿个 AI 助手

传 Sora 两周内推出/OpenAI 元老、北大校友翁荔宣布离职/Google 版「贾维斯」泄露 | Hunt Good 周报

打败 Midjourney，匿名屠榜的 AI 生图黑马，让人人都能设计海报

分类

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉