欢迎大家踏入本期的《AI艺术周刊》。在这里,我们一起探索人工智能的最新进展和它如何重新定义艺术创作的边界。无论你是 AI 艺术的狂热爱好者,还是对这一领域充满好奇的新手,我们都将为你带来灵感的火花和实践中的深刻见解。让我们共同揭开 AI 艺术的神秘面纱,探索它的无限可能。* 每周我需要花费大约 8-12 小时来整理这些周刊内容。如果你喜欢我的工作,不妨在下方赠我一杯咖啡,可以令我保持思绪清晰与热情不减 🙏🌟 本期要闻:
https://humanaigc.github.io/emote-portrait-alive/?ref=aiartweekly |
阿里巴巴的 EMO 唇同步技术能够将任何一张面部图像转换成视频,通过任何音频文件(唱歌或说话)表达出话语和情感。注: EMO 示例
https://sites.google.com/view/genie-2024/?ref=aiartweekly |
本周谷歌带来了另一篇令人震撼的论文。他们介绍了灵感创造者(Genie),这是一个基于互联网视频训练的基础世界模型,能够从合成图像、照片乃至草图中生成无尽变化的可玩世界。这为生成和踏入虚拟世界开启了多种新方式。
注: Genie 示例Multi-LoRA Composition:基于图像生成的多重LoRA组合
https://maszhongming.github.io/Multi-LoRA-Composition/?ref=aiartweekly |
Multi-LoRA Composition 专注于融合多个低秩适应(LoRA)技术,创造出高度定制化且细节丰富的图像。这种方法能够在无需微调的情况下生成包含多个元素的图像,同时不损失细节或图像质量。注: Multi-LoRA Composition 示例DiffuseKronA:个性化扩散模型的参数高效微调方法https://diffusekrona.github.io/?ref=aiartweekly |
DiffuseKronA 采用了一种不同的方法,试图避免使用 LoRAs,并仅通过输入图像实现个性化。该方法能够从多样化和复杂的输入图像及提示中生成高质量图像,具有准确的文本-图像对应关系和改善的色彩分布。注: DiffuseKronA 示例https://mhh0318.github.io/tcd/?ref=aiartweekly |
虽然 LCM 和 Turbo 已经实现了接近实时的图像扩散处理,但图像质量仍有所欠缺。另一方面,TCD 则能够在不牺牲速度的前提下,生成既清晰又细致复杂的图像。注: TCD 示例VastGaussian:用于大场景重建的广阔三维高斯方法https://vastgaussian.github.io/?ref=aiartweekly |
VastGaussian 是一种新的三维高斯喷涂技术,用于高质量重建和实时渲染大型场景。注: VastGaussian 示例https://3d-aigc.github.io/GEA/?ref=aiartweekly |
谈到高斯喷涂技术,GEA 是一种方法,它能够基于三维高斯,从单个视频中高保真重建身体和手部,创造出富有表现力的三维化身。注: GEA 示例
https://lodurality.github.io/GEM3D/?ref=aiartweekly |
GEM3D 是一种新型的深度、拓扑感知的三维形状生成模型。该方法能够从用户建模的骨架生成多样化和可信的三维形状,使得用户可以绘制物体的大致结构,并由模型完成其余部分。注: GEM3D 示例
https://dave.ml/layoutlearning/?ref=aiartweekly |
Layout Learning 能够根据文本自动生成并将其分解为多个对象的三维场景。这意味着,只需给出一个提示,比如一只厨师老鼠站在小凳子上烹饪炖菜,该模型就能生成一个包含厨师老鼠、小凳子和炖菜作为独立对象的三维场景。注: Layout Learning 示例
SongComposer 和 ChatMusicianhttps://pjlab-songcomposer.github.io/?ref=aiartweekly |
https://shanghaicannon.github.io/ChatMusician/?ref=aiartweekly |
我们都已经知道,大语言模型(LLMs)擅长解决各种不同的任务。直到现在,音乐创作并不在其擅长的范围内。歌曲创作家(SongComposer)和聊天音乐家(ChatMusician)是两个专门训练用于通过符号或 ABC 记谱法来创作音乐的 LLMs。歌曲创作家专注于生成人声部分,而聊天音乐家则生成可以与现有音乐工具配合使用的 ABC 记谱。这意味着,即使是音乐创作新手,也能利用这两个工具创作出属于自己的音乐。注: SongComposer 和 ChatMusician 示例
https://zxz267.github.io/OHTA/?ref=aiartweekly |
虽然扩散模型在生成精确的人手图像方面仍面临挑战,但 OHTA 能够仅用一张图片就创建出高保真且可驱动的手部化身。这些手部化身也可以仅通过文本生成,并允许对手部的纹理和几何形状进行编辑。注: OHTA 示例
ViewFusion:
通过插值去噪实现多视角一致性
https://wi-sc.github.io/ViewFusion.github.io/?ref=aiartweekly |
FlowMDM:
通过混合位置编码实现无缝人体动作合成
https://barquerogerman.github.io/FlowMDM/?ref=aiartweekly |
OOTDiffusion:
基于潜在扩散的装备融合,实现可控虚拟试穿
https://github.com/levihsu/OOTDiffusion?ref=aiartweekly |
⚒️ 工具与教程:
Kyle Vorbach - 《How I Faked My Life with AI》还记得那个在 Instagram 上伪造自己生活的家伙吗?他做了一次 TEDx 演讲,值得一看!在演讲《 How I Faked My Life with AI - 如何用人工智能伪造我的生活 》中,电影制作人兼作家凯尔·沃巴赫(Kyle Vorbach)分享了他如何利用生成式人工智能(AI)在社交媒体上构建了一个理想化的生活形象。沃巴赫探讨了现实与虚拟之间的界限,以及在数字时代,我们如何分辨我们看到和听到的一切https://www.youtube.com/watch?v=OP9Hr_hQI4w |
如果你也对 Midjourney 或艺术设计感兴趣,那么欢迎加入我们的社群!在这里,我们可以一起探讨有趣的设计话题,共同探索 Midjourney 所带来的无限可能性!注:如果你与我一样热衷于紧跟人工智能与设计的最新趋势,那么我强烈推荐你试用下我们精心打造的这款应用 — 设计原力。这款应用能够让你随时了解到最前沿的信息,让你的信息库始终保持最新状态▲ 好了,以上这些就是本节的全部内容了 ~ 如果,你也对 AI 绘画感兴趣,不妨记得关注我!我们下期见!!