欢迎大家踏入本期的《AI艺术周刊》。在这里,我们将一同探讨每周人工智能的最新进展,及其如何重新定义艺术创作的边界。无论你是 AI 艺术的狂热爱好者,还是对这一领域充满好奇的新手,我们都将为你带来灵感的火花和在实践中的深刻见解。让我们共同揭开 AI 艺术的神秘面纱,探索它的无限可能。* 每周我需要花费大约 8-12 小时来整理这些周刊内容。如果你喜欢我的工作,不妨在下方赠我一杯咖啡,可以令我保持思绪清晰与热情不减 🙏🌟 本期要闻:
https://x.ai/blog/grok-2?ref=aiartweekly |
本周,xAI 引起了广泛关注,推出了他们最新的语言模型 — Grok-2 和 Grok-2 mini,这些模型具备先进的推理能力。主要特点包括:
在聊天、编程和推理任务中表现更为出色
能够使用 FLUX.1 生成图像
在 LMSYS 排行榜上表现优于 Claude 3.5 Sonnet 和 GPT-4-Turbo
在视觉任务中表现卓越,在视觉数学推理和基于文档的问答中达到了业界领先水平
在遵循指令和提供准确信息方面有显著提升
在各类学术基准测试中,相较于之前的 Grok-1.5 模型有了显著进步
目前,这些模型在𝕏平台上以测试版形式向高级用户开放
我个人尝试了图像生成功能,这次实现的速度、质量和更少的限制性让人体验起来非常有趣。由于 FLUX 能够几乎完美地生成逼真的假照片,不是所有人都对这项技术如此轻易地向大众开放感到满意。但事实上,这项技术已经来到我们身边,并且将继续存在。我们必须接受这样一个事实:屏幕上看到的所有东西都有可能是虚假的。我们越早意识到这一点,就越能适应未来的数字环境
注: Grok 2 海报Midjourney web端新功能更新
https://www.midjourney.com/updates |
Midjourney 推出了全新的 Web 编辑器,将图像处理简化为一个统一的界面。现在,用户可以在同一平台上同时进行图像的修补(inpainting)和扩展(outpainting)。尤其是无限制的扩展功能,为创作带来了更多全新的可能性注: Midjourney Web端示例Photometric Inverse Rendering:阴影与表面反射的分析https://jzbao03.site/projects/PIR/?ref=aiartweekly |
光度逆渲染技术能够解析图像中的光源位置和反射效果,包括复杂的阴影处理。该方法在分解表面反射方面优于其他工具,无论是处理虚拟图像还是真实照片,都能取得良好的效果
注: Photometric Inverse Rendering 示例HeadGAP: 基于通用高斯先验的少样本3D头像生成https://omages.github.io/?ref=aiartweekly |
HeadGAP 能够从少量照片中生成逼真的 3D 头像。通过使用高斯散点技术,生成的头像在不同角度下都非常逼真,并且可以流畅地进行动画处理
注: HeadGAP 示例Sketch2Scene:从用户的随意草图自动生成交互式3D游戏场景https://xrvisionlabs.github.io/Sketch2Scene/?ref=aiartweekly |
Sketch2Scene 能够将简单的草图和文字描述转化为互动的 3D 游戏场景。它结合了扩散模型、ControlNet 和程序化生成技术,创建出符合用户需求的高质量、可玩 3D 环境注: Sketch2Scene 示例MagicFace:无需训练的通用风格人像定制生成https://codegoat24.github.io/MagicFace/?ref=aiartweekly |
MagicFace 能够在无需训练的情况下,生成任何风格的高质量人像。它采用特殊的注意力机制,精准对齐属性并注入特征,支持单一概念和多重概念的定制化生成注: MagicFace 示例
Generative Photomontage:照片拼贴方案https://lseancs.github.io/generativephotomontage/?ref=aiartweekly |
生成型照片拼贴可以使用画笔工具将多张 AI 生成的图像部分组合在一起。它能够创建新的外观组合,修正形状和瑕疵,并提高提示词的匹配度,效果优于现有的图像融合方法注: Generative Photomontage 示例
UniPortrait:保持身份一致性的单人和多人图像个性化统一框架https://aigcdesigngroup.github.io/UniPortrait-Page/?ref=aiartweekly |
UniPortrait 能够高质量地定制一人或多人的图像。它支持精细的面部编辑,并且可以通过自由文本描述来引导图像的修改注: UniPortrait 示例
Puppet-Master:基于局部动态的交互式视频生成扩展https://vgg-puppetmaster.github.io/?ref=aiartweekly |
Puppet-Master 可以通过简单的拖拽操作,从单张图像生成逼真的视频动作。它利用精调的视频扩散模型和全局到局部的注意力机制,生成高质量的视频内容注: Puppet-Master 示例
https://jnjaby.github.io/projects/KEEP/?ref=aiartweekly |
IKEEP 通过在帧间保持一致性,提升视频人脸的超分辨率效果。它采用卡尔曼滤波技术来增强面部细节,适用于合成视频和现实视频中的人脸处理注: IKEEP 示例
PeriodWave:多周期流匹配用于高保真波形生成https://periodwave.github.io/demo/?ref=aiartweekly |
PeriodWave 通过捕捉重复的声音模式生成高质量的语音波形。它使用周期感知流匹配估计器,在文本转语音任务和Mel频谱图重建中表现优于其他模型注: PeriodWave 示例
⚒️ 工具与教程:
@bengttibert、@nathanboey 和 @mind_wank 联手制作了这部精彩的11分钟试播集《AI OR DIE》。绝对值得一看https://x.com/aiordieshow/status/1823708912518094903?ref=aiartweekly |
来自 Runway 的 @iamneubert 分享了他的 GEN-3 图像转视频提示流程。了解他人的工作流程总是很有趣https://x.com/iamneubert/status/1823448276395549018?ref=aiartweekly |
如果你想训练自己的 FLUX LoRA,@HBCoop_ 整理了一篇详尽的资源帖,介绍了如何以及在哪里进行训练。我可能也会在接下来的几周内发布一些相关内容https://x.com/HBCoop_/status/1823422286373745064?ref=aiartweekly |
@EccentrismArt 利用 Gen-3 的情感生成效果,并在此基础上加入了 LivePortrait。这一技术在一年后会变成什么样子?https://x.com/EccentrismArt/status/1823059492520788342?ref=aiartweekly |
@HBCoop_ 精心制作了一个非常酷的8步工作流程和教程,她用这个方法制作了一个AI生成的化妆品广告https://x.com/HBCoop_/status/1822705358684475694?ref=aiartweekly |
@8bit_e 通过将自己的动作输入到他的 Comfy 工作流程中,制作了这部有趣的短篇 AI 动画。音效则由 ElevenLabs 制作https://x.com/8bit_e/status/1824114421775454665?ref=aiartweekly |
如果你也对 Midjourney 或艺术设计感兴趣,那么欢迎加入我们的社群!在这里,我们可以一起探讨有趣的设计话题,共同探索 Midjourney 所带来的无限可能性!
注:如果你与我一样热衷于紧跟人工智能与设计的最新趋势,那么我强烈推荐你试用下我们精心打造的这款应用 — 设计原力。这款应用能够让你随时了解到最前沿的信息,让你的信息库始终保持最新状态▲ 好了,以上这些就是本节的全部内容了 ~ 如果,你也对 AI 绘画感兴趣,不妨记得关注我!我们下期见!!