AI Art Weekly | AI 艺术周刊 #32

文摘   科技   2024-06-24 07:03   北京  

欢迎大家踏入本期的《AI艺术周刊》。在这里,我们一起探索人工智能的最新进展和它如何重新定义艺术创作的边界。无论你是 AI 艺术的狂热爱好者,还是对这一领域充满好奇的新手,我们都将为你带来灵感的火花和实践中的深刻见解。让我们共同揭开 AI 艺术的神秘面纱,探索它的无限可能。
* 每周我需要花费大约 8-12 小时来整理这些周刊内容。如果你喜欢我的工作,不妨在下方赠我一杯咖啡,可以令我保持思绪清晰与热情不减 🙏

🌟 本期要闻

Runway Gen-3 Alpha:即将发布
https://runwayml.com/blog/introducing-gen-3-alpha/?ref=aiartweekly

Runway 即将发布 Gen-3 Alpha 模型,该模型在清晰度、一致性和动作方面相比 Gen-2 有显著提升,是迈向构建通用世界模型的一步。Gen-3 将支持现有的控制模式如运动刷和导演模式,并增加更细粒度的结构、风格和动作控制工具,还能生成文本

注: Runway Gen-3 Alpha 示例

Midjourney:高级风格混合

https://docs.midjourney.com/docs/personalization?ref=aiartweekly
Midjourney 本周更新了用于风格参考和模型个性化混合的新高级选项
  • 混合多个 --sref 代码(例如:--sref 123 456)
  • 组合风格参考图片 URL 和随机代码(例如:--sref 123 url)
  • 为单个代码或 URL 分配权重(例如:--sref 123::2 456::1)
  • 混合多个模型个性化代码(例如:--p ab12ad3 cd34gl)
  • 使用相同的标记进行加权混合(例如:--p ab12ad3::2 cd34gl::1)

注: 高级 Midjourney 风格混合示例
MeshAnything: 使用自回归变压器生成网格

https://buaacyw.github.io/mesh-anything/?ref=aiartweekly

MeshAnything 可以将任何 3D 表示形式的 3D 资产转换为网格。此功能可用于增强各种 3D 资产的制作方法,并显著提高存储、渲染和模拟的效率
注: MeshAnything 示例
HiFiAlbedo:通过纹理量化实现高保真面部反照率估计

https://hifialbedo.github.io/?ref=aiartweekly

HiFiAlbedo 是一种无需捕获反照率数据,即可从单张图像恢复高保真面部反照率图的方法
注: HiFiAlbedo 示例
GaussianSR:高效的三维高斯超分辨率实现技术
https://chchnii.github.io/GaussianSR/?ref=aiartweekly
GaussianSR 能够从低分辨率图像生成高质量的三维高斯,并且渲染速度比以往方法更快
注: GaussianSR 示例
GradeADreamer:结合高斯喷涂与多视图扩散的增强文本到 3D 生成

https://github.com/trapoom555/GradeADreamer?ref=aiartweekly

GradeADreamer 是一种新的文本到 3D 方法。它能够在不到 30 分钟内,使用单个 RTX 3090 GPU 生成高质量的3D资产

注: GradeADreamer 示例

Holistic-Motion2D:二维空间全身运动生成技术

https://holistic-motion2d.github.io/?ref=aiartweekly

可以根据文本提示在二维空间中生成多样且逼真的动作。生成的结果可用于视频生成中的姿势引导,或提升为三维以进行角色动画

注: Holistic-Motion2D  示例

Splatter a Video:多功能视频高斯表示技术
https://sunyangtian.github.io/spatter_a_video_web/?ref=aiartweekly
Splatter a Video 能将视频转化为三维高斯表示,从而提升视频追踪、深度预测、运动和外观编辑,以及立体视频生成等功能

注: Splatter a Video 示例

4K4DGen:4K 分辨率全景 4D 生成
https://4k4dgen.github.io/?ref=aiartweekly
4K4DGen 能够将单张全景图像转化为4K分辨率的沉浸式4D环境,提供360度全景视角。该方法能够动画化场景,并使用高效喷射技术优化一组4D高斯,实现实时探索

注: 4K4DGen 示例

L4GM:大型 4D 高斯重建模型
https://research.nvidia.com/labs/toronto-ai/l4gm/
L4GM 是一种大型 4D 重建模型,能够将单视角视频转换为动画 3D 对象

注:L4GM 示例

D-NPC:用于单目视频的动态神经点云生成非刚性视图合成
https://moritzkappel.github.io/projects/dnpc/?ref=aiartweekly
D-NPC 能将视频转化为动态神经点云,即 4D 场景,使得从不同视角观看同一场景成为可能

注 :D-NPC 示例

iCD:大约七步完成文本引导图像编辑的可逆一致性蒸馏

https://yandex-research.github.io/invertible-cd/?ref=aiartweekly

iCD 可用于基于扩散模型的零样本文本引导图像编辑。该方法能够在仅 3-4 次推理步骤中将真实图像编码到其潜在空间,然后通过文本提示对图像进行编辑

注: iCD 示例

Make It Count:精确物体数量文本到图像生成技术

https://make-it-count-paper.github.io/?ref=aiartweekly

CountGen 能够根据输入提示生成准确数量的物体,同时保持与提示一致的自然布局

注: CountGen 示例

Glyph-ByT5-v2:多语言视觉文本渲染模型

https://glyph-byt5-v2.github.io/?ref=aiartweekly

Glyph-ByT5-v2 是一种新型的 SDXL 模型,能够在 10 种不同语言中生成高质量的视觉布局与文本

注: Glyph-ByT5-v2 示例

EvTexture:用于视频超分辨率的事件驱动纹理增强
https://dachunkai.github.io/evtexture.github.io/?ref=aiartweekly
EvTexture 是一种视频超分辨率上采样方法,利用事件信号进行纹理增强,从而更准确地恢复纹理和高分辨率细节

注: EvTexture 示例

CamTrol:无需训练的视频生成摄像控制
https://lifedecoder.github.io/CamTrol/?ref=aiartweekly
CamTrol 能生成具有可控摄像机移动的高动态视频,无需进行任何微调

注: CamTrol 示例

⚒️ 工具与教程:

AI 频道切换
@david_vipernz 回顾了 Luma Labs 过去一周的一些视频,并制作了一个模拟电视频道切换的短片
https://x.com/david_vipernz/status/1802879409290166578?ref=aiartweekly
Straight Outta Prompton
@ai_s_a_m 使用 Luma AI 的视频输出制作了一支音乐视频。AI 音乐视频即将再次变得有趣起来
https://x.com/ai_s_a_m/status/1802729130254905793?ref=aiartweekly

Hunted in the Redlands
@cfryant 使用 Luma AI 制作了一些伪纪录片风格的视频
https://x.com/ai_s_a_m/status/1802729130254905793?ref=aiartweekly

用 Claude Sonnet 创建 Python 3D 射击游戏
@CoffeeVectors 尝试使用 Claude Sonnet 3.5 用 Python 制作一个基本的 3D 射击游戏
https://x.com/CoffeeVectors/status/1804007367144534495?ref=aiartweekly


如果你也对 Midjourney 或艺术设计感兴趣,那么欢迎加入我们的社群!在这里,我们可以一起探讨有趣的设计话题,共同探索 Midjourney 所带来的无限可能性!

注:如果你与我一样热衷于紧跟人工智能与设计的最新趋势,那么我强烈推荐你试用下我们精心打造的这款应用 — 设计原力。这款应用能够让你随时了解到最前沿的信息,让你的信息库始终保持最新状态
▲ 好了,以上这些就是本节的全部内容了 ~ 如果,你也对 AI 绘画感兴趣,不妨记得关注我!我们下期见!!

设计师的自我修行
创意— 并非要让人惊奇它崭新的形式和素材, 而是应让人惊异它源自最平凡的生活。
 最新文章