AI Art Weekly | AI 艺术周刊 #22

文摘   科技   2024-03-31 03:50   北京  

欢迎大家踏入本期的《AI艺术周刊》。在这里,我们一起探索人工智能的最新进展和它如何重新定义艺术创作的边界。无论你是 AI 艺术的狂热爱好者,还是对这一领域充满好奇的新手,我们都将为你带来灵感的火花和实践中的深刻见解。让我们共同揭开 AI 艺术的神秘面纱,探索它的无限可能。
* 每周我需要花费大约 8-12 小时来整理这些周刊内容。如果你喜欢我的工作,不妨在下方赠我一杯咖啡,可以令我保持思绪清晰与热情不减 🙏

🌟 本期要闻


ThemeStation:从少数示例中生成主题感知的 3D 资产
https://3dthemestation.github.io/?ref=aiartweekly

是否想要为你的 3D 环境获取多样化的树木、汽车或椅子?ThemeStation 能够从一个或多个类似的 3D 参考资产中生成多种变体。该方法还允许使用文本提示编辑 3D 资产

注: ThemeStation 示例

DreamPolisher:通过几何扩散实现高质量文本到 3D 生成

https://yuanze-lin.me/DreamPolisher_page/?ref=aiartweekly
DreamPolisher 是另一种文本到 3D 的方法。这种方法使用高斯斑点和控制网(ControlNet)仅通过文本生成高质量且视角一致的 3D 对象
注: DreamPolisher 示例
 TC4D:轨迹条件的文本到 4D 生成

https://sherwinbahmani.github.io/tc4d/?ref=aiartweekly

TC4D 能够根据任意轨迹对从文本生成的 3D 场景进行动画化。我认为这对于电影或游戏中生成 3D 效果非常有用
注: TC4D 示例
MonoHair:单目视频的高保真头发建模

https://keyuwu-cs.github.io/MonoHair/?ref=aiartweekly

MonoHair 能够从单个视频重建高保真度的 3D 头发。结果非常令人印象深刻,而且该方法能够处理各种类型和风格的头发
注: MonoHair 示例
GaussianCube:使用最优传输对高斯斑点进行结构化以进行 3D 生成建模

https://gaussiancube.github.io/?ref=aiartweekly

GaussianCube 是一种图像到 3D 模型的转换方法,能够从多视角图像生成高质量的 3D 对象。这一方法同样使用 3D 高斯斑点技术,将非结构化表示转换为结构化的体素网格,然后训练一个 3D 扩散模型以生成新的对象。
注: GaussianCube 示例
Garment3DGen:3D 服装风格化和纹理生成

https://nsarafianos.github.io/garment3dgen?ref=aiartweekly

Garment3DGen 能够从 2D 图像和 3D 网格服装中提取并风格化几何形状和纹理!这些可以适配到参数化的身体模型上并进行模拟。可以用于 VR 中的手部与服装互动,或将草图转化为 3D 服装

注: Garment3DGen 示例

Make-It-Vivid:根据文本为你的可动二足卡通角色着装

https://make-it-vivid.github.io/?ref=aiartweekly

Make-It-Vivid 根据文本指令为 3D 二足卡通角色生成高质量的纹理图,使得根据提示为角色着装和动画化成为可能

注: Make-It-Vivid 示例

TRAM:根据视频中重建 3D 人类的轨迹和运动

https://yufu-wang.github.io/tram4d/?ref=aiartweekly

摆脱昂贵的运动捕捉套装和摄像机,TRAM 能够从单目视频中重建一个或多个人类

注: TRAM 示例

AiOS:全能一体化表达式人体姿势与形态估计

https://ttxskk.github.io/AiOS/?ref=aiartweekly

虽然 TRAM 引人注目,但它并非本周唯一的运动捕捉技术。AiOS 同样值得关注,它能够在单一步骤中估计人体姿势、手势和面部表情,从而实现对人物的 3D 重建更为精确和完整

注: AiOS 示例

FlashFace:以高度保真的方式保留个人特征的人像定制化

https://jshilong.github.io/flashface-page/?ref=aiartweekly

LoRA 领域的又一位身份保持竞争者加入战局:FlashFace。该方法基于一张或几张参考面部图像和一个文本提示,可以改变人物的年龄或性别,将虚拟角色变成真人,将真人变成艺术作品,并在保留面部细节的高度上进行面部交换

注: FlashFace 示例

PAID:由提示引导的图片改进技术

https://qy-h00.github.io/attention-interpolation-diffusion/?ref=aiartweekly

PAID 是一种技术,可以让图片在改变时看起来更自然连贯。虽然之前主要是用一种叫做生成对抗网络的方法来做这个,但 PAID 用的是另一种方式,而且做得也很好

注: PAID 示例

NeuroPictor:把脑扫描变成图片的新技术

https://jingyanghuo.github.io/neuropictor/?ref=aiartweekly

好一阵子我们都没听到有关把大脑活动转换成图像的技术了。NeuroPictor 推出了一种新方法,可以把脑部 MRI 扫描重建成图像。随着这样的项目正在进行,我们可能很快就能看到自己梦境中的画面了 🤯

注: NeuroPictor 示例

ObjectDrop:让照片里东西随意“消失”或“出现”的技术

https://objectdrop.github.io/?ref=aiartweekly

谷歌的 ObjectDrop 可以让你在照片里随意去掉或加入物体,而且看起来非常真实。不过,因为这技术是谷歌开发的,所以我们这些普通人可能用不上了

注: ObjectDrop 示例

Inclusion Matching:一键匹配填色

https://ykdai.github.io/projects/InclusionMatching?ref=aiartweekly

Inclusion Matching 可以给动画里的画线填色变得超级简单了。有了一键匹配填色技术,动画中的线稿可以自动填上颜色。画师只需要给一个画面上色,然后这个技术就能自动把这个颜色应用到其他所有画面上

注: Inclusion Matching 示例

Attribute Control:把文字变成图片的技术中,精准调节每个人物的特点

https://compvis.github.io/attribute-control/?ref=aiartweekly

Attribute Control 能在文字描述转换成图片的过程中,精确控制图片中每个人物的特征,比如改变年龄、体型、化妆、笑容等等

注: Attribute Control 示例

Champ:通过 3D 参数指导实现可控且一致的人像动画

https://fudan-generative-vision.github.io/champ/?ref=aiartweekly#/

自从 “Animate Anyone drama” 事件后已经有一段时间了。Champ 是这一想法的下一个迭代版本,它能够利用单一图像和一些运动指导来生成任何人的视频

注: Champ 示例

TRIP:让图片变视频更流畅的新技术

https://trip-i2v.github.io/TRIP/?ref=aiartweekly

TRIP 是把图片转换成视频的一种新方法,能让视频的画面连续性更好

注: TRIP 示例

AniPortrait:由音频驱动的逼真人像动画合成

https://github.com/Zejun-Yang/AniPortrait?tab=readme-ov-file&ref=aiartweekly

AniPortrait 能够利用音频和一张参考人像图片生成高质量的人像动画。它还支持根据参考视频进行面部再现

注: AniPortrait 示例

StreamingT2V:从文本到长视频的一致、动态且可扩展生成

https://streamingt2v.github.io/?ref=aiartweekly

StreamingT2V 能够从长文本生成视频,视频中的动作丰富而流畅,没有任何停滞。它保证了视频的时间一致性,与描述性文本紧密对齐,并维持了高水平的帧级图像质量。视频可长达1200帧,持续2分钟,并且可以扩展至更长时间

注: StreamingT2V 示例

Spectral Motion Alignment:使用扩散模型进行视频运动传输

https://geonyeong-park.github.io/spectral-motion-alignment/?ref=aiartweekly

Spectral Motion Alignment 是一个框架,能够捕捉视频中的复杂和长距离运动模式,并将它们传输到视频到视频的框架中,如:MotionDirector、VMC、Tune-A-Video和ControlVideo

注: Spectral Motion Alignment 示例

📰 其它动态
  • Octree-GS:

    利用 LOD 结构的 3D 高斯实现稳定的实时渲染


    https://city-super.github.io/octree-gs/?ref=aiartweekly

  • InterDreamer:

    零样本文本到 3D动态人物-物体互动


    https://sirui-xu.github.io/InterDreamer/?ref=aiartweekly

  • EVA:

    零样本精准属性与多对象视频编辑


    https://knightyxp.github.io/EVA/?ref=aiartweekly

  • Blur2Blur:

    用于未知领域图像去模糊转换技术


    https://zero1778.github.io/blur2blur/?ref=aiartweekly

  • latentSplat:

    用于快速通用 3D 模型重建的高斯自编码技术


    https://geometric-rl.mpi-inf.mpg.de/latentsplat/?ref=aiartweekly

  • DragAPart:

    学习关节对象的部件级运动


    https://dragapart.github.io/?ref=aiartweekly


⚒️ 工具与教程:

利用 AI 对谷歌街景匿名捕捉的画面进行深入挖掘
@ArgletonLane 一直在利用AI技术,对谷歌街景匿名捕捉的画面进行深入挖掘,揭示那些隐藏在地图中的神秘身份。真是个酷炫的想法
https://twitter.com/ArgletonLane/status/1772989496704782803?ref=aiartweekly

ViggleAI 工作流程
@MaxEinhorn 做了一件相当酷的事,他使用 ViggleAI 将原始影像和一个虚构角色混合在一起。还包括了工作流程。
https://twitter.com/MaxEinhorn/status/1771318701159321690?ref=aiartweekly

为 Vision Pro 创建 3D 对象
@blizaine 展示了另一个很酷的例子,演示了生成式 AI 如何将 3D 对象带入增强现实
https://twitter.com/blizaine/status/1772036504757448752?ref=aiartweekly

AdaSR-TalkingHead
生成对话头像视频的另一种方法
https://github.com/Songluchuan/AdaSR-TalkingHead?ref=aiartweekly

如果你也对 Midjourney 或艺术设计感兴趣,那么欢迎加入我们的社群!在这里,我们可以一起探讨有趣的设计话题,共同探索 Midjourney 所带来的无限可能性!

注:如果你与我一样热衷于紧跟人工智能与设计的最新趋势,那么我强烈推荐你试用下我们精心打造的这款应用 — 设计原力。这款应用能够让你随时了解到最前沿的信息,让你的信息库始终保持最新状态
▲ 好了,以上这些就是本节的全部内容了 ~ 如果,你也对 AI 绘画感兴趣,不妨记得关注我!我们下期见!!

设计师的自我修行
创意— 并非要让人惊奇它崭新的形式和素材, 而是应让人惊异它源自最平凡的生活。
 最新文章