AI Art Weekly | AI 艺术周刊 #12

文摘   科技   2024-01-22 06:30   美国  

欢迎大家踏入本期的《AI艺术周刊》。在这里,我们一起探索人工智能的最新进展和它如何重新定义艺术创作的边界。无论你是 AI 艺术的狂热爱好者,还是对这一领域充满好奇的新手,我们都将为你带来灵感的火花和实践中的深刻见解。让我们共同揭开 AI 艺术的神秘面纱,探索它的无限可能。
* 每周我需要花费大约 8-12 小时来整理这些周刊内容。如果你喜欢我的工作,不妨在下方赠我一杯咖啡,可以令我保持思绪清晰与热情不减 🙏

🌟 本期要闻

VideoCrafter2:突破数据限制,打造高质量视频扩散模型
https://ailab-cvc.github.io/videocrafter2/?ref=aiartweekly
自 VideoCrafter1 发布以来已近一年。VideoCrafter2 是其后续版本,带来了更高质量的生成效果、改进的视觉品质、流畅的动态效果以及更佳的概念构图。

注: VideoCrafter1 与 VideoCrafter2 对比示例

UniVG:多功能视频生成系统
https://univg-baidu.github.io/?ref=aiartweekly

UniVG 是又一款视频生成系统的新星。它的亮点在于能够使用图像输入进行引导,并通过额外的文本提示来修改和指导视频生成。目前还未见其它视频模型具备这样的功能。

注: UniVG 示例

ROVI:利用多模态大语言模型实现基于语言驱动的视频修复

https://jianzongwu.github.io/projects/rovi/?ref=aiartweekly
未来的界面将实现免提操作,因此我们的AI助手需要一种方法,让我们在不标记区域的情况下编辑视频。ROVI 正是通过自然语言指令来实现这一点。它能帮助您仅通过描述想要移除的对象或应该填补的部分,就能从视频中移除物体或填补缺失部分。虽然目前的结果还不够完美,但这预示了未来的发展方向。
注: ROVI 示例
InstantID:零样本实现个性化保持

https://instantid.github.io/?ref=aiartweekly

InstantID 能够从单一参考图像生成各种姿势或风格的定制化图像。其结果可媲美 LoRAs,而且 InstantID 无需任何训练即可实现!它支持风格化、逼真、非肖像以及新颖视角、插值,甚至是分割的多身份生成。
注: InstantID 示例
RoHM:通过扩散技术实现人体运动重建

https://sanweiliti.github.io/ROHM/ROHM.html?ref=aiartweekly

RoHM 能够从单目视频中重建完整、可信的 3D 人体动作,甚至支持识别被遮挡的关节!简而言之,这是一种加强版的运动追踪技术,而且不需要昂贵的设备支持。
注: RoHM 示例
MotionShop:用 3D 虚拟形象替换视频中的人物

https://aigc3d.github.io/motionshop/?ref=aiartweekly

谈到运动追踪,MotionShop 是一个能够将视频中的人物替换为 3D 虚拟形象的流程。这一过程包括多个步骤,如角色检测、分割与追踪、画面修复、姿态估计、动画重定向、光线估计、渲染以及合成。
注: MotionShop 示例
STMC:文本驱动的3D人体运动生成与多轨时间线控制

https://mathis.petrovich.fr/stmc/?ref=aiartweekly

运动追踪是一回事,而从文本生成运动则是另一回事。STMC 是一种可以从文本生成 3D 人体运动的方法,它具备多轨时间线控制功能。这意味着用户不仅仅是通过单一的文本提示,而是可以指定一个包含多个提示的时间线,这些提示有确定的持续时间和重叠,从而创造出更复杂、更精准的动画。
注: STMC 示例
GARField:用辐射场分类任何事物

https://www.garfield.studio/?ref=aiartweekly

在 3D NeRF 场景中,物体并非典型的 3D 模型,而更像是分散在空间中的“像素”,彼此之间没有明显的联系。GARField 是一种方法,能够在 NeRF 场景中识别并将这些“像素”进行分组,将它们提取为独立的资产。
注: GARField 示例
TextureDreamer:通过几何感知扩散实现图像引导的纹理合成

https://texturedreamer.github.io/?ref=aiartweekly

TextureDreamer 能够从 3-5 张图像中提取出逼真、高保真且具有几何感知的纹理,并将其转移到任意 3D 网格上。其生成的结果看起来惊人地优秀。
注: TextureDreamer 流程图
Real3D-Portrait:真实 3D 说话肖像合成

https://real3dportrait.github.io/?ref=aiartweekly

Real3D-Portrait 是一种一键式 3D 说话肖像生成方法。它能够生成逼真的视频,具有自然的躯干运动和可切换的背景。
注: Real3D-Portrait 流程图


📰 其它动态

  • MultiPLY:

    三维世界多感官对象中心化大型语言模型


    https://vis-www.cs.umass.edu/multiply/?ref=aiartweekly

  • EgoGen:

    一款专门生成第一人称视角拍摄的合成数据的工具


    https://ego-gen.github.io/?ref=aiartweekly

  • SHINOBI:

    在自然环境条件下利用双向反射分布函数(BRDF)分解实现形状和光照


    https://vis-www.cs.umass.edu/multiply/?ref=aiartweekly

  • FPDM:

    固定点扩散模型


    https://lukemelas.github.io/fixed-point-diffusion-models?ref=aiartweekly

  • Edit One for All: 

    交互式批量图像编辑工具


    https://thaoshibe.github.io/edit-one-for-all/?ref=aiartweekly



⚒️ 工具与教程:

Bespoke Automata
Bespoke Automata 提供了一个图形用户界面和部署流程,使用户能够在本地和离线环境中构建和部署复杂的人工智能代理。
https://github.com/C0deMunk33/bespoke_automata?ref=aiartweekly
MotionCtrl SVD
稳定视频扩散实现功能。
https://huggingface.co/spaces/TencentARC/MotionCtrl_SVD?ref=aiartweekly
MAGNeT colab
@camenduru 制作了一个专门介绍和展示 Meta 最新推出的音乐/音频模型 MAGNeT 的应用

https://huggingface.co/spaces/PixArt-alpha/PixArt-LCM?ref=aiartweekly

PhotoMaker
腾讯已经公开发布了其 PhotoMaker 图像处理流程的源代码。

https://github.com/TencentARC/PhotoMaker?ref=aiartweekly

Moore-AnimateAnyone
虽然 Animate Anyone 尚未正式发布,但开发者 MooreThreads 已经推出了该论文的非官方实现版本。

https://github.com/MooreThreads/Moore-AnimateAnyone?ref=aiartweekly

如果你也对 Midjourney 或艺术设计感兴趣,那么欢迎加入我们的社群!在这里,我们可以一起探讨有趣的设计话题,共同探索 Midjourney 所带来的无限可能性!

注:如果你与我一样热衷于紧跟人工智能与设计的最新趋势,那么我强烈推荐你试用下我们精心打造的这款应用 — 设计原力。这款应用能够让你随时了解到最前沿的信息,让你的信息库始终保持最新状态
▲ 好了,以上这些就是本节的全部内容了 ~ 如果,你也对 AI 绘画感兴趣,不妨记得关注我!我们下期见!!

设计师的自我修行
创意— 并非要让人惊奇它崭新的形式和素材, 而是应让人惊异它源自最平凡的生活。
 最新文章