Midjourney 人工智能艺术创作从入门到精通·高级篇1:有效解决角色一致性问题的新方法

文摘   教育   2024-01-03 13:51   北京  

对于任何商业设计项目的实施,视觉一致性始终是至关重要的要素。从整体的视觉呈现到细致的风格和调性,都应尽可能保持连贯与统一,以确保项目的连续性与完整性。尽管引入了 Inpainting Vary(区域变化)技术,但在 Midjourney 上想要达到出色的一致性仍然是一项富有挑战性的任务。


本期内容,我们以角色设定项目为例来进行深入探讨。以下是我们在 Midjourney 中常用的一些技术方法


当前常用方法回顾:

1. 使用关键提示词法,例如:“multiple poses”,“character sheet” 以及 “2 different poses and facial expressions” 等等

用关键提示词的方法虽然能够快速在一张画面上为角色生成一组多姿态图像,但由于某些图像尺寸偏小,其分辨率也相对较低,因此创作更多的高质量图像集可能变得困难,甚至是不可能的

2. 使用 --seed 和 Vary(Subtle)锁定图像创建过程的方法

seed 值的可靠性一直是 Midjourney 目前没有办法解决的技术难点,seed 值在不同的服务器集群之间可能会有所不同。Vary (Subtle) 可能会引入其它对角色的面部特征、服装等不利的变化

3. 使用 InsightFace 更改面部特征

利用 Discord 中的另一个插件,它自身涵盖了多种 2D&3D 深度人脸分析算法,其中包括高效的人脸识别、人脸检测和人脸对齐算法。使用这种方法很简单可以帮助更好的接近原图,但会遇到例如后续动作扩展性的限制
分屏序列方法优势:
  • 能够为一致的角色生成无限数量的图片
  • 能够比较灵活调整角色头部倾斜、旋转或改变其身体姿态和面部表情
  • 较高的出图分辨率和细节刻画,更加便于项目后续落地


分屏序列方法步骤:
1. 在 Midjourney 中开启 /remix 模式。这里不多做赘述,如有需要的小伙伴可以参阅我们以前的基础教程(持续更新中):
👉 Midjourney 通·完整指南
2. 首先,需要创建一组 “起始图片”。这里我们要让 Midjourney 为我们生成一组分屏序列动作 “dynamic action | 2 split screen sequences”
Sci-fi, portrait photograph of Henry, 20 years old, an incredibly handsome man of model appearance, in a dark futuristic space pilot suit, black background, dynamic action | 2 split screen sequences --ar 2:1 --v 5.2

注:“起始图片” 是由同一角色的两个相似图像构成的。它用来为 Midjourney 提供基准,以便后续生成新的图像

3. 接下来,我们将生成第三个序列动作。点击 ➡️ “Pan Right”,并补充所需的提示词以生成最右侧的图像 “same screen sequence, ...”
same screen sequence, left side view, dynamic action::2

same screen sequence, smiling, dynamic action::2
注:可以根据你的需求对于第三个序列动作进行描述例如 annoyed, worried 等等, 这里我增加了一些权重是为了让 Midjourney 可以着重去处理新的提示词部分

看看第三张图片的生成结果,是不是很惊人?细腻的动作和丰富的表情,仿佛赋予了角色生命般的真实感

分屏序列方法生成连续动作:
1. 同理,创建一组 “起始图片”
a beautiful woman named jessica with bold red hair, wearing a tight black leather jacket, 20 years old, black background, photo realistic, insane detail, 8k, rtx, graceful curves, cinematic lighting, high sharpness, dynamic action | 2 split screen sequences --ar 16:9 --v 5.2

2. 增添一个你期望的角色动作。点击 ➡️ “Pan Right”,这里我希望为主角增加一个持枪动作,因此我的描述内容如下

same screen sequence, Hands holding pistol pose, dynamic action::2

注:众所周知,Midjourney 在处理手部细节方面一直面临挑战。鉴于此,选择一幅相对令人满意的图像可能需要你投入更多的精力。当找到相对理想的图像后,你可以对其进行局部调整,以进一步达到最佳预期的效果

3. 到此,你可能会感到惊讶地发现,在使用 “Pan Right” 功能后,图片便不再支持局部重绘。不过别担心,这里有一个小技巧可用:点击 🔍 Custom Zoom”,并将后缀参数调整为 --ar 24:9 --zoom 1,这么做的目的是为了重置生成的图像并获得该访问权限

4. 接下来,你可以利用 “🖌️ Vary(Region)” 功能,对特定区域进行细致调整,以实现你心中理想的效果

分屏抖动问题往往是随机出现的(注:有些角色必须要处理这些问题,而有些角色则可以免于此类问题)。当发生分屏抖动问题时,原本的第三张图片可能会被切割成两张或更多的小图片,为了解决这个问题,可以考虑采用以下策略进行

修复分屏抖动问题:
例如在这里我创建一个名为 Morrigan Aensland 的角色
Darkstalkers, Morrigan Aensland, Face close-up, young female, hyper-realistic, unreal engine 5, tech sense, space, 3d, Bender, dynamic action | 2 split screen sequences --niji 5 --style expressive --s 400 --ar 16:9

当补充完分屏序列提示词后如产生类似效果的抖动问题:

注:分屏序列抖动示例

此时可以考虑以下策略来缓解这个问题:

  • 将 “2 split screen sequences” 的短语更改为 “1 split screen sequence” 或 “1 screen sequence”

  • 在提示词“same screen sequence”前添加数字“1”(即“1 same screen sequence,…”),以此告知 Midjourney 强调这是一个相同的屏幕序列

注:分屏序列示例修复后示例。(我建议先不采取任何修正措施,而是执行提示并观察其结果。由于分屏问题的发生很难预测,只有在确实需要时再进行相应的修复)

总结:

分屏方法可以为一致的角色生成无限的照片,不过对于操作技术的把控上较为复杂且暂时不支持 v6 模型使用。需要用户熟悉 [Pan]、[Custom Zoom]、Vary(Region)、滑块方法、多提示以及 /remix 模式,并理解宽高比的重要性。这对初学者来说是一项挑战,因为它涉及到测试关键词、调整提示的迭代过程,通常需要四到五次的尝试才能达到理想效果。

此外,控制角色头部转动和面部表情的精确度有限,有时也难以捕捉特定的摄像机角度或表情。分屏抖动问题是随机发生的无法避免,且有些角色可能因未知原因对这种方法表现并不理想。尽管目前还是有这些局限性,但我仍然认为该方法极具价值,它能为用户开启无限的创造潜力。

 Midjourney  Midjourney 

  沿
    AI 

设计师的自我修行
创意— 并非要让人惊奇它崭新的形式和素材, 而是应让人惊异它源自最平凡的生活。
 最新文章