对于任何商业设计项目的实施,视觉一致性始终是至关重要的要素。从整体的视觉呈现到细致的风格和调性,都应尽可能保持连贯与统一,以确保项目的连续性与完整性。尽管引入了 Inpainting Vary(区域变化)技术,但在 Midjourney 上想要达到出色的一致性仍然是一项富有挑战性的任务。
本期内容,我们以角色设定项目为例来进行深入探讨。以下是我们在 Midjourney 中常用的一些技术方法
当前常用方法回顾:
1. 使用关键提示词法,例如:“multiple poses”,“character sheet” 以及 “2 different poses and facial expressions” 等等
2. 使用 --seed 和 Vary(Subtle)锁定图像创建过程的方法
3. 使用 InsightFace 更改面部特征
能够为一致的角色生成无限数量的图片 能够比较灵活调整角色头部倾斜、旋转或改变其身体姿态和面部表情 较高的出图分辨率和细节刻画,更加便于项目后续落地
Sci-fi, portrait photograph of Henry, 20 years old, an incredibly handsome man of model appearance, in a dark futuristic space pilot suit, black background, dynamic action | 2 split screen sequences --ar 2:1 --v 5.2 |
注:“起始图片” 是由同一角色的两个相似图像构成的。它用来为 Midjourney 提供基准,以便后续生成新的图像
same screen sequence, left side view, dynamic action::2 |
same screen sequence, smiling, dynamic action::2 |
看看第三张图片的生成结果,是不是很惊人?细腻的动作和丰富的表情,仿佛赋予了角色生命般的真实感
a beautiful woman named jessica with bold red hair, wearing a tight black leather jacket, 20 years old, black background, photo realistic, insane detail, 8k, rtx, graceful curves, cinematic lighting, high sharpness, dynamic action | 2 split screen sequences --ar 16:9 --v 5.2 |
same screen sequence, Hands holding pistol pose, dynamic action::2 |
3. 到此,你可能会感到惊讶地发现,在使用 “Pan Right” 功能后,图片便不再支持局部重绘。不过别担心,这里有一个小技巧可用:点击 “🔍 Custom Zoom”,并将后缀参数调整为 --ar 24:9 --zoom 1,这么做的目的是为了重置生成的图像并获得该访问权限
分屏抖动问题往往是随机出现的(注:有些角色必须要处理这些问题,而有些角色则可以免于此类问题)。当发生分屏抖动问题时,原本的第三张图片可能会被切割成两张或更多的小图片,为了解决这个问题,可以考虑采用以下策略进行
Darkstalkers, Morrigan Aensland, Face close-up, young female, hyper-realistic, unreal engine 5, tech sense, space, 3d, Bender, dynamic action | 2 split screen sequences --niji 5 --style expressive --s 400 --ar 16:9 |
当补充完分屏序列提示词后如产生类似效果的抖动问题:
注:分屏序列抖动示例
此时可以考虑以下策略来缓解这个问题:
将 “2 split screen sequences” 的短语更改为 “1 split screen sequence” 或 “1 screen sequence”
在提示词“same screen sequence”前添加数字“1”(即“1 same screen sequence,…”),以此告知 Midjourney 强调这是一个相同的屏幕序列
总结:
分屏方法可以为一致的角色生成无限的照片,不过对于操作技术的把控上较为复杂且暂时不支持 v6 模型使用。需要用户熟悉 [Pan]、[Custom Zoom]、Vary(Region)、滑块方法、多提示以及 /remix 模式,并理解宽高比的重要性。这对初学者来说是一项挑战,因为它涉及到测试关键词、调整提示的迭代过程,通常需要四到五次的尝试才能达到理想效果。
此外,控制角色头部转动和面部表情的精确度有限,有时也难以捕捉特定的摄像机角度或表情。分屏抖动问题是随机发生的无法避免,且有些角色可能因未知原因对这种方法表现并不理想。尽管目前还是有这些局限性,但我仍然认为该方法极具价值,它能为用户开启无限的创造潜力。