大家好,这里是和你们一起探索 AI 的花生~
很久没有写 Midjourney 的更新介绍了,因为它在二三月份接连推出 style reference 风格参考、character reference 角色参考后一直都没有大的更新。不过昨天官方接连发布了 2 条更新内容,分别是官网的新优化和新参数 Personalization 的推出,今天就用一篇文章为大家介绍一下 Midjourney 近期的更新。
一、Alpha 网站优化
官网直达:https://alpha.midjourney.com/
Midjourney 的 Alpha 官网现在基本全面开放了(生成超过 100 张图像即可使用),新网站集成了图像生成/展示/管理/评级、订阅管理、官方指南、更新通知等多种功能,整体使用体验非常不错,比 Discord 方便很多。
此次更新主要对一些重要功能的官网名称进行了调整,包括:
将「Pan 平移」、「Zoom 外绘拓展功能」和 「Remix 混合」合并到同一个新选项「Reframe」中,「Remix」改名为「Edit Prompt」。
「Vary Region」改名为「Repaint」,可以对图像进行局部重绘。
进入官网的图像详情页,在右下角的工具栏中即可看到新版功能按钮了,使用方法与之前基本一致。
网站左侧栏的变得更加简单,「Tasks」版块现在包含了 「Rank Images 图像评级」and「Rank Ideas 用户需求评级」两部分。「Rank Images」是让用户在两张图像之间选择更喜欢的图像,从而帮助官方优化模型表现。每天参与评级表现排名前 2000 名的用户将获得 1 fast hour 的奖励。
「Rank Ideas」包含用户反馈、用户需求评级和需求排行榜 3 个部分。“用户需求评级” 中,官方会提供 5 个需求让用户进行投票,从而评出呼声最高的需求,这可以指导官方随后的工作;“需求排行榜” 则展示了目前排名最高的用户需求,比如生成同一角色的多个角度、改善手和手指的生成效果等,排名越高,该功能就越有可能被官方实现,因此大家可以积极参与投票。
另外官网的图像生成功能也与 Discord 也有细微差别,即 --chaos 参数是通过 Variety 滑块来控制的,其他参数默认值都与 Discord 中一样。需要生成图像时直接在顶部文本框内输入提示词即可,生成参数可以通过滑块来设置,也可以手动输入,比如 --s 250、--c 10、--ar 3:4 等。想深入了解 stylization、weirdness 和 variety 三项参数区别的话,可以看我之前写的这篇文章。
二、Personalization 个性化参数
熟悉 AI 绘画的小伙伴应该都对 Lora 模型有所了解,它以与大模型配合使用,来生成更具风格化的图像。Midjourney 新推出的 Personalization 个性化功能就可以视为一种 lora,它能对原本的 V6 模型进行微调,来生成风格更独特的图像。具体使用方法如下:
① 用户首先要在「Rank Images」版块内,完成至少 200 组图像评级。在这个过程中,系统会记录下你的风格偏好,并以此为基础对原本的模型进行风格微调,你选择图像的过程就等于是在训练 lora 模型。这一步必须先完成,否则无法调用 Personalization 功能。
② 上一步完成后,在提示词后加上 --p 参数发送出去后,生成的图像就会显示出你的专属风格,与默认模型会有明显不同。系统还会返回一个对应的个性化代码,比如我的就是 --personalize jsg4hzo,风格比默认模型更明亮柔和。每个用户的个性化代码都不一样, 并且支持分享,使用他人的代码就相当于用他的专属风在生成图像,欢迎大家在评论区分享自己的代码~
③ 个性化风格的强度也可以通过 --s 参数来调节,数值范围 0-1000,默认值 100,数值越高风格越明显。
三、Random Style References 随机风格参考
之前为大家推荐过一期 Midjourney 风格代码,将它们添加在提示词后就能生成某种特定的风格图像。不过有一部分小伙伴还不知道风格代码的由来,所以在这里也补充一下。
风格代码是通过 --sref random (随机风格)这个参数来获取的,是 4 月份推出的一个小更新。将 --serf random 加在提示词后面,发送后 midjourney 将以一种随机的风格生成四宫格,并附上对应的风格代码。每次返回的代码都会不同,将代码用到其他提示词中,就能生成相同风格的新图像。
比如发送 "California Poppies --ar 3:4 --sref random",第一次返回的风格代码是 --sref 170339948,再次发送返回的代码是 --sref 2709899611。如果你喜欢第二种风格,就可以将其用到其他提示词后面,比如 “a cute cat --ar 3:4 --sref 2709899611”,就能得到相似的风格。
风格代码的数值范围在 0–4294967295 之间,也就是说有几十亿种风格可以使用。目前很多人都在积极探索并分享不同代码代表的风格效果,比如之前为大家推荐过的 Aiiqportal 和 Freeflo 里都有专门的收录。使用风格代码的优势是可以不用再写复杂的风格关键词,而且风格一致性非常稳定。
四、Style Reference Versions 风格参考版本
Style Reference 功能大家应该很熟悉了,它可以让我们复制一张图像的风格来生成新的图像,具体用法可以看我之前写更新介绍。我们都知道可以通过 --sw 参数来控制风格复制的强度,那你知不知道还可以通过 --sv 参数来选择不同的风格复制模式呢?
目前官方提供了 4 种不同的风格参考版本(Style Reference Versions),它们分别是:
--sv 1:独创风格参考算法,非常“有活力”;
--sv 2:风格参考的二次迭代;
--sv 3:是 --sv 1 的升级版本,整体更有活力;
--sv 4:是 --sv 2 的升级版本,也是目前的默认版本。
每个版本在复制图像风格时的侧重点不同,目前公认的是 --sv 4(默认版本) 效果最好,如果你对 --sv 4 的效果不满意,就可以考虑使用其他三种版本。
五、其余更新
在过去的 3 个月中,Midjourney 还陆陆续续发布了一些小的更新。比如新增了 rooms 版块,它的作用是可以让用户邀请多人在一起进行图像生成,房间里支持文字/语音聊天,用户可以随时对图像发表意见或进行点赞,非常适合团队进行讨论交流或头脑风暴。生成图像超过 100 张的用户都可以体验。
还有官方对 Niji 6 模型进行一些优化调整,包括提升图像细节、修复图像伪影,以及可以生成包含简短日语假名文本的图像,某些情况下还可以呈现简单汉字的文本。
那么以上就是对 Midjourney 近期更新的介绍。Midjourney 所有更新官方都会在 discord 社区中的 announcement 版块以及官网左下角的 update(铃铛小图标中)中公布,大家可以时常关注这两个版块的动态。
文章转自:无为设计研究所