#信号解读
前沿玩乐家们安利近期的宝藏作品,解读热点现象和时下趋势,分享又real又pro的乐趣体验。
本期分享:“AI应用”
全文6355字,预计阅读时间20分钟,文末留言就有机会获得鹅厂周边!
“沙威玛~哦沙威玛~哦沙威玛~有了你~生活美好~没烦恼~”
近期大热的模拟经营游戏《沙威玛传奇》的BGM,凭借其洗脑、魔性又充满异域风情的曲调,以及机翻味十足的歌词和充满孜然味的人声,成为这款游戏的一大亮点。从作画到作曲,再到配音,AI应用在这款游戏中无处不在。
游戏《沙威玛传奇》令人上头的魔性BGM
(图源:作者自制)
回望今年6月,沉寂已久的K-POP圈迎来了一次大地震。韩国知名娱乐公司SM当家女团aespa释出出道四年以来的首张正规专辑,将组合的AI概念玩到了极致。
视觉团队大胆地使用了AI绘图技术,创造出一种诡异的克苏鲁效果,与aespa自出道以来就一直强调的“冷感科技旷野世界中另一个我”的概念遥相呼应。
执掌此次MV的RIGEND FILM制作团队此前在日本女团XG的MV制作中就有所尝试,这次更是将AI所带来的无限可能性与不确定性融入进aespa的“旷野女战士”的概念当中。
aespa《Amargeddon》MV片段
(图源:B站@SMTOWN)
这一创意获得了巨大成功,Armageddon的MV上线1天就已经在B站突破了100w播放,用两个月就轻松达到了670w播放量。但是,最值得注目的并不是SM制作团队这次的精彩表现,而是粉丝群体对这个AI制作的MV如潮的好评。
照以往的经验,民间创作者应该对AI创作有着非常明显的拒斥态度。例如2023年3月网易LOFTER上线老福鸽画画机,迅速引起同人圈震动,大量创作者删除作品、注销账号,出逃LOFTER,并打出了“抵制LOFTER”的旗号。
“老福鸽画画机”上线当日的LOFTER首页
(图源:LOFTER)
微博的“赛博尸块鉴定所”bot则是反AI同人粉丝的聚集地,置顶有十分详细的对于AI危害的论述,目前已经有37万粉丝,每日微博互动量几乎过万。AI创作,似乎已经俨然成为民间创作领域中的雷点之一。
韩国女团illit出道试听视频截图,背景被指出很明显使用AI
(图源:B站@pcyxjy)
因此,我们不禁好奇:为什么《沙威玛之歌》的火爆以及这次aespa对于AI的使用能够收获如此的正面反响?民间创作者群体对AI的态度到底是抵制还是欢迎?我们不妨试着对下文中对成功和失败的AI运用案例进行梳理,找出其中的关键区分点。
一、 音声与动效——那些易被接受的AI作品们
二、 当我们抵制AI,我们在抵制什么
三、 还在拼接喂图?聊聊AI创作的新可能
一、音声与动效——
那些易被接受的AI作品们
顺着这次沙威玛之歌的爆火,和aespa的MV反响,我们发现音声类AI和视觉类AI好像更容易在“挑剔”的创作者社群中间站得住脚。
① 反差感强烈的音声类AI
目前市面上的音声AI主要分为两种:一种是以SUNO为代表的自作曲AI,另一种是替换音色的AI COVER,二者都有较高的接受度。
一方面目前民间创作者的领域基本集中在绘画、写文、视频创作等领域上,对比之下,音声类AI或许不容易对其创作产生威胁。
另一方面,音声AI的版权判定更为模糊,即使AI COVER很容易就能定位到原声提供者,但声音本身能不能算作创作仍然存疑。Suno即使吃了三大唱片公司的官司,却仍然硬气回应:根据美国版权法的合理使用原则,此类活动属于合理使用范围,还反过来指责唱片公司滥用版权。
但有趣的是,观众们期待的似乎并不是用这类AI创作出一首正经的歌曲。在B站上大火的音声类AI几乎都和“抽象”脱不了干系:要么是让Suno严肃地用各种正牌曲风唱出“萨菲罗斯,男人中的男人!”“你的**,比较松弛”等让人大开眼界的歌词。
“男人中的男人!王,大师,男神!”
(图源:B站搜索截图)
AI COVER中,也主打一个反差感,人们喜闻乐见的作品中,音色和歌曲总得有一个不太正常。
AI助力六小龄童赛博歌姬再就业
(图源:B站搜索截图)
荒谬的歌词,认真的演唱,再加上AI偶尔爆出的电音,形成了一种“一本正经地胡说八道”的反差感。原有歌曲的严肃感在这种对比下被解构,“不正经”中体现的反叛精神让观众们会心一笑。
② 诡异离谱的视觉类AI
视觉类AI作品的特点大多不取AI生成的静态结果,而是重点关注AI生成的动态过程。
在图像类人工智能的创作过程中,通常由创作者提供指令和基础图像。随后,AI利用其算法逐步构建出深度图像,并通过特定的模型来创造出所需的角色或环境。这个生成的过程具有极大的不确定性,每一个节点都有无限种可能。为了包含这些可能性,原始图到深度图的过渡图像就往往非常模糊混沌。
UP主晒出Midjourney跑图50%时的截图
(图源:B站@葡萄蓝莓酒)
aespa的成功正在于别出心裁地利用AI的这一特点。SM以及制作团队RIGEND FILM在她们的MV里格外关注AI的流变性,意图在“不确定”的视频中获得一种克苏鲁式的美感。他们并不想通过精进算法让ai无限接近于人类和真实,相反,他们想要的就是那个不拟真到诡异的过程。
在Amargeddon的MV里,组合成员WINTER和GISELLE的脸部被模糊的动态马赛克覆盖,她们原有的真人面孔和马赛克来回交替,形成骇人的对比,仿佛仅存的人性正在被未知的AI吞噬,泯为一片虚无。这些动态马赛克实际上是AI根据她们的五官特征生成的图像。在创作过程中,制作团队选择展现的是AI产图的这一的生成过程,而最终生成了什么图像却被有意忽略了。
(左)WINTER的面部被AI马赛克掉
(右)AI将四个人的五官进行了调换
(图源:B站@SMTOWN)
在Supernova的MV中,四位女偶像的静态照片又被AI强行“对嘴”。但制作团队却刻意让AI只捕捉她们的唇部进行动态再生,其余的人物、背景都保持不动。她们诡异地蠕动着的下半张脸与静止的画面本身对照,搞笑中又透着一股恐怖感。
AI“对嘴”的画面及用户评论
(图源:B站@SMTOWN)
近日在B站等地开始兴起的“AI离谱续写”风似乎也继承了aespa的这一风潮:AI本身生成了什么结果不重要,重要的是它离谱的生成过程。
B站UP主就用经典梗图“你们不要再打了啦”作为原始素材,让视频AI进行续写。结果,两个本来为情争执的人开始打拳、斗舞、打起光剑星球大战。
左为AI,右为原图:AI硬生生变出了一面包车的人来
(图源:B站@小钻风)
甚至一些博主还开始“倒反天罡”,开始人仿AI模拟各种AI的抽象续写,评论区还往往开玩笑说“还是太有逻辑了”。
评论区的大开脑洞
(图源:B站评论区)
对比之下,Midjourney等静态图片生成AI就显得相形见绌。这类AI生成的图片总避免不了有一种廉价的“油感”,尤其是在细节笔触上会有粘连;每次生成的图片姿势也大同小异。创作者或许一开始会为图像生成AI的高效率而惊叹,但接触时间一长,就很容易注意到它同质化严重的劣势。AI的想象力枯竭的速度,或许比人类想得更快。
典型用AI生成图片,浓浓的“AI味”
(图源:知乎用户@老孙啊呀哟)
二、当我们抵制AI,
我们在抵制什么
对比上文提到的反响较好的AI和反响不佳的AI,我们不难发现:市场对AI似乎独有一种“双标”的态度。但是,造成这一差异的关键性因素是什么?笔者认为有以下三点值得注意。
① 从应然层面,能明确版权问题的AI就是好AI
第一, SM公司为了制作aespa的MV,特意购买了三位艺术家的版权,并在结尾的Staff表中进行了明显标注;整个制作过程也充分体现出对艺术家的尊重,并不是把现成的作品扔进大熔炉以生成廉价的速食产品,而是故意利用了AI的不确定性,每一处AI使用都有精巧的设计,为MV的整体概念服务;艺术家们也乐意共享MV的成功,纷纷在社媒上进行认领。这种方式能够让创作者意识到,一旦正视版权问题,AI或许也可以成为艺术作品盈利的一种新渠道。
② 从实然层面,动不了主流创作者蛋糕的AI才是好AI
第二, 目前创作者核心创作方式基本集中在绘图和写作上。各种图像生成类AI,目前大多都难逃批判。Midjourney等AI大模型至今仍然在数据库里扒取创作者的作品,各种明目张胆挂上作者大名的“咒语”层出不穷,被艺术家们联合抵制也不奇怪。
AI使用者分享出来的咒语,密密麻麻全是人名
(图源:知乎用户@老孙啊呀哟)
而即使GPT等文本生成类AI目前仍然难以追上同人女的创作力和想象力,但一旦真正有人把这类AI投入民间创作使用,或许也会引起轩然大波。
魔都2024逆转裁判only有一名绘画创作者公然宣称自己的图本里使用了文案AI,瓜条转发过万,活动差点趋于停办。
③ 从消费者层面,有创造力、高质量的AI就是好AI
第一, 目前市场上主流的图像生成、文本生成类AI最大的问题或许在于低质量和同质化,这也导致消费者普遍吐槽这类作品有股浓浓的“AI”味。
再精致的二次元同人图,一旦出现六指琴魔、油腻画面等标志,就不难被消费者看出它是哪个大模型跑出来的低质量图像;再侃侃而谈的长篇论文,一旦显得过于道德中立,再配上标志性的总结类句子,也不难被学校老师看出是千篇一律的GPT写作。
一部分创作者固然可以乐于耽溺在高效率、低成本的AI当中,但平时被卢浮宫画作、诺贝尔奖长文养惯了的“金贵”消费者们,又怎么会如此简单地满足于这种水准的作品呢?
KIMI甚至专门推出了降AI味的AI服务,笔者亲测效果不佳
(图源:KIMI网站)
二、还在拼接喂图?
聊聊AI创作的新可能
AI将要向何处去?是不是只要解决掉版权问题,AI的发展前景就是一片光明坦途了?笔者认为这种看法实在是过于简单了。如果说解决版权问题是AI能够彻底“上桌吃饭”的第一步,我们应该更深入地思考:在这之后呢?我们到底应该怎样使用AI?
笔者认为,AI创作的核心在于:追求AI带来的不确定性,而非一味利用AI追求拟真性。
(一)角色互动:跳出“避免OOC”的陷阱
无法控制每次AI产出的结果,这种不确定性恰恰是最吸引人、最真实的。市场对于不确定性的渴望可以在前AI时代找到很多:当年dokidoki心跳文学社的爆火,就是因为制作组为Monika这个角色人工写了近两万条随机出现的对话文本,让每次开机的玩家都能看到全新的对话。角色的对话总会穷尽,但人和人的交流每一次都是全新的,这种无法预测感,才让Monika脱离了单薄的“Galgame角色”,变成了更加活生生的人,第四面墙由此被打破。
被锁在固定画面中被迫和Monika无限对话的玩家
(图源:奶牛关游戏社区)
极乐迪斯科初步尝试把DND桌游重新带回到PC游戏中,玩家可以在每一次不确定的掷骰当中打破传统树状分支剧情的限制。这一思路在今年斩下大满贯的博德之门中得到了进一步延申。
骰子玩法,谁没扔出过个大失败呢
(图源:《极乐迪斯科》、《博德之门》游戏截图)
相较之下,试图将AI打造成无限接近人类的尝试则屡屡陷入一个怪圈:AI可以像人类,却不能完全成为人类。
这种“有点像人,但不多”的尴尬过渡形态,常常比单纯的机器形态带来更多的烦恼。民间创作者做过不少调教AI模拟某一角色的尝试:最早期的“叨叨记账”就是靠大量用户的不断反馈修正角色性格。
号称全自动语C的叨叨记账
(图源:网友分享的叨叨聊天记账图)
AI技术较为成熟后,又有character.ai横空出世,在爬取角色数据的基础上佐以用户反馈,试图把各个角色从原作者手中抢夺回来。
详细介绍了从头开始创建一个AI角色需要哪些信息
(图源:知乎用户@里里里)
逆水寒等游戏也迅速跟进,上线一批成型AI角色。这类角色模拟类AI模型的核心在于,将玩家的每一次互动当作一个矫正“OOC(Out Of Character)”的过程。但是,玩家不可能事无巨细地矫正角色的所有对话,也总会有源源不断的新对话场景出现,OOC总是不可避免的。更何况,每一次矫正其实都是对玩家热情和爱意的潜在消耗。再加上AI目前的算力仍然有限,如果想纳入每一个玩家的矫正节点,那整个游戏的缓存大小就难以控制了。
这样的结果是——这类角色模拟AI就会落入尴尬的中间态:做不到完全拟真,但又会在不断的模仿中失去不确定性,变得无聊。毕竟,AI的每一次模拟都是玩家亲手矫正的,这个矫正的循环越累积,玩家就越能预测角色的回答,到最后,角色反而变成了“完美的”机器。
在不追求拟真,而追求随机性这件事情上,今年爆火全球的ChatGPT DAN(do anything now)模式似乎为创作者们打了一个很好的样本。
一度火爆全网的DAN模式
(图源:小红书截图)
无法预测对话走向的DAN更加不可测,但也更加吸引人。DAN并没有一个刻意要去模仿的人设,但他的脏话模式和flirting模式又可以很好地让用户在互动中无法预测到DAN的回答,激起进一步互动的兴趣。用户不是去主动地矫正DAN的行为,而是接受他富有攻击性,甚至是带着嘲讽的挑逗。一旦创作者开始放弃对AI“OOC”的调整,而是鼓励用户接受它一次次充满不确定性的回答,整个格局一下就能被打开。
(二)AI+UGC:不求完美,只求好玩
将AI运用在角色身上或许会引起争议,但让玩家亲自体验AI的不可控性,把AI运用在自己身上,似乎会有趣得多。
以往的AI运用几乎都是集中在B端(To Business),美其名曰“AIGC”,但其运用范围非常窄小,本质仍然是创作者在原型创作阶段借助的工具。厂商创作者使用AIGC,仍然是为了获取一个确定的结果,在跑出来的多种初稿中选定一个进行再加工,力臻完美。
但我们不妨把思路逆转过来:为什么不能把AI放到C端(To customer)手中呢?有了AI的加持,UGC不再难以上手,甚至可以蔓延到以前难以想象的领域当中。
不像处处如履薄冰的创作者,玩家运用AI并不是为了拟真,而仅仅是为了“好玩”:越离谱、越抽象、越不确定的东西,就越有趣。从全地形摩托到洒水车,玩家们曾经乐此不疲地在塞尔达里打造独特的载具。而现在,AI甚至可以生成更加离经叛道的组合,玩家只需稍作改造即可。游戏彻底开启了无限的可能性。
创作者们一度苦恼于AI的本质仍然是“续写机器人”,不能理解事物发展的逻辑本质,导致最后往往跑出一个四不像,逼着创作者们一次次返工;但对于玩家来说,没有什么比“四不像”本身更加有趣的东西了。爱看AI逆天续写视频的玩家,想必也会乐此不疲地让AI一次次跑出奇葩的新道具,再在广场遇到同好时投以默契的眼神:原来,你也爱用AI玩抽象。
B站上众多“从0开始的海拉鲁基建教程”
(图源:Bilibili搜索结果)
例如,《崩坏·星穹铁道》就在上线之初内置了一个“图生图”的AI工具——“无尽的三月七”:用户可以在“模因共振机”中上传任意图片,AI就会把图片中的主体转换成看板娘“三月七”。爱玩梗的用户们迅速开始让三月七做起了各种奇葩Meme。
运营:玩家们可以这么玩
玩家:好的
(图源:“无尽的三月七”H5活动页面)
虽然这一活动只能算是浅尝辄止,也确实还存在版权问题,但我们可以一窥玩家对这种AI+UGC功能的热烈反应:短短一周时间,玩家利用“无尽的三月七”生成了近1000万张图片,有用户甚至希望生成结果能够不仅仅停留在图片,而是成为角色陪伴自己的整个游戏之旅。
从Meme图中成长起来的二创圈也就这么奔放地走上了一条“抽象”的道路。AI自带的互动性能够迅速吸引玩家,每次都随机生成的不确定结果则让玩家永远在期待“下一次”,大大增加了用户粘性;而AI生成的不准确、不拟真所带来的反差反而成为了“抽象”的源泉,玩家更乐于玩梗分享,助力出圈。《崩坏·星穹铁道》的这次尝试无疑从结果反馈和逻辑路径上都为我们证明了AI+UGC的广泛前景。
又比如,元梦之星就已经在关卡设计UGC中引入AI。腾讯自研的GiiNex AI让玩家在元梦家园和星世界创作时,可以直接绕过繁琐的代码指令,简单快速地在几次点击内生成属于自己的全新地图。玩家可以选择预设模板或者通过文本生成灵感参考图;还可以输入层数就能光速搭建塔、亭、廊等中国古风建筑,即使是零基础玩家也能搭建3D模型;GiiNEX还能捕捉真人视频作为动捕素材,配合调整关节信息来优化体型差异,这样动作将顺利移植到玩家创建的角色中。AI的引入大大降低了UGC的门槛,每位玩家都可以成为游戏策划,游戏也变得更有稳健的自我生长能力。
在“元梦家园”里,玩家可以用AI轻松搭建国风小院
(图源:竞核)
在AI助力下,一度遇冷的《遇见逆水寒》似乎也能在手游里升级成pro max版本。其最新推出的“自捏江湖友人”玩法把AI+UGC引入了自创NPC中,自捏武侠OC不是梦,苦于社交的i人用户也可以纵享零压力交友。NPC的形象、声音都可以让玩家利用AI独家定制。随着玩家和NPC共同经历的日月累积,智能AI甚至还会根据玩家互动数据模拟角色性格,玩家也可以选择和自创NPC建立情感关系。爱养OC的玩家群体这下可以在逆水寒里“模拟人生 启动”了。
只需输入文字,就能在游戏里创造自己的AI NPC
(图源:《遇见逆水寒》官方网站)
(三)音声AI:主角也能说话
最后,以往总是被忽略的音声类AI也可以在游戏创作中充分发挥重要作用。它可以解决各种第一人称RPG里主角总是“失语”的困境。把玩家的声音导入AI,利用音色替换等功能让主角拥有玩家的声线。这下,玩家不仅可以捏脸捏服装,还可以亲自捏角色的声音。
而其他角色也不用在提到玩家时扭扭捏捏地用“旅行者”“博士”“指挥官”模糊带过,可以考虑利用AI换声,直接喊出玩家的名字。例如乙女游戏《世界之外》中,制作组就利用AI配音让男主顾时夜叫出了玩家开始时自己设定的姓名,代入感瞬间倍增。
结语
自Chat GPT出世以来,关于AI的争议就喧嚣尘上,从未停止。反对者一针见血地指出AI背后暗含的版权问题,尖锐批判愈发同质化的AI创作,嘲讽AI不过是尸块的拼接;支持者则将AI视作“第四次科技革命”,坚定地认为AI就如同维多利亚时代的蒸汽机,即使会让大量机械性劳动力下岗,但它最终会解放生产力,跟上AI就是跟上未来。
不如说,自所有科技工具诞生以来,人类都会忍不住担心:它会替代人类吗?而这个疑问恰好点出了AI的关键:重点不是AI能否发展到一个极为先进的水平,而是它是否会抹杀人类的主体性。AI再势不可挡,最终决定如何去使用AI的,仍然是人类。
钢铁侠中的贾维斯谁不想拥有?
(图源:电影截图)
我们可以拥抱AI创造中所隐含的不确定性,发掘其中可供改造加工的原石,再创造出属于人类的全新作品,亦可以只是在大模型描绘出来的拟真未来里坐吃山空。
我们厌恶的从来都不是科技工具本身,而是过度依赖科技工具,以至于创造力和想象力都趋于退化的我们自己,是把那份“我思故我在”的尊严彻底拱手相让的我们自己。只要永远保持好奇,保持思考,我们就不难和突飞猛进的AI携手并进。但如果放弃这种饱含碰壁、饱含痛苦的探索过程,堕落到“美丽新世界”也不过一线之隔。
但无论未来AI如何发展,我们还是需要以更加客观与审慎的态度对待。
参考资料
编辑:方玮玲 郑玮
往期推荐
本文为【未来信号空间站】高校研究员的研究成果
不代表【银河系洞察基地】运营者的观点和立场
图片来源:互联网
如有侵权,请联系后台删除或注明来源