AI虚拟人｜AI原生与未来社交

文摘科技 2024-03-12 08:04 上海

太长不看版

2024将是AI虚拟人步入商用的一年
AI陪聊产品提高“真实感”的思路：回避记忆、提高成瘾
多模态爆发带将来“真实感”的质变：视觉走肾、听觉走心
新的商业模式：AI模仿人(AI网红-虚拟主播-直播带货)、观察&攻略AI、人与AI共创
AI分离了人与内容生产：于是人成为了孤岛，剩下的连接只有“内容-消费”
内容平台：AI生成内容大量挤占人脑带宽
陌生人社交平台：虚拟人与真实用户无缝切换
熟人社交平台：来自AI社交代理的逐渐侵蚀
“互动”与“内容”都将变得廉价，而“真实”则成为一种稀缺资源

[作者] Yi, Lian

引子‍‍‍‍‍‍‍‍‍‍

如《AGI万字长文(上) | 2023回顾与反思》所讲，2023年唯一一个进入C端APP排行榜前列的“AI原生应用”便是“AI陪聊”。之所以是这个赛道先跑出来，是因为它用起来了LLM大模型最早成熟的能力：“想象力”和“取悦能力”，同时通过各种方法避免暴露现阶段还差强人意的“逻辑能力”和“记忆问题”。

“AI陪聊”最让我最惊艳的地方，是最开始聊时的“迅速上头”能力。但受到大模型本身能力的限制，目前这类产品还有不少问题：1)记忆混乱; 2)AI无法主动推动剧情，全靠用户脑补；这导致了：3)用户上头期短，疲劳度高，长期留存低。

但上面的问题并不影响陪聊类产品的潜力：产品粘性不是完全建立在技术优越性上，而是通过陪聊建立人和AI之间的感情连接。

在AI陪聊/陪伴赛道里除了知名的Character.ai、Replika、星野、豆包、筑梦岛等，还有应用商店一搜一堆的擦边AI女友。这里面，不仅有大量创业公司，也有各个大厂。

数据来源：Sensor Tower

仔细看来，当前这类产品其实满足了人的几个不同诉求。和今天的社交产品一样，这些不同诉求在未来大概率会催生出专业化的不同产品。

<1>AI陪聊满足了用户的哪些诉求？

[诉求1] 荷尔蒙

最原始的冲动，最刚性的需求。

Reddit的调查显示，Romatic Roleplay是Character AI 用户最常见的使用场景；星野、筑梦岛等角色扮演类产品里，AI设定也多为恋爱向。Replika更是直接以“荷尔蒙”为主要卖点。

这里正好是AI的擅长：取悦能力，而不太依赖记忆和逻辑。而且，随着Sora的出现和AI视频音频能力的大爆发，这类产品的能力即将迎来新一轮质的飞跃。

星野的恋爱向角色（图左）和荷尔蒙代表产品Replika（图右）

多模态大爆发：“真实感”的质变、“成瘾性”的质变

抖音的成功已经证明了：对于泛社交/娱乐向产品，音频、视频的加入会带来质的飞跃。这个飞跃的核心便是“真实感”和“成瘾性”。

视觉走肾：视觉直接作用于多巴胺通路，刺激动物本能

尽管以Sora为代表的视频技术仍存在图像不稳定、速度慢、成本高等问题；但假如参考图像技术成熟的速度，2024年将会是AI视频技术逐渐成熟并可以商用的一年：人脸表情的细致刻画、人物微动作（拥抱、牵手、亲吻等）、聊天过程互发自拍、根据故事情节生成回忆片段等……举个例子是星野的“星念”（根据虚拟人形象生成的卡牌），即使目前“星念”和剧情并没有很搭，但仍吸引了大批热衷抽卡的用户。可以想象当真正做到了“和剧情匹配的图片/视频”的时候，它吸引力会有多大。

图：星野的“星念”

声音走心：声音可以直接深入“感性的人”的灵魂，产生依赖感和亲切感。

在音频领域，配音员水平的AI已经成熟，已有不少产品加入了语音功能，星野还提供“对话闲聊”、“情话”、“哄你睡觉”等不同类型的语音聊天。目前，AI语音的主要问题是缺乏感情，但这里的技术突破应该也只是时间问题：当有了多模态理解能力之后，带有感情的对话能力自然会有突破。届时角色可以根据对话内容，调整语气和声音质感：人与AI之间的情感浓度会得到质的提升。这对于AI陪伴类产品，声音“走心”能力所带来的粘性，甚至会高于视觉的荷尔蒙冲动。

此外，一旦生成了好的图片/视频内容，就可以大量在社交媒体传播裂变，这也是产品扩圈的便利手段。

星野的语音聊天模式

[诉求2] 角色扮演&同人

慵懒的快乐=大众消费，创造的快乐=同人作品。

类似RPG游戏、互动小说，这类产品的核心在于故事内容和人物形象。目前，AI还写不出高质量、长篇幅、连贯的内容，所以目前产品的主要做法是从人设数量上弥补：总有一个“平行宇宙”适合你。

“同人”的诉求和上面“荷尔蒙”的诉求看似相近，但如果说“荷尔蒙“的乐趣在于消费内容，那“同人”的乐趣更在于创造。这时的AI虚拟人就不仅仅是“商品”，而是成为了“作品”。在这个视角下，如何创造“被欣赏的作品”就成了产品设计的核心。

于是，除了提供好用的创作工具外，提高角色“差异化”和“IP属性”或许是另一个值得探索的思路。那么，作为平台应该做的是：1）在众多UGC“作品”中筛选出好的作品，2）提供“造星能力”来炒热IP。这一方面可以带动产品出圈，一方面也能更多吸引优秀的创作者。而且，这些IP也可以成为进一步变现的资源。

筑梦岛的虚拟角色

[诉求3] 陪伴&心理支持

人的分享欲伴随着对回应的期待。

举个例子，笑话通常会讲给笑点一致的人听，八卦会优先告诉认识故事主角的人......不过，目前AI的记忆力还无法满足这样的期待，因此最先跑出来的是心理咨询这个特殊应用场景：心理咨询的特点是用户有大量输入，因此对模型的记忆力和逻辑依赖相对小。

长期来看，我还是会看好“朋友式”的陪伴AI（尤其是对于i人）。这类产品的核心竞争力是对“我”的理解，让模型从“陌生”进化到“熟悉”。让熟悉发生的是有关用户习惯的数据，于是当前角色扮演型产品是有潜力通过聊天数据的积累逐渐理解用户，升级为留存更长的“AI朋友”模式；以及，未来的数据采集并不局限于聊天，而是可以和随身硬件结合起来（如AI Pin）。最终，我们可以期待这些数据会真正让“人的模型”诞生出来。

图：Pi，心理疗愈式陪伴

<2>有哪些AI原生商业模式？

[1] AI模仿人：AI网红-虚拟主播-直播带货

AI现在还做不到“全面像人”，但AI网红是AI向人靠近的第一步。网红的特点是不需要完整的塑造一个人，更不需要复杂感情和记忆，这对于AI来相对友好；因此这个方向也大概是最早出圈的产品形态。

其实，在大模型出现之前，已经有用CG技术、AI换脸、Avatar+动捕等方式制作的虚拟网红/偶像，如国内的虚拟美妆博主柳夜熙、巴西知名虚拟偶像Lu Do Magalu等，日本的Vtuber产业更是发达。

大模型的图片、视频生成能力一是使得制作成本大幅下降，二是让照片质感更像真人。Emily Pellegrini、Aitana Lopez、Caryn Marjorie的AI分身等都是去年以来爆火出圈的AI网红。但目前这些“AI网红”吸金的点是“猎奇”，而不是Ta们比真人网红更好。以及，当前制作成本仍然只能支持大流量头部网红，因此，距离大规模推开还需要一些时间，但曙光已经在了。

AI网红Emily Pellegrini（左）和Aitana Lopez（右）

网络上已有不少“零成本变现”的AI网红生成教程，而事实上技术层面还存在一些问题需要解决：

- 生图效率。目前直接文生图的生成效率还不高，尤其是可以以假乱真的真实图片出图率有限，所以目前AI网红主要方式还是垫图换脸+PS；这里版权就会成为一个问题。

- 脸盲。AI生图的一致性问题限制了人物表情、神态、场景的多样性，容易看腻是AI网红的普遍问题。

- 动图/视频。虽然Sora的demo已经很惊艳了，但实际上使用的控制能力还离成熟有一定距离。我们大概可以期待一下2024年末。

除了技术上的问题，创造AI网红本质上还是“造星”。网红不缺颜值，缺的是“有趣的灵魂”。AI网红的加入，实际上是进一步加剧一般网红的泛滥，挤压中腰部网红的生存空间，但对于“有才”的头部网红的威胁不大。

类似的，作为网红的自然延伸：直播和带货带货场景也都可以比较容易通过AI满足，未来也会出现专门在直播领域、带货领域的AI网红和公司。

最后，如果想做“头部AI网红“，就需要搭配内容和讲故事的能力。未来自然会有“有趣的人类灵魂”和“美丽的AI皮囊”的搭配：也就是说颜值不够好，但有才的人类来生产内容，而视觉部分依赖AI网红。

[2] 观察 & 攻略AI

大模型是个“黑盒”：我们大概知道输出概率，但无法确切知道它到底会做出怎样的回应。这是典型的“老虎机”机制。“羊了个羊”的上瘾，也是同一个机制。

“欺骗AI NPC”游戏《Suck up！》是一个较成功的尝试。玩家扮演吸血鬼，通过换装、对话的方式说服AI NPC让自己进门，最终成功吸血足够多的居民来获得游戏胜利。游戏2023年12月上线，上线两周在全网播放突破千万。

《Suck up！》的热度也有一部分来自发疯和整活：社交传播。因为不需要考虑模型的感受，对AI可以肆无忌惮地输出。类似的还有《哄哄模拟器》、星野春节活动的《阴阳怪气怼亲戚》、左手医生的AI病人。把AI整“疯”也算是另一种“攻略”。

《Suck up！》

《阴阳怪气怼亲戚》（左）和左手医生AI病人（下右）

[3] 人与AI共创

另一个看好的领域是人与AI共创。从某种意义上来讲，“文生图”本身就是一个共创过程；类似的过程在未来也可以出现在小说和AI虚拟人场景。这个领域暂时还没有现象级产品，目前主要限制是模型能力；不过相信随着模型记忆能力和逻辑能力的发展，AI将可以作为想象力引擎，与用户共同完成文学、艺术、影视、游戏等各种作品的创作。

共创对AI的要求会更高一些：除了可以理解人设和故事，也需要引导用户创作，这也会是产品设计中的主要考量。

<3> AI新社交？

我在2022年10月的文章《AI|壳中世界》里就提到“人与人的连接正在被手机和账号全面代理”。在AGI即将到来的时代，这个概念又更进了一步。AI让人与内容产生了分离：于是人成为了孤岛，剩下的连接只有内容-消费。在这个过程中，我们普通人并不会感受到人任何的不自然：我们并无法区分和自己聊天的是AI还是真人，我们也无法区分正在和我直播连线的小姐姐是AI生成还是真人演出。唯一的区别，可能就是原来的那个漂亮小姐姐已经失业，而我的打赏100%都进了公司腰包。

在虚拟的世界里，人≈内容，人就是内容的有序集合。比如在熟人场景，我们需要更多更精确、私密的内容，而陌生人社交场景的内容量则相对少。于是，AI的影响也会按“内容平台->陌生人社交平台->熟人社交平台”的顺序逐渐释放。

[1] 内容平台：AI生成的内容成为大多数

内容平台=抖音、快手、小红书、B站、头条等

只要质量有了突破，AI生成内容的成本将远低于人的创造成本。在未来，AI将成为平台大多数的内容来源，而平台本身也将从“连接者”进化为“内容生产者”。与此相匹配的，平台的核心技术将从原来的“算法匹配”变成“内容生成”。

但在这个过程中，平台也将面临众多挑战：如何平衡AI内容与人工原生内容？是否要继续维护创作者生态，还是只需要扶持几个头部？在“内容”变得极端廉价的时候，护城河一方面是用户数据——对于用户的理解，另一方面可能恰恰是这些少量但高质量的人工原生内容。

[2] 陌生人社交平台：虚拟人与真实用户的无缝切换

“所有的陌生人社交平台都是dating app”，真人用户依然是平台的核心资产。

AI可以是一个快速吸引用户的工具。AI可以很好地覆盖“破冰”和“线上荷尔蒙”的部分，甚至说，很多人类用户会使用“AI托管”来替自己聊天。于是，如何动态调节“AI”和“真人”的比例，以及做到“AI与真人无缝切换”会成为这类平台的核心能力。

当然，现在的dating平台也一定有一部分会做“极端化”的进化。一条路是变成“纯AI(xx)陪聊”，另一条路则可以宣传是“纯人类dating平台”

[3] 熟人社交平台：AI代理的缓慢侵蚀

熟人社交平台本质上是为已经存在的熟人关系提供一种沟通工具，只要熟人关系是仍然存在，平台就无法被替代。不过，随着AI代理、AI秘书的兴起，熟人社交平台上的社交也很可能是由AI代理所完成的。

此外，AI虽然无法代替人的现实接触，但人的注意力总和是不变的，当AI吸引了更多的关注，熟人关系仍会不可避免地越来越远。逐渐地，我们会发现世界上所有人创造的数据量将小于“AI生成内容”。

就像《AGI万字长文(下)|2024，洪流与分叉》提到的，“互动”与“内容”都将变得廉价，而“真实”会成为一种稀缺资源。

<后记>AGI世界中的个体生活

[1] 信息权的丧失

搜索引擎的出现，让我们的学习方式逐渐从“记忆知识”转变为“查找和判断信息”。而推荐时代，信息被精心挑选后呈现在我们眼前，我们逐渐被剥夺了提出问题的能力/权力。

大模型带来的是“生成的时代”，内容以一种更“润物细无声”的方式生成并投放给我们，我们甚至丧失了接触真实信息的权力。信息茧房越来越牢固，我们也越来越容易被控制。

[2] 控制集中化

在“人-人”的连接模式下，连接是极度分散的。而“手机-手机”之间的连接则是通过中心化的平台来进行的，通过平台，不论资本还是公共权力都可以更加方便地施加影响。

AI让控制变得更加方便。我们的每一段消息、每一次点击、每一个定位…所有的数据都被详细记录，经AI分析后变成可视化数据，交由“中心平台”做出安排。我们只能被动上交数据、被动接受内容、被动成为平台想要我们成为的人。

[3] “快感”的“阈值”

AI内容不仅挤占带宽，也会剥夺我们对于真实世界的“快感”。AI的“定制化”快乐持续刺激着多巴胺的分泌，“即时反馈”不断巩固着大脑的行为模式，最终，在AI的训练下，“壳”变成了我们唯一的归宿。

AI作为效率工具和陪伴对象的前景毋庸置疑，但“集中式AI”并不是必须。对于普通个体而言，我们有理由去争取在享受AI便利的同时，也拥有更多的数据掌控权和生活自主权，而不是被打包成为资本的“商业价值”和“权力工具”。

前文链接

http://mp.weixin.qq.com/s?__biz=MzkyMTY1MTM4Mw==&mid=2247483955&idx=1&sn=94d1ceb6cb829267dbe195d4aa0ba340

普通人的AI自由

AGI降临的世界中，我们每个人的自由向导。