微信,终于说人话了

科技   2024-11-26 13:05   湖南  

你好,我是唐韧。


别意外,这个开头完全是为了配合今天这篇文章,因为你可以听到我的声音来朗读全篇内容。


方式很简单,你只需要点击文章标题下方蓝色字体后面那个耳机图标就可以开始播放。


如果你上过我的课或者看过我的直播,可以对比一下这个声音和我的原声是否一致。


如果这是你第一次听到我的声音,也别意外,因为这就是我的声音。


前几天我在公众号接入了腾讯元气的 AI 智能体,成功创造了唐韧的 AI 分身,它可以学习我的历史文章来回答一些读者的问题。


现在,我每天都能在后台收到各种各样的提问,AI 分身回答质量目前能打个 70 多分。


腾讯总共给我送了 1 亿 token,目前已经消耗了 263 万,所以你们还可以继续和我聊。


但是这个能力并非微信团队自己做的,不过今天介绍的这个 AI 声音克隆能力就是微信自家的产品了。


这个功能目前还处于灰度测试阶段,在官方订阅号助手 App 里可以选择开启。



让 AI 克隆我的声音非常简单,只需要按照操作提示录制一段朗读音频就可以。


朗读的文案可以选择默认的,系统也会从历史文章里进行截取,这一步主要是采集声音特征。


录制结束后,AI 就会复制音色,大概几秒钟就完成了。



克隆成功后,我就可以在后台选择让系统用我自己的声音朗读文章。


那么,实际效果怎么样呢?


就我自己的听后感受来看,能还原个 80 分左右,主要体现在音色上,但是一些咬字发音还是有不准确的情况。


这里的差异,估计跟采样太少有关系。


不知道你们听完后感受怎么样,听过我真人说话的觉得还原度高不高?


这里还有特别说一下,我在录制阶段其实尝试过不同的录制方法,包括语速、语调、情绪投入。


以下面这个语料为例。



在录制这个例句时,我开始是用比较平缓的方式朗读,结果 AI 克隆出来的声音就有一种比较强的机械感。


接着我换一种带起伏节奏的方式朗读,这次 AI 克隆出来的声音就明显生动很多。


然后我觉得语速有点慢,又在第二种朗读方式的基础上加快语速录制了一遍,也就是你们现在听到的这个声音。


就几次实验情况来看,最后录制的这个效果是比较符合我预期的。


这里也可以看出,AI 克隆声音并不是机械复制,就像产品提示里说的那样,语气和情感也会被复制。


这一点,就和传统的 TTS 模式有很大不同。


我看了下历史文章的朗读数据,其实平时听文章的人还是少数,不知道这个带我声音和语气的「听文」功能会不会提升这方面的表现。


从此,在 AI 的加持下,我的公众号具备了用我的方式自主回答问题以及自主朗读文章的能力,这是一个巨大的进步。


以前我也说过,我在这里写文章就是跟读者的一种交流,分享我的所见所闻和所思所想。


如果过去我们只能见字如面,那现在就可以做到听声识人。


接下来,就看微信什么时候推出 AI 数字人能力了,或许那时候我们就可以每天「见面」了。


使用 AI 克隆完我的声音后,我让几个朋友试听了一下,其中一个朋友的反馈我觉得亮了。


他说:「微信终于说人话了」。


推荐阅读:《干这个,年入千万?
················· 唐韧出品 ·················

▲ 点击上方卡片进入发消息回复“w”,可加我个人微信
关注唐韧,用产品思维洞察现象背后的逻辑

安可时刻

我们计划本周末举办一期线上模式的产品训练营,不方便参加线下训练营的产品经理抓住这次机会,只有这一次。


训练营交付内容和线下一致,同样包含一天的直播互动课程、一个月线上课、一对一辅导,以及简历优化、职业规划和求职内推。


要报名的,可以联系我:tangren0517


如果你想了解关于产品训练营的详细信息,可以让我的 AI 分身给你介绍,你只需要让它介绍一下产品训练营即可。



唐韧
关注我,用产品思维洞察现象背后的逻辑。前非著名程序员,现不知名产品人,只工作不上班的自由职业者。
 最新文章