会说中文,讨好中国?预告4个月后,ChatGPT终于上线了语音功能

科技   2024-09-25 18:38   北京  

四个月前,美国人工智能研究公司OpenAI推出了新旗舰模型“GPT-4o”。当时,一个重大更新就是,AI能实现和人类语音对话了。现场演示的AI对话非常丝滑,就跟一个真人在跟你说话一样。

毫不夸张地说,那一夜几乎所有行业从业者们都震惊了。ChatGPT越来越像一个真人了——能说、能看、能听、能感受、甚至能思考。这不就是一个活生生的人类么?

但是,之前的好几个月,这个功能都没有对外开放。今天,终于更新上线了。

OpenAI24日宣布,所有付费订阅ChatGPT Plus和Team计划的用户,都将可以使用新的“高级语音模式”功能,不过该模式将在未来几天逐步推出。

我梳理了几个重要的信息点:

第一,OpenAI推出了五种不同风格的新声音:Arbor、Maple、Sol、Spruce 和 Vale,加上之前老版本的四种声音Breeze、Juniper、Cove和Ember,可选声音达到九种,撤走了被指山寨“寡姐”(女演员斯嘉丽·约翰逊)的声音Sky。

有些朋友可能不知道斯嘉丽·约翰逊,简单说就是一个非常好看又有才华的演员,是很多人心目中的女神。现在37岁,但是岁月从来不败美人,附上一张突:

之前版本里Sky的声音和这个美女的声音太像了,为了避免麻烦,所以这次这个声音被撤掉了。

第二,OpenAI介绍,先进的语音助手可以用超过50种语言说“对不起,我迟到了”,在视频演示中,用户可以要求语音助手总结想要表达的意思,AI助手按照要求用英语说了一遍,然后,在用户提示AI只会说普通话之后,AI助手又用标准的普通话说了一遍。

不仅会说中国普通话,而且还会说多种方言。这是讨好中国?讨好中国用户?但是,没啥用啊,大陆根本不能用,所以谁在用中国普通话来对话呢?答案一目了然……

第三,根据科学家Drew对GPT-4o语音系统的使用体验的描述,你可以让它扮演面试官,帮助你进行模拟面试;或者创建一个完全虚拟的场景,与它一起进行沉浸式的角色扮演。

其实,国内很多AI大模型都已经有了语音对话的功能,但是说实话,能够让AI实现角色扮演还是有困难的,而且在这方面也涉及一些法律方面的风险。

不光是我们有管理,AI的发展面临全球各个国家不同的管理限制。比如在欧盟,识别别人的情绪是犯法的,所以欧盟网友暂时不能使用这个语音功能。

第四,还有一个比较关键的槽点,“高级语音模式”有时长限制,并且这个限制也是变化的。目前是,当用户的使用时间剩余15分钟时,系统就会发出提醒。

所以,很多人说要搞一个24小时陪伴的AI男友女友,暂时还是别抱希望了。还有,这个功能将首先在美国市场上线。下周,将向OpenAI Edu 和Enterprise 计划的订阅者开放。

这么看来,这个功能惊艳程度远远没有预告的时候高。虽然不能说是期货,但是时间限制而且还有账号限制,这各种限制加起来和期货都没啥区别了。反观国内的AI们,通义千问、文心一言、豆包等等基本都早就上线了语音通话的功能了。

而且,有朋友说,ChatGPT这几个音色,不如豆包的好听。我没有验证,但我感觉可能国产大模型更懂国人音色上的需求吧。

ChatGPT这种挤牙膏式的更新,恍惚间给我一种苹果在功能上追赶国产机的感觉……长此以往,人们对OpenAI的耐心迟早会消耗殆尽。

数字进化岛
洞察科技产业,透视全球真相。
 最新文章