大家好,我是木易,一个持续关注AI领域的互联网技术产品经理,国内Top2本科,美国Top10 CS研究生,MBA。我坚信AI是普通人变强的“外挂”,所以创建了“AI信息Gap”这个公众号,专注于分享AI全维度知识,包括但不限于AI科普,AI工具测评,AI效率提升,AI行业洞察。关注我,AI之路不迷路,2024我们一起变强。
1. 免费实时语音
ChatGPT的免费实时语音功能终于来了!
9月24日,OpenAI正式开始向ChatGPT Plus和Team付费用户推送实时语音功能(OpenAI官方命名为:Advanced Voice Mode)。一周后的10月1日,OpenAI在2024开发者大会(OpenAI DevDay 2024)官宣这一功能将会在未来向所有免费用户开放。现在,它来了。
实时语音功能(Advanced Voice Mode)是什么?实时语音功能也被称为高级语音模式,是标准语音模式的升级版本。相较于之前的标准语音,实时语音功能突出一个“实时(Real-time)”性,利用GPT-4o
模型的原生音频能力(多模态),提供更加自然、实时的类似于真人之间的对话体验,甚至可以识别非语言细节(例如你说话的速度)并带有情感地回应。
ChatGPT免费用户如何使用实时语音功能?首先你需要注册一个ChatGPT账号,已经拥有ChatGPT账号可以忽略。当前注册ChatGPT账号已经非常简单了,基本零门槛,一个邮箱就可以。具体方法参考我这篇文章:《『AI保姆级教程』无需手机号!三分钟注册ChatGPT账号!2024年最新教程!》。
其次,由于实时语音功能目前仅支持手机app端,所以你需要在iOS App Store或者谷歌Play Store下载安装最新版本的ChatGPT app,已经安装过了的可以检查一下,更新至最新版本。
最后,在手机上打开ChatGPT app,登录你的账号。进入首页后,点击页面底部聊天输入框右侧的语音
按钮,如果已经给你推送了实时语音功能,你将会看到下面这个英文提示页面。如果没有,耐心等待推送或者尝试切换网络解决问题,优先推荐美国IP。
点击Continue
,会进入到选择声音种类的界面,ChatGPT实时语音功能提供共计9种声音,按需选择即可。在语音聊天页面,实时语音和标准语音最明显的区别就是实时语音会显示下面这个蓝色的圆球,而标准语音则是黑色圆圈。
另一个明显的区别就是对于已经开通了实时语音功能的用户,不论免费还是付费用户,输入框右侧的语音
按钮都变成了下面的样式。
对于免费用户来说,实时语音功能是有着聊天时长的限制的。虽然OpenAI官方并没有公布具体的时长限制,据周围的小伙伴表示,大约是每天有10分钟的体验时长。达到时长限制后,想要继续以实时语音模式聊天,就需要开通ChatGPT Plus会员了。具体的开通方法可以看这里:《国内支付宝开通ChatGPT Plus和Claude Pro 2024最新教程!》。
2. 全新首页
ChatGPT换了新首页了!
现在的ChatGPT网页端首页是这样的。
而在这之前,ChatGPT首页UI是这样的(部分免费用户现在的首页样式也是这样的)。
在更古老的版本里,还有这样的ChatGPT首页。
对比下来,随着ChatGPT首页UI的进化,ChatGPT是不是越来越像是一个搜索引擎了?!其实这样的更新也能够理解,最新的首页UI设计更加简约、清新、直观,各个功能要素以及重要元素、提醒文字又都保留了下来,突出强调“What can I help with?”的大标题,基本做到了less is more
。更重要的是,用户最常用的文本输入框从之前的页面底部挪到了页面中间的位置,更符合用户文本输入的使用习惯,小伙伴们可以回忆一下,目前市面上大多数搜索引擎的输入框是不是都在页面中间或者中间偏上的位置。
3. Auto模型
这是另一个OpenAI没有大肆宣传,就悄然在ChatGPT上更新的功能。
简单聊一聊Auto
模型出现的背景。Auto
模型更新于OpenAI发布o1
模型后。而在o1
模型发布后,ChatGPT中一共有多少个模型可以选择?非常多。从最低级的GPT-4o mini
,到高级模型如GPT-4 Turbo
,GPT-4o
,再到最新的o1-mini
和o1-preview
,最后还需要加上个针对写作和编程推出的GPT-4o with canvas
模型。这样算下来,一个ChatGPT里就集成了6种模型供用户选择。每种模型都有其特点和特长,以及使用数量上的限制。这样就会导致一个问题:到底该用哪个模型?
Auto
模型的推出正是为了解决到底该用哪个模型
这个问题。如果你在模型选择的下拉菜单里手动选择了Auto
模型,那么当你和ChatGPT对话时,ChatGPT会根据任务的复杂程度智能选择合适的模型来处理该任务。当然,这个功能对于平时使用量不大的小伙伴可能比较鸡肋,因为高级模型可能用都用不完。
4. 联网搜索开关
细心的小伙伴可能在前面ChatGPT的新首页上,看到了输入框左侧有一个酷似地球的网络
标志,没错,这也是近期悄悄上线的一个新功能——联网搜索开关。
OpenAI官方将这个功能称之为Search the web
,顾名思义,就是用来联网搜索实时信息的工具。我在之前的多篇文章里提到过,模型本身并没有联网搜索的能力,比如我这个公众号集成的GPT-4o mini
模型,如果你问它日期、天气之类的实时信息,它百分百回答不出来,因为没有接入联网搜索的第三方工具。
OpenAI就是把原本内置在ChatGPT内部的联网搜索工具,以一个联网搜索开关
的形式开放在了前端页面上。当点击这个网络标志时,ChatGPT就会进入搜索模式,意味着接下来的问题,需要联网搜索实时信息然后回答。搜索模式下的ChatGPT就变成了一个大号的“AI搜索引擎”。
同时,针对搜索结果的展示,ChatGPT也做了相关的优化,这可能与之前爆料的SearchGPT
相关。搜索结果展示的更加人性化,另外信息源也更加一目了然,部分做了“预览”展示的处理。
其实“联网搜索开关”这样的功能本就不新鲜,比如国内AI领域的网红Kimi,在发布初期就有类似的功能。只不过,Kimi的联网搜索开关近期更新为了Kimi探索版
的开关。关于Kimi探索版
的更多介绍,可以看我这篇文章:《『深度分析』Kimi版o1来了!Kimi探索版全面解读!》。
5. 快捷指令(命令)
快捷指令功能严格意义上来说,并不是一个近期的新功能,其实早在一个月前就已经更新上线了,详情在我的这篇文章里:《ChatGPT有三个快捷指令和三个模式,你知道吗?》。
快捷指令,顾名思义,就是快速启用某个功能的方式。当前ChatGPT共有三个快捷指令,分别是:“/Picture”,“/Search”以及“/Reason”。
快捷指令的唤醒也很简单,在输入框里输入“/”这个字符就可以看到这三个快捷指令。并且三个快捷指令对应着ChatGPT的三种模式,分别是画图模式,搜索模式,以及推理模式。这其中画图模式下ChatGPT将自动调用DALL·E 3
模型,不需要再在提示词里添加特定的关键词,如“画xxx”;搜索模式则对应着上面提到的联网搜索,“/Search”快捷指令和“联网搜索开关”的功能几乎一模一样,就是接下来ChatGPT将进入联网搜索模式,配合实时信息来回答问题;推理模式则更好理解,就是接下来ChatGPT会自动调用o1-preview
模型来回答,即使你并没有在模型选择
里手动切换至o1-preview
模型。
最后,值得注意的是,快捷指令功能和上面提到的“联网搜索开关”目前应该只有ChatGPT付费会员才能看到,因为类似于画图、搜索、推理等这些功能在ChatGPT中都属于高级功能。
精选推荐
国内支付宝开通ChatGPT Plus和Claude Pro 2024最新教程! 『AI保姆级教程』无需手机号!三分钟注册ChatGPT账号!2024年最新教程! 『AI保姆级教程』手把手教你注册Claude账号!建议收藏!
都读到这里了,点个赞鼓励一下吧,小手一赞,年薪百万!😊👍👍👍。关注我,AI之路不迷路,原创技术文章第一时间推送🤖。