你还在花 2000 元买 AI 音箱?太亏了!
这篇教程手把手教你如何在 5 分钟内,将家里的小米音箱接入 ChatGPT,免费搞定连续实时语音聊天,无需任何代码基础!
AI 时代已经来临,AI 语音助手能做什么?
陪伴聊天:随时随地进行轻松对话
英语学习:帮助练习口语,提升发音 知识问答:
解答各类问题,扩展认知
亲子互动:为孩子提供有趣的交流体验
全球最好的实时语音 AI,包括 ChatGPT 的高级语音、OpenAI 的 Realtime Voice、微软的 Azure TTS 等,都支持实时语音和连续对话
实时语音 + 连续对话= 互动无缝对接
很多朋友希望家里能有一个集成了 AI 语音的音箱,随时进行对话,还要防止小孩玩手机用眼过度
目前市面上确实有一些方案(如 mi-gpt)可以实现小米音箱与 AI 对话,但往往存在这些问题:
配置步骤繁琐复杂
需要长期开着电脑
成功率较低,容易出错
兄弟们,今天,我将教你一个简单的免费方案,5 分钟搞定实时语音聊天,你可以通过简单的步骤将 ChatGPT 接入小米音箱,轻松实现连续语音对话
而本教程提供的方案优势在于:
5 分钟即可完成配置
手机就能搞定,无需电脑 零代码,人人都能上手
除小米音箱需要自备外,目前可免费使用
没有任何的计算机或代码基础的小伙伴,看完这篇教程,就可以独立完成整个接入流程。
熟练操作后仅需 5 分钟,但前期步骤较多,建议先关注和收藏,以防丢失。
大家好,我是清风徐来,本公众号分享了很多AI教育、AI语音的方法、工具,建议您关注、收藏,点一个“在看”,以免失联。国际惯例,先赞后看
准备工作
首先,你需要一台支持连续对话的小米音箱,用户可以通过音箱输入口语指令。以下是支持该功能的小米音箱型号:
我使用的是一个 50 元左右的小米随身蓝牙音箱,同样可以实现这个功能。
我昨天在微信“小米Lite”商城购买记录如下,这个音箱蓝牙距离是10米:
有了这个 音箱,有ChatGPT plus会员 就可以利用它来与 ChatGPT 对话了,如下
你会说,这不是搞笑吗?
我有 ChatGPT 官方付费 Plus 我还折腾啥?
别急,我只是提醒有Plus的同学可以这样用,给大家多一种选择,☺
下面演示是今天的主菜:手机连接chatgpt后放在一边,用户拿着蓝牙音箱在10米范围内任意使用。
我们利用一个叫 TEN-Agent 的开源软件,将语音 AI 接入小米音响
TEN-Agent 官网如下:
https://github.com/TEN-framework/TEN-Agent
TEN Agent 的口号是:“The World's First Multimodal AI Agent with the OpenAI Realtime API ”。
它兼容了 OpenAI 10 月发布的 Realtime API 和 RTC 技术。
虽然与自家尚未开放 API 的 ChatGPT 高级语音模式相比略有差距,但 OpenAI 的 Realtime API 提供超低延迟,而 RTC 技术则实现了 AI 噪声抑制,TEN Agent 将这两者优势结合在一起。
我们不需要部署这个开源软件 TEN Agent,而是利用官方提供的 Demo 网站来使用
这个网站是国内直联的!非常难得,使用不需要注册
建议使用谷歌 chrome 浏览器
先使用电脑,登录 https://agent.theten.ai
点击左下角“阅读原文”直达
浏览器会提示你是否允许这个网站使用摄像头和麦克风
摄像头可以不开,但麦克风要打开
有如下提示,点允许
如果没这个提示,也可以按如下方法打开麦克风
网站界面如下:
配置演示视频如下,我们点击“connect”随便和它聊聊。
TEN Agent 还给它加了联网功能
下一步我们要设置电脑蓝牙和小米音箱连接
点击蓝牙的查找,找到小米音箱后点连接
现在我们就可以利用笔记本,通过小米音箱与 chatgpt 对话了
你可以开着笔记本做其他事情,语音调用chatgpt,或者音箱给一边的家人使用,互不影响。AI会把对话记录实时翻译成文字到屏幕上。
实测下来,GPT+微软 TTS 比较稳定,但 GPT Realtime 语音质量较高
看到这里,你肯定会骂人了
“还要开电脑?这和文章开头提到的 migpt 有啥区别”
我们扩展下思路,你可以在手机上开 TEN Agent 网站啊
我已经给你测试过了
打开手机,使用 chrome 浏览器
切记!chrome 浏览器要升级到最新版
登录登录 https://agent.theten.ai
浏览器还是会询问你是否允许这个网站使用麦克风
你要在手机的浏览器,点“允许”
不需要登录。进入后界面如下:
设置和电脑一样
当手机蓝牙连上小爱音箱,网站启动正常,你就可以和小爱对话了
手机谷歌浏览器详细设置方式:
打开谷歌浏览器,进入你需要启用麦克风的网站。点击地址栏右侧的三个点,打开“设置”菜单,然后向下滑动,找到“网站设置”或“权限”选项。在“网站设置”中,找到“麦克风”选项,确保麦克风权限是开启的。设置完成后,回到网站,如果看到弹出请求麦克风权限的提示,记得点击“允许”。
如果不行,按如下方式处理
这样就可以了,效果如下:
你可能会奇怪,手机可以对话就 OK 了啊,为啥还要接个音箱?
首先,小爱音箱支持 10 米内的蓝牙,而且声音比手机大一些;另外,一个小巧的音箱给小孩用,既不伤眼睛也减少误操作
我在各种环境下实测,最稳定的还是微软的 Azure TTS ,OpenAI 的 Realtime Voice 偶有不稳定的情况
这个时候,点击disconnect,再连一次基本可以解决
以上就是今天的分享,让我来总结一下这个有趣的方案:
TEN Agent 实际是给开发者二次开发的开源模型,个人或公司开发团队可以基于它来开发很多 APP 应用。(当然,这个是免费软件,你会技术也可以利用 TEN Agent 自行部署到本地使用)
我今天是“借力打力”,利用它官方的免费测试网站,用一个取巧的方法给大家构建了快速调用 chatgpt 等语音的方法
只要买个 50 块钱的小米音箱,就能实现和昂贵 AI 音箱一样的功能,是不是很划算?
不过这是一个过渡方案,随着 AI 技术的发展,我们可以期待:
国产 AI(如豆包耳机)推出更成熟的软件+硬件结合的实时对话功能
基于 TEN Agent 的更多便捷应用
小米音箱内置 AI 助手的进一步升级
希望今天的方案可以帮助到大家
如果您觉得有用,麻烦给我点赞加关注、收藏,点一个“在看”,以免失联。
有问题可以后台留言或加入VIP群咨询!
下期继续为大家带来更多 AI 实用干货!