5分钟搞定!手把手教你将ChatGPT 免费接入到小米音箱,无需代码,小白轻松实现 AI 实时对话!

科技   2024-11-24 10:16   四川  

你还在花 2000 元买 AI 音箱?太亏了!

这篇教程手把手教你如何在 5 分钟内,将家里的小米音箱接入 ChatGPT,免费搞定连续实时语音聊天,无需任何代码基础!

AI 时代已经来临,AI 语音助手能做什么?

  • 陪伴聊天:随时随地进行轻松对话

  • 英语学习:帮助练习口语,提升发音 知识问答:

  • 解答各类问题,扩展认知

  • 亲子互动:为孩子提供有趣的交流体验

全球最好的实时语音 AI,包括 ChatGPT 的高级语音、OpenAI 的 Realtime Voice、微软的 Azure TTS 等,都支持实时语音和连续对话

实时语音 连续对话= 互动无缝对接

很多朋友希望家里能有一个集成了 AI 语音的音箱,随时进行对话,还要防止小孩玩手机用眼过度

目前市面上确实有一些方案(如 mi-gpt)可以实现小米音箱与 AI 对话,但往往存在这些问题:

  • 配置步骤繁琐复杂 

  • 需要长期开着电脑 

  • 成功率较低,容易出错

兄弟们,今天,我将教你一个简单的免费方案,5 分钟搞定实时语音聊天,你可以通过简单的步骤将 ChatGPT 接入小米音箱,轻松实现连续语音对话

而本教程提供的方案优势在于:

  • 5 分钟即可完成配置 

  • 手机就能搞定,无需电脑 零代码,人人都能上手 

  • 除小米音箱需要自备外,目前可免费使用

没有任何的计算机或代码基础的小伙伴,看完这篇教程,就可以独立完成整个接入流程。

熟练操作后仅需 5 分钟,但前期步骤较多,建议先关注和收藏,以防丢失。

大家好,我是清风徐来,本公众号分享了很多AI教育、AI语音的方法、工具,建议您关注、收藏,点一个“在看”,以免失联。国际惯例,先赞后看

准备工作

首先,你需要一台支持连续对话的小米音箱,用户以通过音箱输入口语指令。以下是支持该功能的小米音箱型号:

我使用的是一个 50 元左右的小米随身蓝牙音箱,同样可以实现这个功能。

我昨天在微信“小米Lite”商城购买记录如下,这个音箱蓝牙距离是10米:

有了这个 音箱,有ChatGPT plus会员 就可以利用它来与 ChatGPT 对话了,如下

你会说,这不是搞笑吗?

我有 ChatGPT 官方付费 Plus 我还折腾啥?

别急,我只是提醒有Plus的同学可以这样用,给大家多一种选择,☺

下面演示是今天的主菜:手机连接chatgpt后放在一边,用户拿着蓝牙音箱在10米范围内任意使用。

我们利用一个叫 TEN-Agent 的开源软件,将语音 AI 接入小米音响

TEN-Agent 官网如下:

https://github.com/TEN-framework/TEN-Agent

TEN Agent 的口号是:“The World's First Multimodal AI Agent with the OpenAI Realtime API ”。

它兼容了 OpenAI 10 月发布的 Realtime API 和 RTC 技术

虽然与自家尚未开放 API 的 ChatGPT 高级语音模式相比略有差距,但 OpenAI 的 Realtime API 提供超低延迟,而 RTC 技术则实现了 AI 噪声抑制,TEN Agent 将这两者优势结合在一起。

我们不需要部署这个开源软件 TEN Agent,而是利用官方提供的 Demo 网站来使用

这个网站是国内直联的!非常难得,使用不需要注册

建议使用谷歌 chrome 浏览器

先使用电脑,登录 https://agent.theten.ai

点击左下角“阅读原文”直达

浏览器会提示你是否允许这个网站使用摄像头和麦克风

摄像头可以不开,但麦克风要打开

有如下提示,点允许

如果没这个提示,也可以按如下方法打开麦克风

网站界面如下:

配置演示视频如下,我们点击“connect”随便和它聊聊。

这几个模型中,第三个就是 OpenAI 10 月 2 日在他们的第二次 DevDay(开发者日)发布的实时 API(Realtime API)

TEN Agent 还给它加了联网功能

下一步我们要设置电脑蓝牙和小米音箱连接

点击蓝牙的查找,找到小米音箱后点连接

现在我们就可以利用笔记本,通过小米音箱与 chatgpt 对话了

你可以开着笔记本做其他事情,语音调用chatgpt,或者音箱给一边的家人使用,互不影响。AI会把对话记录实时翻译成文字到屏幕上。

实测下来,GPT+微软 TTS 比较稳定,但 GPT Realtime 语音质量较高

看到这里,你肯定会骂人了

“还要开电脑?这和文章开头提到的 migpt 有啥区别”

我们扩展下思路,你可以在手机上开 TEN Agent 网站啊

我已经给你测试过了

打开手机,使用 chrome 浏览器

切记!chrome 浏览器要升级到最新版

登录登录 https://agent.theten.ai

浏览器还是会询问你是否允许这个网站使用麦克风

你要在手机的浏览器,点“允许”

不需要登录。进入后界面如下:

设置和电脑一样

当手机蓝牙连上小爱音箱,网站启动正常,你就可以和小爱对话了

手机谷歌浏览器详细设置方式:

打开谷歌浏览器,进入你需要启用麦克风的网站。点击地址栏右侧的三个点,打开“设置”菜单,然后向下滑动,找到“网站设置”或“权限”选项。在“网站设置”中,找到“麦克风”选项,确保麦克风权限是开启的。设置完成后,回到网站,如果看到弹出请求麦克风权限的提示,记得点击“允许”。

如果不行,按如下方式处理

这样就可以了,效果如下:

你可能会奇怪,手机可以对话就 OK 了啊,为啥还要接个音箱?

首先,小爱音箱支持 10 米内的蓝牙,而且声音比手机大一些;另外,一个小巧的音箱给小孩用,既不伤眼睛也减少误操作

我在各种环境下实测,最稳定的还是微软的 Azure TTS ,OpenAI 的 Realtime Voice 偶有不稳定的情况

这个时候,点击disconnect,再连一次基本可以解决

以上就是今天的分享,让我来总结一下这个有趣的方案:

TEN Agent 实际是给开发者二次开发的开源模型,个人或公司开发团队可以基于它来开发很多 APP 应用。(当然,这个是免费软件,你会技术也可以利用 TEN Agent 自行部署到本地使用)

我今天是“借力打力”,利用它官方的免费测试网站,用一个取巧的方法给大家构建了快速调用 chatgpt 等语音的方法

只要买个 50 块钱的小米音箱,就能实现和昂贵 AI 音箱一样的功能,是不是很划算?

不过这是一个过渡方案,随着 AI 技术的发展,我们可以期待:

  • 国产 AI(如豆包耳机)推出更成熟的软件+硬件结合的实时对话功能 

  • 基于 TEN Agent 的更多便捷应用 

  • 小米音箱内置 AI 助手的进一步升级

希望今天的方案可以帮助到大家

如果您觉得有用,麻烦给我点赞加关注、收藏,点一个“在看”,以免失联。

有问题可以后台留言或加入VIP群咨询!

下期继续为大家带来更多 AI 实用干货!

清华 AI 团队用 ChatGPT 开医院,即将上线
人傻钱多?字节跳动发布豆包AI耳机
一夜之间,人工智能进中小学课表了!
学霸养成神器!AI 真的要改变教育了
AI时代,“鸡娃”还有必要吗?GPT-4o 轻松拿下丘成桐少年班 2024 年选拔试题
虎妈变慈母,这个顶流AI做家教也太哇塞了吧?关键还免费!
手把手教你用免费软件做AI版行尸走肉
做图神器 Napkin AI 案例及答疑视频号带货搞钱!
《ChatGPT常识手册》 2024年10月版
突发!AI 泰斗Hinton 获得 2024 年诺贝尔物理学奖
ChatGPT Canvas横空出世!AI 写作+编码满级神器,颠覆传统人机交互
保姆级教程!支付宝+WildCard 海外虚拟万事达卡,轻松开通ChatGPT Plus
 Kimi+ WPS,5 分钟做行研 PPT


AI变现研习社
AI在手中,成功在脚下
 最新文章