「会说话」的 AI ，扣子智能语音 OpenAPI 开启内测申请

科技 2024-11-17 09:40 重庆

给客服打电话总是遇到让人高血压的 AI ？

智能音箱对话时总是被错误识别？

AI 陪伴机器人总是感觉有点呆板？

语音交互体验

似乎成为了 AI 落地的一块绊脚石。

试试扣子智能语音 OpenAPI ，

将有望使这种情况成为过去式！

经过这近两年来的发展与验证，大语言模型（LLM）和智能体（Agent）已经逐渐成为行业共识，落地到了生活各处。

AI 虚拟陪伴、AI 口语陪练、AI NPC、AI 游戏陪玩等应用遍地开花，由此也激发了对更优质的 AI 语音交互的强烈需求。

现在，
扣子上线了全新的智能语音 OpenAPI，让 AI 从“能说话”到“会说话”！

首次将“理解”的能力注入语音交互链路，它不只是在听你说话，而是在理解你说话的场景、语境、甚至情绪。

让 AI 开始像人一样思考和表达。

当你与接入扣子智能语音API的智能体或是 AI 应用交谈时，

它不只是在应答，而是在理解、思考、然后用最恰当的方式回应！

实测演示👇

1. Demo 配置流程视频演示

2. 与智能体实时对话测试

3. 语音对话过程中，支持实时打断

4. 轻轻松松进行逼真的音色克隆

这一切的实现归功于以下四个优势：

精准的识别： 使用大模型的 ASR 进行语音转文本，具备上下文理解能力（比如上文出现过的名词能在识别中复用，说话风格和代称也有更好理解），并对噪声、垂直领域、中英混说等复杂场景识别效果提升；
强大的 AI Agent 能力： 不只是听懂你说什么，更是真正理解你的需求。它包含了 Agent 各项能力，能够像人一样有记忆力（文件盒子、数据库、变量）、有知识（文本、表格、照片）、有技能（插件、触发器）、还能编排（工作流、图像流）等；
低延迟、可打断： 使用火山引擎 RTC 方案，把链路中的延迟充分降低，并确保即使在弱网络环境下也能通话顺畅。此外，智能体能毫秒级响应用户打断，流畅切换话题并即时反馈，模拟人类自然交流。火山引擎RTC的AI降噪可有效过滤超过90%的背景噪音，减少误打断，提升对话准确度；
自然的语音效果： 使用大模型的 TTS 进行文本转语音，根据上下文，智能预测文本的情绪、语调等信息；生成超自然、高保真、个性化的语音，在自然度、音质、韵律、气口、情感、语气词表达等方面更像真人；即使是中英文混说也能行云流水应答自如。

目前，扣子语音功能正在内测中，

扫描下方二维码或点击「阅读原文」，

即可申请成为扣子产品体验官！

从“能说话”到“会说话”，

扣子智能语音 OpenAPI ，

正在迈出 AI 应用的一大步。

🙋 扫码加入交流群

关注扣子Coze公众号，后台回复「语音」，获取更多细节！

合作&转载：bd@coze.cn

点击 「阅读原文」，报名参与扣子语音功能内测!

字节跳动技术团队

字节跳动的技术实践分享

NDSS 2025｜抖音集团安全研究团队提出机密沙箱内存管理方案WAVEN

ABCoder 在大模型编程领域的探索

来战！「豆包 MarsCode 算法竞技赛」第二期开赛，丰厚奖金等你来拿

豆包视觉理解模型正式发布，通用模型能力全面对齐GPT-4o！

豆包MarsCode AI编程云课堂回顾｜「入门开发者系列」

Kitex/Hertz 助力大模型：三周年重要特性回顾

北京大学-字节跳动“豆包大模型系统软件联合实验室”成立，聚焦AI系统软件关键问题

直播预约｜字节跳动豆包大模型团队 NeurIPS 2024 中选论文精讲

火山引擎veImageX助力谱时智能云深耕照片直播赛道

见证无限可能！火山引擎冬季 Force 大会开发者论坛来袭

首次覆盖超 11 类真实编程场景！豆包大模型团队开源代码大模型全新基准

参与AI 红人共创计划，拿万元现金大奖！每日投票抽奖！

深度揭秘“快稳省”背后的数仓硬核技术

来战！激发你的编程潜力，挑战极限！豆包 MarsCode 算法竞技赛火热来袭！

APMPlus 发布 HarmonyOS NEXT 鸿蒙系统 App 性能监控

更快、更稳、更优，揭秘火山引擎全站加速 DCDN 规模容器化最佳实践

初级开发者系列｜AI编程云课堂课程预告来啦！

大幅降低数据科学门槛！豆包大模型团队开源AutoKaggle，端到端解决数据处理

QCon演讲实录|赵彦奇：HTTPDNS 边缘下沉，性能、成本和稳定性之间的取舍与思考

字节跳动基于 Ray 的大规模多模态数据处理框架

无文本编码器仍能媲美CLIP！豆包大模型团队首创SuperClass模型

首度揭示！个性化视频技术——短视频体验的秘密！

又稳又快！基于ByteHouse ELT构建高性能离/在线一体化数仓

【请领取打卡礼】刷题不停，Offer可期！豆包MarsCode & 掘金 AI 刷题功能再次升级！

「会说话」的 AI ，扣子智能语音 OpenAPI 开启内测申请

火山引擎论文入选国际会议ACM IMC'24｜一种面向大规模视频点播系统的算法实验平台

火山引擎多媒体实验室VR全链路处理传输显示方案ResVR入选ACM Multimedia 2024最佳论文提名

创新实践：基于边缘智能+扣子的智能取物机器人解决方案

QCon演讲实录|徐广治：边缘云原生操作系统的设计与思考

一句话轻松 P 图！字节跳动图像编辑模型SeedEdit发布，产品端可体验

直播预约｜豆包MarsCode校园发布会即将上线！万元大奖，玩法多多先睹为快

视频生成模型能否“理解”物理规律？豆包大模型团队公布系统性实验结论

抖音集团也在用的数仓「降本」利器

BlockFramework —— 客户端模块化业务开发框架

超低延迟多路径传输：技术演进与大规模业务实践

最高提升20倍吞吐量！豆包大模型团队发布全新 RLHF 框架，现已开源！

AI 代码编程助手真的有用吗

万圣节，一起 Cozeplay ！ iPhone 16 Pro Max、Switch、扣子周边等500份“糖果”掉落！

单元化架构在字节跳动的落地实践

技术专题27期 | 后端Java技术创意冠军角逐赛

【万字干货】保姆级AI编程基础入门，看这篇就够了！

豆包MarsCode Agent 登顶 SWE-bench Lite 评测集

1024 码上奇妙夜｜开发者专属，万元“豪”礼，宠爱满满！

揭秘云数仓ByteHouse四大「降本」硬招

1024限时加码｜豆包MarCode小助手给合伙人送礼啦！

扣子上新！文生播客、客服、陪伴、教育…官方带你抄作业！

一文教会你轻松上手豆包MarsCode 编程助手！（文末送AirPods 4啦）

1024，火山引擎开发者社区给你精彩！

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉