以下文章来源于 Link.AI ,作者:Link.AI开放平台
LinkAI 已原生支持智能体端到端语音对话,并兼容微信、企微、钉钉、飞书、公众号等多渠道端接入。
同时,语音相关能力已通过 Open API 开放,供企业客户和开发者用户调用。
API 简介
本次上线了 语音识别、语音合成 的高级接口,具备以下特性:
支持多种音色可供选择,覆盖了通用问答、智能助手、有声阅读、视频配音、各地方言等多个场景
语音识别 API 支持将语音文件转为文本内容
语音合成 API 支持将多种语言内容合成为丰富、拟人的音色音频
LinkAI 原生语音功能介绍
在网页端使用时,可以在应用配置中设置语音音色,有数十种来自 OpenAI、百度、豆包 的语音合成音色可供选择。设置完成后,即可在应用对话时使用语音进行沟通。
# 在应用设置中选择语音音色:
# 在工作流的结束节点选择语音音色:
# 网页端对话使用:
打开应用对话界面,点击语音输入(“话筒”按钮),根据提示长按说话,松开后等待应用语音回应。
网页端语音对话体验:👉点此体验
# 在渠道端使用:
在渠道端使用时,完全兼容微信、企微等 APP 的语音对话功能,带来最拟人、最方便、最智能的语音对话体验~
渠道端语音对话体验:
👇添加LinkAI小助手,发送语音即可语音回复
语音识别接口
该接口支持将传入的多种格式(如 mp3、mp4、mpeg、mpga、m4a、ogg、wav、webm、flac、amr 等)的语音文件,转换为文本内容。
请求示例
CURL代码请求
curl https://api.link-ai.tech/v1/audio/transcriptions \
-H "Authorization: Bearer YOUR_API_KEY" \
-H "Content-Type: multipart/form-data" \
-F file="@/path/to/file/audio.mp3"
注:在 YOUR_API_KEY 处填入你创建的 API Key,在file参数中填入音频文件的本地路径。
Python代码请求
import requests
file_path = '/path/to/file/audio.mp3' # 替换为你要上传的音频文件路径
url = 'https://api.link-ai.tech/v1/audio/transcriptions'
headers = {
'Authorization': f'Bearer YOUR_API_KEY'
}
files = {
'file': open(file_path, 'rb')
}
res = requests.post(url, headers=headers, files=files)
if res.status_code == 200:
res_json = res.json()
reply_text = res_json.get("text")
print(f"text={reply_text}")
else:
error = res.json()
print(f"请求异常, 错误码={error.get('code')}, 错误信息={error.get('message')}")
注意:在 YOUR_API_KEY 处填入你创建的 API Key,在 file_path 变量中填入音频文件的本地路径。
更多语言和在线调试:
错误说明
{
"success": false,
"code": 408,
"message": "当前版本无该API访问权限",
"data": null
}
根据 HTTP状态码 (status code) 和错误信息 判断错误类型:
接口文档
点击查看 语音识别接口文档,详细了解接口定义(接口地址、请求头、请求体、错误说明和示例代码等),可进行在线调试。
语音合成接口
该接口可将文本内容合称为语音文件,支持多种音色可供选择,覆盖智能助手、有声阅读、视频配音、各地方言等多个场景。
请求示例
CURL代码请求
curl https://api.link-ai.tech/v1/audio/speech \
-H "Authorization: Bearer YOUR_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"input": "你好,请问有什么需要帮助的?",
"voice": "BV700_V2_streaming"
}' \
--output speech.mp3
注:在 YOUR_API_KEY 处填入你创建的 API Key,在file参数中填入音频文件的本地路径。
Python代码请求
import requests
url = 'https://api.link-ai.tech/v1/audio/speech'
headers = {
'Authorization': f'Bearer YOUR_API_KEY',
'Content-Type': 'application/json'
}
data = {
'input': '你好,请问有什么需要帮助的?',
'voice': 'BV007_streaming'
}
res = requests.post(url, headers=headers, json=data)
file_path = "speech.mp3"
if res.status_code == 200:
with open(file_path, 'wb') as f:
f.write(res.content)
print(f"语音合成成功,语音文件:{file_path}")
else:
error = res.json()
print(f"请求异常, 错误码={error.get('code')}, 错误信息={error.get('message')}")
错误说明
{
"success": false,
"code": 408,
"message": "当前版本无该API访问权限",
"data": null
}
根据 HTTP状态码 (status code) 和错误信息 判断错误类型:
接口文档
点击查看 语音合成接口文档,详细了解接口定义(接口地址、请求头、请求体、错误说明和示例代码等),可进行在线调试。
音色列表
查看支持的合成音色列表:https://docs.link-ai.tech/platform/api/voice-speech/voices
版本说明
语音识别与语音合成接口需 Link.AI 标准版 及以上版本用户使用。
咨询反馈
如有问题或建议,欢迎扫码添加客服微信,期待您的反馈:
💡 关注我们,第一时间掌握产品更新及相关咨资讯。
LinkAI —— 更适合企业的领先AI智能体平台