API上新|语音识别&语音合成接口

2024-11-22 11:54   广东  

以下文章来源于 Link.AI ,作者:Link.AI开放平台

LinkAI 已原生支持智能体端到端语音对话,并兼容微信、企微、钉钉、飞书、公众号等多渠道端接入。

同时,语音相关能力已通过 Open API 开放,供企业客户和开发者用户调用。


API 简介

本次上线了 语音识别、语音合成 的高级接口,具备以下特性:

  • 支持多种音色可供选择,覆盖了通用问答、智能助手、有声阅读、视频配音、各地方言等多个场景

  • 语音识别 API 支持将语音文件转为文本内容

  • 语音合成 API 支持将多种语言内容合成为丰富、拟人的音色音频


LinkAI 原生语音功能介绍

在网页端使用时,可以在应用配置中设置语音音色,有数十种来自 OpenAI、百度、豆包 的语音合成音色可供选择。设置完成后,即可在应用对话时使用语音进行沟通。

# 在应用设置中选择语音音色:

# 在工作流的结束节点选择语音音色:

# 网页端对话使用:

打开应用对话界面,点击语音输入(“话筒”按钮),根据提示长按说话,松开后等待应用语音回应。

网页端语音对话体验:👉点此体验


# 在渠道端使用:

在渠道端使用时,完全兼容微信、企微等 APP 的语音对话功能,带来最拟人、最方便、最智能的语音对话体验~

渠道端语音对话体验:

👇添加LinkAI小助手,发送语音即可语音回复



语音识别接口

该接口支持将传入的多种格式(如 mp3、mp4、mpeg、mpga、m4a、ogg、wav、webm、flac、amr 等)的语音文件,转换为文本内容。

请求示例

CURL代码请求

curl https://api.link-ai.tech/v1/audio/transcriptions \  -H "Authorization: Bearer YOUR_API_KEY" \  -H "Content-Type: multipart/form-data" \  -F file="@/path/to/file/audio.mp3"

注:在 YOUR_API_KEY 处填入你创建的 API Key,在file参数中填入音频文件的本地路径。

Python代码请求

import requests
file_path = '/path/to/file/audio.mp3'      # 替换为你要上传的音频文件路径
url = 'https://api.link-ai.tech/v1/audio/transcriptions'headers = {    'Authorization': f'Bearer YOUR_API_KEY'}files = {    'file': open(file_path, 'rb')}res = requests.post(url, headers=headers, files=files)if res.status_code == 200:    res_json = res.json()    reply_text = res_json.get("text")    print(f"text={reply_text}")else:    error = res.json()    print(f"请求异常, 错误码={error.get('code')}, 错误信息={error.get('message')}")

注意:在 YOUR_API_KEY 处填入你创建的 API Key,在 file_path 变量中填入音频文件的本地路径。

更多语言和在线调试:

错误说明

{    "success": false,    "code": 408,    "message": "当前版本无该API访问权限",    "data": null}

根据 HTTP状态码 (status code) 和错误信息 判断错误类型:

接口文档

点击查看 语音识别接口文档,详细了解接口定义(接口地址、请求头、请求体、错误说明和示例代码等),可进行在线调试。


语音合成接口

该接口可将文本内容合称为语音文件,支持多种音色可供选择,覆盖智能助手、有声阅读、视频配音、各地方言等多个场景。

请求示例

CURL代码请求

curl https://api.link-ai.tech/v1/audio/speech \  -H "Authorization: Bearer YOUR_API_KEY" \  -H "Content-Type: application/json" \  -d '{    "input": "你好,请问有什么需要帮助的?",    "voice": "BV700_V2_streaming"  }' \  --output speech.mp3

注:在 YOUR_API_KEY 处填入你创建的 API Key,在file参数中填入音频文件的本地路径。

Python代码请求

import requestsurl = 'https://api.link-ai.tech/v1/audio/speech'headers = {    'Authorization': f'Bearer YOUR_API_KEY',    'Content-Type': 'application/json'}data = {    'input': '你好,请问有什么需要帮助的?',    'voice': 'BV007_streaming'}res = requests.post(url, headers=headers, json=data)file_path = "speech.mp3"if res.status_code == 200:    with open(file_path, 'wb') as f:        f.write(res.content)    print(f"语音合成成功,语音文件:{file_path}")else:    error = res.json()    print(f"请求异常, 错误码={error.get('code')}, 错误信息={error.get('message')}")

错误说明

{    "success": false,    "code": 408,    "message": "当前版本无该API访问权限",    "data": null}

根据 HTTP状态码 (status code) 和错误信息 判断错误类型:

接口文档

点击查看 语音合成接口文档,详细了解接口定义(接口地址、请求头、请求体、错误说明和示例代码等),可进行在线调试。


音色列表

查看支持的合成音色列表:https://docs.link-ai.tech/platform/api/voice-speech/voices



版本说明

语音识别与语音合成接口需 Link.AI 标准版 及以上版本用户使用。

咨询反馈

如有问题或建议,欢迎扫码添加客服微信,期待您的反馈:


💡 关注我们,第一时间掌握产品更新及相关咨资讯。


LinkAI —— 更适合企业的领先AI智能体平台


点个“在看”吧!▼

LinkAI平台
LinkAI是领先的一站式AI Agent搭建平台,零代码快速构建企业级AI智能体,并一键发布至渠道。link-ai.tech