Gladia发布了业界领先的实时语音转文本API,将改变AI助手和客服系统的未来!
在AI语音技术领域,一直存在着一个难题:要么选择高质量但延迟高的批处理模式,要么选择实时但质量较差的流式处理。这个困扰业界多年的问题,如今终于迎来了breakthrough!
Gladia公司推出的新一代实时语音转文本引擎,不仅保持了批处理级别的质量,还实现了实时转录的速度。这项技术的核心优势在于:
超低延迟:延迟低至300毫秒,完美适配各种实时应用场景。
多语言支持:支持100多种语言,并具备出色的口音识别和代码切换能力。
实时洞察:能够在通话过程中实时提取caller的情绪、关键实体和摘要等有价值的信息。
广泛兼容:与现有技术栈和电话协议(如SIP、VoIP、FreeSwitch和Asterisk)完全兼容。
该技术的应用前景十分广阔。
在客户服务领域,它可以帮助企业从被动的事后处理转变为主动的实时工作流,如自动CRM丰富或为呼叫中心坐席提供实时指导。在销售支持方面,它可以为销售人员提供实时的AI辅助,大大提升通话效率和成功率。
🎙Jean-Louis Queguiner(@JiliJeanlouis) 表示:
这次发布是解决行业最大挑战之一的重要一步。多年来,实时处理意味着牺牲质量,所以公司不得不同时运行批处理和实时处理以达到最佳结果...
他进一步解释道:
我们的新API将批处理转录的优质质量与<300毫秒的延迟相结合,非常适合所有常见用例。多亏了这项突破,我们的客户现在正从备用批处理转向全时实时处理!
Gladia 将为AI助手和客服系统带来革命性的变化。实时、高质量的语音转文本,加上强大的实时分析能力,将极大地提升这些系统的智能水平和用户体验。
更为重要的是,Gladia同时还宣布完成了1600万美元的A轮融资,由XAngeVC、IlluminateFM等多家知名投资机构领投。
这笔资金将用于开发新的模型,包括LLM、RAG等,以满足用户不断变化的需求。
相关链接
[1] 原文链接: https://twitter.com/JiliJeanlouis/status/1846145881285730338
👇
👇
👇
👇
本文同步自知识星球《AGI Hunt》
星球实时采集和监控推特、油管、discord、电报等平台的热点AI 内容,并基于数个资讯处理的 AI agent 挑选、审核、翻译、总结到星球中。
每天约监控6000 条消息,可节省约800+ 小时的阅读成本;
每天挖掘出10+ 热门的/新的 github 开源 AI 项目;
每天转译、点评 10+ 热门 arxiv AI 前沿论文。
星球非免费。定价99元/年,0.27元/天。(每+100人,+20元。元老福利~)
一是运行有成本,我希望它能自我闭环,这样才能长期稳定运转;
二是对人的挑选,鱼龙混杂不是我想要的,希望找到关注和热爱 AI 的人。
欢迎你的加入!