Gladia获1600万美元融资,推实时语音AI引擎

旅行   2024-10-16 08:00   北京  

Gladia发布了业界领先的实时语音转文本API,将改变AI助手和客服系统的未来!

在AI语音技术领域,一直存在着一个难题:要么选择高质量但延迟高的批处理模式,要么选择实时但质量较差的流式处理。这个困扰业界多年的问题,如今终于迎来了breakthrough!

Gladia公司推出的新一代实时语音转文本引擎,不仅保持了批处理级别的质量,还实现了实时转录的速度。这项技术的核心优势在于:

  • 超低延迟:延迟低至300毫秒,完美适配各种实时应用场景。

  • 多语言支持:支持100多种语言,并具备出色的口音识别和代码切换能力。

  • 实时洞察:能够在通话过程中实时提取caller的情绪、关键实体和摘要等有价值的信息。

  • 广泛兼容:与现有技术栈和电话协议(如SIP、VoIP、FreeSwitch和Asterisk)完全兼容。

该技术的应用前景十分广阔。

在客户服务领域,它可以帮助企业从被动的事后处理转变为主动的实时工作流,如自动CRM丰富或为呼叫中心坐席提供实时指导。在销售支持方面,它可以为销售人员提供实时的AI辅助,大大提升通话效率和成功率。

🎙Jean-Louis Queguiner(@JiliJeanlouis) 表示:

这次发布是解决行业最大挑战之一的重要一步。多年来,实时处理意味着牺牲质量,所以公司不得不同时运行批处理和实时处理以达到最佳结果...

他进一步解释道:

我们的新API将批处理转录的优质质量与<300毫秒的延迟相结合,非常适合所有常见用例。多亏了这项突破,我们的客户现在正从备用批处理转向全时实时处理!

Gladia 将为AI助手和客服系统带来革命性的变化。实时、高质量的语音转文本,加上强大的实时分析能力,将极大地提升这些系统的智能水平和用户体验。


更为重要的是,Gladia同时还宣布完成了1600万美元的A轮融资,由XAngeVC、IlluminateFM等多家知名投资机构领投。

这笔资金将用于开发新的模型,包括LLM、RAG等,以满足用户不断变化的需求。


相关链接

[1] 原文链接: https://twitter.com/JiliJeanlouis/status/1846145881285730338

👇

👇

👇

👇

本文同步自知识星球《AGI Hunt》

星球实时采集和监控推特、油管、discord、电报等平台的热点AI 内容,并基于数个资讯处理的 AI agent 挑选、审核、翻译、总结到星球中。

  • 每天约监控6000 条消息,可节省约800+ 小时的阅读成本;

  • 每天挖掘出10+ 热门的/新的 github 开源 AI 项目;

  • 每天转译、点评 10+ 热门 arxiv AI 前沿论文。

星球非免费。定价99元/年,0.27元/天。(每+100人,+20元。元老福利~)

  • 一是运行有成本,我希望它能自我闭环,这样才能长期稳定运转;

  • 二是对人的挑选,鱼龙混杂不是我想要的,希望找到关注和热爱 AI 的人。

欢迎你的加入!

AGI Hunt
关注AGI 的沿途风景!
 最新文章