一款开源的语音对话助手:百聆,通过ASR+LLM+TTS实现,时延800ms

科技   2025-01-19 00:00   浙江  

一款开源的语音对话助手:百聆,通过ASR+LLM+TTS实现,时延800ms,低配置也可运行,支持打断。无需GPU,通过优化,可本地部署,仍能提供类GPT-4的性能表现。模块化设计,ASR、VAD、LLM和TTS模块相互独立,可以根据需求进行替换和升级。支持记忆功能,具备持续学习能力,能够记忆用户的偏好与历史对话。

参考文献:
[1] github:https://github.com/wwbin2017/bailing
[2] bailing 实时对话:https://www.zhihu.com/zvideo/1818994917940260865



欢迎支持我的知识星球(NLP工程化):Dify源码剖析及答疑,Dify对话系统源码,电子书籍报告下载,公众号所有付费资料。若微信群二维码过期,则加微信buxingtianxia21进群。

NLP工程化知识星球

NLP工程化资料群

NLP工程化
专注于对话系统领域的技术分享,重点写《Dify应用操作和源码剖析》专栏。
 最新文章