一款开源的语音对话助手:百聆,通过ASR+LLM+TTS实现,时延800ms,低配置也可运行,支持打断。无需GPU,通过优化,可本地部署,仍能提供类GPT-4的性能表现。模块化设计,ASR、VAD、LLM和TTS模块相互独立,可以根据需求进行替换和升级。支持记忆功能,具备持续学习能力,能够记忆用户的偏好与历史对话。
参考文献:
[1] github:https://github.com/wwbin2017/bailing
[2] bailing 实时对话:https://www.zhihu.com/zvideo/1818994917940260865
欢迎支持我的知识星球(NLP工程化):Dify源码剖析及答疑,Dify对话系统源码,电子书籍报告下载,公众号所有付费资料。若微信群二维码过期,则加微信buxingtianxia21进群。
NLP工程化知识星球
NLP工程化资料群