简单易用,支持开始和停止说话的状态监测,支持指定唤醒词触发工作,实时进行将语音转换为文本。从给出的演示视频来看,效果颇为不错,转录速度快且准确率高。可以在 Windows、macOS 以及 Linux 系统上安装使用,同时支持 CUDA 进行 GPU 加速。
参考文献:
[1] GitHub:https://github.com/KoljaB/RealtimeSTT
欢迎支持我的知识星球(NLP工程化):Dify源码剖析及答疑,Dify对话系统源码,电子书籍报告下载,公众号所有付费资料。若微信群二维码过期,则加微信buxingtianxia21进群。
NLP工程化知识星球
NLP工程化资料群