马上就是双十一了,每天都可以领JD红包,使用时间10月14日到10月23日,大家可以扫描这个二维码领一下,感谢大家的支持!
之前分享过飞书等在线服务,可以将视频音频转文字,两年过去了,今天再分享两个很好用的音频转文字软件STT,一个本地离线转换,一个调用大厂接口转换。
01
whisper0.2
这是一个基于开源项目修改,本地模型的的语音转文字工具,所以安装包也是大一些的,应用本体250MB左右。
有三个模型可供调用,分别是500MB、1GB、3GB,模型越大越精准,耗时也越久,第一次使用这些模型会自动下载。
选择文件,选择模型,开始识别即可,软件后面的命令行窗口不要关,那里才是“本体”。
如果电脑上配置好了CUDA可以用GPU,如果没有就用CPU,精度选择int8,(large模型切换精度选择框为float32)
02
AsrTools-v1.0.0
这款工具是逆向剪映、快手、必剪的接口便携的,所以文件小,需要网络连接才行。
可以选择在线接口,不过既然是在线的,就有失效的可能,前三个都可以用,速度也是很快的。
生成的文件保存在音频文件的同一文件夹。
03
获取方式
在公众号:小白自习室 👇
对话框内回复:203 即可获取链接。
微信公众号ID :xb-zxs
软件|资源|教程|安利