首页时事民生政务教育文化科技财富体娱健康情感

旅行百科职场楼市企业乐活学术汽车时尚创业美食幽默美体文摘

7款少有人知的语音转文字黑科技软件，开源免费强大！

科技 2025-01-04 19:20 上海

编辑/排版：卒見

现在我们工作会议的时，都会用到录音转文字工具，我个人也会在工作和娱乐的时候用到这些工具，这里就给大家分享几款不一样的语音转文字工具，都是免费、开源项目！

01

Voice-Pro

AI 语音转换和多语言翻译工具

Voice-Pro 是一款由AI驱动的Web开源应用程序，旨在彻底改变多媒体内容处理。

它集转录、翻译和文字转语音为一体，提供简洁直观的可视化操作界面，支持实时转录和翻译，以及批量处理模式。

它具有 YouTube 视频下载、语音分离、语音识别、翻译和文本转语音的全面功能。

Voice-Pro 安装。

①运行configure.bat 并start.bat

②克隆或下载最新版本（源代码 zip）GitHub 版本

git clone https://github.com/abus-aikorea/voice-pro.git

③运行configure.bat，在 Windows 上安装 git、ffmpeg 和 CUDA

④连接互联网，这个过程可能需要一个多小时，看系统情况。

⑤在安装过程中，请勿关闭 Windows-Command 窗口。

⑥启动 Voice-Pro。Web-UI 将自动运行。

首次运行时，请先安装 Voice-Pro。

如果在安装过程中出现问题，请删除 installer_files 文件夹并再次运行 start.bat。

该项目是用于音频处理的综合 Gradio WebUI，具有 Voice Changer、零样本语音克隆（E2、F5-TTS）、YouTube 下载、语音隔离（UVR5）、文本转语音（Edge-TTS）和多语言翻译。适用于内容创建者和开发人员。

Voice-Pro源代码：

https://pan.quark.cn/s/ccbde0108f7f

开源地址：

https://github.com/abus-aikorea/voice-pro

02

PodCastLM

PDF 生成中文播客！

一款开源免费的工具，可以将 PDF 内容转化为适合音频播客的自然对话，并输出为 MP3 文件。

操作很简单：

①我们可以直接将需要转换的内容上传到操作页面，这里可上传1M以内的PDF文件；

②然后设置语气、时长等，生成播客，你可以查看到文本总结内容，以及整理后的脚本内容！

③点击底部音频按钮，即可播放当前整理好的内容！

开源地址：

https://github.com/YOYZHANG/PodCastLM

在线地址：https://ai.podcastlm.fun

03

video-srt-windows

自动识别视频语音生成字幕文件的工具

video-srt-windows是一个可以识别视频语音自动生成字幕SRT文件的开源 Windows-GUI 软件工具。

它采用 Go+walk 开发，仅支持 Windows 系统。基础原理是请求在线语音转文字的服务，超出免费额度需付费。另外还加入了导出字幕文件和翻译功能。

VideoSrt下载：

https://pan.quark.cn/s/ebd97ead46e3

开源地址：

https://github.com/wxbool/video-srt-windows

https://gitcode.com/gh_mirrors/vi/video-srt-windows

04

buzz

音频转录与翻译工具，可以在你的个人计算机上离线转录和翻译音频服务。

该项目是基于 Whisper 的音频转录和翻译工具，开箱即用、操作简单，支持语音转文字、音频翻译、多种语言和离线使用！

Mac 原生版本的 Buzz，具有更简洁的外观、音频播放、拖放导入、转录文本编辑、搜索等功能。它同时适用于Windows 和 Linux 平台。

功能支持：

①导入音频和视频文件并将转录文本导出为 TXT、SRT 和 VTT（演示)

②从计算机的麦克风转录和翻译为文本

③支持Whisper、Whisper.cpp、Faster Whisper、Whisper兼容的 Hugging Face 模型，以及 OpenAI Whisper API

④命令行界面

Buzz v1.2.0下载：

https://pan.quark.cn/s/8c08670cfe56

开源地址：

https://github.com/chidiwilliams/buzz

05

ChatTTS

SOTA 开源 TTS，强大的对话式文本转语音模型，专门为对话场景设计，支持中、英双语。生成较短的语音效果很好，无机械感！

它主要用于 LLM 助手对话任务、对话语音以及视频介绍等，支持中英文混合文本合成语音，音色表现强，能达到真假难辨程度。

它不仅能够生成自然、流畅的语音，还能控制和添加笑声、停顿和语气词等。

ChatTTS源代码：

https://pan.quark.cn/s/48101f70fc83

开源地址：

https://github.com/2noise/ChatTTS

06

fish-speech

所有人都能用的开源语音合成模型

该项目是由 Fish Audio 开发的基于 VQGAN+Llama 的文本转语音模型，它仅需 4GB 显存即可在个人设备上轻松运行和微调(16GB)，支持中英日语和音色调整，语音合成效果出色。

fish-speech源代码：

https://pan.quark.cn/s/cf829869e7f0

开源地址：

https://github.com/fishaudio/fish-speech

07

GPT-SoVITS

少样本语音转换和合成工具

强大的少样本语音转换和语音合成 WebUI 工具，输入 5 秒的声音样本就能体验文本到语音转换。支持少样本 TTS、英语、日语和中文，集成了声音伴奏分离、中文自动语音识别和文本标注等功能。

特色功能：

零点TTS：输入5秒的人声样本并体验即时文本到语音转换。

少发TTS：只需1分钟的训练数据即可微调模型，以提高语音相似度和真实感。

跨语言支持：使用与训练数据集不同的语言进行推理，目前支持英语、日语、韩语、粤语和中文。

WebUI 工具：集成工具包括语音伴奏分离、自动训练集分割、中文 ASR 和文本标注，帮助初学者创建训练数据集和 GPT/SoVITS 模型。

开源地址：

https://github.com/RVC-Boss/GPT-SoVITS

kua链：

https://pan.quark.cn/s/cf509d794f54

du链：

https://pan.baidu.com/s/1AQwPg3B60RlozShq97h4_g?pwd=gecp

提取码: gecp

Ok，本期的分享就到这里了，希望以上语音转文字、文字转语音的工具可以帮助你，不管是在生活上，还是在工作中，提高效率！

❶5款鲜有人知的剪辑黑科技app

❷5款堪称神器的黑科技软件

❸强烈推荐4款Windows工具神器

办公技巧达人

办公技巧，资源分享，无章无法，卒見世界！

最新文章

4个少有人知的文字识别朗读翻译黑科技app

从脚背爽到脚底！这双“不闷脚”的王炸老爹鞋！暴走不累！

7款少有人知的语音转文字黑科技软件，开源免费强大！

出行好伙伴，这个杯子超乎你想象，颜值在线，狂甩不漏，保温保冷，一年四季好用

剪辑只会用剪映？推荐5款鲜有人知的剪辑黑科技app

速薅！出门被问800次的保温杯！24h保温，大容量，高颜值，喝水太方便！

5个少有人知的AI办公ppt工具推荐，让你的年终总结智能化

“变形金刚”双肩包！收纳超能装，防水耐磨

分享6个少有人知的猎奇工具

耳机界的劳斯莱斯，千元级音质、久戴不痛，今日2位数拿下！

4款手机阅读器，激发不一样的阅读体验

10分钟自热艾草护膝：老寒腿克星。冬天膝盖再也不疼了

分享3种类型，9个AI写作工具，少有人知的黑科技来啦！

工信部计算机视觉设计开发工程师证书——助您成为AI领域的佼佼者！

这双情侣拖鞋增高，防水防滑！自带按摩！太好穿了~

4个实用防窥屏小工具分享，从此告别“好奇眼光”

极速降温，保暖神器首选ta！3秒即热，暖手、暖脚、暖全身……

闷声干大事！低调考取AI大模型证书，成为朋友圈的传说？

「真无线」降噪耳机，HIFI音质，久戴舒适...联想投资品牌！

4个开源免费的视频采取工具，获取视频资源易如反掌！

您还再睡荞麦皮枕头吗？试试【荞麦壳枕头】吧！防潮透气，冬暖夏凉！颈椎好舒服~

推荐ai入门好的书籍和视频课程，0基础实操（附AI课程资料和专业AIGC技术指南）

梁实秋教“骂人”，一夜刷屏：治愈一个成年人，看他就够了

8个被AI入侵的思维导图，你知道哪些？

明末第一才子张岱，迷倒无数女人；有趣，才是一个人的魅力

强烈推荐5款播放器和电台app，让你的耳朵听点好的！

10分钟自热艾草护膝：老寒腿克星。冬天膝盖再也不疼了

较小、免费、开源，少有人知的6个安卓手机工具分享！

干净清爽的卸妆膏安利，不长闭口的那种！

6个少有人知的黑科技，给你分享开源第三方客户端

当你负债累累，连亲戚也瞧不起你时，不妨读读这套书

6款安卓手机效率黑科技，伴你进入理想生活！

这个颈托火了！头变轻了，脖子爽了，颈椎越来越舒服

推荐，功能强大又干净的极简音乐播放器

不闷的冰丝网孔内裤，爽到起飞！

干货，非常良心的电脑软件可以良心到什么程度？

10分钟自热艾草护膝：老寒腿克星。冬天膝盖再也不疼了

少有人知的开源文生视频工具，简单高效！

穿上这畅快“呼吸”的男士内裤，好~凉~快~

5款手机必备的神器App，只有少数人才知道

干净清爽的卸妆膏安利，不长闭口的那种！

小众黑科技AI神器，每一个都好用到无法自拔！

同样是雨刮精，为什么用起来差别就这么大？

6个黑科技截图处理工具，每一个都是非常良心！

水壶大小的破壁豆浆机，不用泡豆免滤渣，喝完自己会清晰

鲜有人知的软件漫画搜索引擎，帮助你快速找到软件和漫画资源！

拥抱你的内向孩子：他们的优势，超出你想象！

6个黑科技屏幕捕捉，每一个都是非常良心

您还再睡荞麦皮枕头吗？试试【荞麦壳枕头】吧！防潮透气，冬暖夏凉！颈椎好舒服~

6款黑科技转换器，每一款都让人爱不释手

分类

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉