* 戳上方蓝字“开源先锋”关注我
推荐阅读:
《25.3K star!搞定VSCode所有插件,就是这么舒适!》
《5.6K star!再见了DocSend,这款开源项目更不错!》
《14.5K star!一款开源的工作流编排调度项目,无限可扩展!!》
《27.5K star!无需GPU本地轻松运行AI模型,超推荐!》
《33.1K star!又来一款币圈交易开源项目,助你追上2025年行情!》
大家好,我是开源君!
在科研的浩瀚海洋中,我们经常需要阅读大量的英文文献,尤其是那些包含复杂数学公式和图表的PDF文件。对于英语不太好的小伙伴来说,这简直就是噩梦!翻译软件虽然能帮上忙,但翻译后的格式总是乱七八糟,公式和图表也常常显示不全。
今天开源君给大家介绍一个超级实用的开源项目 - PDFMathTranslate
,简直就是科研工作者和学术研究者的“翻译神器”,用起来简直不要太爽!
项目简介
PDFMathTranslate
是一个开源的PDF文档翻译工具,专门用于翻译科技论文等PDF文件。它不仅能完整保留原文的排版,包括公式、图表和目录结构,还能生成双语对照文档,方便我们对照原文和译文。而且,它还支持多种翻译服务,如Google、DeepL、Ollama和OpenAI等,简直就是翻译界的“瑞士军刀”!
目前在Github上收获了14K star!
性能特色
完美保留排版:翻译后的文档与原文排版一致,公式、图表、目录一个不落,看着就舒心! 多语言支持:支持多种语言翻译,不管你是想看英文、日文还是其他语言,它都能搞定! 多种翻译服务:内置Google、DeepL、Ollama、OpenAI等多种翻译服务,想用什么就用什么,灵活切换无压力! 双语对照:还能生成双语对照文档,方便你对照原文和译文,学习起来更高效! 批量处理:支持批量翻译,再也不用一篇一篇地翻译了,效率翻倍!
安装使用
官方提供了多种安装PDFMathTranslate的方式。
1、命令行安装
确保你的Python版本在3.8到3.12之间,然后运行以下命令安装:
pip install pdf2zh
安装完成后,在命令行中输入以下命令即可翻译整个文档:
pdf2zh example.pdf
如果你想翻译特定页面,比如第1到3页,可以这样做:
pdf2zh example.pdf -p 1-3
如果你想指定翻译的语言,可以使用以下命令:
pdf2zh example.pdf -li en -lo zh
这会将英文文档翻译成中文。
命令行使用参考
2、图形化界面
如果你喜欢图形界面,也可以这样启动:
pdf2zh -i
然后通过浏览器http://localhost:7860/
即可使用图形界面。
3、Docker安装
docker pull byaidu/pdf2zh
docker run -d -p 7860:7860 byaidu/pdf2zh
完成后浏览器打开http://localhost:7860/
即可。
在图形界面中,你可以拖拽文件开始翻译,点击设置调整翻译选项,还可以批量处理文档,非常方便!
项目体验展示
官方还提供了在线体验服务,可以直接访问下面地址进行尝试:
https://pdf2zh.com/
https://huggingface.co/spaces/reycn/PDFMathTranslate-Docker
开源君试了一下,翻译出来的文档不仅保留了原文的排版,而且公式和图表也显示得非常清晰,能够更好地理解论文的内容。而且,生成的双语对照文档也非常方便,我可以一边看原文,一边看译文,学习效率大大提高了!
PDFMathTranslate
是一个非常优秀的开源项目,它不仅解决了外文文献翻译的大难题,还保留了原文的排版格式,让你的学习和研究更加高效。无论你是科研人员、学生还是教育工作者,它都能成为你的得力助手。
更多细节功能,感兴趣的可以到项目地址查看:
项目地址:
https://github.com/Byaidu/PDFMathTranslate