14K star!开源文献翻译神器,可完整保留排版,爽的不行!

文摘   2025-01-07 21:01   江西  

* 戳上方蓝字“开源先锋”关注我


推荐阅读:

《25.3K star!搞定VSCode所有插件,就是这么舒适!


《5.6K star!再见了DocSend,这款开源项目更不错!


《14.5K star!一款开源的工作流编排调度项目,无限可扩展!!》


《52K+ star!解放双手,工作流自动化神器!》


《27.5K star!无需GPU本地轻松运行AI模型,超推荐!》

《33.1K star!又来一款币圈交易开源项目,助你追上2025年行情!》


大家好,我是开源君!

在科研的浩瀚海洋中,我们经常需要阅读大量的英文文献,尤其是那些包含复杂数学公式和图表的PDF文件。对于英语不太好的小伙伴来说,这简直就是噩梦!翻译软件虽然能帮上忙,但翻译后的格式总是乱七八糟,公式和图表也常常显示不全。

今天开源君给大家介绍一个超级实用的开源项目 - PDFMathTranslate,简直就是科研工作者和学术研究者的“翻译神器”,用起来简直不要太爽!

项目简介

PDFMathTranslate是一个开源的PDF文档翻译工具,专门用于翻译科技论文等PDF文件。它不仅能完整保留原文的排版,包括公式、图表和目录结构,还能生成双语对照文档,方便我们对照原文和译文。而且,它还支持多种翻译服务,如Google、DeepL、Ollama和OpenAI等,简直就是翻译界的“瑞士军刀”!

目前在Github上收获了14K star!

性能特色

  • 完美保留排版:翻译后的文档与原文排版一致,公式、图表、目录一个不落,看着就舒心!
  • 多语言支持:支持多种语言翻译,不管你是想看英文、日文还是其他语言,它都能搞定!
  • 多种翻译服务:内置Google、DeepL、Ollama、OpenAI等多种翻译服务,想用什么就用什么,灵活切换无压力!
  • 双语对照:还能生成双语对照文档,方便你对照原文和译文,学习起来更高效!
  • 批量处理:支持批量翻译,再也不用一篇一篇地翻译了,效率翻倍!

安装使用

官方提供了多种安装PDFMathTranslate的方式。

1、命令行安装

确保你的Python版本在3.8到3.12之间,然后运行以下命令安装:

pip install pdf2zh

安装完成后,在命令行中输入以下命令即可翻译整个文档:

pdf2zh example.pdf

如果你想翻译特定页面,比如第1到3页,可以这样做:

pdf2zh example.pdf -p 1-3

如果你想指定翻译的语言,可以使用以下命令:

pdf2zh example.pdf -li en -lo zh

这会将英文文档翻译成中文。

命令行使用参考

2、图形化界面

如果你喜欢图形界面,也可以这样启动:

pdf2zh -i

然后通过浏览器http://localhost:7860/即可使用图形界面。

3、Docker安装

docker pull byaidu/pdf2zh
docker run -d -p 7860:7860 byaidu/pdf2zh

完成后浏览器打开http://localhost:7860/即可。

在图形界面中,你可以拖拽文件开始翻译,点击设置调整翻译选项,还可以批量处理文档,非常方便!

项目体验展示

官方还提供了在线体验服务,可以直接访问下面地址进行尝试:

https://pdf2zh.com/
https://huggingface.co/spaces/reycn/PDFMathTranslate-Docker

开源君试了一下,翻译出来的文档不仅保留了原文的排版,而且公式和图表也显示得非常清晰,能够更好地理解论文的内容。而且,生成的双语对照文档也非常方便,我可以一边看原文,一边看译文,学习效率大大提高了!

PDFMathTranslate是一个非常优秀的开源项目,它不仅解决了外文文献翻译的大难题,还保留了原文的排版格式,让你的学习和研究更加高效。无论你是科研人员、学生还是教育工作者,它都能成为你的得力助手。

更多细节功能,感兴趣的可以到项目地址查看:

项目地址:
https://github.com/Byaidu/PDFMathTranslate


开源先锋
分享Github上最有趣的开源项目
 最新文章