告别联网限制!这款离线OCR工具支持HTTP调用,完全免费!
简介
Umi-OCR 是一款开源免费的离线OCR工具。通过利用本地高效的OCR引擎,用户能够在无需网络的情况下快速识别图片中的文字,支持多种格式的文件处理和不同语言的识别需求。Umi-OCR 的设计初衷是提供一个轻量、高效、灵活的文字识别工具,适用于各种文本处理场景。
GitHub 地址:https://github.com/hiroi-sora/Umi-OCR
Umi-OCR 的特点
• 免费:本项目所有代码开源,完全免费。
• 方便:解压即用,离线运行,无需网络。
• 高效:自带高效率的离线OCR引擎,内置多种语言识别库。
• 灵活:支持命令行、HTTP接口等外部调用方式。
• 功能:截图OCR / 批量OCR / PDF识别 / 二维码 / 公式识别
主要功能介绍
截图OCR
截图OCR 是Umi-OCR的核心功能之一。用户可以通过快捷键快速截图,并识别截图中的文字。
• 图片预览栏:截图后的图片将显示在左侧,可以直接选择并复制其中的部分图像。
• 识别记录栏:右侧展示识别的文字记录,用户可以对识别结果进行编辑,支持批量选择多个记录后统一复制。
• 图片粘贴识别:用户也可以从其他地方复制图片,直接粘贴到Umi-OCR进行识别。
批量OCR
批量OCR 提供了一种高效处理多张图片的方式,特别适用于大量文档的批量识别工作。
• 支持一次性加载并处理多张图片文件,省去了单次识别的麻烦。
• 批量处理的速度较快,适合需要批量文档管理的场景,如合同处理、文件归档等。
忽略区域
忽略区域 是一个针对批量OCR场景下的功能,用户可以通过该功能设置不想识别的图片区域。例如,水印或Logo等无关信息可以通过忽略区域排除掉,减少识别错误。
• 用户可以在批量OCR设置中找到忽略区域编辑器。
• 操作方法:按住右键,选择图片上不需要识别的区域,系统会忽略这些部分的内容。
• 该功能特别适用于需要对大量图片进行批量处理的场景,极大提升了识别效率和准确性。
HTTP接口
如上图,必须允许HTTP服务才能使用HTTP接口(默认开启)。如果需要允许被局域网访问,请将主机切换到任何可用地址。
在全局设置页中勾选高级才会显示。
注意事项:
1. 关闭 Umi-OCR 软件时,如果仍有用户未断开HTTP接口连接,可能导致Umi-OCR关闭不完全(UI线程结束了,但负责网络的子线程未被关闭)。这时只能等待所有用户关闭连接,或者进任务管理器强制结束进程。
2. 由于后端组件的性能限制,对并发支持较差,尽量不要并发调用。
3. 由于后端组件的性能限制,在长时间、大批量、连续调用时,有小几率出现
Error: connect ECONNREFUSED
之类的HTTP报错。此时重新发起请求即可。只要后台工作线程没有崩,这些小问题不会持续影响调用。
调用接口说明参考:https://github.com/hiroi-sora/Umi-OCR/blob/main/docs/http/api_ocr.md
文档识别
Umi-OCR 支持对各种文档格式(如PDF、XPS等)进行识别,适合处理扫描文件或提取原有文本内容。
• 支持格式:PDF、XPS、EPUB、MOBI、FB2、CBZ 等常见文档格式。
• 双层可搜索PDF:识别后的文档可以输出为双层可搜索PDF,便于后续的内容检索。
• 忽略区域:同样支持设置忽略区域,用于排除不需要的页眉页脚内容。
4. Umi-OCR 的使用场景
1. 文档管理:适用于企业文档的电子化管理和存档,快速扫描、识别、分类文档内容。
2. 个人笔记整理:将书籍、笔记、图片中的文字提取出来,形成可编辑的电子文本,方便存档和检索。
3. 业务系统应用:适合需要批量处理大量图片的情况。
更多精彩文章
欢迎关注我的公众号“编程与架构”,原创技术文章第一时间推送。