告别联网限制!这款离线OCR工具支持HTTP调用,完全开源免费!

文摘   2024-10-18 12:04   辽宁  
关注下方公众号,获取更多热点资讯

告别联网限制!这款离线OCR工具支持HTTP调用,完全免费!

简介

Umi-OCR 是一款开源免费的离线OCR工具。通过利用本地高效的OCR引擎,用户能够在无需网络的情况下快速识别图片中的文字,支持多种格式的文件处理和不同语言的识别需求。Umi-OCR 的设计初衷是提供一个轻量、高效、灵活的文字识别工具,适用于各种文本处理场景。

GitHub 地址:https://github.com/hiroi-sora/Umi-OCR

Umi-OCR 的特点

  • • 免费:本项目所有代码开源,完全免费。

  • • 方便:解压即用,离线运行,无需网络。

  • • 高效:自带高效率的离线OCR引擎,内置多种语言识别库。

  • • 灵活:支持命令行、HTTP接口等外部调用方式。

  • • 功能:截图OCR / 批量OCR / PDF识别 / 二维码 / 公式识别

主要功能介绍

截图OCR

截图OCR 是Umi-OCR的核心功能之一。用户可以通过快捷键快速截图,并识别截图中的文字。

  • • 图片预览栏:截图后的图片将显示在左侧,可以直接选择并复制其中的部分图像。

  • • 识别记录栏:右侧展示识别的文字记录,用户可以对识别结果进行编辑,支持批量选择多个记录后统一复制。

  • • 图片粘贴识别:用户也可以从其他地方复制图片,直接粘贴到Umi-OCR进行识别。

批量OCR

批量OCR 提供了一种高效处理多张图片的方式,特别适用于大量文档的批量识别工作。

  • • 支持一次性加载并处理多张图片文件,省去了单次识别的麻烦。

  • • 批量处理的速度较快,适合需要批量文档管理的场景,如合同处理、文件归档等。

忽略区域

忽略区域 是一个针对批量OCR场景下的功能,用户可以通过该功能设置不想识别的图片区域。例如,水印或Logo等无关信息可以通过忽略区域排除掉,减少识别错误。

  • • 用户可以在批量OCR设置中找到忽略区域编辑器。

  • • 操作方法:按住右键,选择图片上不需要识别的区域,系统会忽略这些部分的内容。

  • • 该功能特别适用于需要对大量图片进行批量处理的场景,极大提升了识别效率和准确性。

HTTP接口

如上图,必须允许HTTP服务才能使用HTTP接口(默认开启)。如果需要允许被局域网访问,请将主机切换到任何可用地址

在全局设置页中勾选高级才会显示。

注意事项:
  1. 1. 关闭 Umi-OCR 软件时,如果仍有用户未断开HTTP接口连接,可能导致Umi-OCR关闭不完全(UI线程结束了,但负责网络的子线程未被关闭)。这时只能等待所有用户关闭连接,或者进任务管理器强制结束进程。

  2. 2. 由于后端组件的性能限制,对并发支持较差,尽量不要并发调用。

  3. 3. 由于后端组件的性能限制,在长时间、大批量、连续调用时,有小几率出现 Error: connect ECONNREFUSED 之类的HTTP报错。此时重新发起请求即可。只要后台工作线程没有崩,这些小问题不会持续影响调用。

调用接口说明参考:https://github.com/hiroi-sora/Umi-OCR/blob/main/docs/http/api_ocr.md

文档识别

Umi-OCR 支持对各种文档格式(如PDF、XPS等)进行识别,适合处理扫描文件或提取原有文本内容。

  • • 支持格式:PDF、XPS、EPUB、MOBI、FB2、CBZ 等常见文档格式。

  • • 双层可搜索PDF:识别后的文档可以输出为双层可搜索PDF,便于后续的内容检索。

  • • 忽略区域:同样支持设置忽略区域,用于排除不需要的页眉页脚内容。

4. Umi-OCR 的使用场景

  1. 1. 文档管理:适用于企业文档的电子化管理和存档,快速扫描、识别、分类文档内容。

  2. 2. 个人笔记整理:将书籍、笔记、图片中的文字提取出来,形成可编辑的电子文本,方便存档和检索。

  3. 3. 业务系统应用:适合需要批量处理大量图片的情况。


更多精彩文章

自动化登录神器sshpass!交互无需手动输入密码

Linux没有curl和wget怎么发送http请求?

无需破解!IntelliJ IDEA提供开源免费版本!



欢迎关注我的公众号“编程与架构”,原创技术文章第一时间推送。



编程与架构
专注于Java、大数据、AI以及开发运维技术的深入探索与分享。作为一名开源爱好者,致力于分享实战经验和前沿技术动态,帮助更多技术人提升技能。
 最新文章