告别联网限制！这款离线OCR工具支持HTTP调用，完全开源免费！

文摘 2024-10-18 12:04 辽宁

关注下方公众号，获取更多热点资讯

告别联网限制！这款离线OCR工具支持HTTP调用，完全免费！

简介

Umi-OCR 是一款开源免费的离线OCR工具。通过利用本地高效的OCR引擎，用户能够在无需网络的情况下快速识别图片中的文字，支持多种格式的文件处理和不同语言的识别需求。Umi-OCR 的设计初衷是提供一个轻量、高效、灵活的文字识别工具，适用于各种文本处理场景。

GitHub 地址：https://github.com/hiroi-sora/Umi-OCR

Umi-OCR 的特点

• 免费：本项目所有代码开源，完全免费。
• 方便：解压即用，离线运行，无需网络。
• 高效：自带高效率的离线OCR引擎，内置多种语言识别库。
• 灵活：支持命令行、HTTP接口等外部调用方式。
• 功能：截图OCR / 批量OCR / PDF识别 / 二维码 / 公式识别

主要功能介绍

截图OCR

截图OCR 是Umi-OCR的核心功能之一。用户可以通过快捷键快速截图，并识别截图中的文字。

• 图片预览栏：截图后的图片将显示在左侧，可以直接选择并复制其中的部分图像。
• 识别记录栏：右侧展示识别的文字记录，用户可以对识别结果进行编辑，支持批量选择多个记录后统一复制。
• 图片粘贴识别：用户也可以从其他地方复制图片，直接粘贴到Umi-OCR进行识别。

批量OCR

批量OCR 提供了一种高效处理多张图片的方式，特别适用于大量文档的批量识别工作。

• 支持一次性加载并处理多张图片文件，省去了单次识别的麻烦。
• 批量处理的速度较快，适合需要批量文档管理的场景，如合同处理、文件归档等。

忽略区域

忽略区域 是一个针对批量OCR场景下的功能，用户可以通过该功能设置不想识别的图片区域。例如，水印或Logo等无关信息可以通过忽略区域排除掉，减少识别错误。

• 用户可以在批量OCR设置中找到忽略区域编辑器。
• 操作方法：按住右键，选择图片上不需要识别的区域，系统会忽略这些部分的内容。
• 该功能特别适用于需要对大量图片进行批量处理的场景，极大提升了识别效率和准确性。

HTTP接口

如上图，必须允许HTTP服务才能使用HTTP接口（默认开启）。如果需要允许被局域网访问，请将主机切换到任何可用地址。

在全局设置页中勾选高级才会显示。

注意事项：

1. 关闭 Umi-OCR 软件时，如果仍有用户未断开HTTP接口连接，可能导致Umi-OCR关闭不完全（UI线程结束了，但负责网络的子线程未被关闭）。这时只能等待所有用户关闭连接，或者进任务管理器强制结束进程。
2. 由于后端组件的性能限制，对并发支持较差，尽量不要并发调用。
3. 由于后端组件的性能限制，在长时间、大批量、连续调用时，有小几率出现 Error: connect ECONNREFUSED 之类的HTTP报错。此时重新发起请求即可。只要后台工作线程没有崩，这些小问题不会持续影响调用。

调用接口说明参考：https://github.com/hiroi-sora/Umi-OCR/blob/main/docs/http/api_ocr.md

文档识别

Umi-OCR 支持对各种文档格式（如PDF、XPS等）进行识别，适合处理扫描文件或提取原有文本内容。

• 支持格式：PDF、XPS、EPUB、MOBI、FB2、CBZ 等常见文档格式。
• 双层可搜索PDF：识别后的文档可以输出为双层可搜索PDF，便于后续的内容检索。
• 忽略区域：同样支持设置忽略区域，用于排除不需要的页眉页脚内容。

4. Umi-OCR 的使用场景

1. 文档管理：适用于企业文档的电子化管理和存档，快速扫描、识别、分类文档内容。
2. 个人笔记整理：将书籍、笔记、图片中的文字提取出来，形成可编辑的电子文本，方便存档和检索。
3. 业务系统应用：适合需要批量处理大量图片的情况。

更多精彩文章

自动化登录神器sshpass！交互无需手动输入密码

Linux没有curl和wget怎么发送http请求？

无需破解！IntelliJ IDEA提供开源免费版本！

欢迎关注我的公众号“编程与架构”，原创技术文章第一时间推送。

http://mp.weixin.qq.com/s?__biz=MzAxNDYyNjI1OQ==&mid=2454473576&idx=1&sn=f53ce7bd28a6a25d1dee8da799bed3e0

编程与架构

专注于Java、大数据、AI以及开发运维技术的深入探索与分享。作为一名开源爱好者，致力于分享实战经验和前沿技术动态，帮助更多技术人提升技能。

最新文章

深入解析Kubernetes Pod生命周期（含示例代码）

无所不能的BusyBox：如何用它打造极小的Linux环境

Vim编辑器小技巧：轻松解决复制粘贴时的自动缩进

告别 Java 8！Java 17 这些特性让开发更高效

强烈推荐！一款开源支持Docker管理、自动部署、日常运维的软件

开源：通过 Shell 打造强大的 Linux 可视化监控工具

一文搞懂：到底什么是 RESTful 风格接口

84.9k！推荐一款开源支持在线协作的流程图绘制工具

重大变革：VMware Workstation和Fusion彻底免费支持商用

为何JetBrains Writerside是技术文档编写者的最佳选择？

快速源码修改指南：轻松编辑 Jar 包中的代码

开源 62.6k！带你高效构建数据可视化

Superset 详细安装部署指南

推荐一款 Java 代码覆盖率工具

推荐一款开源数据库设计工具！可在线体验

再见Navicat DBeaver！这款开源AI数据库管理工具完美替代

深入探讨 Awaitility：异步测试的神器

36k Star！Arthas Java开发者的故障排查利器

最新发布国产免费 AI 知识库：ima copilot

比Airtable还好用的无代码数据库解决方案：NocoDB开源免费!

MySQL自增ID用完了？掌握这些技巧，轻松应对！

Metabase：推荐一款开源数据可视化 BI 分析工具

实现高效MySQL数据库监控：mysqld_exporter+Grafana快速部署

Docker可视化管理神器：Portainer详细介绍，包含汉化版本！

创建你自己的Linux服务：如何在Linux中创建 Systemd 服务

还在用 XXLJob？任务调度新时代：SnailJob分布式任务调度平台

快速简单：MySQL数据库一键备份指南

6k Star! 开源SQL审核查询与优化平台

告别联网限制！这款离线OCR工具支持HTTP调用，完全开源免费！

自动化登录神器sshpass！交互无需手动输入密码

Linux没有curl和wget怎么发送http请求？

JSON 数据的可视化神器：同时支持在线使用和私有化部署

Elasticsearch性能优化指南：线程池优化详细介绍

无需破解！IntelliJ IDEA提供开源免费版本！

提升开发效率：JCommander高效Java命令行参数解析利器

Docker镜像瘦身：Slim精准删除无用内容，打造极致轻量容器

DataGrip：全面替代Navicat的高效数据库管理工具

Nginx UI：高效管理Nginx的图形化界面工具

MySQL 5.x和MySQL 8.x到底有什么区别？

ElasticSearch中副本和分片如何优化？

常说的API和SPI到底是什么意思？

Linux free命令你真的会用吗？

你真的会用GPT吗？教你快速生成理想Prompt的技巧！

简化部署流程：IDEA实现一键部署至远程Docker容器

Kafka监控工具大盘点：找到最适合你的那一款

开发者福音：utools工具所有插件免费使用！

从Elasticsearch到RedisSearch：探索更快的搜索引擎解决方案

免费申请永久域名攻略！快速注册，秒级生效

Linux还在用top命令？试试htop和btop更直观更高效！

Docker中部署Flink：快速部署调试各版本

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉