tesseract：一个.Net版本的开源OCR项目

科技 2024-09-29 23:25 福建

推荐一个.Net版本的开源OCR项目，方便我们在项目中集成OCR功能。

项目简介

tesseract是针对Tesseract-OCR（C++）引擎封装的.NET版本，支持超过100种语言的文本识别，使得.NET开发者能够轻松地利用Tesseract的强大功能，无需深入了解OCR的底层技术。

此项目缺点是，只能识别印刷的文本，针对手写的需要自己训练语言包。

使用方法

1、安装依赖Tesseract

Install-Package Tesseract

2、下载语言数据文件

根据需求下载对于的语言数据文件，并在属性设置“复制到输出目录”设置为“始终”，如下示例为中文简体数据文件。

语言文件下载地址：

https://github.com/tesseract-ocr/tessdata_fast

3、示例代码

using System.Diagnostics;using Tesseract;
var testImagePath = "./photo.bmp";
try{    using (var engine = new TesseractEngine(@".", "chi_sim", EngineMode.Default))    {        using (var img = Pix.LoadFromFile(testImagePath))        {            using (var page = engine.Process(img))            {                var text = page.GetText();
                Console.WriteLine("识别结果：" + text);            }        }    }}catch (Exception e){    Console.WriteLine(e.ToString());}Console.ReadKey(true);

4、识别效果

图片：

识别：

项目地址

https://github.com/charlesw/tesseract

- End -

最新文章

.Net程序员想要学习AI的，官方的AI教程来了！

.Net交流群：建新群，限时加入！

Fleck：一个轻量级的C#开源WebSocket服务端库

.Net交流群：建新群，限时加入！

Superpower：一个基于 C# 的文本解析工具开源项目

ASP.NET Core 9.0的7个方面重大更新！

.NET 9正式发布，亮点是.NET Aspire和AI

一款可以替代Navicat的数据库管理工具

Bulk-Crap-Uninstaller：一个高效卸载，轻松管理你的应用程序的.Net开源工具

推荐一个Star超过2K的.Net轻量级的CMS开源项目

推荐一个.NetCore开源的CMS项目，功能强大、扩展性强、支持插件的系统！

SpreadCheetah：高性能的Excel操作处理.NET库

PythonNet：实现Python与.Net代码相互调用！

ImageGlass：基于C#开发的轻量级、多功能的图像查看器

Dapper.SimpleCRUD：Dapper的CRUD助手

PDFPatcher：一个无所不能的开源PDF处理工具

盘点5个常用的.Net依赖注入框架！

.NET日志库：Serilog、NLog、Log4Net等十大开源日志库大盘点！

一半的程序员认为AI更适合写代码，不适合测试

9月份9个热门.Net开源项目汇总！

tesseract：一个.Net版本的开源OCR项目

Html2OpenXml：HTML转化为OpenXml的.Net库，轻松实现Html转为Word。

学习C#，视频、书籍、在线文档哪种是你喜欢的方式，80%的人竟然选择这个方式！

C#在国外真的很流行吗？这份报告，告诉你答案。

Pidgin：一个轻量级、快速且灵活的 C# 解析库

.Net交流群：建新群，限时加入！

Sep：一个低内存、高性能的CSV文件读写操作.Net开源库

.Net交流群：建新群，限时加入！

如何学好C#？看看这6个点。

推荐4个音频处理相关的.Net开源项目

5个热门的.NetCore开源商城项目

.NET 一直跻身 30 大Github最活跃开源项目之列。

Boxed：包含多个.Net项目模板，涵盖了ASP.NET Core API、GraphQL等。

.Net交流群：建新群，限时加入！

3个WebSocket的.Net开源项目

CSCore：一个.Net功能强大且灵活的开源音频处理库

.Net交流群：建新群，限时加入！

ChoETL：支持多数据库读写.Net开源库，包含 CSV、XML、JSON等8个格式

一个专注推荐.Net开源项目的榜单

.Net交流群：建新群，限时加入！

Atata：一个基于 Selenium的C#自动化测试Web框架

3个热门、好用、功能强大的C#开源帮助工具类

.Net交流群：建新群，限时加入！

一个专注推荐.Net开源项目的榜单

5个热门Blazor UI开源组件！

.Net学习社区，我已经坚持一年了！

回答几个星球的问题！

HtmlSanitizer: 一个保护你的网站免受XSS攻击的.Net开源项目

.Net交流群：建新群，限时加入！

8个热门.Net开源项目汇总！

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉