Tesseractjs:OCR 前端识别提取图像文本字符 支持 100+ 种语言

科技   2024-10-25 17:56   湖北  

Tesseract.js 是一个基于 JavaScript 的光学字符识别(OCR)库,它是 Tesseract-OCR 引擎的一个纯前端实现。Tesseract-OCR 是由 Google 开发的一个开源项目,广泛用于将图像中的文本转换成机器编码的文本。

上传图像识别文本字符:

安装使用:

// npm
npm install tesseract.js
// yarn
yarn add tesseract.js
// import
import { createWorker } from 'tesseract.js';
(async () => {
  const worker = await createWorker('eng');
  const ret = await worker.recognize('xxx.png');
  console.log(ret.data.text);
  await worker.terminate();
})();

功能和特性:

纯 JavaScript 实现:Tesseract.js 是 基于 Tesseract OCR 引擎的 JavaScript 版本,可以在浏览器和 Node.js 环境中运行,无需依赖任何原生库。

支持超过 100 种语言:Tesseract.js 支持识别 100 多种不同的语言,这使得它成为一个多语言环境下的强大工具。

自动文本方向和脚本检测:它能够自动检测文本的方向和使用的脚本,这减少了对用户输入方向信息的需求。

简单的接口:提供了一个简单的接口来读取段落、单词和字符的边界框,使得开发者可以轻松地集成和使用 OCR 功能。

浏览器和服务器端支持:Tesseract.js 可以在浏览器端运行,也可以在服务器端使用 Node.js 运行,这为不同的应用场景提供了灵活性。

示例代码和 API 文档:官方网站提供了示例代码和 API 文档,帮助开发者快速了解如何使用这个库。

开源免费:Tesseract.js 是一个开源项目,这意味着它可以被自由地使用、修改。

使用场景:

文档数字化:将纸质文档扫描成图像后,使用 Tesseract.js 将图像中的文本转换为可编辑的文本格式。

自动化数据录入:自动识别图片中的表格数据,减少手动输入的工作量。

辅助阅读工具:为视障人士提供辅助,将图像中的文本转换为语音。

社交媒体内容分析:自动识别社交媒体上的图片中包含的文本,用于内容分析检测。

票据识别:自动识别发票、收据等票据上的文本信息,用于财务处理。


《前端资源推荐》公众号收集各种前端组件 UI 框架、JS 插件工具、中后台系统模板、动画库、低代码、可视化资源、开源项目、学习资源、特效源码等,如有其他优秀资源,欢迎发消息投稿,感谢点赞、在看、转发、关注!!!

GitHub:https://github.com/naptha/tesseract.js
官方文档:https://tesseract.projectnaptha.com/
其他推荐:
PagePlug:为开发者而生 低代码开发工具
Vue Draggable Plus:支持多种拖拽方式的组件库
600+ CSS Loading 动画加载器 

Vuetify:谷歌 Material 风格 响应式 UI 组件库

GitHub 56k+ Star AI 项目 截图就能生成前端代码
NutUI:京东开源 移动端 UI 组件库

前端资源推荐
推荐分享各种前端组件UI、插件工具、中后台系统、低代码、可视化、开源项目、学习资源、特效源码等
 最新文章