Tesseract.js 是一个基于 JavaScript 的光学字符识别(OCR)库,它是 Tesseract-OCR 引擎的一个纯前端实现。Tesseract-OCR 是由 Google 开发的一个开源项目,广泛用于将图像中的文本转换成机器编码的文本。
上传图像识别文本字符:
安装使用:
// npm
npm install tesseract.js
// yarn
yarn add tesseract.js
// import
import { createWorker } from 'tesseract.js';
(async () => {
const worker = await createWorker('eng');
const ret = await worker.recognize('xxx.png');
console.log(ret.data.text);
await worker.terminate();
})();
功能和特性:
纯 JavaScript 实现:Tesseract.js 是 基于 Tesseract OCR 引擎的 JavaScript 版本,可以在浏览器和 Node.js 环境中运行,无需依赖任何原生库。
支持超过 100 种语言:Tesseract.js 支持识别 100 多种不同的语言,这使得它成为一个多语言环境下的强大工具。
自动文本方向和脚本检测:它能够自动检测文本的方向和使用的脚本,这减少了对用户输入方向信息的需求。
简单的接口:提供了一个简单的接口来读取段落、单词和字符的边界框,使得开发者可以轻松地集成和使用 OCR 功能。
浏览器和服务器端支持:Tesseract.js 可以在浏览器端运行,也可以在服务器端使用 Node.js 运行,这为不同的应用场景提供了灵活性。
示例代码和 API 文档:官方网站提供了示例代码和 API 文档,帮助开发者快速了解如何使用这个库。
开源免费:Tesseract.js 是一个开源项目,这意味着它可以被自由地使用、修改。
文档数字化:将纸质文档扫描成图像后,使用 Tesseract.js 将图像中的文本转换为可编辑的文本格式。
自动化数据录入:自动识别图片中的表格数据,减少手动输入的工作量。
辅助阅读工具:为视障人士提供辅助,将图像中的文本转换为语音。
社交媒体内容分析:自动识别社交媒体上的图片中包含的文本,用于内容分析检测。
票据识别:自动识别发票、收据等票据上的文本信息,用于财务处理。
《前端资源推荐》公众号收集各种前端组件 UI 框架、JS 插件工具、中后台系统模板、动画库、低代码、可视化资源、开源项目、学习资源、特效源码等,如有其他优秀资源,欢迎发消息投稿,感谢点赞、在看、转发、关注!!!