自己读取图像并提取文本非常简单。但动态提取照片中的文本则有点困难,幸运的是,imgclip提供了一个相当简单的解决方案。
此命令行工具在 Mac、Windows 和 Linux 的终端中运行。它只需将图像文件和语言作为参数,然后返回复制到剪贴板的文本。
你可以通过 npm 安装整个库,这是一个非常简单的安装。它只有几 KB 大小,并且附带一个 JS 文件,你可以在 GitHub 上浏览。
Imgclip使用Tesseract.js库自动处理图像并通过OCR提取文本。它是迄今为止最强大的 OCR 库之一,并且与 imgclip 一样完全开源。
我认为这款工具的质量和速度给我留下了最深刻的印象。它确实能提取准确的文本,而且它是最容易使用的工具之一。
imgclip 命令应直接在终端中运行,后跟图像的相对路径。您还可以在末尾添加四个选项来自定义输出。
-h
,--help
:输出使用信息-V
,--version
:输出版本号-l
,--lang
:输出图片中文字的语言-p
,--print
:打印出图像中的文本(而不是复制到剪贴板)
截至撰写本文时,Tesseract支持65 种语言,并且正在开发更多语言。您附加到标签的代码--lang
应该是这些 Tesseract 文件中使用的任何代码。
例如,-l eng
将在图像中搜索英文文本,而-l jpn
将搜索日文文本,甚至可以运行-l jpn_vert
来搜索垂直方向的日文文本。
由于 imgclip 严重依赖于 Tesseract,因此您基本上可以使用整个库的功能。
要开始使用,请访问GitHub 页面并在本地下载一份副本,或者通过 npm 将其安装到特定目录。然后,您可以像应用程序一样在终端中运行该工具来解析您想要的任何图像。
要查看imgclip 的实际运行,请观看作为 imgclip 演示创建的这个简短视频。
欢迎关注我,共同探讨学习科技前沿技术资讯,提升认知赚钱能力。