▍前言
阅读时,直接在书本上做标记,读完后再统一摘抄出来,使用键盘输入摘抄,或语音输入摘抄;
边阅读边使用手机 app OCR,如自带相机、白描、Office Lens、Readwise 等应用识别并手动拾取文字;
使用智能硬件进行文字摘抄,如扫描笔。
后台迭代计算与摘录 👉
利用多目相机,结构光或者激光雷达等专用硬件对文档进行扫描,获得文档表面的 3D 结构信息,进而对文档校正展平。这类方法一般可以得到比较好的校正效果,但依赖专用设备的特点限制了其使用场景,一般应用在高拍仪上。 利用显式的几何模型以适应形变文档曲面,依靠图像信息以及文档形变的先验知识对图像进行校正。一般需要进行文字行或者表格线的检测,并假设曲面符合特定的几何约束,如曲面是柱面。其校正效果受文字行检测准确度的限制,对文档版式比较敏感,无法处理存在大量图表的文档,且误检的文字行有可能会对校正造成严重干扰。 基于优化的方法,利用损失函数缓慢迭代优化以获得形变矫正结果。 数据驱动的方法。训练形变矫正神经网络,学习形变场,得到类似扫描的结果。
分割
扭曲矫正
光照校正
标记提取与 OCR
后台迭代计算与摘录 👉
结合电子书文件对 OCR 结果进行校正; 手指拾取文本行后的智能断句; 复杂排版书籍的扭曲校正; 手写注释的提取。