ArcGIS用深度学习从影像提取带坐标的文本

2024-08-07 09:00   陕西  

在地理信息系统(GIS)中,提取影像中的文本信息,特别是带有坐标的文本,是一个重要的任务。随着深度学习技术的发展,这一过程变得更加高效和精准。本文将探讨如何在ArcGIS Pro中利用深度学习技术,从影像中提取带坐标的文本,并介绍相关的步骤和工具。


关于深度学习

上次我体验了一下ArcGIS官方提供的预训练模型来提取道路,结果效果并不如预期。我以为那已经很差劲了,但这两天我尝试了其他模型,比如建筑物提取的预训练模型,效果同样不佳。然而,OCR模型给我留下了不错的印象,它在提取带坐标的文本方面表现出色,尤其对于纸质地图的矢量化有很大帮助。不过,目前该模型仅支持英文识别,不支持中文,因此我下载了标准地图的英文版进行了测试。

关于参数的调整

这次使用的OCR模型给了三个可调整参数:

阈值:只有置信度分数高于此值的检测结果才会包含在最终输出中。允许的值范围为 0 到 1.0。

test_time_augmentation:在预测时是否执行测试时间增强。如果设置为 true,则会将输入图像的翻转和旋转变体的预测结果合并到最终输出中。

batch_size:文本识别模型一次处理的文本检测数量。

首先给大家看一下阈值0.1和0.9的区别,不难看出允许值越低识别的越全,但是效果越差(容易出现碎片化)

再看看调整最大文本长度batch_size16和1600的区别,我感觉没什么区别,还是会把一段长话分割成多部分。

关于使用方法

上篇文章其实已经说的很清楚了,所以本文就不再赘述了,想学的去这里看→深度学习有多深?浅试卫星图像中提取道路

但是有人提出了看不清工具所在的位置所以本篇再演示一下

结语

希望本文的介绍让您对ArcGIS Pro中深度学习的应用有了更深入的了解。如果你觉得这篇文章对你有帮助,请不要忘记关注、点赞、在看、收藏、转发给更多的朋友,你的支持是我们持续创作的动力!如需获取已经下载好的深度学习框架(毕竟GitHub下载确实慢)、下载好的道路提取预训练模型、本期提到的文本提取模型、建筑物提取模型,请在公众号后台回复“深度学习



--THE END--


GIS民工
记录、分享、思考、求知、求是!
 最新文章