只要你以后还要去处理矢量,早晚要用到这个功能...

文摘   2024-09-17 11:02   广东  

大家中秋节快乐!

1 介绍

这个是标题党吗?我认为不是,因为只要你以后要处理shp,若是你处理不当,shp随时都会破损。

所以标题这句话的意思是,只要你以后还要去处理矢量,早晚要用到这个shp修复功能...除非你不用shp格式改用gpkg格式


哈哈,开玩笑的。shp格式现在还是很广泛地被地理信息行业使用,现阶段不可能被gpkg新格式所取代,所以shp修复这个功能很基础,也很重要

一年前,我的shp就因为破损,如果中途我并没有保存多一份矢量文件,那么我就要重新画一个shp,想想这个工程量让人感觉到恶心。

一开始,我就觉得shp可以修复,在网上找了很多很多的资料,却找不到一个合适的方案。

中文搜索不行,那就用英文吧,启动魔法去外面找吧,但是呢,老外好像也没有一个好的解决方法。

找啊找,想啊想,慢慢地,找到了解决办法。一开始是用软件解决shp修复。我把这段经历写成了一段文字记录了下来:shp文件在arcgis打开失败及其修复


后来再琢磨琢磨,借助了老外写的pydbf库,实现了简单地对dbf文件的进行读写。以及分析了shp破损的原因,最后写出了一个py脚本解决了shp修复的问题,当时写了一个简陋的命令行小工具,同时把这一过程记录了在:修复破损shp文件 | 工具下载 | 代码分享

现在,时不时看到在后台看到有人在下载shp修复的工具,我知道他遇到了曾经我遇到困境,能帮助到他们我很开心的。有一个问题值得说一说:之前写的工具太简陋了,界面不好看,以及功能单一。

恰好,前不久我写了一个rstool的软件,全名叫做remote sensing tool,中文名字叫做遥感工具箱。现在想把shp修复集成到rstool,方便更多人去使用。

综上,今天公众号的主题是shp修复,这篇文章围绕以下两个方面进行展开:

1、当时是怎么实现破损shp文件修复。

2、现在怎么把这个功能集成到rstool软件


2 流程

说到shp文件夹修复,必然要讲讲这个问题是怎么出现的。

记得某一天,我在愉快的使用着arcgis,正在编辑图斑,由于不可抗力软件闪退了,导致shp文件的图形数量和dbf的属性表数量对不上。

shp的图形是保存在内存里,你画完了一个图形,电脑把这个点位数据自动地保存在.shp文件中,但是属性表需要手动地去完成保存。

如果在你未及时保存文件前,电脑重启了或者arcgis软件大退,就会把整个shp文件打碎,最后把这个矢量文件拖拽到arcgis,显示无法打开。

好了,理解清楚了这个问题的原因,解决思路就很清晰了。

1.修改.shp,使它的图形数量和dbf的属性表个数保持一致。

2.修改.dbf,使它的属性表个数和.shp的图形数量保持一致。


当时选择的方式是第二条,以下是shp修复的流程图

以下代码,是上面的流程的实现(当时为了外国人也看得懂把注释改为了英文。。。)

#!/usr/bin/env python
# -*- coding: utf-8 -*-
# @Time : 2024/1/3 20:32
# @File : RestoreShp.py

# 修复shp文件, shp文件中的几何数据和属性数据不一致
import os
import shutil
from struct import unpack
import dbf

class RestoreShp(object):
   def __init__(self, file, outpath=None):
       self.file = file
       self.outpath = outpath
       if self.outpath is None:
           self.outpath = os.path.dirname(self.file)
       if not os.path.exists(self.outpath):
           os.makedirs(self.outpath)
       if os.path.exists(self.file) is None:
           raise Exception('File does not exist')
       else:
           self.dbffile = os.path.splitext(self.file)[0] + '.dbf'

       self.outfile = [os.path.join(self.outpath, os.path.splitext(os.path.basename(self.file))[0] + '_restore.shp'),
                       os.path.join(self.outpath, os.path.splitext(os.path.basename(self.file))[0] + '_restore.dbf'),
                       os.path.join(self.outpath, os.path.splitext(os.path.basename(self.file))[0] + '_restore.shx'),
                       os.path.join(self.outpath, os.path.splitext(os.path.basename(self.file))[0] + '_restore.prj')]
       self.copyfile
   @property
   def copyfile(self):
       # 读取shp文件
       shutil.copyfile(self.file, self.outfile[0])
       shutil.copyfile(self.dbffile, self.outfile[1])
       shutil.copyfile(os.path.splitext(self.file)[0] + '.shx', self.outfile[2])

       try:
           shutil.copyfile(os.path.splitext(self.file)[0] + '.prj', self.outfile[3])
       except Exception as e:
           print(e)
       print('Copy the initial file to the output directory')

   def get_shp_shape_records(self):
       try:
           # First read the geometry data and attribute data of the original file, and return the number of geometric data
               self.shx = open("%s" % (self.outfile[2]), "rb")
               self.shx.seek(24)
               shxRecordLength = (unpack(">i", self.shx.read(4))[0] * 2) - 100
               self.numShapes = shxRecordLength // 8
               return self.numShapes
       except Exception as e:
           print(e)
   def get_dbf_shape_records(self):
       # db = dbf.Dbf(self.dbffile)
       with dbf.Table(self.outfile[1], codepage='utf8', default_data_types='enhanced') as table:
           pass
       return table
   def restore_shp(self):
       # Number of records read from shp file

       shp_numrecords = self.get_shp_shape_records()
       # Number of records read from dbf file
       table = self.get_dbf_shape_records()
       dbf_numrecords = len(table)


       # Check whether the number of shp and dbf records is equal
       if shp_numrecords != dbf_numrecords:
           num = shp_numrecords - dbf_numrecords
           if num > 0:
               print('The shp file has {} more records than the dbf file'.format(num))
               for i in range(num):
                   table.open(mode=dbf.READ_WRITE)
                   table.append()
               table.pack()

           else:
               print('The dbf file has {} more records than the shp file'.format(abs(num)))
               table.open(mode=dbf.READ_WRITE)
               for record in table[shp_numrecords:]:
                   dbf.delete(record)
               table.pack()

if __name__ == '__main__':
   file = input('Please enter the path of the shp file: ')
   outpath = input('Please enter the path of the output file: ')

   if os.path.exists(file) :
       record_num = RestoreShp(file, outpath).restore_shp()
       print('complete')
   else:
       print('File does not exist')
   input()

如果你想学习以上代码,我建议逐行运行,慢慢打断点。代码的逻辑和上面的流程图是一致的。

3 人为制造破损文件

现在手头上没有一个破损的shp文件,但是,但是我们可以构造一个破损的shp文件              

1,复制一个dbf作为临时文件。这个文件待会用到。

     

2,在arcgis打开刚刚那个shp,右键它,选择编辑要素,选择开始编辑,如下图


3,画了个圆,点击保存,然后退出arcgis

4,把原先的dbf删除,再把一开始的复制的dbf改名为被删除的dbf名字,完成替换。

5,自此,shp文件就变成了破损的shp文件,拖拽到arcgis,就打不开了。

4 集成到rstool

1、在Qt Designer上画插件的ui

2、将这个ui文件保存为restoreshp.ui

3、在命令行输入:

pyuic5 -o restoreshp.py restoreshp.ui

结果如下:

4、在rstool项目中,修改相关代码。我们查看一下rstool整体的结构,如下:

5、在ui文件夹,创建一个叫做ui_restoreshp.py的文件(我直接复制其他已有的文件,这样在已有的基础上进行修改,更节省时间)

先建立一个restore_shpWidget的类,待会用到。剩下的都是体力活了,修改正确的Ui_Form文件的名字,这里不再细说。

6、修改function文件夹下的messages.py文件,这个文件负责前端界面的提示功能


7、修改主程序入口的文件rstool.py,在开头添加一行代码,导入第5步的创建的restore_shpWidget类


8、在rstool.py中的window类中,增加一行代码,将restoreshpWidget类实例化


9、在rstool.py中的window类中的window_signals函数增加这句,把shp修复界面的按钮以另一个线程的方式串联起来。就是当你点击运行按钮,就在另一个线程运行后端shp修复的函数,这样做的好处是,前端界面不卡顿。


10、在rstool.py中的window类中的init_navigation函数增加这句,目的是在前端的导航栏添加shp修复的菜单。


11、在rstool.py中的window类中的click_prompt_signal函数,添加一行代码,把第6步所创建的新增的shp修复的提示功能加载到rstool中。


12、运行rstool.py进行测试,如果遇到报错,则一个错误一个错误去解决。如果没报错,应是如下界面:


点击“用前必看”按钮,应是如下界面:


接下来进行功能测试。rstool有两种输入参数的方法:

一、点击获取文件按钮,会弹出对话框,让用户选择对应的破损shp文件。

二、直接复制粘贴shp文件的路径到“ 获取文件”按钮的左侧的空白输入框


如果你输出的参数有问题,rstool不允许你点击 “开始修复”按钮


shp修复的速度极快,若完成了数据修复,会弹出一个窗口提示 完成数据修复。

修复后的shp保存在D:\temp\破损\out文件夹中,如下所示。此文件夹不需要提前建立。


我们把修复后的shp拖拽到arcgis,测试是否完成修复。


13、在miniconda环境下,使用pyinstaller进行打包,再进行测试。

打包命令是:

pyinstaller -F -w -i G:\code\rstool\resources\images\icon.ico rstool.py

打包完成后,会在dist文件夹生成ratool.exe文件。


我们再次重复第12步的测试。

最后暂时无报错。

测试过程如下:



5 小结

老规矩,在后台回复rstool获取rstool.exe的下载链接。

rstool暂时集成了四个功能分别是植被色彩增强、shp转kml、shp转dxf、shp修复。

rstool正在开发中,不定期更新,开源地址是https://github.com/ytkz11/rs-tool

欢迎来白嫖!有哪里不对劲的地方也可以指出来。

最后,在我的预想中rstool集成的功能最好具备以下几个特点。

1、具有通用性,尽可能地帮助到更多的同行。

2、具有实用性,确确实实解决实际问题。

3、具有针对性,比如说现在这四个功能是比较少见的,其他软件没有具体的实现,若是其他的软件可以实现,那就使用其他的软件就好了,不要重复造轮子。

如果你有其他想实现的功能,希望集成到rstool中,可以在下方留言区留下你宝贵的建议,一起讨论讨论。



remote sensing
一个专注于测绘、地信、遥感的公众号
 最新文章