数据发布 | CN-MSLU-100K:地块(社区)尺度全国土地利用类别数据集

文摘   2024-08-29 10:09   湖北  

01

数据集介绍




  • 数据标注过程与结果


CN-MSLU-100K是地块(或称社区、AOI)尺度的多级土地利用分类数据集,覆盖区域包括中国81个主要城市 (Zhang et al. 2022) ,研究区域总面积为983,215平方千米。由于这些城市具有不同的空间形态、格局和景观,因此数据集可以较好的描述中国城市的遥感景观,具有代表性。

CN-MSLU-100K数据说明书请点击推送最下方阅读原文,转到UrbanComp官网下载。

在标注任务准备阶段,为了适配地块(社区、AOI)尺度,我们集成了阿里内部的iTAG智能标注平台、宜搭平台和DataStudio平台,开发了AliLBS-CUG多源时空数据人机协作标注平台。

在数据标注阶段,我们基于Data Centric思想提出了一种人机协作的数据集构建框架。在该框架中,数据标注过程由人类专家和机器共同完成,目标是通过迭代来提升数据集的质量和模型的表现。这一框架的详细内容将会在我们即将发表的论文中进行全面阐述,敬请期待。

在数据验证阶段,我们采用了交叉检验方法,将不同志愿者之间的25%的数据用于验证,保证准确率范围在90%至95%之间。最终,我们得到了116,121条数据,其中包括居住用地44,588条、公共服务8,184条、商业服务9,065条、工业用地27,529条和农业与自然用地26,755条。


  • 合作方


本研究的合作单位是阿里巴巴控股集团,为本研究的工作做出了重要贡献。包括但不限于以下内容:
  • 强大的云计算支持:阿里云作为阿里巴巴控股集团旗下的云计算平台,为处理大规模数据集和复杂算法提供了强大的计算能力,提供了高性能计算支持。

  • 高精度测绘地图信息支持:阿里巴巴控股集团旗下的高德集团是全球领先的数字地图服务提供商之一。他们提供了高精度的测绘地图信息,为数据集标注提供了准确的地理位置和地理特征信息。

  • 数据中台与行业前沿算法支持:阿里巴巴控股集团的数据中台(现经过业务拆解,被划分为爱橙科技等部门)是一个集数据管理、数据应用和数据服务于一体的平台,集成丰富的数据资源和数据服务。为本研究提供合作的的LBS团队在人工智能和机器学习领域拥有丰富的经验和技术实力,包括图像识别、自然语言处理等方面,为研究工作提供了有力支持。

此外,我们还要格外感谢岐伟所带领的LBS团队的每一位成员,他们的专业知识、耐心指导和帮助对我们的研究工作起到了至关重要的作用,我们对他们的支持深表感激!


  • 测试集说明与下载地址


为了使大家更好地了解数据集的特点和适用性,我们决定开放一部分测试数据供大家使用。我们从每个类别中选择了部分数据作为测试数据集,并将其命名为CN-MSLU-DEMO-1K和10K。现在CN-MSLU-DEMO-1K完全开放供各位老师和同学使用!

DEMO-1K下载地址:

https://urbancomp.oss-cn-hangzhou.aliyuncs.com/CN-MSLU-DEMO-1K.zip

DEMO-10K下载地址:

https://urbancomp.oss-cn-hangzhou.aliyuncs.com/CN-MSLU-DEMO-10K.zip

10K数据集的解压密码请在本微信公众号(UrbanComp位置智能和城市感知)发送“MSLU-10K密码”获取。


完整版100K获取方式:
完整版数据集暂不开放下载,如有需要请和姚尧老师邮件(yaoy@cug.edu.cn)联系。


  • 反馈与交流


我们欢迎您对研究的建议和交流!

若需要完整版数据进行研究,请联系项目负责人姚尧老师( yaoy@cug.edu.cn )。


02

基于DCAI思想的标注平台




AliLBS-CUG多源时空数据人机协作标注平台是UrbanComp团队联合阿里LBS团队,在阿里巴巴创新研究计划(Air)项目合作中开发的地理语义标注平台。该平台基于Data Centric AI (DCAI)思想,目的是辅助在全国、全球大尺度土地利用、城市功能、社会经济识别和监测中,对多源时空大数据进行动态展示,支撑微观尺度人机协作标注和多尺度样本集快速建立。该平台耦合多种阿里内部高性能存储、计算平台,打通了不同平台间联动困难的壁垒。本平台经过多次版本迭代,实现了符合相关需求的操作简便、响应快速的人机协作智能标注。

AliLBS-CUG标注平台只是一个开始,未来的研究会对基于DCAI的平台进行进一步的研究,敬请期待!


03

感谢名单




我们从地质大学(武汉)的地理信息等相关专业召集了56名志愿者同学参与标注工作。在此,我们衷心感谢每一位志愿者同学的辛勤付出!

以下是志愿者名单,按照拼音字母顺序横向排列,不分先后:
曾城泷戴良洋董安宁樊明
范云鹏冯羽彤高荣徽郭延铎
郭子豪郭紫锦韩佳澎韩葳奇
胡志辉胡子敬黄坤姜家政
江瑛李贵程李昊然李建锋
李锦鲜李思宇梁琳刘航甫
刘佳耀刘宇骁马跃恒裘嘉楠
冉耘博任斐然尚青欣汪玉笳
王斌王慧纹王芊卓王兆歆
尉锐武浩夏迎兵肖诗宇
熊凯路徐苏琪徐争薛晨阳
杨明斯喻承龙张凯楠张翔
赵传成赵业博周文海周宇航
朱坤坤朱恰祝翰林卓星语


04

参考文献




DCAI-CLUD Model:
  • Wu, H., Jiang, Z., Dong, A., Gao, R., Yan, X., Hu, Z., … Yao, Y. (2024). DCAI-CLUD: a data-centric framework for the construction of land-use datasets. International Journal of Geographical Information Science, 1–24.

本论文推送点击这里




你可能感兴趣


论文 | DCAI-CLUD:以数据为中心的土地利用数据集构建框架
论文 | 融合多模态数据的城市土地利用识别和不确定性分析
论文 | 基于多时相兴趣点嵌入向量的无监督土地利用变化检测
论文 | 手把手教:用兴趣点数据和自然语言处理技术开展土地利用分类
教学 | 基于多源数据融合的土地利用分类模型




UrbanComp位置智能和城市感知
中国地质大学(武汉)地理与信息工程学院姚尧老师课题组,UrbanComp@HPSCIL的科研发布公众号。研究方向为地理位置智能、时空数据挖掘和可计算城市科学。团队主页:https://www.urbancomp.net。
 最新文章