International Journal of Disaster Risk Science近日发表了关于城市地质安全综合评价方法研究的文章,第一作者和通讯作者分别为中国地质调查局南京地质调查中心城市地质研究团队的于博帆以及邢怀学正高级工程师。研究对困扰杭州市城区的主要地质灾害:地面塌陷、地面沉降以及岩溶塌陷进行了易发性制图,结合杭州市的经济、人口数据进行了综合评价,并最终利用可解释的机器学习模型探讨了模型的决策过程,打开了机器学习的“黑箱”。
随着大型城市的不断建设扩张,城市地质灾害与城市可持续发展的矛盾日益显现。对地质灾害进行分区以确定区域范围内灾害发生的风险是灾害防治的重要一环,而杭州市作为中国的特大城市之一,坐落于平原区的主城区曾多次发生地面塌陷、岩溶塌陷以及地面沉降等地质灾害(图1),对杭州市进行地质灾害综合评价具有重要的防灾减灾意义。
图1 (a)研究区地面塌陷分布图;(b)研究区岩溶塌陷分布图;(c)研究区地面沉降分布图
(左右滑动,查看分图)
为了进行准确的易发性评价,文章选取了CatBoost模型,一种梯度提升决策树模型进行灾害预测,最终模型以地面塌陷、岩溶塌陷以及地面沉降三种灾害的AUC值分别为0.92,0.92,0.94,完成了高精度的预测。随后文章将易发性等级划分为低、中、高、极高四个等级进行了各灾害的易发性制图以及灾害综合易发性制图(图2)。
图2 研究区灾害综合易发性图
为了解决机器学习模型的黑箱问题,文章引入了机器学习解释工具SHAP(Shapley Additive exPlanations),其原理基于合作博弈论中的Shapley值,将模型输出分解为特征的贡献度。SHAP能够为每个输入样本计算特征对最终预测结果的影响,帮助理解模型的决策过程。通过SHAP值,可以更清晰地识别模型是如何利用特征进行预测的,进而提升模型的可解释性和透明度。在文章中,作者分别对选取的三种灾害,利用SHAP工具对每种灾害选取的6种评价因子进行了分析,例如SHAP力图,可以以单样本的角度观察每个因子的贡献,红色箭头代表了正向贡献,与其对应的,蓝色箭头代表了负向贡献,且箭头越长贡献越大(图3)。
图3 测试集的SHAP力图
最后,文章将灾害综合易发性图与杭州市2022年的人均GDP数据以及人口密度数据进行叠加,尝试回答杭州市不同区划灾害等级与城市发展之间的关系的问题。结果表明:滨江区与上城区人口密集且经济发展水平高,但同时也面临着很高的城市道路塌陷风险,因此需要格外重视增加相关的监测与防范措施。而钱塘区虽然人口密度较低,但存在众多重点产业,地面沉降风险很高,同样需要给予足够的关注(图4)。
图4 研究区灾害易发性与人均GDP,人口密度叠加分析图
本研究对杭州的地面塌陷、地面沉降以及岩溶塌陷灾害进行了综合易发性评价,同时应用了SHAP可解释模型对模型的预测结果进行了分析,打开了机器学习模型的黑箱,为城市决策者提供了更可靠的判断。最后,本文结合杭州市经济人口数据,提出了贴合杭州市发展实际的灾害治理资源分配建议,为杭州市城市可持续性发展提供了具有参考价值的建议,也为其他城市预防治理城市地质灾害提供了一个可复制的参考模板。
文章链接:
https://link.springer.com/article/10.1007/s13753-024-00578-2