点击上方“Fundamental Research”关注我们
危险废物非法倾倒场址分布范围广、随机性强,面向有限监管经验下的危险废物非法倾倒监管难题,本研究创新性地开发了基于半监督学习的集成模型,利用小样本历史监管数据,通过迭代挖掘非法倾倒地点的潜在特征,实现非法倾倒场址的精准预测。进一步地,以江苏省为研究区域进行模型应用,研究结果发现,约68%的非法倾倒均发生在该模型所预测的高风险区域,表明了该模型的可靠性,利用该方法得到的非法倾倒风险热点可以为监管资源的优化配置提供科学参考。
中文题目:利用人工智能技术精准预测危废非法倾倒场址
英文原题:An ensemble machine learning model to uncover potential sites of hazardous waste illegal dumping based on limited supervision experience
通讯作者:方 文,南京大学
第一作者:耿敬华,南京大学
关键词:危险废物;非法倾倒;机器学习;风险预测;半监督学习
背景介绍
危险废物非法倾倒是危废环境风险的主要源头,也是危废环境违法行为的主要形式。危废非法倾倒事件后果严重,容易造成严重的土壤、地下水污染及人体健康风险,加强非法倾倒监管是危险废物风险防控的关键环节。然而,非法倾倒的地点呈现大范围、随机性、隐蔽性高的特点,如何科学准确预测非法倾倒高风险区域,将有限的监管资源优先分配至更高风险的区域是亟待解决的环境管理难题。
针对这一问题,本研究中引入了半监督机器学习中的PU learning 算法,它可以利用一个仅由有限的正样本和大量无标签样本组成的集合来构建模型。相比于传统的机器学习方法,PU learning方法不仅可以从有限的案例中挖掘信息,还可以充分利用无标签样本补充信息,从而建立广义模型,帮助我们识别出区域内可能发生非法倾倒的地点。
研究成果
开发了基于PU Learning算法的集成模型来预测研究区域内的非法倾倒风险热点,模型示意图如图1所示,包括数据集重构、模型训练和概率计算三个阶段。在数据集重构阶段(图1a),首先将研究区域划分为1km边长的网格,其中,发生非法倾倒的网格记作正样本,其他网格记作未知样本。由于原始数据集存在明显的类别不平衡,通过随机抽取未知样本,与已知的正样本组成1:1的混合二分类子集。重复抽取5000个混合子集,随机抽取80%用于基分类器训练,剩下20%用于基分类器性能评估。在模型训练阶段(图1b),分别采用了五种二分类算法,每种算法下均训练了5000个基分类器。在结果计算阶段(图1c),将基分类器的结果根据一定规则进行加权平均,即可得到最终预测的非法倾倒概率。
图1 基于PU Learning的集成模型框架。(a)数据集重构、(b)模型训练和(c)概率计算。
结果验证
我们以江苏省为例,预测得到了江苏省1km2网格的危险废物非法倾倒风险热点分布(见图2),同时,将2018年的实际案例用于模型结果验证。验证结果表明,分别有68.1%和62.2%的验证案例位于风险等级为8~10的区域,而且该模型在高风险区域的验证结果明显优于判别分析等统计分析方法(见图3),可见该模型的预测结果很可靠。该方法可以作为辅助决策工具提高执法监管效率,为资源优化配置提供有价值的参考,助力精准执法和现代化环境风险智能监管。
图2 (a)PU-KNN和(b)PU-RF预测的研究区域内危险废物非法倾倒风险水平空间分布。黑色三角形表示用于验证的实际倾倒点位。
图3 验证点位在基于PU-KNN、PU-RF和判别分析模型预测结果中的风险水平分布及累积百分比曲线。1-10级代表从低到高的非法倾倒风险水平。
主要作者简介
方文 南京大学环境学院助理教授/特聘研究员,博士生导师。主持国家自然科学基金面上项目、青年项目、泰州市国家智能社会治理实验子基地(环境治理)项目、江苏省碳达峰碳中和科技创新专项子课题等10余项。在Nature Communication、Environmental Science & Technology等发表学术论文40余篇。授权国家发明专利8项,获得软件著作权6项。获日内瓦国际发明展金奖、 环境保护科学技术二等奖等。
耿敬华 南京大学环境学院2023级博士生,以第一作者身份发表SCI一篇。
引用本文
Jinghua Geng, Yimeng Ding, Wenjun Xie et al., An ensemble machine learning model to uncover potential sites of hazardous waste illegal dumping based on limited supervision experience, Fundamental Research, 4(4) (2024) 972-978.
原文链接(复制到浏览器中查看):
https://www.sciencedirect.com/science/article/pii/S2667325823001954
关于Fundamental Research
Fundamental Research是由国家自然科学基金委员会主管、主办的综合性英文学术期刊。创刊于2021年,期刊立足反映国家自然科学基金资助的优秀成果,全方位报道世界基础研究前沿重要进展和重大创新性成果,提升中国基础研究和中国科学家在国际科学界的显示度和影响力,为中外科学家打造一个高端的国际学术交流平台。内容涵盖数学物理、化学化工、生命科学、地球科学、工程与材料科学、信息科学、管理科学、健康医学、交叉科学等领域,设置Article、Review、Highlight、Perspective、Commentary等栏目。期刊已被ESCI、Scopus、DOAJ、PubMed、CAS(美国化学文摘社)、CSCD(中国科学引文数据库)、CSTPCD(中国科技论文与引文数据库)等国内外知名数据库收录。2023年影响因子5.7,位于综合性期刊Q1区。欢迎广大科研工作者关注、投稿、引用!
扫描或长按识别下方二维码关注我们
期刊主页:
www.keaipublishing.com/en/journals/fundamental-research/
文章阅读:
www.sciencedirect.com/journal/Fundamental-Research
投稿系统:
www.editorialmanager.com/fmre
查看更多本期信息,点击文末“阅读原文”,欢迎阅读、下载及引用!
喜欢本篇内容请给我们点个
在看
点击“阅读原文”了解更多