机器学习在氮循环领域的应用研究进展
文摘
科学
2023-09-05 11:00
江苏
单位:华东师范大学地理科学学院,地理信息科学教育部重点实验室;崇明生态研究院;自然资源部超大城市自然资源时空大数据分析应用重点实验室;中国科学院大气物理研究所大气边界层物理和大气化学国家重点实验室氮循环是地球圈层中水-土-气-生多介质、多界面的复杂过程(图1),与土壤健康、粮食安全、全球变暖、空气污染、水体质量等环境问题密切相关。近年来,得益于计算机技术的快速发展和海量、多源数据的产生,机器学习迅速成为研究氮素循环强有力的工具。如图2所示,关于机器学习和氮素交叉研究的论文数量呈现逐年增长的趋势,2010年以来更是飞速发展。机器学习已被证明具有强大的表征和泛化能力,可以进一步认识多源、多尺度、多介质、复杂高维的时空关系,研究者可以通过训练模型获取、筛选、分析和可视化生物地球化学数据;模拟氮循环重要微生物或非生物转化过程;探索发现潜在转化机制,解决氮素失衡导致的土壤(如土壤酸化)、大气(如臭氧层空洞)和水体(如富营养化)等生态安全问题。单一的、集成的、或与基于物理过程模型混合建模的机器学习算法与氮素经典的研究手段结合被应用于生态系统氮素循环各个时空尺度的研究(图3)。机器学习凭借更灵活的模型结构和更高的计算效率,能够定量构建社会、经济、环境要素到氮素浓度变化的动态响应关系,从不断增长的地理空间数据流中提取模式和见解,目前它承接了室内培养实验、田间野外试验、大气外场观测、遥感观测和分子生物学手段产生的高通量数据流,进行了各个研究尺度上的模型模拟。从单细胞、微生物纯菌等微观尺度,到培养瓶、盆栽等小尺度,以及小区、田块、流域等中等尺度,再到国家、洲际和全球等大尺度,建立了包含海洋固氮、预测硝化速率及N2O的排放等多个全球尺度时空模型,氮肥的输入和氮沉降相关的多个农业模型,改善水体富营养化的反硝化过程和厌氧氨氧化模型,以及识别固氮基因的分子生物学模型在内的各种定量评估氮素循环过程、驱动机制和环境影响的手段。随着计算机性能的突破,深度学习和强化学习的持续发展,易于使用的机器学习工具箱的出现,预示着未来10年机器学习算法针对地球科学领域的预测研究将继续呈现持续性的增长。通过将强化学习和深度学习结合,还能实现与环境交互,制定完整解决方案,自动改进算法,建立动态自动化系统。但在实际应用方面,未来还需要考虑模型的复杂性和可解释性,对此建议根据从地球系统物理模型派生的合成数据测试机器学习方法的性能,在遵守物理定律的框架下,同时在理论薄弱的地方发挥数据驱动和经验驱动的协同作用。未来基于大数据和机器学习技术的特征工程和模型融合的研究,将会给氮循环领域的数据分析与建模带来巨大变革。同时,将机器学习与基于物理过程的模型相结合解决氮循环过程中的复杂问题,可为服务国家“双碳”战略以及控制全球变暖、空气污染等环境问题提供重要支撑。图2 基于Web of Science以“机器学习”和“氮”为关键词搜索到的世界各国已发表论文的数量
(访问日期2022年7月15日)
图3 机器学习各类算法性能和可解释性之间的权衡以及各自优势
吴电明,华东师范大学教授,博士生导师。2015年博士毕业于德国马普化学研究所和中国科学院遗传与发育生物学研究农业资源中心,随后在德国马普化学研究所从事博士后研究工作,2017年入职华东师范大学地理科学学院。主要研究方向为土壤与大气界面活性氮循环。目前兼任中国土壤学会氮素工作组委员,iMeta执行副主编,Frontiers of Agricultural Science and Engineering青年编委,Frontiers in
Environmental Science评审编委。曾获得中国科学院优秀博士论文、中国科学院院长特别奖等。主持国家自然科学基金面上和青年项目、上海市“浦江人才计划”项目等。以第一作者或共同作者在The ISME Journal、Environmental Science and Technology、Soil Biology and Biochemistry、PNAS(第二作者)和Science(第四作者)等期刊发表论文40余篇,授权发明专利2项,参与制定国家标准2项。