科研动态丨迁移学习:预测自然环境混凝土的钢腐蚀

文摘   2024-11-05 22:21   吉林  




引言



      读者朋友大家好,本文的内容是我在日常文章阅读当中,整理出来的一篇比较有意思的文章翻译,原文来自Dr.Ji发表在Cement and Concrete Composites的一篇文章,而我本人的主要研究方向是金属腐蚀电化学。因为最近人工智能的炙手可热,不少的学者在各个领域都借此东风,向智能化靠拢。而我也在自己研究的基础上,同时选修了《数据解析学》这门课,翻译和整理了一下文章作者的一部分内容作为分享。在数据特征进行解析和机器学习应用,腐蚀特征分析上,这篇论文有很多地方都是值得借鉴的。




论文背景



       首先,目前常见的预测钢材腐蚀的模型,包括经验模型,电化学模型和机器学习模型。

       经验模型的预测,一般都以回归公式的形式呈现,具有应用上的方便性和实用性。电化学模型以电化学原理为基础,利用有限元法模拟钢表面发生的电化学反应,建立腐蚀过程并预测钢筋的腐蚀速率。然而,经验模型和电化学模型只能预测与模型开发和校准所采用的环境设置和材料特性基本相同的钢铁腐蚀,难以适用于实际的复杂腐蚀环境。




迁移学习



      机器学习的预测有效性已经在特定的数据集中得到证实,但其对更现实和更复杂的场景(例如自然环境下混凝土中的钢材腐蚀)的外推性和适用性仍然不确定。
       迁移学习是机器学习的一个重要分支,旨在通过利用从相关源任务中获取的知识,提升模型在目标任务中的表现。不同于从头开始训练模型的传统机器学习,转移学习通过预训练模型,不仅减少了训练时间,还显著提高了在数据有限情况下模型的泛化和性能。
       转移学习通过知识迁移机制,克服了目标任务从头学习的挑战。
Fig. 迁移学习(TL)和 机器学习(ML)



数据来源



      数据来源于之前的研究以及补充实验,包含共计240个数据集(144个源领域数据集来自之前的研究,96个来自作者补充实验)

 实验设计:根据具体数据需求,设计了96个实验,涉及水泥砂浆的配合比和暴露条件,测试了氯离子含量和相对湿度等多个因素。






数据解析方法



     
  数据特征:本研究数据包括14个与腐蚀因素分析相关的特征(如水泥比、氯离子含量和孔隙率)。使用Spearman相关系数和随机森林回归(RFR)方法,识别出与腐蚀率高度相关的特征。之后采用SHAP(SHapley Additive exPlanations)方法解释不同特征值对腐蚀预测的影响
Fig. 240组腐蚀速率分布直方图
   红色表示两个特征之间呈正相关关系,即一个特征的值随着另一个特征值的增加而增加。相反,蓝色表示负相关,表示一个特征的值随着另一个特征的值的增加而减少。颜色的强度和圆圈的大小表示相关系数的大小。当相关系数绝对值超过0.8时,表明两个特征之间的相关性较强。
      可以看出,显示强相关性的特征组包括(pH, log [Cl-]/[OH-]),(TCC, FCC), (DoS,含水量)。

Fig. 14个特征之间的Pearson相关系数
      为了提高机器学习模型的准确性,必须消除冗余特征。在去除冗余特征时,重要的是要考虑每个特征对腐蚀速率的相对贡献。通过两种相关系数的筛选,最终明确了6个关键特征。
Fig.   Spearman和RFR相关系数表征各参数对腐蚀速率
       特征选择方法提供了特征对腐蚀速率的相关性和贡献的宏观分析(或者说是耦合影响分析),但它在分析单个特征值(单一变量)如何影响腐蚀速率的时存在不足。作者又引入了一种博弈论方法-----SHAP(SHapley Additive exPlanations),量化了特定特征值对模型输出的影响。
       以ER的分析为例,其SHAP值分布范围很广,说明该特征值对腐蚀速率有显著影响。较大的特征值产生负的SHAP值,表明有腐蚀抑制作用。随着ER的增大,SHAP值由正迅速转变为负,然后趋于稳定。这表明,较低的ER促进腐蚀并具有更明显的影响,而较高的ER抑制腐蚀,尽管影响很小。
       由图可知,ER、log [Cl-]/[OH-]和腐蚀电位对腐蚀速率有显著影响。
Fig. 6个输入特征对腐蚀速率影响的SHAP值
       进一步的,虽然6种特征值之间的耦合影响和单一影响被证明了可以对腐蚀速率进行预测,但考虑预测腐蚀速率的各种特征进行排列组合的性能,仍然无法确定。
      采用ANN算法建立的模型在不同特征数组合下的检验RMSE。图上的每个点代表一个特定的组合。结果表明,随着特征数量的减少,总体RMSE逐渐增大,表明模型性能下降。当特征数量减少时,RMSE分布变宽,突出了模型对所选特征的强依赖性。
      作者使用了不同特征组合数量下的最优结果,即图中不同特征数量组合内的最小值对应的组合,随着特征组合的减少,R²减小,MSE上升,模型的性能下降。
Fig.不同特征数组合构建的ANN模型的RMSE



结论归纳



  1. 通过迁移学习(Transfer Learning,TL),可以有效提高机器学习模型预测自然环境下混凝土中钢筋腐蚀速率的准确性。尽管现有的实验室数据只能用于有限的场景,但迁移学习方法能够从实验室条件下的钢筋腐蚀数据中提取知识,并成功应用于自然环境中的腐蚀预测。
  2. 在不同的特征中,电阻率、氯离子与氢氧根离子浓度比、腐蚀电位、孔隙率、含水量和水泥比例对腐蚀速率的预测具有重要影响,特别是电阻率在预测模型中起到关键作用。
  3. 在多种机器学习模型中,人工神经网络(ANN)模型表现出最佳的预测性能。特征的数量和组合在预测腐蚀速率中起着至关重要的作用,虽然增加特征数量通常提高准确性,但特征的选择和组合方式同样重要。
  4. 原有基于实验室数据构建的机器学习模型在预测自然环境下的钢筋腐蚀速率时效果较差,但在没有目标域标签(腐蚀速率数据)的情况下,迁移学习策略显著提升了预测性能,R²值从-0.288提升至0.815。
  5. 通过选择与目标域相似的腐蚀数据和适当的特征提取策略,迁移学习在提高自然环境下钢筋腐蚀速率预测的准确性方面效果显著,结合这两种方法比单独使用任意一种方法更有效。
      总的来说,迁移学习在缺乏自然腐蚀数据的情况下,为混凝土结构中的钢筋腐蚀速率预测提供了一种有效的解决方案。
(翻译自 香港大学土木工程学院  Dr.Haodong Ji 的论文 侵删)
作者  九州大学工学研究院 周
科研动态板块:该板块旨在汇聚智能建造领域的前沿研究成果与学术动态。我们诚邀相关学者和研究人员投稿,分享您在智能建造、建筑信息建模(BIM)、机器人技术等方面的创新研究与实践经验。通过这个平台,我们希望促进学术交流,推动行业发展,共同探索智能建造的未来。

BIM高校学生联盟
促进高校学生了解BIM,提供BIM学习就业资讯。
 最新文章