早上开会刚说到符号回归,看文献就看到了符号回归,那网红丁就快速过一遍下面的文章好了。
Y. -H. Sun, T. Huang, J. -H. Zhong, J. Zhang and Y. -J. Gong, "Symbolic Regression-Assisted Offline Data-Driven Evolutionary Computation," in IEEE Transactions on Evolutionary Computation, doi: 10.1109/TEVC.2024.3482326.
这篇工作,面向的问题是离线数据驱动的优化问题(离线数据驱动的优化,了解一下?),也就是在优化过程中没有新数据来更新代理模型的情况,那么优化完全依赖离线数据构建的代理模型做引导,非常太容易被误导,那么代理模型的精度和鲁棒性要求会比优化过程中能够采样(在线问题)的情况下要高,过去网红丁也介绍过几个解决这方面挑战的工作,如下:
今天读到的这个工作(SR-DDEA)的代理模型是符号回归,符号回归算是一种可解释机器学习方法,通过进化优化方法找到数学表达式,其实比常用的回归模型有更大的自由度,这也是这篇文章采用符号回归做代理模型的动机。
当然这个想法并不意外,但是为什么我们今天才看到这个工作呢,其实目前的主流符号回归方法要克服下面两个困难:缺乏多变量操作和难以解决高维决策变量。关于这两点,SR-DDEA采用了一种新的函数符号集合,见下表:
此外,解码模式是一种队列编码方法,见下图:
当然为了保证代理模型更加鲁棒,SR-DDEA也和DDEA-SE一样采用了选择性集成学习,以聚类的方法来选择多样的模型进行集成。相关实验结果如下:
确实模型多样性上来了之后,优化结果也相应提升了。和之前一样网红丁把原文链接埋在文末“阅读原文”中去了,更多细节还是要看原文呀。
最后,欢迎转载,欢迎留言,欢迎扔砖,欢迎吐槽,欢迎提问,还有欢迎关注。