Nature正刊(演化深度持续学习)Loss of plasticity in deep continual learning

文摘   2024-08-25 20:19   陕西  

最近,Nature正刊登了一篇演化计算(变异与选择)与深度学习结合的工作(进行持续学习),出自强化学习之父(Sutton)团队。论文明确指出了梯度方法和随机、无梯度组件(结合)在深度持续学习中的重要性。



论文正文中明确指出:“The variation and selection is reminiscent of trial-and-error processes in evolution and behaviour…Continual backpropagation brings a form of this old idea to modern deep learning"..."That is, continual backpropagation involves a form of variation and selection in the space of neuron-like units, combined with continuing gradient descent. This idea has many historical antecedents …"


强化学习之父(Sutton)收藏了一篇经典论文:来自MIT的Oliver Selfridge(AI历史上最著名的1956年会议参与者之一,被誉为"AI先驱"):http://www.incompleteideas.net/papers/pandemonium.pdf

文中给出了演化算法的最早雏形之一:虽然1948年图灵在(英国)国家物理实验室提出了“演化搜索”;1958年Oliver Selfridge又是在(英国)国家物理实验室独立提出“演化过程”(已经包含变异、自然选择、与种群等基本搜索概念)进行学习系统的自我改进!
《Loss of plasticity in deep continual learning》引用了这一经典论文,也引用了遗传算法之父(Holland)的两篇经典的遗传算法论文,作为其“Generation-Test”部分的先驱工作。


从学术树来说,遗传算法之父(Holland)是强化学习之父(Sutton)的博士导师(Barto)的博士导师的博士导师。而遗传算法之父(Holland)是参与第一台通用数字电子计算机ENIAC设计的研究人员之一Arthur Burks(后成为冯诺依曼在普林斯顿高等研究院的助手,冯诺依曼的遗著《自我复制》自动机就是由其整理出版)的博士生。冯诺依曼研究的《自我复制》/《元胞》自动机,影响了后来的演化计算与强化学习(研究适应系统)。有趣的是,早期Holland学生(的学生)的博士论文关于《元胞》自动机:一位进入数据库领域开发了著名的关系型数据库模型(获得了图灵奖),一位参与开创了强化学习领域。


文中引用的演化计算的论文如下:


[1] Selfridge, O. G. Pandemonium: a paradigm for learning. In Mechanization of Thought Processes: Proceedings of a Symposium Held at the National Physical Laboratory 511–531 (Her Majesty’s Stationary Office, 1958).

[2] Klopf, A. H. & Gose, E. An evolutionary pattern recognition network. IEEE Trans. Syst. Sci. Cybern. 5, 247–250 (1969).

[3] Holland, J. H. & Reitman, J. S. Cognitive systems based on adaptive algorithms. ACM SIGART Bull. 63, 49–49 (1977).

[4] Campbell, D. T. Blind variation and selective survival as a general strategy in knowledge-processes. Psychol. Rev. 67, 380–400 (1960).

[5] Holland, J. H. Adaptation in Natural and Artificial Systems (MIT Press, 1992).

[6] Stanley, K. O. & Miikkulainen, R. Evolving neural networks through augmenting topologies. Evol. Comput. 10, 99–127 (2002).


编辑&校对:

Qiqi Duan&Chao Wang

EvoIGroup
Evolutionary Intelligence (EvoI) Group。主要介绍进化智能在网络科学,机器学习,优化和实际(工业)应用上的研究进展。欢迎投稿推文等。联系方式:evoIgroup@163.com。
 最新文章