AI岳子 | 机器学习在科学发现中的机遇

学术   2024-07-29 12:26   法国  


摘要:技术的进步极大地提升了计算能力和数据可用性,使得在各个领域能够应用强大的机器学习(ML)技术成为可能。然而,我们在利用ML方法进行科学发现方面的能力,即获取关于自然过程的基本和形式化知识,仍然处于初级阶段。

在这篇综述中,我们讨论了科学界如何越来越多地利用ML技术来实现科学发现。我们观察到,ML的适用性和机会在很大程度上取决于问题领域的性质,以及我们对系统的支配方程和物理属性是否具有完整的(例如,湍流)、部分的(例如,计算生物化学)或没有的(例如,神经科学)先验知识。尽管仍然存在挑战,但原则上使用ML正在为基础科学发现开辟新的途径。在这些不同领域中,有一个共同的主题是ML使研究人员能够处理以前对经典分析和数值研究来说难以解决的复杂观察数据。

总结和展望机器学习的发展已经带来了几项科技进步,这些进步在几年前还被认为是遥不可及的。从有效解决图像分类和分割问题,到赢得围棋比赛,当代数据驱动方法的发展为科学发现提供了独特的机会。本文重点介绍了那些能推动科学前沿超越迄今所能达到的最先进方法。

为了具体说明这种潜力,我们根据可用于解决问题的传统科学知识水平对现有方法进行了分类。这些设置范围从支配方程已经被很好地理解和部分理解的情况,到关于底层支配方程和原理几乎完全没有正式知识的情况。正如总结性的表1所强调的,机器学习在进行新科学发现方面的潜力涵盖了各种方法论途径。

这些方法可以支持广泛的科学发现,例如揭示物理系统的基本支配原理,使高度复杂系统的参数评估成为可能,诱导我们只有部分确定性理解的系统中未知的行为,并在复杂多尺度系统中因果推断原理。机器学习在进行科学发现方面的潜力覆盖了从理论到应用设置的广泛应用领域,涵盖了物理学、数学、化学和生命科学等。我们认为,持续关注这类发现任务代表了机器学习在现代科学实践中更有成效和有益的用途之一,使得科学在以前难以想象的时间框架内实现飞跃。

然而,使用数据驱动方法推动科学前沿也带来了自身的一系列挑战。尽管机器学习方法的一个明显优势是与它们学习和高效表征复杂系统的能力相关,但这通常需要大量的训练数据来成功捕捉底层现象。在某些情况下,数据可用性可能不是主要障碍,然而,在科学发现的实例中,数据稀缺经常是一个障碍,例如因果描述不频繁的天体物理事件,推断尚未测试(或尚未发现)的药物剂的描述,或实现罕见病病理生理现象的机械理解。有趣的是,补充的机器学习方法可以促进适合训练数据的创建(例如加速计算模拟),或避免对大型数据集的需求(例如通过自我监督的超出分布的泛化,维度折叠等)。

因此,即使是那些本身不导致科学发现的机器学习技术,也可能在可用训练数据稀缺的情况下促进发现。对机器学习驱动的科学发现进行验证是另一个挑战,其中可能不存在用于确认输出描述的底层支配原则。然而,对机器学习驱动的发现进行验证不应该与对确定性驱动的发现进行验证有何不同,其中假设驱动的调查、观察确认和比较基准测试都可以帮助确认推断的行为或描述。

最后,当利用机器学习进行科学发现时,一个挑战在于要克服标准深度学习框架的黑箱性质,以获得形式化的知识。训练好的网络的黑箱设置并不直接向人类开放,特别是网络权重中隐藏的内部化神经网络数据很难解释,这使得获得形式化知识和理解变得具有挑战性。

在科学发现的背景下,这对于知识的形式化以及公众传播和接受来说是一个主要挑战。可解释和可解释的机器学习提供了一种替代方法,在这种方法中保留了人类的监督,然而,这些方法在许多应用中仍然具有挑战性。假设可以部署可解释和/或可解释的机器学习。在这种情况下,发现的新知识或提出的科学进步可以在现有的概念和技能中得到确认和验证,确保科学上的知识进展。

随着机器学习技术的快速发展,科学界在广泛的学科领域中正受益于将这些方法纳入其研究方法和工具箱,为科学发现开辟了新的机会。虽然这带来了新的挑战,但我们相信最近的发展表明,我们可以期待机器学习技术进一步演变,以适应各学科的具体需求。这些技术很可能提供机会来缓解最近作品中概述的限制,使新的发现成为可能。




上面这个文章写的流弊不?其他号转发量都2000了。大家应该也看到过类似的文章,不管什么文章,甚至是SIAM那种非常高深的算法,公众号这面转手就是一篇解析。感兴趣可以把你们看到的一些文章粘贴到这里看看是不是AI写的。

https://smodin.io/zh-cn/ai内容检测器

岳子作为一个坚持原创解析算法的自然人,深感AI写作的强大,同时感到自然人的不足。岳子决定也搞点之前不屑于干的事情。天下文章大家抄嘛。今天这个文章就是。反正复制粘贴不费时间。但是岳子有底线,坚持自己解读算法,让大家看得懂,看的明白。下面几个是岳子亲自看算法嚼醉了,纯手敲的:

要看原创嚼碎了的前沿算法解析,这里是流弊的CFD界!

CFD界
更多的原创CFD开脑洞算法
 最新文章