报告题目:机器学习的数学原理
报 告 人:鄂维南教授,Princeton University
报告时间:2020年10月22日星期四下午4点
报告地点:清华大学理科楼A404
报告摘要:
现代机器学习的核心问题是怎样有效地逼近一个高维空间的函数。
传统的逼近论方法会导致维数灾难,这是对许多领域来说困惑了我们多年的问题。
在这个演讲里,我们将介绍以下几方面的内容:
1.怎样建立起一个数学理论?
这里的问题本身跟传统的数值分析基本一样。不同的是机器学习需要处理的核心问题是维数灾难。所以我们需要建立起一个高维数值分析理论,包括逼近论,先验和后验误差估计,优化理论等。这个理论会帮助我们理解什么样的模型和算法没有维数灾难。
2.怎样formulate 一个好的机器学习的数学模型?
正确的方法是首先在连续的层面formulate 好的机器学习的模型,然后采用数值分析的想法,对这些连续模型作离散化而得到所需要的机器学习算法。我们发现许多神经网络模型,包括残差网络模型,都可以通过这种途径得到。
因为有一个好的连续模型作为背景,这样得到的机器学习模型和算法自然就有比较好的性质。
3.实际应用中有一些比较奇怪的现象,比方说double descent。怎样解释这些现象?
实际应用中人们也没有按照前面所说的套路来做,那为什么其效果也还很好呢?
4.哪些问题还有待解决?