高斯过程回归（Gaussian Process Regression）——数学基础

学术科技 2023-10-17 17:45 黑龙江

高斯过程回归（Gaussian Process Regression）是一种非参数的回归方法，它基于高斯过程模型来建模数据的分布情况。在高斯过程回归中，假设数据点之间的关系服从多元高斯分布。

具体来说，考虑有一组输入变量X和对应的输出变量Y，我们希望通过这些已知数据点来建立一个模型，进而预测未知输入变量对应的输出变量。高斯过程回归的目标就是要估计在给定输入变量X的情况下输出变量Y的条件分布。

高斯过程回归的关键在于定义一个核函数（也称为协方差函数），用于度量不同输入变量之间的相似性。常用的核函数有线性核、多项式核、高斯核（也称为径向基函数核）等。通过核函数，可以计算任意两个输入变量之间的协方差。

在使用高斯过程回归进行预测时，通过计算输入变量的协方差矩阵以及已知数据点的输出变量的协方差矩阵，可以得到未知输入变量的输出变量的均值和方差。均值表示对应输入变量的预测输出，方差表示预测输出的不确定性。

高斯过程回归具有较好的灵活性和泛化能力，可以适应各种不同的数据分布和模式。此外，高斯过程回归还提供了对预测结果的不确定性估计，对于决策和控制问题具有重要意义。

在实际应用中，高斯过程回归可以用于机器学习、数据挖掘、优化等领域，特别适用于小样本、非线性、噪声较大的问题。

数学基础

多元高斯分布

一元高斯分布

一元高斯分布的概率密度函数为

其中表示平均值（对应于曲线的峰值），表示分布的标准偏差，它给出了分布的宽度的估计：越大，分布越宽。计算积分

发现曲线下的面积，代表分布的总概率，等于，因此它出现作为一个归一化常数。

一元标准高斯分布

设，即，将代入至（1）中进行换元，

其中，

此时定义随机变量服从一元标准高斯分布，记为，均值为，方差，概率密度函数(pdf)写为：

按照中心极限定理，当对大量独立同分布的随机变量进行相加和归一化时，这些变量的总和会趋向于服从高斯分布。换句话说，无论原始随机变量的分布是什么，当样本数量足够大时，它们的总和的分布会接近高斯分布。这是因为独立同分布随机变量的总和趋向于平均值，并且根据高斯分布的特性，随着样本数量增加，总和的分布将趋近于高斯分布。所以研究高斯分布在数学、金融学、物理学和工程学等领域有着重要的意义。

多元标准高斯分布

将上述一维的随机变量扩展至高维，即由单独实数变为向量，设随机向量为,其中随机向量内各元素服从一元标准高斯分布,同时假设各元素相互独立，计算该随机向量的联合概率密度函数：

由于随机向量内各随机变量服从标准高斯分布且相互独立，所以均值为零向量，协方差（多元分布中的“方差”）为单位阵，写为，

多元高斯分布

讨论更为一般的情况，去掉随机向量内各随机变量服从标准高斯分布且相互独立的假设。设随机向量为,其中随机向量内各元素服从一元高斯分布.

为了得到这个多元高斯分布的联合概率密度函数，可使用上述求得的多元标准高斯分布作为求解的桥梁，则问题转化为如何将多元高斯分布转化为多元标准高斯分布。依然采用上述线性变换的方法进行换元，即设并代入至(6)中，此处设。

此时联合概率密度函数的微分项为，类比一元高斯分布换元过程中，多元高斯分布换元中需要求雅各比矩阵的行列式以将微分项换为，，那么概率密度函数写为：

为后续计算方法，利用行列式性质对进行改写：

式(8)改写为：

设（换元），最终得到的式(8)为

注意到，此时的就是随机向量的协方差矩阵，证明如下

下图是以二元高斯分布为例的概率分布图：

多元高斯分布的条件概率

在概率论和统计估计中，我们经常遇到这样的问题：有多个高斯随机变量的联合分布，其中我们能够观察到其中一个或多个向量的具体实现。根据这个观察，我们想要知道剩余的向量的位置（即均值）和协方差。这被称为寻找未观察向量的“条件分布”。两个高斯随机变量的联合分布写为：

在给定的情况下，分布的位置为：

协方差为：

证明：

设和是联合高斯随机向量（请注意，为了简化符号表示，这里不在特地区分随机向量和其实现），的联合分布为：

设

通过上述变换，可得出：，这里需要求解，使得和不相关，即二者相互独立。通过确定以解出.

假设这里我们设定为条件，即认为是定值，不再是随机变量。由于和相互独立，依旧是随机变量，并未受到影响，因此

综上我们得出了条件概率的分布：

同理也可得出的分布。

下期将对高斯回归过程、核函数进行具体讲解，含MATLAB、C++、python实现，敬请关注本公众号！

控我所思VS制之以衡

专注于控制理论、控制工程、数学、运筹、算法等方面的经验积累与分享

最新文章

决策分析新武器：深度解析Dempster-Shafer(DST)证据理论

DS证据理论的Python实现源代码

基于非线性增强比例导引的导弹-目标交战仿真软件（含MATLAB源码）

太震撼！美国民兵Ⅲ型核导弹制导系统和计算机内部欣赏

控制系统的校正方法(3)：案例分析(附资源)

“筷子夹火箭”首次成功！SpaceX星舰第五次试飞！

关于在科研活动中规范使用人工智能技术的诚信提醒

控制系统的校正方法(2)：补偿方法

控制系统的校正方法系列(1)：PI控制与PID控制

滑模观测器

《线性代数的艺术》：仅12页涵盖线性代数全部重要要点，全文分享，值得收藏！

重磅，2023年度国家科学技术奖励名单揭晓（全名单）

《天际回响：中继卫星轨道确定》（含美国中继卫星系统(TDRSS)系统仿真代码）

嫦娥五号月球轨道交会导引策略设计

控制系统的“脆弱”与“坚韧”:灵敏度的双刃剑

限时删！太牛了！最强大模型：ChatGPT-4，强烈建议大家学一学…

浅析最大似然估计：用数据说话

火箭全程模拟软件（含源码）

我国组建军事航天部队：安全进出、开放利用、危机管控、综合治理、和平利用

预设性能控制——性能函数

预设性能控制（含视觉仿真代码）

稳定性与状态矩阵特征值

彪马PUMA优化器（含MATLAB代码）

Sora物理悖谬的几何解释

小白必看：控制系统的基本分析框架（视频讲解）

红包封面奉上，祝愿大家龙年龙行龘龘前程朤朤生活䲜䲜！

遗传算法详解（含代码实现）

一张数学地图带你尽览数学分支

从贝叶斯的角度理解卡尔曼滤波器

不会求解Cost Function？如何进行非线性优化？试试『高斯牛顿解法』！

泛函术语辨析：欧几里得空间、希尔伯特空间、巴纳赫空间、赋值范数空间、内积空间

我们如何快速用上官方Gemini Pro？3分钟帮你搞定！

概率与统计基础知识简明速查手册，建议收藏！

[视频]矩阵谱分解、奇异值分解的可视化理解

2023年工程院、科学院院士增选当选院士名单公布！祝贺！

万物皆可“贝叶斯”——高斯分布的贝叶斯推断

中心极限定理的理解

万物皆可“贝叶斯”——Bayes' Theorem-贝叶斯定理

高斯过程回归（Gaussian Process Regression）——具体理解

高斯过程回归（Gaussian Process Regression）——数学基础

四旋翼无人机的物理模型及控制方法

粒子群算法的快速理解(含MATLAB实现)

对Lipschitz连续的理解

[分享]傅里叶级数,傅里叶变换,离散时间傅里叶变换,离散傅里叶变换,快速傅里叶变换,拉普拉斯变,Z变换之间的关系

论文辅导 | 科研新手，如何搞定第一篇SCI/SSCI论文？

[工具分享]final2x:再模糊的图片放到今天也能变成4K(含资源、安装与使用教程)

583位/655位，中国科学院/中国工程院院士有效候选人名单公布！

指导“深度学习+控制理论”做到1+1>2的方法论

一文读懂策略梯度算法：REINFORCE、Actor-Critic、A2C

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉