顶刊必备的图,原来这么简单!t-SNE降维,特征可视化,可解释性,深度学习故障识别,回归预测的必备工具!2个应用示例,直接运行!

文摘   教育   2024-12-27 09:06   江苏  
适用平台:Matlab2021及以上
你肯定见过这些顶级期刊在做论文中的特征可视化工具:t-SNE;出来的图都非常好看,能够给专家及读者留下非常好的印象,这是科研的必备工具!尽快拿下!
t-SNE的作用:当我们处理高维数据时,很难直观地理解数据之间的关系。t-SNE的目标是帮助我们在一个更低维度的空间中(通常是2D或3D)对数据进行可视化,同时保留数据点之间的相似性关系。通过一些数学变换,将原始信息从复杂的高维度(比如100维)变成一个简单的低维度(比如2维或3维)的样本分布图
计算步骤:
  • t-SNE的核心思想是保持高维空间中数据点之间的相似性关系,尽量在低维空间中保持相似的关系。简单说,如果在高维空间中两个点很相似,它们在降维后的低维空间中仍然要尽量保持相似。

  • 这个算法的数学原理涉及到概率分布和距离的概念。它首先计算高维空间中点与点之间的相似性,使用一个概率分布来表示这种相似性。然后,在低维空间中,它再计算点与点之间的相似性,并构建另一个概率分布。

  • t-SNE的目标是最小化这两个概率分布之间的差异,以确保高维空间中相似的点在低维空间中仍然保持相似。这个差异通常通过使用KL散度(Kullback-Leibler divergence)来衡量。

简而言之,t-SNE让我们在一个更容易理解的低维空间中看到数据点,同时尽量保持原始数据点之间的相似性关系。这使得我们可以更好地理解数据的结构和模式,特别是在局部区域内的关系。
示例1:高维数据进行低维空间可视化

数据的特征(维度)越高,就越难以在低维空间中进行绘制,没有明显的规律性(散乱);用t-SNE降维成二维或者三维较低空间时,数据样本的分布呈现出一定的规律(聚合)。

示例2:CNN-SVM卷积-支持向量机神经网络输入与输出的特征对比

观察刚输入的原始故障样本分布和模型提取特征后全连接层的样本特征分布。

原始样本分布:(样本分散,分布混乱,无明显规律)

模型提取特征后的样本分布:(不同故障样本分离,同类故障样本聚合,特征提取成功)

结果分析:与原始样本相比较,经特征提取后数据样本同类聚合明显,说明CNN-SVM网络模型具有很强的特征提取能力,可以实现有效的故障识别。

完整代码:https://mbd.pub/o/bread/ZZqamJls

欢迎感兴趣的小伙伴获得完整版代码哦~
①点击左下角“阅读原文
②复制搜索上方“上方链接

创新优化及预测代码
免费分享研究理论及方法,基础代码资料,努力提供电力系统相关专业预测及优化研究领域的创新性代码,保质保量!面包多地址:https://mbd.pub/o/yc_yh/work
 最新文章