Kmeans和高斯混合模型有什么区别?

文摘   2024-11-12 08:33   辽宁  

通过前面的学习,我们知道Kmeans是基于质心的聚类方法,高斯混合模型则可以看作是一种基于概率分布的聚类方法。

那它们之间有什么区别呢?

其实,高斯混合模型可以看作是Kmeans更通用的版本,它解决了KMeans一些众所周知的局限性。

KMeans的局限性

首先,KMeans只能产生球形聚类。如下图所示,即使数据的聚类本身是非圆形或不规则的,K-means 仍然会试图将其分成圆形或球形的簇。

此外,KMeans执行的是硬分配。也就是说,不会计算每个数据点属于每个簇的概率估计。

最后,它仅依赖基于距离的度量将数据点分配到簇中。

为了更好地理解这一点,考虑在二维空间中有两个聚类——A和B。聚类A的分布比聚类B更广泛。

现在考虑一条位于A和B的质心中间位置的线。

人工智能大讲堂
专注人工智能数学原理和应用
 最新文章