简介:K均值聚类算法(k-means clustering algorithm)是一种迭代求解的聚类分析算法,是非监督学习算法的一种,其算法思想大致为:先从样本集中随机选取K个样本作为簇中心,并计算所有样本与这k个"簇中心"的距离,对于每一个样本,将其划分到与其距离最近的"簇中心"所在的簇中,对于新的簇计算各个簇的新的"簇中心"。
基本原理:随机设置K个特征空间内的点作为初始的聚类中心,对于其他每个点计算到k个中心点的距离,选择最近的一个聚类中心点作为标记类别,接着对着标记的聚类中心,重新计算出每个聚类点的平均值,如果计算得出的新中心点与原中心点一样,那么结束,否则把新的平均值点作为新的中心,重新进行第二步过程。
主要应用:分类
相关案例: