简介:层次聚类算法 (Hierarchical Clustering Method)又称为系统聚类法、分级聚类法。层次聚类算法又分为两种形式:(1)凝聚层次聚类:首先将每个对象作为一个簇,然后合并这些原子簇为越来越大的簇,直到某个终结条件被满足。(2)分裂层次聚类:首先将所有对象置于一个簇中,然后逐渐细分为越来越小的簇,直到达到了某个终结条件。
基本原理:在分裂或者从上至下的聚类方法中,所有的观测值被分配给了一个单一的聚类,然后将这个簇分开至至少两个相似的簇. 最后我们在每个聚类上进行递归,直到每个观察值只有一个聚类。在凝聚或者自下而上的聚类方法中,把每个观测值分配到他自己的聚类中,然后计算每个聚类之间的相似度(例如:距离),并且结合两个最相似的聚类。最后,重复直到仅剩下一个单一聚类。
主要应用:分类
相关案例: