6.1聚类分析
聚类分析是将物理的或者抽象的数据集合划分为多个类别的过程,聚类之后的每个类别中任意两个数据样本之间具有较高的相似度,而不同类别的数据样本之间具有较低的相似度。
数据聚类算法可以分为结构性或者分散性。结构性算法利用以前成功使用过的聚类器进行分类,而分散型算法则是一次确定所有分类。结构性算法可以从上至下或者从下至上双向进行计算。从下至上算法从每个对象作为单独分类开始,不断融合其中相近的对象。而从上至下算法则是把所有对象作为一个整体分类,然后逐渐分小。
聚类分析的要求
(1) 可伸缩性
(2) 处理不同类型属性的能力
(3) 发现任意形状聚类的能力
(4) 减小对先验知识和用户自定义参数的依赖性
(5) 处理噪声数据的能力
(6) 可解释性和实用性
聚类算法
(1) 划分聚类方法
(2) 层次聚类方法
(3) 基于密度的聚类方法
(4) 基于网格的聚类方法
最后修改: 2023年04月20日 星期四 10:26