4月 17, 2011
SAS多元分析之聚类(2)–proc fastclus
本文主要对SAS做聚类分析的proc fastclus步的应用做一个简单的摘录,相关的理论知识细节,请参见SAS help文档及其他统计学相关文献等。
1.简介
proc fastclus为动态聚类(又称快速聚类),以迭代思想为理论基础,先对样本观测粗略分类,然后按某种最优准则逐步修改分类至最优为止,其适用于观测量大的数据。
步骤为:
- 选择若干观测为初始“凝聚点”。(注:凝聚点必须是完整观测,即该观测的各个变量值不能有缺失存在。)
1) 系统顺序选取
2) 系统随机选取
3) 指定初始凝聚点
- 根据初始“凝聚点”进行初始分类。
1) 按批初始分类
2) 逐个初始分类
- 对分类进行逐步修改优化。
1) 按批修改法
2) 逐个修改法
- 确定最优分类。