4月 17, 2011

Posted in 统计应用 | 12 条评论

SAS多元分析之聚类(2)–proc fastclus

本文主要对SAS做聚类分析的proc fastclus步的应用做一个简单的摘录,相关的理论知识细节,请参见SAS help文档及其他统计学相关文献等。

1.简介

proc fastclus为动态聚类(又称快速聚类),以迭代思想为理论基础,先对样本观测粗略分类,然后按某种最优准则逐步修改分类至最优为止,其适用于观测量大的数据。
步骤为:

  1. 选择若干观测为初始“凝聚点”。(注:凝聚点必须是完整观测,即该观测的各个变量值不能有缺失存在。)

1) 系统顺序选取
2) 系统随机选取
3) 指定初始凝聚点

  1. 根据初始“凝聚点”进行初始分类。

1) 按批初始分类
2) 逐个初始分类

  1. 对分类进行逐步修改优化。

1) 按批修改法
2) 逐个修改法

  1. 确定最优分类。

继续阅读
返回顶部