5月 11, 2011
SAS多元分析之判别(1)–proc discrim
本文主要对SAS做判别分析的proc discrim步的应用做一个简单的摘录,相关的理论知识细节,请参见SAS help文档及其他统计学相关文献等。
1.简介
判别分式是判断样本所属类别的一种统计方法,常用的判别分析法有:
- 距离判别法:首先定义新样本到总体的距离,然后考察样本到各个总体的距离,把新样本判归至与其距离最近的总体。常用距离使用马氏距离。
- 贝叶斯(Bayes)判别法:更具Bayes统计思想,计算新样本属于各个总体的条件概率,比较各个条件概率的大小,将新样本判归至条件概率最大的总体。
- Fisher判别法:是一种先进行高维向低位投影,再根据距离判别的一种方法。借助方差分析的思想构造判别函数(相当于一种投影),使组间区别最大、组内离差最小,然后代入新样本数据,将其与判别临界值比较以确定应判为至哪一总体。
- 逐步判别法:主要是利用一些检验规则,对变量进行逐步筛选,同时进行判别的一种方法。
SAS中的proc discrim(判别归类过程)可以实现:距离判别法,贝叶斯(Bayes)判别法,Fisher判别法(典型判别)。
在proc discrim中,当各总体为正态总体是,距离判别是Bayes判别的特殊形式。
继续阅读