10月 19, 2011

Posted in 统计应用 | 7 条评论

SAS9.2统计图形过程步帮助文档导读(1)

SAS自9.2版本后在作图方面有很大提高, SAS/GRAPH 9.2的基本内容可参见这里,如下图:

统计图形过程步(Statistical Graphics Procedures)是SAS 9.2中新增(相对于SAS 9.1及以前版本)的部分,这些过程步都以SG开头,包括:SGplot, SGpanel, SGscatter, SGrender, SGdesign。《Statistical Graphics Procedures Guide》即是其相关介绍。

本系列主要概览性地介绍《SAS/GRAPH 9.2: Statistical Graphics Procedures Guide, Second Edition》这一帮助文档,以期大家能对SAS 9.2统计作图过程步有个较为全面的了解,在以后使用中能快速上手。

可以在官网下载《SAS/GRAPH 9.2: Statistical Graphics Procedures Guide, Second Edition》。

下图是该帮助文档的主目录:

What’s New不介绍了,因为SAS 9.3都已经出来了,还有更新的了。下文主要对其他三个部分进行简要介绍。

继续阅读
7月 8, 2011

Posted in 统计应用 | 0 条评论

SAS9.2统计作图小记

参考《Statistical Graphics in SAS》,本文对SAS 9.2作图方式进行了简单的梳理。

1.主要的3种统计图形生成方式:

  1. 利用Output Delivery System(ODS),统计过程步直接产生统计图形。使用“ods graphics on”语句,将会直接输出统计过程步的默认图形。
  2. 利用SG过程步。主要包括proc sgplot,proc sgscatter,proc sgpanel三个过程步。
  3. 利用GTL(Graph Template Language)。主要使用proc template和proc sgrender。

2.实例:

对数据集sashelp.class中的weight关于height作一次回归拟合图。

数据如下:

继续阅读
5月 11, 2011

Posted in 统计应用 | 1 条评论

SAS多元分析之判别(1)–proc discrim

 

本文主要对SAS做判别分析的proc discrim步的应用做一个简单的摘录,相关的理论知识细节,请参见SAS help文档及其他统计学相关文献等。

1.简介

判别分式是判断样本所属类别的一种统计方法,常用的判别分析法有:

  • 距离判别法:首先定义新样本到总体的距离,然后考察样本到各个总体的距离,把新样本判归至与其距离最近的总体。常用距离使用马氏距离。
  • 贝叶斯(Bayes)判别法:更具Bayes统计思想,计算新样本属于各个总体的条件概率,比较各个条件概率的大小,将新样本判归至条件概率最大的总体。
  • Fisher判别法:是一种先进行高维向低位投影,再根据距离判别的一种方法。借助方差分析的思想构造判别函数(相当于一种投影),使组间区别最大、组内离差最小,然后代入新样本数据,将其与判别临界值比较以确定应判为至哪一总体。
  • 逐步判别法:主要是利用一些检验规则,对变量进行逐步筛选,同时进行判别的一种方法。

SAS中的proc discrim(判别归类过程)可以实现:距离判别法,贝叶斯(Bayes)判别法,Fisher判别法(典型判别)。

在proc discrim中,当各总体为正态总体是,距离判别是Bayes判别的特殊形式。

继续阅读
4月 17, 2011

Posted in 统计应用 | 7 条评论

SAS多元分析之聚类(2)–proc fastclus

本文主要对SAS做聚类分析的proc fastclus步的应用做一个简单的摘录,相关的理论知识细节,请参见SAS help文档及其他统计学相关文献等。

1.简介

proc fastclus为动态聚类(又称快速聚类),以迭代思想为理论基础,先对样本观测粗略分类,然后按某种最优准则逐步修改分类至最优为止,其适用于观测量大的数据。
步骤为:

  1. 选择若干观测为初始“凝聚点”。(注:凝聚点必须是完整观测,即该观测的各个变量值不能有缺失存在。)

1) 系统顺序选取
2) 系统随机选取
3) 指定初始凝聚点

  1. 根据初始“凝聚点”进行初始分类。

1) 按批初始分类
2) 逐个初始分类

  1. 对分类进行逐步修改优化。

1) 按批修改法
2) 逐个修改法

  1. 确定最优分类。

继续阅读
4月 4, 2011

Posted in 统计应用 | 6 条评论

SAS多元分析之聚类(1)–proc cluster

本文主要对SAS做聚类分析的proc cluster步的应用做一个简单的摘录,相关的理论知识细节,请参见SAS help文档及其他统计学相关文献等。

1.简介

proc cluster一般适用于规模较小的样本观测聚类(即Q型聚类)。proc cluster为系统聚类,包括11种方法,根据“距离”作为分类标准。

继续阅读
返回顶部