全部版块 我的主页
论坛 提问 悬赏 求职 新闻 读书 功能一区 学习笔记1.0
1114 0
2011-04-22
第一部分:
统计描述是通过绘制统计图、编制统计表、计算统计量等方法来表述资料的分布特征。
means过程可以用于正态或近似正态资料的统计量计算,chart过程可以用于绘制直方图和编制频数表,而univariate过程是最全面的单变量统计描述分析模块。
在SAS系统中,资料的正态性判断还可以采用shapiro-wilks正态性假设检验方法和分布拟合优度检验方法。
1 means过程
(1) proc means data=数据集;
    run;
    调用sas系统中的means过程计算数据集中各变量数据的均值、标准差、最大值和最小值等统计量。
(2) proc means 选择项;
    class 变量名;
    var   变量名;
    freq  频数变量名;
    output out=输出数据集名 统计量关键字=保存变量名;
    by 变量名;
选择项中包含以下命令:
(1) data=sas数据集名,指定要计算的数据集名
(2) noprint略去计算结果的打印输出;
(3) maxdec=小数位数 指定结果的最大小数位数,小数位数通常在0-8整数;
(4) alpha=小数值 指定计算可信区间的置信水平,默认0.05;
(5) 统计量关键字 默认的有均值、标准差、最大值和最小值,一旦指定统计量,那么就只计算指定的统计量。
常用统计量:
1)N(例数)、mean、std、max、min、cv(变异系数)、range(全距)、var、css、uss、sum、sumwgt
2) 分位数包括median|p50、Q3|P75、Q1|P25、qrange等
3)skew(偏度系数)、kurt(峰度系数)
4)clm(可信区间)、lclm(可信区间下限)和uclm(可信区间上限)
5)样本均值与总体均值的t检验和prob(t统计量的概率值)。
class语句
  定义分组计算变量,得到各族组内的计算统计量
var语句
  指定计算的变量及顺序。
freq语句
  一般的,当输入的数据为频数表资料时,才使用freq语句。
output语句
  sas计算结果输出到SAS数据集中保存。
2 univariate过程
univariate过程是sas中功能最全面的单变量描述统计分析过程,除可以完成means过程的所有计算外,还可以绘制若干描述变量分布的统计图,进行正态性检验等
proc univariate 选择项;
var 变量名表;
freq 频数变量名表;
histogram变量明表/绘图选择项
probplot变量名表/绘图选择项
qqplot变量名表/绘图选择项
inset统计量关键字/选择项
output out=输出数据集名 统计量关键字=保存变量名;
by 变量名表;
析:
  proc univariate语句
该语句的常用选择项为:
(1) data=sas数据集名、noprint和alpha=
(2) round=小数位数单位
(3) 编制频数表
(4) normal指定进行shapiro-wilks等正态性检验
(5)pctldef=方法值 指定百分位数的计算方法,其值为1到5
(6)绘制茎叶图、正态概率图等
(7)指定要比较的总体均值mu=总体均值
histogram语句
绘制高分辨直方图
vscale 指定垂直坐标轴的尺度。
midpoints指定各组组种植以确定各组组段。
normal 指定正态曲线估计和绘制的,其估计结果、正态性拟合优度和正态概率图的分位点输出在输出窗。
grid 指定绘制网格
href 指定绘制水平参考线
vref 指定绘制垂直参考线
probplot语句
该语句绘制相应变量的高分辨正态概率图
normal 其意义与上相同
grid 绘制网格
square 绘图区域为方形
QQplot语句
绘制Q-Q图,同上
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群