全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学
5311 10
2010-04-12
给出一个例子

2.1.1
MEANS语句描述数据



2.1  计算课本上习题1.2的平均数和标准差。
  在进行分析之前,最好先建立一个外部数据文件。如果不建立外部数据文件,在作业流中输入数据也可以。一般来说,在数据量比较大,有可能重复使用时,最好建立一个数据文件。在这里我们创建一个称为2-1data.dat 的外部数据文件,存储在A盘中。用MEANS过程描述数据的最基本的程序如下:


options
linesize=76;


data
abc;


infile
‘a:\2-1data.dat’;


input
x;


run;


proc
means;


run;


提交SAS运行后,所得结果如下:

21 2.1输出的结果






The SAS System




Analysis Variable : X



N


Mean


Std Dev


Minimum


Maximum


250


63.2760000


3.0139941


55.0000000


70.0000000



                                                                              


打印的结果中包括数据个数平均数标准差最小值和最大值。这是MEANS语句在缺省时得到的基本结果。若需要对数据作更详细的描述,则要指明所需的统计量(关于统计量的概念见课本2.2.4)。用MEANS过程所计算的统计量,在这里也一并列出。下面还会反复提到变量这一名词,关于变量的概念见课本2.2.1MEANS过程所计算的统计量是用关键词表示,这些关键词及其含义如下:

N
:输入的观测值(观测值的概念见课本2.2.1)个数


NMISS
:每个变量所含缺失值的个数


MEAN
:变量的平均数


STD
:变量的标准差


MIN
:变量的最小值


MAX
:变量的最大值


RANGE
:变量的极差


SUM
:变量所有值的和


VAR
:变量的方差


USS
:每一变量原始数据的平方和(未校正平方和)


CSS
:每一变量的离均差平方和(校正平方和)


CV
:变异系数


STDERR
:每一变量的标准误差(平均数的标准差)


T
:在H0:μ= 0时的t
值(见课本5.1.4


PRT
:在H0:μ= 0 的假设下,统计量t 大于t
临界值绝对值的概率(见课本4.1.1


SKEWNESS
:偏斜度


KURTOSIS
:峭度


CLM
:置信区间的上限和下限(见课本6.2.1


LCLM
:置信区间的下限


UCLM
:置信区间的上限

另外,在PROC
MEANS
语句中还有12个选项,其中几个主要选项如下:

DATA=(SAS 数据集):指出SAS 数据集的名称,若省略,则使用最近产生的数据集
MAXDEC=(数字):指出所输出的结果中,小数部分的最大位数(08),缺省时为8
FW=(域宽):指出打印的结果中每个统计量的域宽,缺省时为12
VARDEF=(DF / N):VARDEFDF为缺省值,表示计算方差时,使用n-1 作分母,


VARDEF
N表示计算方差时,使用观测值个数n 作分母

ALPHA=(α值):指出在计算置信区间时,选用的显著水平
附件列表
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2010-4-12 10:48:59
楼主  这未免有点在杀猪啊@!!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2010-4-12 10:54:03
杀猪时什么意思。
2# cz851218
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2010-4-12 16:06:10
2# cz851218
我是新来的。随便标的价格,改成10怎么样。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2010-4-12 17:14:48
真没劲,这是做什么呀
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2010-4-12 22:38:36
太贵了,楼主真够黑的
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

点击查看更多内容…
相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群