本专题是以SPSS和统计学为关键词,本帖来点基础的,看SPSS中常用的统计概念。
SPSS相关统计学概念:
总体(population):总体是根据研究目的确定的同质观察单位的全体,或者说是同质的所有观察单位某种观察值(变量值)的集合。
样本(sample):样本是总体中随机抽取部分观察单位,其实测值的集合。随机抽样就是按随机化原则(即总体中每一个观察单位都有同等机会被选入到样本中来)获取样本,以避免误差和偏倚对研究结果有所影响。样本包含的观察单位称样本含量或样本大小(sample size),也称样本例数。
资料和变量(data and variable):研究者对每个观察单位的某项特征进行测量和观察 ,这种特征称为变量。对变量测得的值称变量值(value of variable)或观察值(observed value)亦称为资料。观察个体间的差异,称为变异(variation)。
定量资料(quantitative data):数值变量(numerical variable)其变量的值是定量的,表现为数值的大小,一般有度量衡。
分类资料(categorical data):分类变量( categorical variable )其观察值是定性的,表现为互不相容的类别或属性。无序分类:阳性或阴性,治愈或未治愈;有序分类:治愈、显效、好转、无效
概率(probability):概率是描述随机事件发生的可能性大小的数值,常用P表示。随机事件概率的大小在0与1之间,既0 £ P ³ 1。P值越接近于1,表示某事件发生的可能性越大; P值越接近于0,表示某事件发生的可能性越小。P=1表示事件必然发生,P=0表示事件不可能发生。P £0.05称为小概率事件,表示在一次实验或观察中该事件发生的可能性很小,可以认为很可能不发生。
频数(frequency):各组段内的数据个数,频数分布类型有正态,左偏态和右偏态
算术均数(mean):总体均数m,样本均数X
几何均数(geometric mean):原始数据分布不对称,但经对数转换后呈对称分布的数据。几何均数G
中位数 (median):指将一组数值从小到大排序后居于中间位置的那个数值。中位数M
极差(range):全距R,描述数据的分布范围,极差大说明数据分布较分散
四分位数间距(inter-quartile range): QU与QL的差距
百分位数(percentile):Px ,如P25,P50等
四分位数:QL(下四分位数,25%),QU(上四分位数,75%)
方差(variance):样本方差S2,总体方差s2
标准差(standard deviation):标准差S替代方差描述数据分布的离散程度
变异系数(coefficient of variation):CV,标准差与算术均数之比,它描述数据分布的相对离散程度。
标准误(standard error,SE)与均数的标准误( standard error of mean,SEM ):均数的标准误与标准差成正比,与样本例数n的平方根成反比.
假设检验(hypothesis test)也称显著性检验(significance test)
1、建立检验假设( hypothesis under test ): 无效假设,m= m0(样本均数=总体均数) H0
2、建立备择假设( alternative hypothesis ): H1,若H0被否决,则H1成立。
3、设定检验水准(size of test)或称显著性水准( significance level): a =0.05(方差齐性检验a=0.10,正态性检验a =0.20)
4、确定P值,作出推断:推断结论包括统计结论和专业结论,统计结论说明有统计学意义(statistical significance)或无统计学意义(no statistical significance ),若P£ a,则拒绝H0 ,接受H1 ,有统计学意义(统计结论);则可认为……不同或不等(专业结论)。
假设检验的方法:t检验(t-test或称Student’s t-test)和u检验(u-test或称Z-test)。
☆ t检验应用条件:当样本量较小时(如 n<50),理论上要求样本取自正态总体,两小样本均数比较时要求两样本总体方差相等。
☆ u检验应用条件:样本含量n较大,或n虽小但总体标准差已知。
(1)单样本t检验(one sample/group t-test):即样本均数代表的未知总体均数m和已知总体均数m0 (一般为理论值、标准值或经过大量观察所得的稳定值)的比较。
(2)配对t检验(paired t-test for dependent samples): 两种情况
(1)两个同质受试对象分别接受两种不同的处理;(2)同一受试对象分别接受两种不同的处理。配对t检验设两种处理的效应相同,即m1 = m2 ,则m1 - m2 =0(即已知总体m0 )。
(3)两样本t检验( tow-sample t-test for independent samples ):又称成组t检验。完全随机设计两样本均数的比较。当关心两总体均数m1 , m2是否相等时,理论上应考虑是否两总体方差相同,即齐性方差(homogeneity),若相等直接接受t检验。
欢迎大家继续补充,奖励热心坛友啦~~~