【SPSS看统计学】之SPSS常用统计概念（中英文）

bakoll

12146

收藏 2014-07-20

本专题是以SPSS和统计学为关键词，本帖来点基础的，看SPSS中常用的统计概念。

SPSS相关统计学概念：

总体（population）：总体是根据研究目的确定的同质观察单位的全体，或者说是同质的所有观察单位某种观察值（变量值）的集合。

样本（sample）：样本是总体中随机抽取部分观察单位，其实测值的集合。随机抽样就是按随机化原则（即总体中每一个观察单位都有同等机会被选入到样本中来）获取样本，以避免误差和偏倚对研究结果有所影响。样本包含的观察单位称样本含量或样本大小（sample size），也称样本例数。

资料和变量（data and variable）：研究者对每个观察单位的某项特征进行测量和观察，这种特征称为变量。对变量测得的值称变量值（value of variable）或观察值（observed value）亦称为资料。观察个体间的差异，称为变异（variation）。

定量资料（quantitative data）：数值变量（numerical variable）其变量的值是定量的，表现为数值的大小，一般有度量衡。

分类资料（categorical data）：分类变量（ categorical variable ）其观察值是定性的，表现为互不相容的类别或属性。无序分类：阳性或阴性，治愈或未治愈；有序分类：治愈、显效、好转、无效

概率（probability）：概率是描述随机事件发生的可能性大小的数值，常用P表示。随机事件概率的大小在0与1之间，既0 £ P ³ 1。P值越接近于1，表示某事件发生的可能性越大； P值越接近于0，表示某事件发生的可能性越小。P=1表示事件必然发生，P=0表示事件不可能发生。P £0.05称为小概率事件，表示在一次实验或观察中该事件发生的可能性很小，可以认为很可能不发生。

频数（frequency）：各组段内的数据个数，频数分布类型有正态，左偏态和右偏态

算术均数（mean）：总体均数m，样本均数X

几何均数（geometric mean）：原始数据分布不对称，但经对数转换后呈对称分布的数据。几何均数G

中位数 （median）：指将一组数值从小到大排序后居于中间位置的那个数值。中位数M

极差（range）：全距R，描述数据的分布范围，极差大说明数据分布较分散

四分位数间距（inter-quartile range）： QU与QL的差距

百分位数（percentile）：Px ，如P25，P50等

四分位数：QL（下四分位数，25%），QU（上四分位数，75%）

方差（variance）：样本方差S2，总体方差s2

标准差（standard deviation）：标准差S替代方差描述数据分布的离散程度

变异系数（coefficient of variation）：CV，标准差与算术均数之比，它描述数据分布的相对离散程度。

标准误（standard error，SE）与均数的标准误（ standard error of mean，SEM ）：均数的标准误与标准差成正比，与样本例数n的平方根成反比.

假设检验（hypothesis test）也称显著性检验（significance test）

1、建立检验假设（ hypothesis under test ）: 无效假设，m= m0（样本均数=总体均数） H0

2、建立备择假设（ alternative hypothesis ）: H1，若H0被否决，则H1成立。

3、设定检验水准（size of test）或称显著性水准（ significance level）: a =0.05（方差齐性检验a=0.10，正态性检验a =0.20）

4、确定P值，作出推断：推断结论包括统计结论和专业结论，统计结论说明有统计学意义（statistical significance）或无统计学意义（no statistical significance ），若P£ a，则拒绝H0 ，接受H1 ，有统计学意义（统计结论）；则可认为……不同或不等（专业结论）。

假设检验的方法：t检验（t-test或称Student’s t-test）和u检验（u-test或称Z-test）。

☆ t检验应用条件：当样本量较小时（如 n<50），理论上要求样本取自正态总体，两小样本均数比较时要求两样本总体方差相等。

☆ u检验应用条件：样本含量n较大，或n虽小但总体标准差已知。

（1）单样本t检验（one sample/group t-test）：即样本均数代表的未知总体均数m和已知总体均数m0 （一般为理论值、标准值或经过大量观察所得的稳定值）的比较。

（2）配对t检验（paired t-test for dependent samples）：两种情况

（1）两个同质受试对象分别接受两种不同的处理；（2）同一受试对象分别接受两种不同的处理。配对t检验设两种处理的效应相同，即m1 = m2 ，则m1 - m2 =0（即已知总体m0 ）。

（3）两样本t检验（ tow-sample t-test for independent samples ）：又称成组t检验。完全随机设计两样本均数的比较。当关心两总体均数m1 ， m2是否相等时，理论上应考虑是否两总体方差相同，即齐性方差（homogeneity），若相等直接接受t检验。