全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 SPSS论坛
11973 3
2014-07-20

本专题是以SPSS和统计学为关键词,本帖来点基础的,看SPSS中常用的统计概念。

SPSS相关统计学概念:

总体(population):总体是根据研究目的确定的同质观察单位的全体,或者说是同质的所有观察单位某种观察值(变量值)的集合。

样本(sample:样本是总体中随机抽取部分观察单位,其实测值的集合。随机抽样就是按随机化原则(即总体中每一个观察单位都有同等机会被选入到样本中来)获取样本,以避免误差和偏倚对研究结果有所影响。样本包含的观察单位称样本含量或样本大小(sample size),也称样本例数。

资料和变量(data and variable:研究者对每个观察单位的某项特征进行测量和观察 ,这种特征称为变量。对变量测得的值称变量值(value of variable)或观察值(observed value)亦称为资料。观察个体间的差异,称为变异(variation)。

定量资料(quantitative data):数值变量(numerical variable)其变量的值是定量的,表现为数值的大小,一般有度量衡。

分类资料(categorical data:分类变量( categorical variable )其观察值是定性的,表现为互不相容的类别或属性。无序分类:阳性或阴性,治愈或未治愈;有序分类:治愈、显效、好转、无效

概率(probability:概率是描述随机事件发生的可能性大小的数值,常用P表示。随机事件概率的大小在01之间,既0 £ P ³ 1P值越接近于1,表示某事件发生的可能性越大; P值越接近于0,表示某事件发生的可能性越小。P=1表示事件必然发生,P=0表示事件不可能发生。P £0.05称为小概率事件,表示在一次实验或观察中该事件发生的可能性很小,可以认为很可能不发生。

频数(frequency):各组段内的数据个数,频数分布类型有正态,左偏态和右偏态

算术均数(mean):总体均数m,样本均数X

几何均数(geometric mean):原始数据分布不对称,但经对数转换后呈对称分布的数据。几何均数G

中位数 median:指将一组数值从小到大排序后居于中间位置的那个数值。中位数M

极差(range:全距R,描述数据的分布范围,极差大说明数据分布较分散

四分位数间距(inter-quartile range): QUQL的差距

百分位数(percentile):Px ,如P25P50

四分位数QL(下四分位数,25%),QU(上四分位数,75%

方差(variance:样本方差S2,总体方差s2

标准差(standard deviation:标准差S替代方差描述数据分布的离散程度

变异系数(coefficient of variation):CV,标准差与算术均数之比,它描述数据分布的相对离散程度。

标准误(standard errorSE与均数的标准误( standard error of meanSEM ):均数的标准误与标准差成正比,与样本例数n的平方根成反比.

假设检验hypothesis test)也称显著性检验(significance test

1、建立检验假设( hypothesis under test : 无效假设,m= m0(样本均数=总体均数) H0

2、建立备择假设( alternative hypothesis : H1,若H0被否决,则H1成立。

3、设定检验水准(size of test)或称显著性水准( significance level: a =0.05(方差齐性检验a=0.10,正态性检验a =0.20

4、确定P值,作出推断:推断结论包括统计结论和专业结论,统计结论说明有统计学意义(statistical significance)或无统计学意义(no statistical significance ),若P£ a,则拒绝H0 ,接受H1 ,有统计学意义(统计结论);则可认为……不同或不等(专业结论)。

假设检验的方法t检验(t-test或称Student’s t-test)和u检验(u-test或称Z-test)。

t检验应用条件:当样本量较小时(如 n<50),理论上要求样本取自正态总体,两小样本均数比较时要求两样本总体方差相等。

u检验应用条件:样本含量n较大,或n虽小但总体标准差已知。

1)单样本t检验one sample/group t-test):即样本均数代表的未知总体均数m和已知总体均数m0 (一般为理论值、标准值或经过大量观察所得的稳定值)的比较。

2)配对t检验paired t-test for dependent samples): 两种情况

    1)两个同质受试对象分别接受两种不同的处理;(2)同一受试对象分别接受两种不同的处理。配对t检验设两种处理的效应相同,即m1 = m2 ,则m1 - m2 =0(即已知总体m0 )。

3)两样本t检验 tow-sample t-test for independent samples ):又称成组t检验。完全随机设计两样本均数的比较。当关心两总体均数m1 m2是否相等时,理论上应考虑是否两总体方差相同,即齐性方差(homogeneity),若相等直接接受t检验。

欢迎大家继续补充,奖励热心坛友啦~~~

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2014-7-20 22:00:36
学习一下
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2014-7-21 09:15:23
学习下基础知识。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2014-7-21 16:17:50
wapaja 发表于 2014-7-21 09:15
学习下基础知识。
haha
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群