全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 SPSS论坛
5023 0
2021-11-17

方差分析含义

方差分析(Analysis of Variance,简称ANOVA)控制因素:控制变量不同水平所产生的影响。方差分析也称变异分析,利用方差可分解性原理来进行假设检验,所以称为方差分析,其主要功能在于分析实验数据中不同来源的变异对总变异的贡献大小,从而确定自变量是否对因变量有重要影响。

领域:广泛应用于经济学、管理学、社会学、教育学、心理学、医学和化学等众多领域,在科学研究中发挥着极其重要的作用。

案例

农作物产量问题:农作物的产量受品种、施肥量、地域特征等因素的影响,通过分析找出最优的组合方案。

广告效果问题:广告的效果受广告形式、地区规模、播放时间等的影响,通过分析找出最优的组合方案。

上述问题可以利用方差分析的方法来实现。

概念:

(1)因变量(观测变量):作为观测的对象,如农作物产量、广告效果等。

(2)自变量(控制变量、因子):人为可以控制的因素如:施肥量、品种、广告形式、地区规模、播放时间等。将控制变量的不同类别称为控制变量的不同水平,(20kg、30kg;甲品种、乙品种等)。

(3)随机因素:人为很难控制的因素(如:气候、推销人员的形象、抽样误差等),方差分析中主要指抽样误差。

类型

(1)单因素方差分析:只考虑一个自变量的影响

(2)多因素方差分析:考虑两个以上的自变量和它们的交互作用对观测变量的影响

(3)协方差分析:在尽量排除其他因素的影响下,分析单个或多个控制因素对观测变量的影响.(引入协变量)

前言

前提:

独立性、正态性和方差齐性

每个水平下的因变量应是相互独立的;

每个水平下的因变量应服从正态分布;

每个水平下的因变量总体的方差应相同

5.1单因素方差分析

目的:研究一个自变量对一个因变量是否存在显著影响,即研究自变量的不同水平是否对因变量产生了不同的影响.

例如:

研究公司类型是否对资产负债有显著影响

研究学历是否对工资收入有显著影响

应用面很广涉及到科学试验,社会经济等问题。

基本原理

单因素方差分析依据的基本原理是方差的可分解性,该方法认为因变量会受到自变量和随机变量的影响,因此,可以将因变量总的离差平方和(SST)分解为组间离差平方(SSR)和与组内离差平方和(SSE)两部分。

基本步骤

1.建立原假设H0:单因素方差分析的原假设H0为自变量不同水平下因变量各总体的均值无显著差异,即H0:m1 =m2=…=mk 。

2.确定检验统计量:单因素方差分析检验统计量采用F统计量。               

5.1单因素方差分析

3.计算检验统计量观测值及发生的概率p值:使用SPSS软件进行操作,SPSS会自动计算统计量F和概率p值。

4.规定显著性水平a与概率p值进行比较,做出统计决策

当概率p值大于显著性水平(p>a)时,接受原假设,结论为自变量不同水平下因变量各总体的均值无显著差异;

当概率p值小于显著性水平(p<a)时,拒绝原假设,结论为自变量不同水平下因变量各总体的均值有显著差异。

方差齐性检验

检验各水平下各总体方差是否齐性

当方差齐性时,做F检验结果是稳定的;如果在方差不齐性时做F检验,所得结果就要谨慎了。

常用的检验方差齐性的方法:有Bartlett法、Hartley法、Levene法和Cochran法等,SPSS采用的是Levene法。

多重比较检验

多重比较就是分别对每个水平下的因变量均值进行逐对比较,判断哪一对均值间有显著性差异,哪一对均值间没有显著性的差异。

例如:确定了盘股板块对公司净利润有显著的影响,那么还需分析小盘股、中盘股、大盘股对公司净利润影响更显著。

方差齐性时采用的方法

(1)LSD(Leastsignificant Difference)最小显著性差异法,其检验敏感度最高。

(2)Bonferroni方法。Bonferroni方法称为修正最小显著差异法。

(3)T(Tukey)方法。适合各水平下样本数均相同的情况,即均衡试验。

(4)Scheffe方法,又称谢弗检验法。

(5)S-N-K方法。S-N-K方法是一种有效划分相似性子集的方法。

方差不齐性时采用的方法

(1)Tamhane’sT2方法:表示用t检验进行配对比较检验。

(2)Dunnett’sT3方法:表示用Student最大系数进行配对比较检验。

(3)Games-Howell方法:表示方差不齐时的配对比较检验。

(4)Dunnett’sC方法:表示用极差统计量进行配对比较检验。

单因素方差分析的SPSS过程

案例5-1为研究盘股板块对公司净利润的影响是否存显著,收集到了交易所的相关数据,不同盘股板分别为小盘股、中盘股和大盘股,利用数据“股票净利润.sav”进行分析。

案例分析:研究中涉及一个自变量,即“盘股板块”,一个因变量,即“净利润”,而且自变量,即“股盘板块”的水平数有小股盘、中股盘和大股盘三个,因此可用单因素方差分析方法进行分析。

步骤1:先打开本章数据“

股票净利润.rar
大小:(756 Bytes)

只需: 4 个论坛币  马上下载

本附件包括:

  • 股票净利润.sav

”。

步骤2:数据录入后,依次选择【分析】→【比较均值】→【单因素ANOVA】命令,如右图所示。

步骤3:

单击【单因素ANOVA】进入其对话框。本例题研究股盘对利润的影响,以“净利润”为因变量,“盘股板块”为自变量,所以把“净利润”添加到【因变量列表】框中,把“盘股板块”添加到【因子】框中,如右图所示。

单击【选项】按钮进入其对话框,如图5-8所示,选中【描述性】【方差同质性检验】和【均值图】复选框。单击【继续】按钮回到主对话框,其他选项默认,最后单击【确定】按钮,提交系统分析。

(1)方差齐性检验:由表5-3可知,Levene检验统计量为1.532,对应的概率p值为0.231,p=0.231>a=0.05时,可以认为不同盘股的净利润方差没有显著差异,即认为各个总体方差相等,满足方差分析的前提,可进行F检验。

(2)F检验:由表5-4可知,F检验统计量为24.950,对应的概率p值为0.000,p=0.000<a=0.05时,拒绝原假设H0,即可以认为不同盘股板块的净利润均值比较是有显著差异。

(3)事后检验:SPSS进行多重比较检验的操作步骤如下。

单击【两两比较】按钮进入其对话框,如图5-10所示。已经知道方差齐性检验,所以应该选择【假定方差齐性】选项组中的方法,这里只选择LSD。

两两比较举例说明。第一行数据中(I)盘股板块为“小盘股”,(J)盘股板块为“中盘股”,对应的均值差(I-J)为-1 002.466 67,概率p值为0.184,p=0.184>a=0.05时,接受原假设,则结论为小盘股与中盘股利润的均值没有显著性差异


多因素方差分析      

1.基本含义

多因素方差分析用来研究两个及两个以上自变量是否对因变量产生显著影响。它不仅能分析多个因素对因变量的独立影响,而且能够分析多个因素的交互作用能否对因变量产生显著影响,从而找到有利于因变量的最优组合方案。

2.影响因变量的因素有三个:自变量独立作用;自变量间交互作用;随机误差。

3.交互作用

例如:促销方式(自变量)---打折、赠送礼品;

          地区(自变量)---A地区、B地区、C地区

交互作用:

(打折,A地区)、(打折,B地区)、(打折,C地区)、(赠送礼品,A地区)、(赠送礼品,B地区)、(赠送礼品,C地区)。

因变量方差的分解

两个自变量总的离差平方和分解为:

SST为因变量的总离差平方和;SSA、SSB分别为自变量A、B独立作用引起的变差;SSAB为自变量A、B两两交互作用引起的变差;SSE为随机因素引起的变差。

多因素方差分析的基本步骤

1.建立原假设H0:各自变量不同水平下因变量各总体的均值无显著差异,自变量各效应和交互作用效应同时为0(或无交互作用)。记为

H01:a1=a2=…=ak=0         

H02:b1=b2=…=br=0

H03:(ab)11=(ab)12=…=(ab)kr=0

2.确定检验统计量:

固定效应模型

随机效应模型

3.计算检验统计量观测值和概率p值

4.将显著性水平与概率p值进行比较,做出统计决策

显著性水平α可选择0.05或者0.01,现要求在 α =0.05的情况下进行分析,与概率P-值比较。

若P> α =0.05则接受原假设

若P < α =0.05则拒绝原假设

方法及应用概述

1.多因素方差分析的饱和模型和非饱和模型

饱和模型:因变量总方差由三部分组成,自变量独立作用、自变量交互作用及抽样误差

  SST=SSA+SSB+SSAB+SSE(两自变量)

非饱和模型:自变量的交互作用对因变量没有产生显著影响,那么就尝试建立非饱和模型。

    SST=SSA+SSB+SSE(两自变量)

2.均值检验

对各个控制变量不同水平下的均值是否存在显著差异进行比较。

多重比较与对比检验

多重比较:单因素方差分析

  如果是对某控制变量的不同水平对观测变量产生的影响,用多重比较法(PostHoc)比较不同水平间的均值类似单因素方差分析。

对比检验:单样本t检验

3.控制变量交互作用的图形分析

如果各控制变量之间无交互作用,各水平对应的直线是近于平行的;

如果控制变量之间存在交互作用,各水平对应的直线会相互交叉。


多因素方差分析的SPSS过程

案例5-2

根据案例5-1的分析结果可知,不同盘股板块对净利润的均值有显著差异,进一步研究:不同盘股板块、不同地区板块对净利润的影响是否存在显著差异,同盘股板块、不同地区板块的交互作用是否对净利润产生显著影响。不同盘股板为小盘股、中盘股、大盘股;不同盘股板块为北京板块、福建板块、湖南板块以及广西板块,利用数据“”进行分析。

5.2  多因素方差分析

案例分析:

题目要研究不同盘股板块、不同地区板块对净利润的影响是否存在显著差异,涉及2个自变量,因此,用多因素方差分析方法进行分析。因变量:净利润;自变量:盘股板块、地区板块

步骤1:

先将表5-1数据(见本章数据“”)录入到SPSS中

步骤2:

打开数据,依次选择【分析】→【一般线性模型】→【单变量】命令,如图5-14所示。

步骤3:多因素方差饱和模型分析。单击【单变量】进入其对话框。以“净利润”为因变量,“地区板块”“盘股板块”为自变量,所以把“净利润”添加到【因变量】框中,把“地区板块”“盘股板块”添加到【固定因子】框中,单击【确定】按钮,系统默认建立饱和模型,如右图所示。结果输出如下表所示。

由上表可知:(1)不同地区板块对净利润产生显著影响;(2)不同盘股板块对净利润产生显著影响。(3)地区板块和盘股板块对净利润没有产生显著的交互作用影响。结论没有显著交互作用,尝试建立非饱和模型。

步骤4:单击【模型】按钮进入其对话框,如右图所示。系统默认选择【全因子】选项,建立饱和模型。要建立非饱和模型,则选择【设定】选项。在【因子与协变量】框中把“地区板块”和“盘股板块”添加到【模型】框中,在【类型】下拉列表框中有主效应和交互作用项,交互作用项可为所有二阶、所有三阶、所有四阶和所有五阶项,可根据研究问题来选择,根据题意,本次选择所有二阶。

表5-8给出了多因素方差非饱和模型分析结果。因为在建立饱和模型分析时,结果表明地区板块和盘股板块不存在显著的交互作用,所以在构建非饱和模型时,交互作用项被系统剔除。从表5-8最后一列数据(Sig.)可看出,不同地区板块和不同盘股板块对净利润产生显著影响

步骤5:多因素方差均值比较分析。

(1)多重比较检验方法。在主对话框单击【两两比较】按钮进入其对话框,如图所示。在【因子】框中,把“地区板块”“盘股板块”添加到【两两比较检验】框中。如果方差相等,则选择【假定方差齐性】选项组中的分析方法;如果方差不相等,则选择【未假定方差齐性】选项组中的分析方法。

(2)对比检验方法。在主对话框中单击【对比】按钮进入其对话框,如右图所示。默认不进行对比检验,显示如图所示的“盘股板块(无)”,如果进行对比检验方法分析,在【对比】下拉列表框中,选择一种对比方式,这里选择“偏差”。然后单击【更改】按钮,使【因子】框中的“地区板块”由“无”变成“偏差”“盘股板块”变量的操作一样。之后单击【继续】按钮回到主对话框,提交系统分析。

左表为不同地区板块下净利润的均值对比检验结果,数据只显示了前三个水平,省略了第四水平,检验值是各水平的均值。级别1(北京板块)与检验值的差为2 360.759,标准误差为207.116,概率p值为0.000,说明北京板块的净利润与总体净利润存在显著差异,且明显高于总体水平。

级别2(福建板块)的净利润与检验值的差为364.773,p=0.088<0.05,说明其与总体净利润不存在差异;

级别3(湖南板块)的净利润明显低于总体水平。

步骤6:多因素方差自变量交互作用图形分析。

单击【绘制】按钮,进入【单变量:轮廓图】对话框,如右图所示,在【因子】框中把“地区板块”“盘股板块”中的任意一个添加到【水平轴】框中,剩下的另一个变量添加到【单图】框中。如果还存在第三变量,把第三个变量添加到【多图】框中。在这里,把“地区板块”添加到【水平轴】框中,把“盘股板块”添加到【单图】框中,再单击【添加】按钮,把“地区板块*盘股板”添加到【图】框中,单击【继续】按钮回到主对话框,单击【确认】按钮,提交系统分析

在右图中,地区板块从第一水平到第四水平,各个不同盘股板块的净利润都呈递减规律变化,三条线是相互平行的,从前面提到的理论知识可知,如果绘制的交互作用图呈现平行线则不存在交互作用,所以从右图中可看出,地区板块与盘股板块不存在显著的交互作用,这也验证了前面的分析结果。


二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群