全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 SAS专版
8296 5
2009-12-21
Let's compare the average miles per gallon (mpg) among the cars in the different repair groups using Analysis of Variance. You might think to use proc anova for such an analysis, but proc anova assumes that the sample sizes for all groups are equal, an assumption that is frequently untrue.   Instead, we will use proc glm to perform an ANOVA comparing the prices among the repair groups.  Since there are so few cars with a repair record (rep78) of 1 or 2, we will use a where statement to omit them, allowing us to concentrate on the cars with repair records of 3, 4 and 5.  The proc glm below performs an Analysis of Variance testing whether the average mpg for the 3 repair groups (rep78) are the same.  It also produces the means for the 3 repair groups。
红色的字说是假定样本量要相同,但是很多人都没有这么做,这是为什么呢?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2009-12-21 22:54:00
我觉得这个问题应该这么理解:proc anova 需要均衡的数据。如果数据不均衡就用proc glm来做anova分析。如果数据均衡,两个过程的结果应该相同。从analysis of variance的角度来讲,proc glm 只是proc anova的延伸。我想,没有很多人会把不均衡的数据放在proc anova 上运行,因为通常是无法运行的。proce anova存在的理由是它适用于分析多种均衡的实验设计以及它自身的一些独特的功能,还有,或许它会快一些。
我不是分析试验设计的,所以任何的anova,无论数据均衡与否,我都用proc glm。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2009-12-22 09:04:10
2# jingju11

同意。proc anova 适用于balanced design,而glm应用更广泛,相对不受design的影响。但是glm在处理非 iid 的数据比较受局限,在有random effects 或 repeated measure的时候用proc mixed更为保险。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2010-6-16 17:42:13
同意,glm是anova的扩展,偶也更倾向于使用glm
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2010-6-17 07:17:43
ANOVA有个前提假设是各组方差齐。当样本量不同时,对各组样本方差的差异范围要求更高。
当样本量很大时,组间样本量差异可能影响并不显著。但是如果各组样本量很低且不齐,则F检验可能不成立。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2015-7-9 13:21:31
chenjung0825 发表于 2010-6-17 07:17
ANOVA有个前提假设是各组方差齐。当样本量不同时,对各组样本方差的差异范围要求更高。
当样本量很大时,组 ...
当各组样本量很低且不齐的时候,怎么判别方差分析是否还适用? 比如个别组的样本量不足10个,用ANOVA分析,检验满足正态分布和方差齐次的要求,且得出分组因子对观测值的影响是显著的,这样的结果有意义吗?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群