全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 R语言论坛
1299 5
2013-01-21
研究目的:研究不同收入水平(高、中、低)的y(数值型因变量)是否有显著性差异。

做了两次分析。
分析1、只纳入一个因素:收入
分析2、纳入两个因素:收入和性别(男、女)

发现:这两次分析结果中,收入的SS(Sum of Squares)不同。想知道原因。

根据组间SS的计算公式:sum(该水平的样本数*(该水平的均数-总均数)^2)
我用上述公式计算书上的例子,结果没问题。所以认为组间的SS似乎是个定值,因为各水平的样本数、各
水平的均数、总均数都是固定的。但为什么单因素和多因素的“收入”相应的SS是不同的?

谢谢


二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2013-1-22 13:41:46
自己顶一下,希望大家指点。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2013-1-23 09:39:57
sum of square of error 肯定减少的
total sum of square是不变的
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2013-1-23 20:20:40
ntsean 发表于 2013-1-23 09:39
sum of square of error 肯定减少的
total sum of square是不变的
这个我理解:总SS不变,因素越多,各因素对应的SS越小.但从公式看,觉得组间SS又是定值,因为因为各水平的样本数、各水平的均数、总均数都是固定的。这又该怎么理解呢?谢谢!

公式:
组间SS=sum(该水平的样本数*(该水平的均数-总均数)^2)

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2013-1-23 22:42:23
组间SS,当然不是定植了
组越多, 组间SS越大
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2013-1-24 10:05:02
ntsean 发表于 2013-1-23 22:42
组间SS,当然不是定植了
组越多, 组间SS越大
应该是组越多,组间SS越小吧,因为总SS是固定的,所以因素数越多,该因素分担的组间SS越小。
我只是不明白,根据组间SS计算公式:组间SS=sum(该水平的样本数*(该水平的均数-总均数)^2)
公式中的各个成分都是固定值(例如性别,男人数,女人数都是固定的,男均数和女均数是固定的,总均数也是固定的),为什么实际上会随着因素数的变化而变化呢?我用这个公式计算过书上的多因素ANOVA例子,结果正确,所以认为这个公式是正确的。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群