全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 SPSS论坛
8608 4
2010-02-08
房租是连续型变量,我想分为高低两组,我分别以中位数和均值做了两次分组,跟另一个2分类变量做卡方,发现中位数分组通过检验,均值分组未通过检验。
现在很困惑。我应该取哪个值作为分组依据?
谢谢
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2010-2-9 23:28:05
amandawon 发表于 2010-2-8 23:29
房租是连续型变量,我想分为高低两组,我分别以中位数和均值做了两次分组,跟另一个2分类变量做卡方,发现中位数分组通过检验,均值分组未通过检验。
现在很困惑。我应该取哪个值作为分组依据?
谢谢
樓主的高低區分方法沒有文獻支持,以前聽老師上課,比較好的方法是

取前後27%資料作為上、下界線,但現在一時找不到資料來佐證我的說法。

此一作法固然較為嚴謹,但也損失了46%(=100-27*2)的資料。

所以除非你的樣本數夠大否則效果也不會太好!!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2010-2-10 23:57:46
谢谢。我的样本量800. 因为是非正态分布的,我想是不是要用非参数检验?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2010-3-1 23:18:28
1# amandawon
这个问题应该在项目分析时使用的,采用27%的常见。一般不低于25%,不高于33%。即分四组或三组为宜,取高低两组进行检验。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2015-9-28 22:39:52
那样本损失不少,我样本很少,才300多
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群