全部版块 我的主页
论坛 提问 悬赏 求职 新闻 读书 功能一区 经管百科 爱问频道
1333 4
2013-03-09
    我想对全国居民的收入做回归,比如收入和教育的关系。因为城市和农村的收入决定过程可能是不同的,所以需要对城乡加以区分。是不是有两种方法:一种是城乡混合在一起回归,将城镇作为虚拟变量,另外加入教育年限,以及城镇虚拟变量与教育年限的交互项。另一种方法是城市和农村分别进行回归,也就两个回归方程,每个方程中都只需要加入教育年限这一个解释变量。这两种方法有什么不同吗?如何评价?
    另外按照上面的第二种方法,两个回归方程中的解释变量是一样的。是否可以城市和农村的回归方程中加入不同的变量,比如城市居民收入仅对教育年限回归,农村居民的回归方程对教育年限和拥有的土地面积两个变量回归,然后对城市和农村进行比较?谢谢。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2013-3-9 23:45:59
第一个model 如果有所有交互项(不光是和教育的),已经涵盖第二个model了。如果所有解释变量都一样,只做第一个分析(加所有交互项)就好了。如果变量数量很多,分开做可能写表达式比较简单吧。如果某些变量只对农村或城市有效,应该分开做方便一点吧。

如果想用第二个model,在城乡加入不同的变量,当然可以。但是重要的是如何解释、对比。比如你在农村的model中用了拥有的土地面积,城市中为何不用类似的data,比如拥有房产价值?没有data?data可信度不高?

regression model包含什么变量固然重要,interpretation也是同等甚而更重要的。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2013-3-10 02:07:41
又想了一下,觉得还是第二个model 好一点。主要是通常regression model,都假设
Y=bX+sigma^2 I,
如果因为种种原因,城乡的sigma不一样,第一个model虽然可以做,但是要自己写variance-covariance,再fit。不好直接用simple linear regression。所以,保守的还是用第二个吧。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2013-3-10 10:10:47
感觉第一个模型好些,但解释起来可能困难些;第二个虽然直白,但城市乡村的对照就勉强些了,无论如何它们不是一个模型中的变量吗。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2013-3-10 14:41:03
chyshl 发表于 2013-3-10 10:10
感觉第一个模型好些,但解释起来可能困难些;第二个虽然直白,但城市乡村的对照就勉强些了,无论如何它们不 ...
我也是觉得第一个模型做起来比较复杂,所以想用第二个模型,但是怕对比着分城乡进行解释的时候会不妥。有什么其他好建议吗?谢谢。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群