全部版块 我的主页
论坛 计量经济学与统计论坛 五区 计量经济学与统计软件 Stata专版
19050 10
2016-09-11
假设有1000个样本。两个解释变量
解释变量中有100个数值为“0”
10个数值为“.”

回归的时候要不要删除掉“0”或者删除“.”之后再回归呢?
不删除的话对结果有什么影响?是影响系数还是影响t,p值?
另外这个知识看书的话应该属于哪个章节啊?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2016-9-11 11:06:16
第一个问题:缺失值在回归前一般是要处理的,有多种处理方式。1)均值替代;2)多重补漏分析;3)删除;第二个问题:解释变量中有太多0,会使得变量呈右偏态分布,建议取对数处理一下变量。或者将连续变量处理为类别变量来分析。祝好运~
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2016-9-11 14:21:04
xddlovejiao1314 发表于 2016-9-11 11:06
第一个问题:缺失值在回归前一般是要处理的,有多种处理方式。1)均值替代;2)多重补漏分析;3)删除;第二 ...
谢谢回答啊,我问完还睡了一觉,想等有回答了再做,没想到回的这么快

被解释变量是教育年限,很多没受过教育的就有0值了,而且真的比例挺大的。这个能取对数或者分类成受教育水平再OLS吗?分类之后是不是就要做逻辑回归了啊?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2016-9-11 15:40:59
mmnu 发表于 2016-9-11 14:21
谢谢回答啊,我问完还睡了一觉,想等有回答了再做,没想到回的这么快

被解释变量是教育年限, ...
你这个不是自变量么,以虚拟变量形式纳入模型即可。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2016-9-11 19:53:55
xddlovejiao1314 发表于 2016-9-11 15:40
你这个不是自变量么,以虚拟变量形式纳入模型即可。
方成两边都有教育年限。左边的0值较少,右边的0值较多。
我看了一下方程左边的数值基本正态分布。右边的不正态了
这样可以用最小二乘法吧?
虚拟变量的话,要设定8个,觉得结果不是太好解释。
也想过把0替换成1,但好像不能这么干吧。
目前我就是按0在的状态OLS的。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2016-9-11 20:58:17
mmnu 发表于 2016-9-11 19:53
方成两边都有教育年限。左边的0值较少,右边的0值较多。
我看了一下方程左边的数值基本正态分布。右边的 ...
OLS回归的基本假定是iid,即独立同分布,要得到无偏一致的估计量还得正态。所以可能你需要做相应的处理。受教育年限这个变量如果不是你关注的变量,那么处理为类别变量时不一定非要划分那么细的。比如可以考虑有没有上过大学将其划分为0,1之类的。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

点击查看更多内容…
相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群