全部版块 我的主页
论坛 计量经济学与统计论坛 五区 计量经济学与统计软件
6822 6
2011-11-03
悬赏 20 个论坛币 已解决
我想分析女性的婚姻决策问题,分析什么因素影响女性选择结婚或者不结婚。我现在遇到的问题是,2000个样本中,Y变量取1的样本有1950个,取0的样本有50个,即未婚的只有50个,剩下1950个都是结婚的,两类样本数量差别很大。不知道在这种情况下运用二元probit模型是否合适?
如果不合适的话,有什么方法解决吗?另外,二元probit模型中取0和取1的样本比例大概为多少是合适的?
请大家赐教!

最佳答案

Mayonnaise 查看完整内容

zero inflated probit
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2011-11-3 18:42:02
zero inflated probit
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2011-11-3 19:11:29
似乎不太合适
看看你的样本
是不是年龄都比较大?
增加点样本吧
哈哈 增加一些18岁以下的样本
我敢保证未婚的比较多(偏远农村可能例外)

要不,你的题目就叫 大龄女青年婚姻决策问题
这样人口特征统计的研究没做过也没什么意思
只能统计描述给人娱乐的
对政策指导上没什么用处

虽然,没有研究具体数据,但是结果差不多都可以猜测出来,决定女性是否结婚的最大因素是年龄
“待价”和“待嫁”还是比较少的,这样的样本你可能也收集不到
搞个数理模型比计量模型要有趣得多

另外,研究女性是否决策生孩子,生几个孩子也不错 嘿嘿

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2011-11-3 20:03:13
zmn123452700 发表于 2011-11-3 19:11
似乎不太合适
看看你的样本
是不是年龄都比较大?
非常感谢您,的确让我对研究的问题清楚了不少。
目前困惑我的主要问题是,50个未婚的样本,1950个结婚的样本,这么大的样本差是否用probit模型是合适的?如果不合适,为什么呢?请您多指教啊O(∩_∩)O~
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2011-11-3 23:52:13
zhanglin8562 发表于 2011-11-3 20:03
非常感谢您,的确让我对研究的问题清楚了不少。
目前困惑我的主要问题是,50个未婚的样本,1950个结婚的 ...
不合适
原因很多,你可以简单地理解为小概率事件下的离散选择研究没有意义。
你现在的问题很可能是在抽样上出了问题。
比例没有固定限制,如果年龄分布正常的话,0.7-0.8是可以的。
不知道你怎么调查的,调查哪些人,结婚的接近0.98了!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2012-1-21 11:44:24
确实不太 合适。你这个叫类别不平衡,而且不平很的程度太大了。
另外,我们处理不平衡的样本有bagging,boosting等等方法,过抽样也是,你可以搜搜看
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

点击查看更多内容…
相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群