全部版块 我的主页
论坛 计量经济学与统计论坛 五区 计量经济学与统计软件 Stata专版
5207 6
2012-02-11
我的资料是用每年的家户收支调查,
手上蒐集了连续10年,
由于每年调查的家户数目都不同(ex:第一年10000笔、第二年11000笔....第十年11500笔)
而每年抽到的家户也不同,
所以这是属于cross sectional data而不能用panel data的方式处理。

我想要把十年的资料合併用logit/probit方法探讨家户落入贫穷的决定因素,
现在的方法是十年资料合併后(有十万多笔)直接跑一次logit/probit的回归,
解释变数除了放入的应变数外还有放入属于各年的dummy,
也得到了结果。

不过请问这样的作法是适当的吗?
适当的话其中要注意什麽问题?
还是这样的作法根本就是错的

期待各位的回覆,谢谢!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2012-2-11 14:06:04
楼主的自变量与因变量分别是什么呀?logit与probit模型是离散选择模型,所以因变量要么是1要么是0。不过看到楼主将年份都做成一个虚拟变量(哑变量),就有一个注意点了。那就是这个哑变量是变截距变量还是即变截距又变系数(不但要研究这个哑变量是怎么影响方程截距项,还要研究是否影响方程自变量的系数,大部分时候对系数的影响远远重要于对截距的影响)。楼主有十年的数据,通过引入哑变量一次性建模太复杂。而且还是作为横截面数据来处理,所以建议年一年建一次模型。然后观察每年的变量系数与截距的变化比较直观与简单。PS:其实最理想的方法是进行面板建模。每年数据样本对象不同,我个人感觉是没有关系的,因为只要你每年的样本选择是随机的,一般假设是每年的样本都可以反映整体。所以这十年数据是一个面板数据,但是可能需要将目标聚类一下,不是一个自然人而是一个地区或是一类人,然后用这一类人的平均值来作为面板中的数据单元。
以上纯属个人建议!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2012-2-11 14:13:08
我觉得作法上本质上应该没什么错。
深信这资料您都收集十年,应当很了解。

但您应该对资料的调查做更多的说明,
虽然您已经说出了部份。

譬如,各年度里,家户是不是同一批家户?
【这算是资料建立提供者的问题,如果无法做,使用资料的研究者应当提出不可行的说明】
也许有的家户在某些年度都被调查到,有的则没有,
而且家户的进入与退出时间点不一样吧?

另外,个年度调查里,变量的不同应当值得注意,
我相信,随时代变迁与各种考量,各年度的变量应当会有差异,
研究者在pooling时,为了方便精简,也许会锁定一些比较重要的笔量,
虽然这项效果,也许会反应在各年的dummy里。
但小心遇对龟毛审稿人,如果有些变量它很坚持某些变量,
比较保险的作法,也许您可以把这些变量与时间进行交叉项,算模型变化。
如果模型变化后,依然得到相同的结果,那么您的结果算是很稳健。

另外,一个私人的建议,建议您投国外期刊,特别是比较不懂您资料的国外期刊,
因为计量方法国外学者比较不挑,但国内学者会要求比较新又难的计量方法使用。
国外学者也许会觉得您这样大量资料的使用,本身就是一种贡献,
计量方法没啥大问题的话,他们也就七七八八的认可了!

国内的话,嗯! 资料部份,可能他们都觉得您没他们懂,而且,计量方法,他们也觉得他们都是大师吧!

总之,祝福您!
我也只能提供这样的浅见! 希望其他人也能给些意见吧! 也帮助您的研究。




二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2012-2-11 18:28:13
学习下,谢谢分享。。。。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2012-2-11 20:18:26
602dxz 发表于 2012-2-11 14:06
楼主的自变量与因变量分别是什么呀?logit与probit模型是离散选择模型,所以因变量要么是1要么是0。不过看到 ...
"PS:其实最理想的方法是进行面板建模。每年数据样本对象不同,我个人感觉是没有关系的,因为只要你每年的样本选择是随机的,一般假设是每年的样本都可以反映整体。所以这十年数据是一个面板数据,但是可能需要将目标聚类一下,不是一个自然人而是一个地区或是一类人,然后用这一类人的平均值来作为面板中的数据单元。"

我之前看过一种称作pseudo panel data
是否就是您所说的呢?
是的话我之前有考虑过,不过後来并不打算用此方法!

非常谢谢您的建议噢!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2012-2-11 20:36:15
h3327156 发表于 2012-2-11 14:13
我觉得作法上本质上应该没什么错。
深信这资料您都收集十年,应当很了解。
想继续请教:
1.您说"应该对资料的调查做更多的说明->譬如,各年度里,家户是不是同一批家户?"
这些家户资料是每一年随机抽的,
我想每年要抽到相同的家户几乎不可能!
所以认为每年所抽到的家户都不同,
而家户进出的时间点因此也不会一样。

2.目前仅仅还是在尝试的阶段,
所以还没加入变量和年度的交叉项(就担心一开始作法是全错的!),
不过之前有考虑到此问题!
之後也会尝试!

谢谢h大您的回覆,
让我有了继续下去的信心!
也希望还有其他高手能够提供相关的意见
我自己也还在学习当中
非常感谢
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

点击查看更多内容…
相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群