全部版块 我的主页
论坛 计量经济学与统计论坛 五区 计量经济学与统计软件 Stata专版
22321 8
2012-02-21
总共有21个行业分类,我要在回归中控制行业影响,听说可以通过设置哑变量来完成,不知道如何做,或者还有没有别的方法。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2012-2-21 19:50:57
ta industry,g(ind)
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2012-2-21 22:07:04
似乎有三种作法:

第一种,如楼上sungmoo大大说的
ta industry,g(ind)
【这时您可以得到各行业的哑变量,一共21个,分别为ind1 ind2 ind3........一直到ind21】
【这个方法好处是,您可以自由选择基准组,其它方法并不是说不行,只是感觉比较麻烦】

第二种与第三种方法,都是书中或手册说的factor variable

  第二种即
  假设您做简单线性回归,被解释变量是y
  xi: reg y i.industry
  【第二种方法,您会发现除基准组变量外,会有_Iindustry_2  _Iindustry_3  _Iindustry_4 ......
     一直到_Iindustry_21】
  【这个方法依然有著除基准组哑变量外,其它的哑变量】
  【缺点是可能有matsize太小的问题】

   第三种即
   reg y i.industry
   【这个方法的缺点是在您的变量里并不会有各行业的哑变量出现,但优点是,不会像第二种方法,有时会出现matsize太小的问题】

参考看看吧! 祝福您~
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2012-2-21 22:14:13
h3327156 发表于 2012-2-21 22:07
似乎有三种作法:

第一种,如楼上sungmoo大大说的
第三种不太懂,请问能否再解释下?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2012-2-21 23:36:48
aolei 发表于 2012-2-21 22:14
第三种不太懂,请问能否再解释下?
根据测试的结果,发现第二种与第三种,当哑变量很多很多时,都会面临matsize的问题。
Stata对模型的解释变量初步有限制啦! 除非您去更改set matsize

对于第三种的缺点是对的,但优点我认为我说错了! 测试的结果发现它也是会出现matsize太小的讯息。

*以下是测试的例子
set seed 12345
set obs 400
drawnorm u1
gen x1=uniform()
gen y1=0.7*x1+u1
gen xx=_n

xi: reg y1 x1 i.xx
reg y1 x1 i.xx
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2012-2-27 11:22:18
sungmoo 真是高手
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

点击查看更多内容…
相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群