全部版块 我的主页
论坛 计量经济学与统计论坛 五区 计量经济学与统计软件 Stata专版
4858 4
2015-10-18
请教各位stata大神:
我的回归模型中因变量有6组数据构成,即因变量有6类,但每类中的数据都是连续的。每类因变量都对应着自变量和控制变量,但是这些自变量和控制变量又被分为4类,即总共有6*4=24种。
考虑到回归模型的稳健性和可靠性,我决定分别加入两组虚拟变量,一组表示因变量的类别(有6-1=5个虚拟变量组成),另一组表示自变量和控制变量的类别(有4-1=3个虚拟变量组成)。
但是模型有点复杂 有点混乱 不知道如何用stata进行操作啊?
跪求各位stata高手帮忙解答
谢谢啊!!!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2015-10-18 10:28:33
加i.变量名,或者 c.变量名, 就可以直接生成该变量各个category的虚拟变量了。更具体的话,你google一下吧
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2015-10-18 10:32:44
1011639 发表于 2015-10-18 10:28
加i.变量名,或者 c.变量名, 就可以直接生成该变量各个category的虚拟变量了。更具体的话,你google一下吧
THX 我试试
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2015-10-19 18:17:16
其实……病没看懂,但觉得,如果单纯讲命令怎么写,楼上正解!不过我建议别用另建一套category var,对应不用的排列组合。
gen var1=1 if cat1==1 & cat2==1 & ...
gen var2=1 if cat1==1 & cat2==2 & ...
这样你才能知道具体是那种组合显著。但是,如果组合过多的话,可能会not reliable. 简而言之,不能同时control多组同一变量。要么挑几组重要的,要么,修改生成方法。the problem of multiple testing具体解释见 http://home.uchicago.edu/amshaikh/webfiles/palgrave.pdf
或者考虑用IV...
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2015-10-24 20:07:32
réussite 发表于 2015-10-19 18:17
其实……病没看懂,但觉得,如果单纯讲命令怎么写,楼上正解!不过我建议别用另建一套category var,对应不用 ...
太感谢了 我好好研究研究
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群