本人小硕,刚接触stata,发现这个软件虽然小,但是博大精深,导致问题多多。为了激励自己学好stata,特开设此贴,作为个人学习笔记之用,不定时更新。由于专业原因,大部分内容和面板数据模型有关。能力有限,我只能告诉你解决方法,别问我为什么。
PS本人用的是stata12,如有错误请换该版本。
20日更新 1.什么是中心化,什么时候用,怎么用?
答:中心化是变量减均值,与标准化是不一样的(标准化是减完均值再除标准差)。当我们证明调节效应,经常要加入交互项。为了避免多重共线性,这时候就需要对交互项测量有关的变量进行中心化。
stata命令是center 变量名称,会自动生成。
也有用gen命令生成,sum x
gen x1=x-r(x),
两者结果在均值上有略微差别,但几乎都为0了。
个人的疑惑是面板数据的中心化是按照总体均值中心化,还是要按年度的数据分别中心化呢?如果我模型中加入了年度变量。
16日上传GMM学习资料,见附件
1.上市公司面板数据怎么编码Id?
答:egen id=group(x),X为上市公司证券代码,注意此处不能用gen命令。
2. hausman检验的基本步骤?
答:先
xtset id year ,
然后Xtreg y x x ,fe
Estimates store fixed
Xtreg y x x,re
Hausman fixed
若Prob>chi2=很小的数 显著不为0拒绝零假设,固定效应估计优于随机效应模型。一般值大于0.05,就可以选择随机模型。但如果提示V_b-V_B is notpositive definite,大牛说这个时候应该用固定效应或者工具变量来做了。
3.什么是xttest0?
是BP检验考察使用随机效应还是混合OLS估计。若Prob>chi2= 显著不为0,所以拒绝零假设,随机模型优于混合OLS估计。
4.xttest3是用于检验固定效应异方差问题。
5.怎么下载新命令或者提示命令不识别。
使用findit x ,x为要下载的命令,弹出对话框,好好找一下你要下载的命令,左击下载。网页下载的命令应放入C盘的ado/plus文件中
6.如何导入XLS文件
一般先转换成CSV,然后使用insheet using e:/stata10/x.csv ,stata12已经开始可以用xls导入,用到import
7.如何生产年度哑变量
答:
tab year, gen (yr)
drop yr5 yr5是最后一个年度哑变量,删除它就是把它当作基准年。一般有N年,就设置n-1个哑变量
8.如何进行winsorize处理
答:一般,会对文章中的连续变量进行了上下1%winsorize处理,避免异常值产生的影响。命令如下
winsor x, gen(x1) p(0.01),输完之后并不会弹出滚动结果,你浏览下数据就发现多了个x1变量