纯新手,想用stata做实证,对于统计的知识有很多空白,求指导。
原始数据如下:
求教几个问题:
(1)这个是叫非平衡面板数据吗?
(2)我应该选择
混合估计模型、随机效应模型还是固定效应模型来回归呢?通过什么方法确定?
(3)如果我选择时间和行业为控制变量,是不是只需要通过命令 i.year和i.ind就可以了?不需要自己设置虚拟变量?有人说i.ind需要ind为数值型,我数据中这种含字符的可以吗?如果不需要手工设虚拟变量,是不是按图中格式直接放到stata就可以了?(4)如果做截面回归,是不是取每家公司的年平均值回归即是截面回归?如果是,有命令可以直接操作吗?因为原始数据中每家公司的时间序列数量不一样,取平均有点麻烦。
(5)图中的缺失值需要做什么处理吗?还是不管它?
看了一些资料还是没搞懂这些问题,对于小白来说要从原理开始看时间有点来不及了,求精准指导{:3_59:}