小白一枚,我最近刚刚开始用stata处理盈余管理的数据,估计真实盈余管理指标时我采用分行业分年度进行回归,但是回归结果不是很理想。看了很多相关文献,前辈们都在回归时保证每年每个行业至少有15个观测值,,我看了自己的回归结果发现,有很多分组都不符合这个条件。所以有两个小问题:
(1)如何能够保证数据中每年每行业至少有15个观测值??或者说删除掉不符合条件的数据。
(2)通过查阅很多帖子,我采用了两种方法估计残差,但是两种方法下的残差差很多,这是为什么呢??是不是残差应该接近于0才更加准确呢??(以下是我使用的命令)
    求大神赐教~
  *-真实盈余管理指标估计一
use all2.dta
sort year Indcd
bys year  Indcd: reg  cfo aa sa sa1
predict res1, res
*-真实盈余管理指标估计二
use all2.dta
egen t=group(year)
qui sum t
local Nt=r(max)
egen s=group(Indcd)
qui sum s
local Ns=r(max)
gen res=.
forvalues t=1/`Nt'{
  forvalues s=1/`Ns'{
    cap qui reg cfo aa sa sa1 if (t==`t'& s==`s')
        cap qui predict e if e(sample),res
        cap qui replace res=e if e(sample)
        cap drop e
  }
 }
save all_2,replace
sc res res1
 
这张图表代表了什么呢??基本知识不扎实的我求大神帮忙解释以下~