众位大侠,
关于公司金融的数据分析.
假设要针对某数据库里的每一家公司(以股票代码CODE识别)先找到所有与之同行业同年份的所有公司, 再对这些与原始公司同年同行业的公司进行y=a+bx1+cx2+u 的回归, 求回归后的估计值, 再算该估计值与原始公司y的差值.
目前看起来好象有两种方法达到以上结果(下面说的都是包含原始公司自身的方法):
(1)
gen reg_obs = .
gen yhat = .
gen res = .
local N = _N
forv i = 1/`N' {
local industry = industry[`i']
local year = year[`i']
capture {
regress y x1 x2 if industry == `industry' & year == `year'
replace reg_obs = e(N) in `i'
predict p in `i', xb
replace yhat=p in `i'
predict r in `i', residuals
replace res = r in `i'
drop r p
}
}
(2)
sort year industry
by year industry:reg y x1 x2
predict yhat, p
predict res,res
照理说这两种方法应该是相同的, 可是我用两种方法做出来的每个公司的yhat, res却不相同,
还有第二种方法回归时是包含了该原始公司还是不包含?
请教究竟问题出在哪里?
多谢多谢
SORRY, yhat相同的事情是自己想糊涂了, 那部分已删