A为关心的政策变量;b为一分类变量,比如说企业规模。企业规模分为三类:大型、中型、小型。
我想看A在不同规模的企业中的作用效果。做法有两种:
第一,进行分样本回归;其缺陷在于不同样本组中的A的回归系数即使存在差异,也无法从统计意义上进行推断;
第二,加入交乘项。即A*b.但b为一分类变量,最好将b转换为三个虚拟变量:b1,b2,b3.
此时,又有两种方法来构造交乘项:第一种是控制A, b1,b2,b3,加入交乘项A*b2,A*b3(b1作为基准组);第二种是控制b1,b2,b3,加入交乘项A*b1,A*b2,A*b3。这里有两个问题:
 
在两种做法中,何种情况下选择分样本回归?何种情况适宜于交乘项回归?
在加入交乘项的回归中:
a.作为基准组的级别样本一般需要满足哪些条件?
b.两种加入交乘项的方法有何差异?两者是否等价?一般情况下采用哪一种?
 
谢谢。