a.之所以把残差平方和作为优化的函数而不用离差和作为优化的目标函数,是因为离差有正有负,会正负抵消掉一些,对参数评价不合理。
b.黑人虚拟变量前面的系数如果统计显著说明黑人和白人相比,基本工资水平是有差别的。
c.模型中已经引入了性别虚拟变量(女性),而性别一共只有两个类别,所以只引入一个性别虚拟变量就可以了,不需要再引入男性虚拟变量,如果同时引入两个变量就会产生完全共线性问题。
d.如果把两个虚拟变量乘项加入模型则是考虑会存在乘数效应,就是同时满足黑人和女性的人的工资和只是满足黑人或者只是满足女性的人的工资可能存在差异。
e.无偏性这个性质,是通过数学证明的。满足线性回归基本假设的情况下,beta1这个参数应该是具有无偏性的。获得一个样本就能够得到一个参数估计量,而所有可能的样本得到的参数估计量的平均值是真实值。因此这个样本参数是总体参数的一个无偏估计量。
f.为了增强模型的解释程度,可以加入一些其他解释变量比如工作年限,工作时长。因为对于同一个工种或者劳动的复杂程度接近的话,如果工作时间越长应该工资越高。一般来说一个人的工作经验越多就越能得到更高的工资,而工作经验通常是用工作年限来表示。