什么时候应该取对数?满足以下两个条件之一,可以考虑取对数:被解释变量 Y 与核心解释变量 X 数据的数量级差距很大,例如 Y 取值普遍小于10,X 的取值一般在100~1000之间分布,就可以考虑对 X 取对数,也可以更改 X 的单位;某个变量取值差异极大,例如家庭的工资收入,最低的为0,普遍为2~4万,最高有上百万,这种情况下为避免极端值的影响,可以考虑取对数,同时为了避免工资收入为0的家庭取对数后为缺失值 (因为对0去对数没有意义),可以+1元后再去对数,可以在避免对收入数据造成较大影响的情况下,保留工资收入为0的样本。【但是,取对数的变量不应该有负数。】如果一个变量取负数是合理的,取对数会造成样本的选择性偏差。例如可能由于经营企业等亏损,家庭总收入可能小于0,这是合理的,如果取对数,会造成使用家庭总收入的对数值进行计量时,家庭总收入小于0的样本被忽略。