个人学历,性别等这些是定性数据。利用虚拟变量来解决此类问题。比如说,你要分析个人的学历对工资的影响,可以把学历分为几类,比如:初中以下(x0),高中(x1),大学(x2),研究生(x3),研究生以上(x4)。把任何一个作为基类,其他的四个引进方程,比如把x1到x4引入方程。如是高中学历就让其等于1,其他为0,如果是大学学历就让其等于1,其他三个为0,依次类推。
这四个因变量的系数表示与基类(即初中以下)的差别。比如说x1的系数为100(在方程为线性且不取对数的情况下),意思就是高中学历的人平均比初中以下学历的人的工资高100
[此贴子已经被作者于2008-11-21 9:43:07编辑过]