对分类变量的编码主要是服务于对回归系数的解释。虚拟变量编码(dummy variable coding)是一种,一般采用0和1,0是参照组,这样回归中此虚拟变量的系数就表示取值为1的那组和参照组的平均效应相差多少(这通常是我们希望了解的,也正是采用0,1编码的便利所在,而不仅仅是为了区别不同组)。除此之外,还有其它的编码系统,比如unweighted effects coding system(参照组取-1)和weighted effects coding system(基于每组的样本量来构建编码),不同的编码使得回归系数的意义不同。具体可参见Cohen, J., Cohen, P., West, S. G., & Aiken, L. S. 2003. Applied multiple regression/correlation analysis for the behavioral sciences (3rd ed.). Mahwah, NJ: Lawrence Erlbaum Associates Publishers中的相关章节。