例如x为四分类的变量,则需要产生四个哑变量(事实上分析时一般只需要纳入三个哑变量即可,以未纳入的作为reference group)
X
| X1
| X2
| X3
| X4
|
1
| 1
| 0
| 0
| 0
|
2
| 0
| 1
| 0
| 0
|
3
| 0
| 0
| 1
| 0
|
4
| 0
| 0
| 0
| 1
|
在Stata中实现
先建立数据集a
clear
input x
1
2
3
4
end
方法一:
tab x,gen(x),改命令直接产生四个哑变量,分别为x1 x2 x3 x4
方法二;
xi: means i.x
xi要求将命令中以“i.”开头的变量自动转换为哑变量进入模型。本例中有四个水平,但是只产生三个哑变量,变量名分别为_Ix_2 _Ix_3 _Ix_4,默认将_Ix_1作为reference group.
注意:在stata中xi是系统默认的,i不能改为其他的字母但是means可以随便换成其他的命令语句
如xi: logistic y sex i.group则是对变量group产生哑变量