哑变量放入其实就是对这一类做显著性解释,有一个哑变量显著,就说明类别是有意义的。有个帖子中举了个例子我觉得挺好的:
我举一个例子:
假设Gender有3个分类:男人,女人,女博士
首先看看哪个分类的数量最多,中国的情况是男人所占比例最大,那么Gender重新编码为:
男人-> GenderFemale=0,GenderPhd=0
女人-> GenderFemale=1,GenderPhd=0
女博士->GenderFemale=0,GenderPhd=1
然后做回归分析,如果GenderFemale是显著的,则表明对于女人与男人两组群体Y的均值有显著不同(ANOVA的思想);如果GenderPhd是显著的,则表明对于女博士与男人两组群体Y的均值有显著不同
不知道解释的清楚吗
---
男人女人女博士纯属搞笑,绝无冒犯各位女Phd的意思
https://bbs.pinggu.org/thread-1146986-2-1.html