全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 SPSS论坛
2013-6-4 13:12:19
llulla 发表于 2008-11-13 03:26
对于一般线性回归,通常不主张用虚拟变量进行分析。因为要求资料是正态分布。但对于大样本,也可以进行分析。 ...
您对虚拟变量的理解有误。
虚拟变量个数的选择标准:
1.若定性因素具有m个相互排斥属性(或几个水平),当回归模型有截距项时,只能引入(m-1)个虚拟变量;2.当回归模型无截距项时,则可引入m个虚拟变量;否则,就会陷入“虚拟变量陷阱”。
按照您说的,如果模型中存在截距项,模型中应该引入两个虚拟变量而不是三个,否则会造成虚拟变量之间的多重共线(即通常所说的虚拟变量陷阱);可以引入是否是汉族(1表示是汉族,0表示不是汉族),是否是回族这两个虚拟变量(1表示是回族,0表示不是回族)。

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2016-4-12 11:27:21
还有问题就是如何对虚拟变量的总题项进行解释,比如上面所说的民族,有回族对汉族 以及其他民族对汉族,但是 总变量“民族”怎么解释呢
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群