全部版块 我的主页
论坛 提问 悬赏 求职 新闻 读书 功能一区 经管百科 爱问频道
4352 3
2014-04-19
大于两类以上的分类变量如何用一个虚拟变量表示?好像有说是对不同的类型赋值?但是我现在对这些不同类别对因变量的影响差别不是很清楚,赋不了值啊 而且 这赋值存在主观性,怎么较好避免?  
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2014-4-19 19:10:35
当一个分类变量包括m个类别,那么可以产生m个相应的虚拟变量。但是,建模需要的虚拟变量的数目应等于分类总数-1,也就是说,如果变量包括m个类别,那只需要建立M-1个虚拟变量即可。(因为每一个虚拟变量都是其余虚拟变量的线性组合)
  从建模中省略的那个类别(omitted category)称作参照类。
比如,模型的变量有三个类别:重点中学、城市普通中学、农村普通中学。在模型中可以设置两个虚拟变量var1,var2分别表示重点中学和城市普通中学,模型中没有包含的农村普通中学就作为参照类。
当一个学生属于重点中学时,var1=1,else var1=0;
当一个学生属于城市普通中学时,var2=1,else var2=0;
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2014-4-19 19:19:35
无情兽 发表于 2014-4-19 19:10
当一个分类变量包括m个类别,那么可以产生m个相应的虚拟变量。但是,建模需要的虚拟变量的数目应等于分类总 ...
嗯嗯,你说的对,但是我想咨询的是:假设我的分类变量有5类(同属于一个自变量),那要用4个虚拟变量来表示,而且在模型中这本来是一个变量的,应该是一个系数,就有4个变量,4个系数了,这样我觉得不太好,就是有没有方法是,用一个变量表示的,变量的不同值表示不同的类别,得到一个系数?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2014-4-19 20:13:00
jbj0910 发表于 2014-4-19 19:19
嗯嗯,你说的对,但是我想咨询的是:假设我的分类变量有5类(同属于一个自变量),那要用4个虚拟变量来表 ...
木有吧,没有学过
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群