全部版块 我的主页
论坛 新商科论坛 四区(原工商管理论坛) 商学院 数字化企业管理
3448 3
2007-08-09
<P>做逻辑回归时,对于分类变量数字化问题:</P>
<P>    一种解决方是用0,1编码。若分类变量有n个值,则0,1串长度为n-1。<BR>    例如,某产品有3种颜色:黑、白、绿。若黑为(0,1),白为(1,0),则绿是</P>
<P>(1,1),还是(0,0)?</P>
<P>     还有一种办法是求分类变量WOE值。<BR>     请问WOE值如何求才合理呢?<BR>     仍以某产品有3种颜色为例。假如要用逻辑回归,判断客户对产品的满意度。而颜</P>
<P>色是产品的特性之一。则三种颜色的WOE值该如何求。</P>
<P>     对于神经网络模型而言,也需把分类变量数字化。</P>
<P>     请问数字化方法是与照逻辑回归相同,还是有其它注意事项?</P>
<P>     最后,请大家注意,管理员答应回答一个问题,奖100论坛币....</P>
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2007-8-14 13:39:00
<P>该产品颜色是个三分类变量,那么只要引入两个变量color1和color2,其中color1取0或1,分别代表不是黑色和是黑色;同样color2也取0或1,分别代表不是白色和是白色。只需要引入两个变量color1或color2就可以,不必对绿色再引入color3这个变量.因为如果color1=0且color2=0,代表既不是黑也不是白,那么就是绿了.</P>
<P>从理论上说,对一个n分类变量就只要引入n-1个(0,1)取值的逻辑变量就可以.如果引入n个逻辑变量是错误的,因为这会引起一个叫"多重共线性"的问题,也就是说存在color1\color2\color3取值向量的一个线性组合其值等于0,这将使得回归系数的方差变动很大,这样得出的回归系数就不可靠了.</P>
<P>反正回归当中这个问题是这样处理的.神经网络模型我只会瞎用用,理论上还搞不懂.提出来,希望对您有所帮助.</P>
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2007-8-14 14:27:00
虚拟变量的设置在郭志刚那本spss的书有详细讲的。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2012-11-7 10:28:46
学习了~~
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群