全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 SPSS论坛
5848 10
2015-04-27
最近在用逻辑回归做因素评价(包括各个因素之间的相互影响),主要影响因素如下:1,称作为空间,有4种,分别叫做Lab,Luv,grey,RGB,这些空间每次只能选择一个,在设置时需要三个dummy变量,以RGB为参考;
2,称作为k值,k可以取值为1,3,5,7四个值,和1类似,每次k只能为一个值,同样设置三个dummy变量,以k=7作为参考;
3,称作为特征,共有六种因素,分别为:Mean,Std,M2,M3,M4,M5,每一个都为一个dummy变量,取值为1或0,取值为1说明使用这个特征因素

实验的结果形式为:一种空间下,一个k值,在特征的一个组合的情况下,分类物品的正确率(如,在Lab下,k=1,选择Mean和Std(即Mean=1,Std=1,M2=0,M3=0,M4=0,M5=0),分类正确率为97%)。
p(正确率)    空间  k值   Mean  Std  M2  M3  M4  M5      
0.97           lab     1      1        1      0      0      0     0      




现在想问:
(1),空间对应成三个dummy变量,并且是以RGB这个为参考是什么意思?转化成变量是否类似如下(个人理解,是有三个新的变量):X1=Lab,X2=Luv,X3=grey,当选取Lab时,对应就是(X1=1,X2=0,X3=0),当选取Luv时,对应就是(X1=0,X2=1,X3=0)当选取grey时,对应就是(X1=0,X2=0,X3=1),然后RGB就是(X1=0,X2=0,X3=0),不知道这种理解是否正确?

(2)上面的实验结果统计出来,导入到SPSS中,上面对应的这些变量该如何设置?(按照(1),会有12个自变量,一个因变量,在逻辑回归下,因变量对应成为:log(p/1-p),是不是需要在导入实验数据前将第一列的p转换成log之后的结果)

希望又懂得的人帮忙解答一下,多谢了啊,很急很急~
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2015-4-27 19:50:44
谈谈我对虚拟变量的理解, 我觉得虚拟变量应该放在一起考虑, 以你的空间变量为例:
如果其回归系数为 a1, a2, a3, 那么在回归方程中应该为 c+a1*x1+a2*x2+a3*x3
其中c为常数项(截距),
当自变量x1,x2,x3都取0时, c+a1*x1+a2*x2+a3*x3=c, (参考)
当自变量x1取1, x2和x3取0时,  c+a1*x1+a2*x2+a3*x3=c+a1, (a1即当x1由0变为1时,因变量相对参考的变化)
当自变量x2取1, x1和x3取0是,  c+a1*x1+a2*x2+a3*x3=c+a2, (a2即当x2由0变为1时,因变量相对参考的变化)
当自变量x3取1, x1和x2取0是,  c+a1*x1+a2*x2+a3*x3=c+a3, (a3即当x3由0变为1时,因变量相对参考的变化)
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2015-4-27 19:57:50
如果你的因变量是p的话, 应该是不能使用逻辑斯蒂回归的, 逻辑斯蒂回归的因变量应该是分类变量.
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2015-4-27 20:18:27
enxizheng 发表于 2015-4-27 19:50
谈谈我对虚拟变量的理解, 我觉得虚拟变量应该放在一起考虑, 以你的空间变量为例:
如果其回归系数为 a1, a2 ...
上面我的个人理解最终是12个自变量,同时需要做相互影响的分析,所以请教你一下,在导入到SPSS中的数据的因变量y的值是不是log(p/1-p),其他的数据就是类似上面我提到的实验结果形式(将其中的Lab换成X1,X2,X3这样的)?
另外,(1)在软件里面有什么需要注意的地方吗?还是就是简单的设置p为因变量,其他全部为自变量?
          (2)由于上面的X1,X2,X3按照公式里面会有类似a12X1X2这样的形式存在,这一块在你和过程中由于X1-3肯定会有0出现,所以不会得到a12这个系数的值,那面最后软件里面是怎么处理的?还是有其他的设置可以排除这个因素的相互作用?
谢谢啦~
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2015-4-27 20:18:32
enxizheng 发表于 2015-4-27 19:50
谈谈我对虚拟变量的理解, 我觉得虚拟变量应该放在一起考虑, 以你的空间变量为例:
如果其回归系数为 a1, a2 ...
上面我的个人理解最终是12个自变量,同时需要做相互影响的分析,所以请教你一下,在导入到SPSS中的数据的因变量y的值是不是log(p/1-p),其他的数据就是类似上面我提到的实验结果形式(将其中的Lab换成X1,X2,X3这样的)?
另外,(1)在软件里面有什么需要注意的地方吗?还是就是简单的设置p为因变量,其他全部为自变量?
          (2)由于上面的X1,X2,X3按照公式里面会有类似a12X1X2这样的形式存在,这一块在你和过程中由于X1-3肯定会有0出现,所以不会得到a12这个系数的值,那面最后软件里面是怎么处理的?还是有其他的设置可以排除这个因素的相互作用?
谢谢啦~
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2015-4-27 21:19:20
也许再也不见 发表于 2015-4-27 20:18
上面我的个人理解最终是12个自变量,同时需要做相互影响的分析,所以请教你一下,在导入到SPSS中的数据的 ...
使用spss做逻辑回归, 因变量必须是分类变量, 而log(p/1-p)不是分类变量, 所以你的因变量应该是和这个p对应的分类变量.

没有必要把Lab改成X1 X2 X3, 我上面只是随便举个例子, 还用你原来的变量名即可.

得不到a12, 说明没有交互效应, 软件应该会把这个系数置0.
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

点击查看更多内容…
相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群