全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 SPSS论坛
1262 2
2012-02-29
现有一组数据,里面有连续量,也有开关量,想对其做主成份分析,不知道如何做,还请哪位大侠赐教一下?谢谢!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2012-2-29 16:22:57
自顶,现在贴上数据的前2行:
(1)0,udp,private,SF,105,146,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,1,1,0.00,0.00,0.00,0.00,1.00,0.00,0.00,255,254,1.00,0.01,0.00,0.00,0.00,0.00,0.00,0.00,normal.
(2)0,udp,private,SF,105,146,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,1,1,0.00,0.00,0.00,0.00,1.00,0.00,0.00,255,254,1.00,0.01,0.00,0.00,0.00,0.00,0.00,0.00,normal.

如上所示,有很多列的数据大部分是0,极少数是1,所以被SPSS直接踢掉了,但是从常识判断那几列中又很重要,所以想问一下。

PS:还有个问题,例如第2到4列,是有限个字符串,应该如何处理呢?是按1/2/3...赋值吗?有没有更好的方法?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2015-3-18 18:22:52
字符型主成分分析就得转化为数值型,要是这些字符型不影响你的目标因变量,可以在主成分是不提取他们,然后在综合得分时根据自己的经验给一个权重分数
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群