全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 SPSS论坛
15248 7
2010-12-11
为了衡量一地区的基础设施水平,本人选取了公路里程、铁路营运里程、能源消费总量、邮路总长度和长途光缆长度几个变量,想用SPSS做主成分分析得到一综合指标,然后用其作为因变量进行回归。请问用主成分分析得到的变量可以作为因变量吗?还有这一变量应如何选取,是取第一主成分,还是将所有主成分用方差贡献率进行加权?能否推荐几篇相关文章?
希望知道的能给予解答,不胜感激!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2010-12-11 21:38:41
可以 有论文这样做。。。。。。。。。。。。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2010-12-11 22:22:47
谢谢二楼的回答!
还想问下能否推荐几篇这样的文章,谢啦!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2010-12-12 08:39:32
一般来说principal component analysis是在covariates之间有potential collinearity的情况下使用
来通过线形变化生成多个不相关的变量用于回归
LZ选取的几个变量间的collinearity很难确定 如果说里程有潜在关系 但是能源就不好说了
这样的话很有可能需要选取多个成分来包含这些原始协变量的信息 而线性组合的成分之间也有可能出现线性关系来误导回归模型
当然具体的步骤要建立在具体的数据上
建议LZ输出这些covariates的correlation coefficients和matrix scatter plot来判断他们之间的关系
并选取潜在相关的变量做主成分分析 而独立的变量最好直接输入模型来保持信息的完成
pca会根据相关变量的个数生成主成分 一般选取1到2个主成分来包含80%以上的variance就可以了
至于对于主成分的加权 我认为应该相当小心 如果样本很小 还是不要了 以免无法满足回归的假设
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2010-12-12 14:49:00
谢谢各位的解答,很有帮助!
但本人还有两个疑问:1、主成分分析后得到的主成分得分有正有负,用该得分作为因变量进行回归,是否需要将其全部转换为正值,如何转换?
                                      2、算主成分得分时,是用原始数据的标准化数据进行的,那么将主成分得分作为因变量进行回归时,是否需要将解释变量也进行标准化,还是有其他方法可以把主成分得分还原成与原始数据相关的指标。
望知情者给予进一步的解答,多谢了!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2010-12-12 20:19:34
是不需要转化正负的 保持线性变换后的数值就可以
应该是用原始数据来算主成分
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

点击查看更多内容…
相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群