全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 R语言论坛
4023 4
2018-02-26
数据可通过kappa函数来确定多重共线性是否很显著
但请问R中是否有函数能够直接从大于40个变量中确定哪两个变量相关性高?
还是用for函数一个一个做循环,再用which函数找出相关性高的变量?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2018-2-27 08:39:04
你需要的是不是主成分分析PCA?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2018-2-27 21:15:51
cheetahfly 发表于 2018-2-27 08:39
你需要的是不是主成分分析PCA?
不是,就是变量太多,多重共线性也比较大,想删减些变量
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2018-2-28 13:15:19
做一个相关系数矩阵不就行了?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2018-3-1 15:15:56
Thanos123 发表于 2018-2-27 21:15
不是,就是变量太多,多重共线性也比较大,想删减些变量
你可以用主成分分析或者因子分析进行降维,或者直接利用奇异值分解来降维啊,直接删除变量是很冒险的做法,因为就算两组数据存在共线性,在带入模型中时也是可能显著提高贡献度的。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群