全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 R语言论坛
16393 8
2014-08-27
大家好!

我遇到一个问题,假设研究若干个变量对某一个因变量的影响。而自变量非常的多,这种影响极有可能是非线性的,变量太多。
除了使用主成分分析方法外,还有其它更为可性的方法吗?

比如y = f(x1, x2, x3, ..., x100)
我不可能使用所有的变量,同时对于最后选定的变量,还需要看每个变量影响的贡献率,只有主成分分析方法了吗?
比如我使用了广义可加模型或者广义线性模型。

谢谢!

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2014-8-29 14:16:56
还可以使用因子分析
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2014-8-29 21:37:12
RUSSO12138 发表于 2014-8-29 14:16
还可以使用因子分析
谢谢!但是因子分析是不是也是建立在线性关系基础上的?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2014-8-30 12:20:32
peijianshi 发表于 2014-8-29 21:37
谢谢!但是因子分析是不是也是建立在线性关系基础上的?
逐步回归方法?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2014-8-30 15:13:25
有几种方法都和你说一下。
首先是主成分,优势是 可以 解决多重贡献性 的问题
其次 可以使用多元方差分析,可以 删除对 y没有影响的变量
然后可以使用 Aic 的逐步回归
最后也可以使用leaps 包里面的全子集 回归
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2014-8-31 09:23:47
而自变量非常的多
-----------------
lasso
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

点击查看更多内容…
相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群