全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 R语言论坛
2869 2
2007-06-04

我现在有一组数据需要回归分析,挑选显著的变量,一般情况常规的分析可以完成,然而, X矩阵中,自变量个数巨多,大概有6000多,而观察值数只有60多,显然是一个P>n的情况,R的package中LARS能够处理这个问题,可惜我这方面完全是个新手

附件是X和Y矩阵

请各路高人给予指点,写一段小程序给我。谢谢

123142.txt
大小:(797.62 KB)

 马上下载


123144.txt
大小:(493 Bytes)

 马上下载


二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2007-6-4 19:04:00

正如你所说的LARS能处理这个问题。其实该问题最关键的是如Bellman(1961)所指出的维数祸害(dimentional hazard),处理饱和的非参数模型,Hastie(1990)的可加模型(additive model)可以一试,R中也有相应的PACKAGE。

如果仅仅是为了挑选显著变量,你还不如做相关检验或者多元主成分分析。

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2007-6-4 22:41:00

谢谢peterf老师的热情指点,我首先想把 R的LARS运行起来,我的主要问题是不知道如何操作这个语言,能否请您仔细的指导一下如何操作,谢谢.

如您所说,我将测试相关检验或者多元主成分分析.

再次谢谢您的指点

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群