我现在有一组数据需要回归分析,挑选显著的变量,一般情况常规的分析可以完成,然而, X矩阵中,自变量个数巨多,大概有6000多,而观察值数只有60多,显然是一个P>n的情况,R的package中LARS能够处理这个问题,可惜我这方面完全是个新手
附件是X和Y矩阵
请各路高人给予指点,写一段小程序给我。谢谢
马上下载
请注明:姓名-公司-职位
以便审核进群资格,未注明则拒绝
正如你所说的LARS能处理这个问题。其实该问题最关键的是如Bellman(1961)所指出的维数祸害(dimentional hazard),处理饱和的非参数模型,Hastie(1990)的可加模型(additive model)可以一试,R中也有相应的PACKAGE。
如果仅仅是为了挑选显著变量,你还不如做相关检验或者多元主成分分析。
谢谢peterf老师的热情指点,我首先想把 R的LARS运行起来,我的主要问题是不知道如何操作这个语言,能否请您仔细的指导一下如何操作,谢谢.
如您所说,我将测试相关检验或者多元主成分分析.
再次谢谢您的指点