R模型优化问题急急急！！

4253

收藏 2011-03-05

假设有24组数据要求其中一个与其他变量之间的线性关系
在R里用step()算出一个模型包含17个变量，接下来要怎么优化模型呢？求思路~

可以在summary之后，先把没有significant星号的去掉，建立一个新模型，然后重复上一步，把sig.level只有一星之类不高的都剔除掉？

如果去掉一个不显著的变量之后，其他变量的显著水平发生了变化，那是证明这两个变量之间有共线性吗？那要怎么办呢？

还有关于anova，最好是把上面步骤做完，得到一个最优的模型之后再做one way anova吗？只有一个变量可以分level，做anova的时候其他变量怎么办呢？要把他们和y结合起来然后对factor做one way anova吗？

谢谢了！

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

全部回复

ltx5151

2011-3-6 09:17:06

lz这个问题不难，但是要说的实在太多了，lz还是好好看看书理解理解，再把问题减肥一下来问吧。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

_jiejie

2011-3-6 16:12:06

ltx5151 发表于 2011-3-6 09:17
lz这个问题不难，但是要说的实在太多了，lz还是好好看看书理解理解，再把问题减肥一下来问吧。

看了半天书还是不懂啊。。。。

那就先问一下做完stepwise selection选出来的模型要在怎样进一步筛选合适的变量呢？因为stepwise之后剩的实在太多了。。。。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

wngbaq

2011-3-6 19:09:56

似乎可以考虑变量选择问题，比如lasso、SCAD等，仅供参考！

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

_jiejie

2011-3-6 19:45:04

4# wngbaq

还没学过那么复杂的。。。。
可以看剩下变量的significance来筛选吗？做完stepwise之后

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

windlove

2011-3-8 04:06:35

可以用cross-validation,在每一个删去变量以后的model算一个CV estimate,结果越小的越好。
one-out CV,每一个model，可以直接用sum( resid^2/(1-hatvalue)) 来计算，这样就省去了你先循环程序的步骤。resid和hatvalue，R里面都可以只直接用function得出来。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

点击查看更多内容…

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

分享

扫码加好友，拉您进群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群