全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 R语言论坛
4155 6
2011-03-05
假设有24组数据 要求其中一个与其他变量之间的线性关系
在R里用step()算出一个模型 包含17个变量,接下来要怎么优化模型呢?求思路~

可以在summary之后,先把没有significant星号的去掉,建立一个新模型,然后重复上一步,把sig.level只有一星之类 不高的都剔除掉?

如果去掉一个不显著的变量之后,其他变量的显著水平发生了变化,那是证明这两个变量之间有共线性吗?那要怎么办呢?

还有关于anova,最好是把上面步骤做完,得到一个最优的模型之后再做one way anova吗?只有一个变量可以分level,做anova的时候其他变量怎么办呢?要把他们和y结合起来 然后对factor做one way anova吗?

谢谢了!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2011-3-6 09:17:06
lz这个问题不难,但是要说的实在太多了,lz还是好好看看书理解理解,再把问题减肥一下来问吧。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2011-3-6 16:12:06
ltx5151 发表于 2011-3-6 09:17
lz这个问题不难,但是要说的实在太多了,lz还是好好看看书理解理解,再把问题减肥一下来问吧。
看了半天书还是不懂啊。。。。

那就先问一下做完stepwise selection选出来的模型要在怎样进一步筛选合适的变量呢?因为stepwise之后剩的实在太多了。。。。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2011-3-6 19:09:56
似乎可以考虑变量选择问题,比如lasso、SCAD等,仅供参考!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2011-3-6 19:45:04
4# wngbaq

还没学过那么复杂的。。。。
可以看剩下变量的significance来筛选吗?做完stepwise之后
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2011-3-8 04:06:35
可以用cross-validation,在每一个删去变量以后的model算一个CV estimate,结果越小的越好。
one-out CV,每一个model,可以直接用sum( resid^2/(1-hatvalue)) 来计算,这样就省去了你先循环程序的步骤。resid和hatvalue,R里面都可以只直接用function得出来。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

点击查看更多内容…
相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群