全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 R语言论坛
16871 26
2009-12-11
我最近在做线性模型中的变量选择问题,要用到Fan and Li(2001)年的SCAD方法来做,我编了一个程序,感觉有问题。主要问题就出在,当回归系数很小时,就令其为零,这其中的阈值该怎么取?我的程序中是将它设为1e-4.Fan and Li(2001)的论文中说回归系数很小是就令最终的估计为零,并把相应的设计阵中的对应的那一列去掉。我具体的做法是这样的,我把很小的回归系数设为了零,而把相应的设计阵中的那一列设为零,之后用广义逆来做。最后用GCV 来选模型中的参数。但在选出使得GCV最小的参数后,效果不是很好。就是其中还有好几个变量没选出来,而且估计也不好。另一问题是,Oracle 的GCV是不是最小的?我的模拟出来后,有一部分的GCV比Oracle的GCV还要小。
        做了两周了,晚上做梦都在想这个东西。希望有相关方面研究的高人指点指点,小弟在此先谢过了!
        
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2009-12-12 20:23:14
咋没人吱声呢?我自己顶顶!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2009-12-16 22:07:10
我已编好了!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2009-12-17 09:02:37
强人a!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2012-8-29 13:41:07
我现在在学习这一块,楼主能不能分享一下,一起学习啊,谢谢
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2012-9-4 23:15:30
楼主最后得到的模型是否是个疏系数的模型!就是部分变量的系数为零!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

点击查看更多内容…
相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群