全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 R语言论坛
7955 3
2015-06-18
有5000个特征向量,我想通过特征选择获得其中的500个,我这样写对不对?
profile <- rfe(tt,tt[,"类型"], sizes = c(500), rfeControl = rfeControl(functions=rfFuncs ))
或者其他的包有什么函数可以做到的?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2015-6-19 14:47:13
这样写有点问题,首先是tt,tt[,"类型"] 应该做一下区分,按照你的思路,tt代表的是训练集吧,那tt[,"类型"] 代表测试集应该跟训练集不同,还有就是选择500个, sizes = c(500)应该是 sizes = c(1:500)或者是别的长度为500的向量。特征选择用caret包里别的函数也可以做,比如rfeIter、safs等。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2015-6-23 18:29:06
victorchan0633 发表于 2015-6-19 14:47
这样写有点问题,首先是tt,tt[,"类型"] 应该做一下区分,按照你的思路,tt代表的是训练集吧,那tt[,"类型"] ...
谢谢你的回答,
我是看了这个链接才这样写的:http://blog.sina.com.cn/s/blog_7b75bd9e0101bybb.html
tt[,"类型"]代表的是因变量,
还有在rfe的介绍文档中给出的例子:
rfe(x, y,
    sizes = 2^(2:4),
    metric = ifelse(is.factor(y), "Accuracy", "RMSE"),
    maximize = ifelse(metric == "RMSE", FALSE, TRUE),
    rfeControl = rfeControl(),
    ...)
中对y的介绍:a vector of training set outcomes (either numeric or factor)也是因变量的意思
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2016-4-19 15:05:58
http://blog.sina.com.cn/s/blog_7b75bd9e0101bybb.html楼主,这个例子中的自变量和因变量是那个数据集划分成的两个么,分别代表x和y?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群