全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 R语言论坛
4775 1
2015-10-13


library(caret)
data(mdrr)
1. caret包中的rfe函数
x=mdrrDescr;y=mdrrClass
profile=rfe(x,trainy,sizes=c(21,25,28,30,33),
             rfeControl = rfeControl(functions=rfFuncs,method=’cv’))中sizes该如何设置?
我设置了三种形式
sizes=c(18:33)
sizes=c(18,19,20,21,22,23,24,25,26,27,28,29,30,31,32,33)
sizes=c(21,25,28,33)
三种sizes设置得出的结果依次如下图所示
问题1: size具体该怎么设置? 如果能得出最优变量集?
问题2: 是否还有其他好用的特征筛选报或者函数用?有没有使用案例分享? 谢谢

Variables Accuracy  Kappa AccuracySD KappaSD Selected
        18   0.7909 0.5693    0.06198 0.12545
        19   0.7934 0.5746    0.06212 0.12399
        20   0.7985 0.5843    0.05859 0.12037
        21   0.7935 0.5739    0.05700 0.11734
        22   0.8010 0.5889    0.05664 0.11624
        23   0.8085 0.6042    0.05666 0.11614
        24   0.7960 0.5781    0.05015 0.10407
        25   0.8008 0.5895    0.05744 0.11723
        26   0.8010 0.5894    0.04828 0.09891
        27   0.8059 0.5995    0.05695 0.11608
        28   0.8060 0.5989    0.06216 0.12671
        29   0.7985 0.5852    0.07074 0.14358
        30   0.8110 0.6084    0.05113 0.10568        *
        31   0.8085 0.6050    0.05776 0.11893
        32   0.8060 0.5989    0.06435 0.13150
        33   0.8035 0.5948    0.06083 0.12350
        64   0.8110 0.6095    0.05418 0.11089
——————————————————
Variables Accuracy  Kappa AccuracySD KappaSD Selected
        18   0.7810 0.5478    0.06127  0.1210
        19   0.7783 0.5425    0.06264  0.1249
        20   0.7883 0.5635    0.06863  0.1384
        21   0.7833 0.5525    0.05086  0.1031
        22   0.7860 0.5598    0.06262  0.1255
        23   0.7809 0.5482    0.06145  0.1229
        24   0.7910 0.5700    0.06230  0.1222
        25   0.7936 0.5756    0.05948  0.1161        *
        26   0.7910 0.5692    0.07010  0.1401
        27   0.7935 0.5743    0.04951  0.0961
        28   0.7810 0.5490    0.05877  0.1162
        29   0.7810 0.5497    0.06303  0.1229
        30   0.7835 0.5543    0.05246  0.1004
        31   0.7911 0.5700    0.06520  0.1269
        32   0.7935 0.5743    0.05483  0.1066
        33   0.7860 0.5599    0.06885  0.1351
        64   0.7911 0.5692    0.06441  0.1308
—————————————————–
Variables Accuracy  Kappa AccuracySD KappaSD Selected
        21   0.8010 0.5866    0.07637  0.1623
        25   0.8013 0.5874    0.07015  0.1492
        28   0.7986 0.5810    0.08060  0.1721
        30   0.7986 0.5813    0.06582  0.1419
        33   0.8034 0.5912    0.08454  0.1788        *
        64   0.7988 0.5850    0.07505  0.1575

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2015-12-19 12:15:17
应该是选择最高的那个数量吧。rfe会把特征重要性依次排序,size是留在模型里的比较重要的特征数量。
按照我的观点,应该选择Accuracy和  Kappa比较高,而且SD低的那个size。这说明模型预测精度高,而且比较稳定。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群