全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 R语言论坛
4614 5
2011-12-30
悬赏 20 个论坛币 已解决
我有21个地方9年的数据,我想做区域分组,如果我把9年数据放在一起一共就有189条,这时我用R软件做分类回归树,可以分三组;但如果把这9年数据取个平均值,就有21条数据,只能分出两组。我用的指令是fit=rpart(y~x1+x2+x3+x4+x5,data=a)

补充一下:我做过其他试验,貌似数据一少,就只能分2组,其实我觉得21条已经不少,为啥又只能分两组?
以下是我的数据,万分感谢
数据.xls
大小:(39.5 KB)

 马上下载


最佳答案

qoiqpwqr 查看完整内容

这是rpart的一些选项 rpart.control(minsplit = 20, minbucket = round(minsplit/3), cp = 0.01, maxcompete = 4, maxsurrogate = 5, usesurrogate = 2, xval = 10, surrogatestyle = 0, maxdepth = 30, ...) 第一个minsplit的缺省值是20,如果一个node的个数小于20的话,就不会再继续分下去了。 你的总个数是21,分了一次之后一个是13,一个是8,所以不会再继续下去了。 > fit=rpart(y~x1+x ...
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2011-12-30 18:10:26
这是rpart的一些选项
rpart.control(minsplit = 20, minbucket = round(minsplit/3), cp = 0.01,
              maxcompete = 4, maxsurrogate = 5, usesurrogate = 2, xval = 10,
              surrogatestyle = 0, maxdepth = 30, ...)
第一个minsplit的缺省值是20,如果一个node的个数小于20的话,就不会再继续分下去了。
你的总个数是21,分了一次之后一个是13,一个是8,所以不会再继续下去了。

> fit=rpart(y~x1+x3+x5,data=dat, cp = 0.001, minsplit = 5)
> fit
n= 21

node), split, n, deviance, yval
      * denotes terminal node

1) root 21 4.92946800 0.5857907  
   2) x3< 4.621357e+07 17 0.43087720 0.4131688  
     4) x5< 1.477778 6 0.07079054 0.2864146  
       8) x5< 1.005 2 0.01760142 0.1982708 *
       9) x5>=1.005 4 0.02988114 0.3304865 *
     5) x5>=1.477778 11 0.21110520 0.4823075  
      10) x3< 3.049149e+07 9 0.13067690 0.4455678  
        20) x3>=2.615278e+07 3 0.02317325 0.3416831 *
        21) x3< 2.615278e+07 6 0.05893949 0.4975102  
          42) x3< 2.472364e+07 4 0.02392114 0.4521742 *
          43) x3>=2.472364e+07 2 0.01035413 0.5881822 *
      11) x3>=3.049149e+07 2 0.01361306 0.6476360 *
   3) x3>=4.621357e+07 4 1.83909100 1.3194340 *
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2011-12-31 14:44:54
qoiqpwqr 发表于 2011-12-30 18:10
这是rpart的一些选项
rpart.control(minsplit = 20, minbucket = round(minsplit/3), cp = 0.01,
       ...
真谢谢啊~~那如果我要用prune这函数进行剪枝,并且Ra(T)=R(T)+a|T|公式中a=2,那么应该如何使用prune这函数呢?
还想请问一下哪里可以找到rpart,以及prune这两个函数的参数介绍啊?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2011-12-31 14:53:18
robit 发表于 2011-12-31 14:44
真谢谢啊~~那如果我要用prune这函数进行剪枝,并且Ra(T)=R(T)+a|T|公式中a=2,那么应该如何使用prune这函 ...
?rpart
?prune
?rpart.control
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2011-12-31 16:52:59
qoiqpwqr 发表于 2011-12-31 14:53
?rpart
?prune
?rpart.control
谢谢啊~做了分类树后,那能不能求出各预测变量的重要性啊?应该输入什么指令?再次麻烦了~
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2012-3-14 08:09:44
robit 发表于 2011-12-31 16:52
谢谢啊~做了分类树后,那能不能求出各预测变量的重要性啊?应该输入什么指令?再次麻烦了~
predict命令
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群