全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 R语言论坛
3698 7
2016-11-10
做出来的决策树效果不好,预测的正确率只有50%,不知道是什么原因,求大神指教下
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2016-11-10 15:21:58
方法不对吧。采用新方法训练下
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2016-11-10 16:00:19
tianjixuetu 发表于 2016-11-10 15:21
方法不对吧。采用新方法训练下
我用的rpart包,代码如下:
data <- read.csv("E://sha.csv",header=T)
ind <- sample(2, nrow(data), replace=TRUE, prob=c(0.9, 0.1))
traindata <- data[ind==1,]
testdata<- data[ind==2,]

library(rpart)
ct<-rpart.control(xval=5,minsplit=2,minbucket=1,cp=0.01)
model.CART <-rpart(f~七天+X1月+X3月+X6月+X12月+X18月+X24月+a+b+c+d,method="class",control=ct,data=traindata,parms=list(prior=c(0.6,0.4),split="information")
prune(model.CART,cp=0.01)

results.CART <-predict(model.CART,newdata=testdata, type="class")
不知道是不是代码写的有问题,还是那个参数没有设置对啊,总共11个变量,其中有9个都是连续的,是不是要把连续变量离散化?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2016-11-10 18:26:09
一,决策树中很不稳定的,二,50%,说明,数据没啥子用信息含量,三,决策树,对变量没有要求离散化,它是最适合各类变量类型的ML,四,现在,单用决策树,已很少有价值了。。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2016-11-11 09:07:54
jgchen1966 发表于 2016-11-10 18:26
一,决策树中很不稳定的,二,50%,说明,数据没啥子用信息含量,三,决策树,对变量没有要求离散化,它是最 ...
你好,那除了用决策树,还有什么方法可以用来分类预测?用随机森林是不是可以提高稳定性和正确率呀?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2016-11-11 10:50:17
yaoqsm321 发表于 2016-11-11 09:07
你好,那除了用决策树,还有什么方法可以用来分类预测?用随机森林是不是可以提高稳定性和正确率呀?
如 果,有兴趣,有时间,可好好研习 R 包 caret  ,它包含了近百个分类ML 方法。。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

点击查看更多内容…
相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群