全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 R语言论坛
2282 2
2018-04-08

我想用rpart函数建立一个分类树模型,共有五万多个样本,变量共有120个,都是分类变量,目标变量是一个二分类变量,但是建模后模型中没有引入任何变量,绘制分类树图只有一个根节点。

我把所有分类变量都改成因子型了,用C50建模没有任何问题,但是用rpart或者randomforest就不行,所以应该不是数据的问题,求各位大神帮忙看看是什么情况!!

代码:

> mod_rpart <- rpart(formula = 目标变量~ ., data = dat_train, method = "class")
> summary(mod_rpart)
Call:
rpart(formula = 目标变量 ~ ., data = dat1, control = rpart.control(minsplit = 10))
n= 55760

CP nsplit rel error xerror xstd
1 0 0 1 0 0

Node number 1: 55760 observations
predicted class=1 expected loss=0.4706241 P(node) =1
class counts: 26242 29518
probabilities: 0.471 0.529


二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2018-4-9 09:45:46
我感觉信息太少不知道你的模型问题在哪,不过提供一些思路帮助:
首先,C50和 rpart包的分类树以及 RF 都不是一样的模型,数据可以跑 C50,而不能跑其他模型,并不代表数据没有问题。 不同的模型对数据有不同的要求,所以我觉得还是需要再看看数据,比如缺失值等。
其次,只有根节点的话,那也可能存在完美分割的问题。可能有某个变量可能完美分类,建议用图像或者交叉表检测一下数据。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2018-4-10 13:48:04
复制代码

参数调一下试试
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群