全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 R语言论坛
2608 1
2014-07-27
各位大侠,求助:
我在作分类树时,用的rpart包,因变量是二分类的,其中有一部分自变量是分类,如性别,类型等,这种离散型的如何处理?
同时,我变量有快三十个,直接用rpart出来才有四五个变量留了下来。这个有是怎么回事?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2014-12-12 16:17:21
对于这种离散变量的处理,给个例子吧——  
height,sex,maritalStatus,age,edu, homeType
SEX
         1. Male
         2. Female

MARITAL STATUS
         1. Married
         2. Living together, not married
         3. Divorced or separated
         4. Widowed
         5. Single, never married

  

trainingData$sex = as.factor(trainingData$sex)
trainingData$maritalStatus = as.factor(trainingData$maritalStatus)
rfit = rpart(homeType~., data = trainingData,method = "class", cp= 0.0001)

后面那一问,估计你要把数据贴近来才行
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群