R中的中文处理问题~~~~~~~~~~~~~~~~~~~~~~~~~~~~

tegulia

10342

收藏 2015-01-12

算法包，比如C50算法包在处理中文数据的时候，会报错。

我将原来的数据转换为utf8，确认在Rstudio中已经是正常的显示中文了，但仍然会报错。

数据样本：

函数使用：

C5.0.default(x = proble[, c(1:3)], y = proble[, 4])

Classification Tree

Number of samples: 500

Number of predictors: 3

Tree size: 0

Non-standard options: attempt to group attributes

报错信息：

警告信息：

1: In strsplit(Z$output, "\n") : 输入的字符串1不适用于此语言环境

2: In strsplit(x$output, "\n") : 输入的字符串1不适用于此语言环境

ps：后来我用了stringi包，转换为\u5317等类型的字符，然后再需要输出显示的时候，再转换回来，这种方式很不方便，因为stringi里面，似乎不能直接转换文本。请问，有没有什么更好的办法解决这个问题呢？相信这个问题也是很多R工作者关心的问题。

十分感谢！

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

全部回复

ryoeng

2015-1-18 16:04:09

提示: 作者被禁止或删除内容自动屏蔽

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

萨克的减肥药

2015-8-22 16:19:29

不知版主的问题解决了没有？
我总是出现Tree Size：0 的问题，楼主的方法能否说一下？麻烦的方法也好啊

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

sinceregao

2016-1-20 21:32:10

> Sys.setlocale(category = "LC_ALL", locale = "English_United States.1252")
就好了!

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

shinny

2016-6-4 11:32:20

https://stackoverflow.com/questions/22803310/c5-0-decision-tree-c50-code-called-exit-with-value-1?rq=1

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

分享

扫码加好友，拉您进群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群