算法包,比如C50算法包在处理中文数据的时候,会报错。
我将原来的数据转换为utf8,确认在Rstudio中已经是正常的显示中文了,但仍然会报错。
数据样本:
函数使用:
C5.0.default(x = proble[, c(1:3)], y = proble[, 4])
Classification Tree
Number of samples: 500
Number of predictors: 3
Tree size: 0
Non-standard options: attempt to group attributes
报错信息:
警告信息:
1: In strsplit(Z$output, "\n") : 输入的字符串1不适用于此语言环境
2: In strsplit(x$output, "\n") : 输入的字符串1不适用于此语言环境
ps:后来我用了stringi包,转换为\u5317等类型的字符,然后再需要输出显示的时候,再转换回来,这种方式很不方便,因为stringi里面,似乎不能直接转换文本。请问,有没有什么更好的办法解决这个问题呢?相信这个问题也是很多R工作者关心的问题。
十分感谢!