全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 R语言论坛
2311 3
2020-05-20
QQ图片20200520001652.png
大概是这样的数据,想做一下决策树和关联规则,用rpart.plot出图的时候Rstudio直接卡死,关都关不掉,好几遍了,只能重启电脑,但是换另一个R自带的数据集(比图中这个数据集的变量和观察值多得多)就没事。
我想了一下,不知道是以下哪个原因引起的:
1. 这个数据集是excel导入的
2. 这个数据集含中文
3. 我的电脑或者Rstudio不行
4. 电脑分配给Rstudio的内存太小
5. 有多分变量(属性变量的种类太多?比如电影类型,还有这个片名,可是我之前做含英文地名的数据集就没事)
真的不知道怎么解决了,来不及换数据了,如果是因为含中文的话,各位大佬们知道有没有不用把中文改成英文就可以解决的方法吗?比如特定的指令紧急求救

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2020-5-20 10:26:42
用str()查一下数据集各变量的类型,可能有些变量比如票房看上去是数值但实际是字符型或因子型,另外有的变量比如country、season却需要因子化。另外xlsx数据导入用openxlsx包可能问题少一些。与中文无关。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2020-5-20 10:36:21
llb_321 发表于 2020-5-20 10:26
用str()查一下数据集各变量的类型,可能有些变量比如票房看上去是数值但实际是字符型或因子型,另外有的变量 ...
谢谢!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2020-5-20 10:36:25
llb_321 发表于 2020-5-20 10:26
用str()查一下数据集各变量的类型,可能有些变量比如票房看上去是数值但实际是字符型或因子型,另外有的变量 ...
谢谢!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群