全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 R语言论坛
5318 3
2018-12-29
各位大神,我在阅读时发现,在某些时候导入数据时有stringsAsFactor=F,看了百度还是不太明白,什么时候用stringsAsFactor?
另外,在做一些预测时,有时会把某列转化成factor,例如,data<- transform(data,y=as.factor(y)),为什么要如此转换?
求指教。
附件列表
6~S5][TX@XJG4H3GWTML_S6.png

原图尺寸 13.17 KB

6~S5][TX@XJG4H3GWTML_S6.png

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2018-12-30 15:30:53
重现编码转化成因子,关于factor其实可以查看内置帮助help,里面更加详细
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2019-1-7 23:15:06
在计算机发展的早期,硬盘和内存都比较贵,将数据存储为Factor形式,可以节约空间,R语言默认保留了这一习惯。但现在介质都非常便宜了,所以很多人觉得没有这个必要,比如大牛Hadley就主张直接存为character的形式。
不过,作为factor也有很多好处,其中之一是确定为discrete variable。有一些算法要求转化为factor。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2019-1-7 23:39:36
cheetahfly 发表于 2019-1-7 23:15
在计算机发展的早期,硬盘和内存都比较贵,将数据存储为Factor形式,可以节约空间,R语言默认保留了这一习惯 ...
factor还有另外一个优势就是在做分类型变量的分析的时候,你可以指定你的参照组以及每个数字对应的标签。比如:
x = factor(x, levels = c(0, 1, 2), labels = c("Apple", "Google", "Microsoft"))
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群