全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 R语言论坛
1297 2
2019-12-05
数据框data有100行3列(列名分别为a,b,c),三列都是因子类型,a和c都是100 levels,但是b是80 levels,使用
data$a=as.numeric(as.character(data$a))
data$c=as.numeric(as.character(data$c))
data$b=as.numeric(as.character(data$b)) #b列都成NA。
查看所有数据后,发现b列有重复,如何转换成数值类型不出现NA值呢?敬请大神指点!谢谢啦
注:data后有美元符号,不知为何不显示。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2019-12-6 08:45:08
数据发一些上来看看
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2019-12-6 11:27:34
5752 发表于 2019-12-6 08:45
数据发一些上来看看
谢谢参与。可能是列名b中的数据格式引起,原来是这种格式:0.123-0.879,我把b列分为两列b1和b2,对应数据是0.123和0.879,虽然b1和b2也有重复值并非100水平,但是可以使用常规方法把因子转换为数值型。我估计是减号的原因,也曾经存为excel格式查看发现原先b列的竟然有多个1月1日出现,估计是对应了1.000-1.000数据。已经解决。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群