全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 R语言论坛
4941 3
2014-10-10
今天在做一个项目的时候发现R剔除重复值比较困难,百度之后找到了解决办法:如果有下列的数据
> a
  公司 比例
1    a  0.4
2    a  0.3
3    a  0.2
4    b  0.5
5    b  0.4
如果想仅保留每个公司的第一条数据,可使用如下方法
> duplicated(a$公司)
[1] FALSE  TRUE  TRUE FALSE  TRUE
> b<-duplicated(a$公司)
> a[!b,]
  公司 比例
1    a  0.4
4    b  0.5

如果是要完全去重呢?也就是去除公司和比例完全一样的行数据,则用如下方法:
> duplicated(paste(a$公司,a$比例))
[1] FALSE FALSE FALSE FALSE FALSE
> a[!duplicated(paste(a$公司,a$比例)),]
  公司 比例
1    a  0.4
2    a  0.3
3    a  0.2
4    b  0.5
5    b  0.4
如果有更好的方法,欢迎回复



二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2014-10-10 11:19:15
好贴,谢谢分享
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2014-10-10 15:47:43
进来看看                                                                        
                                       
                                                     
                                                     
                                             
                                                                 
                                                                                 
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2014-10-10 17:15:28
公司 比例
    a  0.4
    a  0.4
    a  0.2
    b  0.4
    b  0.4

unique(a)
  公司 比例
1    a  0.4
3    a  0.2
4    b  0.4
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群