求对数据框某一列去重的函数 - 经管之家

› 论坛 › 数据科学与人工智能 › 数据分析与数据科学 › R语言论坛

求对数据框某一列去重的函数

5407

4

收藏 2017-05-22

目前知道的对数据框排序去重的方法为
data[!duplicated(data$ID),]
但是代码量太多了，求问有没有哪个包有现成的去重函数，代码比较简便，类似function(data,ID)这种

也想知道一下，duplicated的效率和其他包的去重函数的效率相比是怎样的，是什么原理导致的效率不同

二维码

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

全部回复

2017-5-22 09:37:08

复制代码

二维码

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

2017-5-22 10:19:16

dplyr::distinct(data, ID, .keep_all = TRUE)

二维码

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

2017-5-22 16:45:52

万人往LVR 发表于 2017-5-22 08:54
目前知道的对数据框排序去重的方法为
data[!duplicated(data$ID),]
但是代码量太多了，求问有没有哪个包有 ...

dplyr包中的select函数就可以

二维码

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

2017-5-23 09:04:13

多谢各位

二维码

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

相关推荐

栏目导航

热门文章

推荐文章

扫码加好友，拉您进群

各岗位、行业、专业交流群