全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 R语言论坛
5407 4
2017-05-22
目前知道的对数据框排序去重的方法为
data[!duplicated(data$ID),]
但是代码量太多了,求问有没有哪个包有现成的去重函数,代码比较简便,类似function(data,ID)这种

也想知道一下,duplicated的效率和其他包的去重函数的效率相比是怎样的,是什么原理导致的效率不同
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2017-5-22 09:37:08
复制代码
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2017-5-22 10:19:16
dplyr::distinct(data, ID, .keep_all = TRUE)
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2017-5-22 16:45:52
万人往LVR 发表于 2017-5-22 08:54
目前知道的对数据框排序去重的方法为
data[!duplicated(data$ID),]
但是代码量太多了,求问有没有哪个包有 ...
dplyr包中的select函数就可以
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2017-5-23 09:04:13
多谢各位
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群