全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 R语言论坛
3249 8
2020-11-16
比如有个数据集:

data <- data.frame(x = c("A", "B", "C", "D"), y = c("B", "A", "D", "C"), z = c("a", "a", "b", "b"))


x y z
1A B a
2B A a
3 C D b
4 D C b


我们认为第一行和第二行在z=a时候是重复的(都是A,B),同理认为第三行和第四行在z=b时是重复的(都是C,D),因此,想去掉第二行和第四行,由于数据量很大,不能简单的利用for循环计算,请教论坛里面的大侠是否有便捷方法,在此先谢了!


二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2020-11-17 08:49:16
dplyr::distinct函数,看看,有用
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2020-11-17 13:04:04
nieqiang110 发表于 2020-11-17 08:49
dplyr::distinct函数,看看,有用
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2020-11-17 18:19:11
nieqiang110 发表于 2020-11-17 08:49
dplyr::distinct函数,看看,有用
谢谢大侠的回答,我认认真真的去查看了distinct函数,它还是不能解决我这个问题。看您还有没有更好的办法,谢谢啦!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2020-11-17 21:17:35
data <- data.frame(x = c("A", "C", "C", "D"), y = c("B", "A", "D", "C"), z = c("a", "a", "b", "b"))
  x y z
1 A B a
2 C A a
3 C D b
4 D C b
如果是这样,是要留下1,2,3行吗?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2020-11-17 22:09:02
x列和y列看上去像两个维度,其实你是想当做一个维度来处理,因此思路应该是降维,然后排序,再去重。
复制代码
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

点击查看更多内容…
相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群