R语言如何快速去掉数据框中重叠的行

湖大anchu

3466

收藏 2020-11-16

比如有个数据集：

data <- data.frame(x = c("A", "B", "C", "D"), y = c("B", "A", "D", "C"), z = c("a", "a", "b", "b"))

	x	y	z
1	A	B	a
2	B	A	a
3	C	D	b
4	D	C	b

我们认为第一行和第二行在z=a时候是重复的（都是A，B），同理认为第三行和第四行在z=b时是重复的（都是C，D），因此，想去掉第二行和第四行，由于数据量很大，不能简单的利用for循环计算，请教论坛里面的大侠是否有便捷方法，在此先谢了！

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

全部回复

nieqiang110

2020-11-17 08:49:16

dplyr::distinct函数，看看，有用

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

llb_321

2020-11-17 13:04:04

nieqiang110 发表于 2020-11-17 08:49
dplyr::distinct函数，看看，有用

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

湖大anchu

2020-11-17 18:19:11

nieqiang110 发表于 2020-11-17 08:49
dplyr::distinct函数，看看，有用

谢谢大侠的回答，我认认真真的去查看了distinct函数，它还是不能解决我这个问题。看您还有没有更好的办法，谢谢啦！

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

szxship

2020-11-17 21:17:35

data <- data.frame(x = c("A", "C", "C", "D"), y = c("B", "A", "D", "C"), z = c("a", "a", "b", "b"))
x y z
1 A B a
2 C A a
3 C D b
4 D C b
如果是这样，是要留下1，2，3行吗？

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

cheetahfly

2020-11-17 22:09:02

x列和y列看上去像两个维度，其实你是想当做一个维度来处理，因此思路应该是降维，然后排序，再去重。

复制代码

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

点击查看更多内容…

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

分享

扫码加好友，拉您进群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群