比如有个数据集:
data <- data.frame(x = c("A", "B", "C", "D"), y = c("B", "A", "D", "C"), z = c("a", "a", "b", "b"))
| | x | y | z |
| 1 | A | B | a |
| 2 | B | A | a |
| 3 | C | D | b |
| 4 | D | C | b |
我们认为第一行和第二行在z=a时候是重复的(都是A,B),同理认为第三行和第四行在z=b时是重复的(都是C,D),因此,想去掉第二行和第四行,由于数据量很大,不能简单的利用for循环计算,请教论坛里面的大侠是否有便捷方法,在此先谢了!