我有一个数据集 变量是var1 - varn
我想把同一个观测里面的重复的值找出来, 输出到一个新的数据集,
比如:
id var1 var2 var3 var4 var5 var6
obs1 1 3 1 2 1 . .
obs2 2 2 2 2 3 5 6
obs1 里面的var2和var4值相等, 所以需要把其中一个, 比方说var4的那个1取出来放入新的数据集, 老数据集的var4就变成 "."
obs2 里面要把var2和var3的2取出来放入新的数据集, 老数据集的var2和var3就变成 "."
只比较同一行里面的重复值, 不同的obs之间不比较.
同一行里面只比较var1-varn, id不参与比较.
取出来的重复值最好带着本行(obs)的id写入新的数据集.
求解. 非常感谢~