小灰灰no1 发表于 2018-8-15 11:13
如何找出数据中重复的值呢
我有一个思路,stata软件。下面写的year只是通常情况,你的就不用写year了。<br>
gen 计数器=1<br>
bys id year:egen 出现次数=sum(计数器)<br>
list id year 出现次数 if 出现次数>=2<br>
上面是列出来,下面保证每个样本只出现一次,并且在出现次数那一列写了原来出现过多少次。<br>
duplicates drop id,force
如果还有year,最好是用id和year合并生成一个独一无二的编码,叫yearid(excel下是用&函数,stata下我还没有试过),duplicates这步就改成yearid。<br>