最近使用CHIP2002的数据作一个论文,处理数据的时候碰到一个神奇的现象,让我百思不得其解……
我的目的是要找出一个家庭中收入最高的那个个案,命令如下:
by pcode, sort: egen histinc=max(p201) /*pcode代表“家庭编号”,p201代表“个人年收入”*/
drop if p201!=histinc
tab pcode
return list /*探查不同家庭编号的个数,从而得到家庭的个数*/
2#蓝色
我把删除前后的家庭编号核对了一部分以后,终于发现问题了,可能是STATA的一个bug
我发现用“drop if p201!=histinc”删掉的个案,他们的histinc(家庭中的个人最高收入)都是小数形式呈现的(如23000.65),也就是说STATA无法识别有小数的数字是否是相等的值,统统都当成不相等给删了……