全部版块 我的主页
论坛 计量经济学与统计论坛 五区 计量经济学与统计软件 Stata专版
14827 8
2016-08-24
以x1 x2 作为标准删除重复观察值duplicates drop x1 x2, force


sum x3 x4后,每次得到的结果不一致,为何会出现这一原因?
是不是duplicates drop 在删除时产生了随机性?如何能够保证得到唯一的结果?

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2016-8-24 12:38:06
既然是以x1,x2为准  这两个只要是重复了,应该是随便删除哪个都是可以的
如果x1,x2是一样的,为什么x3和x4不同,这没有道理



二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2016-8-24 13:10:05
感谢楼上的朋友。
这是由数据的复杂决定的,两个观察值可能在x1,x2上是一样的,但在x3,x4上可能是不一样的。此种情况一般如何处理?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2016-8-24 15:47:29
那就不能删除
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2016-8-25 00:14:40
分析有道理,谢谢!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2016-8-25 01:18:18
用duplicates drop只保存相同观测的第一个值。你说的每次drop之后其他变量的su结果不一样可能是因为duplicates drop之前的某些命令会随机打乱观测值的排序,比如merge。
如果想每次duplicates drop的结果一样,建议在drop之前的关键步骤先进行sort,再gen order = _n。这样再在drop之前sort order可以确保每次删除的都是同一批重复观测。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

点击查看更多内容…
相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群