全部版块 我的主页
论坛 计量经济学与统计论坛 五区 计量经济学与统计软件 Stata专版
159362 38
2010-08-05
请问 (1) 在stata中 有某两个或多个样本所有变量或部分变量相同,想删除重复的样本 仅保留一个如何操作。

            (2)想有条件地删除样本,比如 if year==2007 ,命令是怎样的呢?

谢谢!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2010-8-5 16:21:12
wonway 发表于 2010-8-5 15:52 (1) 在stata中 有某两个或多个样本所有变量或部分变量相同,想删除重复的样本 仅保留一个如何操作
举个例子,摆出原始数据,说明你想要的结果。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2010-8-5 18:02:40
可以用 duplicates 命令,具体的参数可以参看stata的help
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2010-8-6 11:14:22
我的问题的两个例子就是:
(1) id      year      age        height
             1      2007       5             1.2
             1      2007        5            1.4
             2      2008        5            1.2
比如在这个数据中,前两个样本id  year  age相同,我想要删除掉其中一个,仅保留一个,然后还想附加一个条件,就是删掉height较小(1.2)的那个。

(2)还是上面的数据,然后我想要删掉 year==2007的全部样本。

请问这两个命令如何操作,谢谢了。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2010-8-6 11:53:56
wonway 发表于 2010-8-6 11:14
(1) id      year      age        height
             1      2007       5             1.2
             1      2007        5            1.4
             2      2008        5            1.2
比如在这个数据中,前两个样本id  year  age相同,我想要删除掉其中一个,仅保留一个,然后还想附加一个条件,就是删掉height较小(1.2)的那个。
*设数据中无缺失值
bys id year age (height): g n=_n
bys id year age (height): g N=_N
keep if n==N
drop n N
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2010-8-6 11:54:45
wonway 发表于 2010-8-6 11:14 我想要删掉 year==2007的全部样本
drop if year==2007
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

点击查看更多内容…
相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群