全部版块 我的主页
论坛 计量经济学与统计论坛 五区 计量经济学与统计软件 Stata专版
8723 19
2008-05-18
如何把数据表中的重复数据项删去

两张表:一个企业家的基本情况表,另一个企业的情况表,我想把两个表合二为一,我知道是用merge这个命令,以企业名称为排序的关键字,但是一其中一个表中发现有重复的数据项,不知道怎么去掉?请哪位高手指点一下,谢谢

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2008-5-18 22:23:00
这个不难,excel里写个小程序就搞定了,好像spss里有剔出重复数据的选项,stata里没注意过
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2008-5-18 22:47:00
我后来在EXCEL里先解决了,然后再导到STATA里去弄的,不过,又出现了一个新的问题:在从STATA的导出数据时,导出格式为EXCEL格式,在EXCEL表中的表头显示的是变量名,而我要的是标签,因为我从EXCEL格式用insheet导入到STATA中时,EXCEL中表头出现在数据表里就是标签,为什么导入后再导出就成了变量名,而不是标签呢?谢谢
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2008-5-18 23:38:00

duplicates drop varible(有重复数据的那个变量)

建议你看看版上陈传波老师那个中文教程,很简单的。

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2008-5-19 02:53:00
楼上正解,duplicates足矣
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2008-5-19 09:57:00

谢谢各位告诉我是用duplicates这个命令,我查询了帮助,知道怎么用了,现在的问题还在第三楼我提到的那个:

用insheet 命令导入数据时,在EXCEL表中的每个样本数据都有一个变量名(比如说企业名称、企业职工人数等),到STATA的表里就成了标签,变量名成了系统默认的v1,v2,。。。,然后横向合并数据后,再用outsheet导出时,出来的就是v1,v2,...等这些变量名,而不是我原先导入到STATA表中的变量名了(比如说企业名称、企业职工人数等),而我需要出来的是标签,这样好看,因为数据的变量名(比如说企业名称、企业职工人数等)太多,有90多个,所以无法用手工的方法来解决。

我查过outsheet帮助命令了,里面没有输出标签的这个option,只有不输出标签的nolabel这个option,不知道有没有办法解决,谢谢

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

点击查看更多内容…
相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群