arlionn 发表于 2016-5-5 09:39 
或(不够好)
forvalues i=2/6{
cap import excel using "C:\stata\00000`i'.xls" ,firstrow clear
连老师,再请教你一个问题。
我在导入数据时由于手工操作失误,导致code(证券代码)输入错误。即:
真实的数据为:
code year asset
000001 2001 231
000001 2002 234
000001 2003 222
000002 2001 111
000002 2002 100
000002 2003 99
结果在导入数据时将code=000001的数据全部赋予了code=000002,即
code year asset
000001 2001 231
000001 2002 234
000001 2003 222
000002 2001 231
000002 2002 234
000002 2003 222
我的问题是如何挑出这些除了code不同外 ,year和asset全部相同的两组或多组数据。这样就可以重新更正数据了。
P.S.造成上述问题的原因是,将code=000001的数据下载下来后保存为000001.xls。由于操作失误,然后重复下载了code=000001的数据,但是,却保存为了000002.xls。而数据集中的code是根据“000002.xls”的文件名生成的。所以,就导致出现code不同,但是,year和asset相同的情况。
现在,为了确保数据真实准确,所以,我需要挑出code不同,而year和asset全部相同的数据,重新核对和更正。
请连老师指点指点。谢谢。