1、对市级面板数据进行处理,现有全国city的面板数据共5377个dta(部分年份数据缺失),如下图。
2、想要结果:我想要获得的数据是city(i)在n年让与给region(j)的土地宗数、area和price的总和,其中i=1-355,n=2000-2020,这些都是数据已知的,但是region不存在,且j是未知的。数据中主要包括city、landholder、price、area,regionbu不存在,但是将来源于landholder。landholder一项有人名、公司名,通过公司名中包含有地区名(即region)。我假设是city(i)每年都会分别让与土地给34个省、333个市和1312个县。那么我给j定义的规则就是j=34个省+333个市+1312个县=1679个region。
3、我将人工整理出34个、333个市和1312个县的名称。然后通过gen dum =srmatch(landholder,“*北京*”) keep if dum ==1;gen dum2 =srmatch(landholder,“*上海*”) keep if dum2 ==1......这样类似的命令进行1679(region)次循环。再对dum、area、price进行统计。 
4、现困难1在于如何编写3、中的命令;困难2在于如何循环调用文件中的dta再执行3、的命令。
数据示例如下:安徽省安庆市2006.dta