黃河泉 发表于 2021-5-28 16:25 
我不是搞的很懂你的问题,关键还是我刚刚讲的 (没规则),我也没什么好建议!
黄老师,我的问题是,city作为土地所有者将土地让与landholder使用,我所想得到的结果是城市city(i)(i=1-355,总共355个city)在n年(n=2000-2020,数据年份为2000-2020)中将土地让与地区region(j)所使用的土地宗数、area、price的总和(j不可知,但是我将j定义为全国的34个省、333个市和1312个县)。landholder分为个人和公司,公司一般带有地区名,比如示例数据中的第二个“喀左县城市污水处理厂”。个人数据我不理会,只对公司数据进行整理,因为公司数据带有地区名。
我将规则定为landhodler的名称中包含34个省、333个市或1312个县名称,我自己在命令中一个个打出gen dum = strmatch(landholder,"*武汉*")keep if dum ==1;gen dum2 = strmatch(landholder,"*北京*");keep if dum ==1......其中武汉、北京就是34个省、333个市和1312个县,就是region。
比如我的示例数据中,人工可以看出city(宁波)在2018年让与region(宁波)的有土地15宗、价格是101.51,面积是131.7394;city(宁波)在2018年让与region(慈溪)的土地有12宗,价格是0,面积是7.6902,;city(宁波)在2019年让与region(宁波)的土地有2宗,价格是0,面积是3.8251。
实际我假如不经过人工看的话,我并不知道city(宁波)在2018年只让与土地给了region(宁波)和region(慈溪)的公司,所以我就假设city(宁波)在2018年让与了34个省、333个市和1312个县的所有region,到时候宁波并没有给很多region让与土地的话,自然就不会反馈出值。
刚刚我说的很多5377个dta,是基于昨天我已经将所有数据分成了city层面的面板数,所以我设想能用stata自动调用我的5377dta进行数据统计。
不知道这样说黄老师您是否能给出建议。
* Example generated by -dataex-. To install: ssc install dataex
clear
input str9 city int city_id float area str6 landholder float price int year1 byte 宗数
"宁波市" 3302 131.7394 "宁波" 10151.25 2018 15
"宁波市" 3302   3.8251 "宁波"        0 2019  2
"宁波市" 3302   7.6902 "慈溪"        0 2019 12
end
本文来自: 人大经济论坛 Stata专版 版,详细出处参考: 
https://bbs.pinggu.org/forum.php ... amp;from^^uid=8786494