我有一份各省GDP和FDI面板数据,数据是从excel导入的,每份数据年份跨度不同。GDP是从1978-2014,FDI是从1979-2016。现想把这两个数据合并成一个数据,用的是merge 1:1 province year 命令。
下面是我的数据导入程序:
import excel "D:\Assignment\Ansel\China_Province_year_GDP.xls" ///
, sheet("Sheet1") cellrange(C5:AG41) clear
stack C-AG,into(GDP) clear
by _stack,sort:gen year = _n +1977 // from 1978 to 2014
rename _stack province
order province year GDP
save GDP,replace
import excel "D:\Assignment\Ansel\China_Province_year_FDI.xls" ///
, sheet("Sheet1") cellrange(B5:AE42) clear
stack B-AE,into(FDI) clear
by _stack,sort:gen year = _n +1978 // from 1979 to 2016
rename _stack province
order province year FDI
save FDI,replace
下面是我的数据合并程序
use FDI,clear
merge 1:1 province year using GDP
我发现这里每个省份的数据是从1978年开始的,但是FDI在2015、2016年的数据没有了。但是我希望2015、2016年的数据也出现在这里。
我换了master和using 的顺序,采用以下程序
use FDI,clear
merge 1:1 province year using GDP
结果是2015、2016年有了,但1978年的数据没有了。
我的问题是,怎样在不改变原始数据的情况下,让合并后的数据时间跨度是两者的并集?