楼主,你好,想请教一个问题,一篇论文中对变量的定义和数据来源的说明中,发现有些变量是时间序列数据,而有些变量是截面数据,论文的目的是用Weibull hazard model做生存分析。
比如 variable1  它的数据为1970-2015的时间序列数据
     variable2  它的数据为2000-2010年的平均值
     实在想不通它的数据结构是什么样子的?
是不是以下这种形式呢?先谢谢啦。
year  variable1               varible2
1970        数值                 缺失
1971        数值                 缺失
1972        数值                 缺失
1973        数值                 缺失
1974        数值                 缺失
1975        数值                 缺失
1976        数值                 缺失
1977        数值                 缺失
1978        数值                 缺失
…         …                  …
2000        数值        2000-2015年变量2的平均值
2001        数值        2000-2015年变量2的平均值
2002        数值        2000-2015年变量2的平均值
2003        数值        2000-2015年变量2的平均值
2004        数值        2000-2015年变量2的平均值
2005        数值        2000-2015年变量2的平均值
2006        数值        2000-2015年变量2的平均值
2007        数值        2000-2015年变量2的平均值
2008        数值        2000-2015年变量2的平均值
2009        数值        2000-2015年变量2的平均值
2010        数值        2000-2015年变量2的平均值
2011        数值        2000-2015年变量2的平均值
2012        数值        2000-2015年变量2的平均值
2013        数值        2000-2015年变量2的平均值
2014        数值        2000-2015年变量2的平均值
2015        数值        2000-2015年变量2的平均值