一篇论文中对变量的定义和数据来源的说明中,发现有些变量是时间序列数据,而有些变量是截面数据,论文的目的是用Weibull hazard model做生存分析。
比如 variable1 它的数据为1970-2015的时间序列数据
variable2 它的数据为2000-2010年的平均值
实在想不通它的数据结构是什么样子的?
是不是以下这种形式呢?先谢谢啦。
| variable1 | varible2 |
| 1970 | 1 | 缺失 |
| 1971 | 2 | 缺失 |
| 1972 | 3 | 缺失 |
| 1973 | 4 | 缺失 |
| 1974 | 5 | 缺失 |
| 1975 | 6 | 缺失 |
| 1976 | 7 | 缺失 |
| 1977 | 8 | 缺失 |
| 1978 | 9 | 缺失 |
| … | … | … |
| 2000 | 21 | 2000-2015年变量2的平均值 |
| 2001 | 22 | 2000-2015年变量2的平均值 |
| 2002 | 23 | 2000-2015年变量2的平均值 |
| 2003 | 24 | 2000-2015年变量2的平均值 |
| 2004 | 25 | 2000-2015年变量2的平均值 |
| 2005 | 26 | 2000-2015年变量2的平均值 |
| 2006 | 27 | 2000-2015年变量2的平均值 |
| 2007 | 28 | 2000-2015年变量2的平均值 |
| 2008 | 29 | 2000-2015年变量2的平均值 |
| 2009 | 30 | 2000-2015年变量2的平均值 |
| 2010 | 31 | 2000-2015年变量2的平均值 |
| 2011 | 32 | 2000-2015年变量2的平均值 |
| 2012 | 33 | 2000-2015年变量2的平均值 |
| 2013 | 34 | 2000-2015年变量2的平均值 |
| 2014 | 35 | 2000-2015年变量2的平均值 |
| 2015 | 36 | 2000-2015年变量2的平均值 |