救助各位:我想按2009(初始年)的医保号(唯一标识)追踪这些患者在接下来的2010-2014年的住院记录,并纵向合并,如何实现?
如,2009年的住院数据可能为
| 医保号 | 性别 | 年龄 | 总费用 | .... | 
| 13585 | 1 | 45 | 3577 | .... | 
| 13585 | 1 | 45 | 4325 | .... | 
| 12346 | 2 | 65 | 7432 | .... | 
| 23569 | 1 | 34 | 8653 | .... | 
| 65432 | 2 | 68 | 8532 | .... | 
2010年的住院数据可能为
| 医保号 | 性别 | 年龄 | 总费用 | .... | 
| 13585 | 1 | 46 | 8854 | .... | 
| 19632 | 1 | 53 | 7777 | .... | 
| 12346 | 2 | 66 | 7432 | .... | 
| 12346 | 2 | 66 | 95555 | .... | 
| 16456 | 2 | 33 | 4333 | .... | 
等等2011年、2012年
其复杂性和要求:(1)同一患者在不同年份可能不止发生一次住院,这些记录都要保留。如2009年医保号为12346的患者发生一次住院,在2010年发生两次住院,这两次住院记录都要追踪匹配到。
最终想要得到的数据形式为:
| year | 医保号 | 性别 | 年龄 | 总费用 | .... | 
| 2009 | 13585 | 1 | 45 | 3577 | .... | 
| 2009 | 13585 | 1 | 45 | 4325 | .... | 
| 2010 | 13585 | 1 | 46 | 8854 | .... | 
| 2009 | 12346 | 2 | 65 | 7432 | .... | 
| 2010 | 12346 | 2 | 66 | 7432 | .... | 
| 2010 | 12346 | 2 | 66 | 95555 | .... |