有这样一个数据,
Code BeginDate EndDate
001 08/15/1981 08/18/2007
001 12/10/2007 09/30/2009
001 10/01/2009 12/31/2014
002 08/15/1981 08/18/2007
002 12/10/2007 09/30/2009
003 08/15/1981 08/18/2007
003 12/10/2007 09/30/2009
003 10/01/2009 12/31/2014
004 08/15/1981 08/18/2007
004 12/10/2007 09/30/2009
004 10/01/2009 12/31/2014
005 08/15/1981 12/09/2007
005 12/10/2007 09/30/2009
005 10/01/2009 12/31/2014
我在想如何在同一个code下,把begin date 和enddate尽可能的合并在一起,举例来说,如果在code 001中,第二个时间07年12月10号至09年9月30号,与第三个时间09年10月1号至14年12月31号,他们其实是连续的,所以合并成为从07年12月10号至14年12月31号,这样001只剩下两个观测量。
又比如005中,从81年8月15日一直到14年12月31日一直都是连续的,所以最后005只会剩下一个观测量81年8月15日到14年12月31日。
我一开始的做法是比较begin date和lag(end date)+1的区别,如果相等,就把begin date赋值成为lag(enddate)+1,但是这样只能执行一步,像005中这种情况就不行了,所以想请大家探讨一下,多谢指点。