简略版:
有两个变量,id和time,id是数字格式,time是时间格式。因为同一个id有不同的记录,我想每个id只保留时间最近的一条记录。求问如何写命令? 谢谢。
---------------------------------------------分割线--------------------------------------------------
吐槽版:
对stata不是很熟,根据要求自己摸索着写了以下命令:
gsort -time
bysort id:gen n=_n
keep if n==1
list in 1/10
但是这样做出来之后发现,最后留下的不一定是每个id时间最近的一条记录,并且如果去掉keep那条命令的话,如果多跑几次dofile,对于特定的一条记录,每次的n都不一样?很疑惑……求高手打脸……