大家好,有个数据处理的问题请问大家,具体如下:
前提:我已经按照user_id和request_time进行排序,为某一个user的数据
目前需求:想要把request_time挨在一起的重复出现的sku_id删除只保留一个(比如sku:a864c609d0,在倒数第五行和倒数第四行挨着出现,我只想留下一个,但同时,他也在最后一行和第五航出现,这两个数据是我想保留的)
我已经尝试过duplicates drop user_id sku_id,但是该命令下没有考虑时间时间顺序,比如sku_id为864c609d0的数据,一共出现了3次,用duplicates drop就会只留下一个,因此想请教大家有没有其他方法可以解决?