现有一份半结构化的数据,结构大概为 用户ID 运动1,运动1时长,运动2,运动2时长..... 现在想把它整理一下,把相同活动的时间累加到一起,存到数据框里,举例如下:
user1 足球,3,篮球,4,游泳,2,足球,5
user2 篮球,2,篮球,3,游泳,3,羽毛球,5,足球,2,足球,4
user3 足球,1
user4
整理后:
user_id 足球 篮球 游泳 羽毛球
user1 8 4 2 0
user2 6 5 3 5
user3 1 0 0 0
user4 0 0 0 0
求教,这种半结构化的数据如何处理比较高效?或者有什么合适的package可以处理?谢谢!