请教各位大佬,处理数据的时候卡在这一步了。我的数据中有以下几个变量:var1 var2 var3 var4
var1 var2 var3 var4
2024 M1 A abc
2024 M1 A def
2024 M1 B opq
2024 M2 A rst
最后我是希望得到 当var1、var2、var3相同时,var4合并到同一行,也就是类似以下的结果
var1 var2 var3 var41 var42
2024 M1 A abc def
2024 M1 B opq
2024 M2 A rst
当然,实际上的数据量非常非常大,有将近五百万条的观测,并且合并后会形成大量的var41,var42,var43....(会超过stata能容纳的列数),由于数据量太大,用stata的reshape功能无法实现我想要的效果,所以我也试过让最后呈现的效果是这样,也就是不新增列数,但是还是没法达成我想要的结果。
var1 var2 var3 var4
2024 M1 A abc+def
2024 M1 B opq
2024 M2 A rst
python也试过了,还是无法处理,想问下有人知道这种情况应该怎么办吗