在计算数据集1的新变量时,需要用到数据集2的一些变量值,数据集1和数据集2都有相同id。
刚开始考虑用合并文件的方式,根据id将两个文件合并。但是,数据集1中,有id重复的情况,就是一个id有多次记录,此时合并文件后,只有其中一个个案的新变量会被赋值,后面的相同id的个案新变量都是缺失的。
然后,想能不能把长型的数据集1转换成宽型的数据集,然后再合并文件,可是原数据集中没有索引变量,而且这个数据集很大,有上万行,每个id记录的次数也不尽相同,人工添加的方法也不现实。
求教高手,有没有什么好的方法,可以解决这个问题啊?