在下有一个数据集希望实现以下三个小目标,自己的编程水平有限,望各路大神指教!感恩!
最终目标:在原数据集里为每一个id根据条件匹配到子样本(一对多匹配),并计算子样本的某一变量的加总值sum,最后重新将sum(var)重新赋值给每一个id。
- 目标一——样本匹配:待匹配的变量是id, 匹配条件是location,legalform,size_ms这个三个变量的数值。假设需要为id为1的样本匹配对对应的样本,目标即为寻找跟id为1的样本 有相同的location,legal form,size_ms的值的样本。
- 目标二——计算所匹配的样本的某一变量的加总值:根据匹配的样本结果,计算与id为1的相匹配的样本所对应的a_SocialRespon3的加总值sum:即,一对多匹配,并计算多个匹配对象的sum(a_SocialRespon3),sum( a_Management3) ,sum(a_FoodSafety)这三个变量的各自的加总值。
- 目标三———循环。使得每一个id都可以按照上面的步骤循环计算出相应的值。
匹配数据集和待匹配数据集是同一个数据集