我碰到问题是这样的,有两个数据集a和b:
a b
firmname firmcode var1 var2 var3 firmname firmcode var1 var2 var3
a 01 x x x aX 01 x x x
我想知道哪些公司在两个数据集上都出现过,并统计和列出这些公司的名字和代码。但是现在有一个问题,两个数据上的公司名字,也就是第一个变量firmname在两个数据集上的表示是有差异的,所以只能用FIRMCODE,也就是公司代码来识别他们。
想请教一下各位大神怎样才能找出两个数据集上都出现过的公司,并且只保留这些公司的数据,谢谢了~