因为基础不好,这个问题纠结了挺久,还请论坛的前辈指导。有两个数据库A和B,分别有几千个样本,假设分别有a个样本和b个样本,然后要将A中的所有元素分别与B中的所有元素做简单的两两运算,得出值并形成一个a*b的矩阵。
简单的例子是这样的:如果a=4,b=5:
A(id) variable1 variable2
1 3 2
2 4 4
3 5 4
4 3 1
5 2 0
B(id) variable1' variable2'
1 1 0
2 4 6
3 6 1
4 3 5
假设计算的公式是得到 Xij= (variable1i-variable1'j)*(variable2i-variable2'j), i=1,2,3,4,5, j=1,2,3,4. 所有得到的Xij 形成一个5*4的矩阵。
因为样本量太大了,实在是需要一个行得通的方法,不知道用stata是否可行,编程麻烦吗?还请高手指点。谢谢谢谢。