最近在写毕业论文需要用到stata。 我下载了一个数据库是关于某国国民生活水平的调查问卷。下载下来之后发现它被按主题(如基本信息 教育程度 工作信息 健康程度等)分成了很多小的数据库(均已stata数据文件存储)。
但是我发现每个子数据库的样本数量不一样。后来发现是有些数据库剔除掉了一些观测值。因此我需要在不同数据库中找出包含所有我需要的变量的那些观测值。每一个观测值由3个变量来确定它的唯一性。
例如: (不同数据库中只有variable 1 variable 2 variable 3 都相同的观测值才是统一观测值)
数据库1
variable1 variable2 variable 3
1 1 1 1
2 1 1 2
3 1 1 3
4 1 2 1
5 1 2 2
6 1 3 1
7 1 3 2
8 1 3 3
9 1 3 4
10 2 1 1
11 2 1 2
12 2 2 1
13 2 2 2
14 2 2 3
15 2 3 1
16 2 3 2
但是到了数据库2 可能只剩下
variable1 variable2 variable 3
1 1 1 1
2 1 1 3
3 1 2 2
4 1 3 1
5 1 3 4
6 2 1 2
7 2 2 1
8 2 2 3
9 2 3 2 所以我需要去掉数据库1中不包含数据2信息的那些观测值该如何操作?
因为是毕业论文所以比较急 烦请各位帮忙 谢啦