全部版块 我的主页
论坛 计量经济学与统计论坛 五区 计量经济学与统计软件 Stata专版
3781 0
2009-09-04
最近在写毕业论文需要用到stata。  我下载了一个数据库是关于某国国民生活水平的调查问卷。下载下来之后发现它被按主题(如基本信息 教育程度  工作信息  健康程度等)分成了很多小的数据库(均已stata数据文件存储)。
但是我发现每个子数据库的样本数量不一样。后来发现是有些数据库剔除掉了一些观测值。因此我需要在不同数据库中找出包含所有我需要的变量的那些观测值。每一个观测值由3个变量来确定它的唯一性。
例如: (不同数据库中只有variable 1 variable 2 variable 3 都相同的观测值才是统一观测值)
数据库1
         variable1 variable2 variable 3
1            1              1               1
2             1             1               2
3             1             1               3
4             1             2               1
5             1             2               2
6             1             3               1
7              1            3               2
8              1            3               3
9              1            3                4
10           2             1               1
11           2             1               2
12           2             2               1
13          2             2                2
14          2            2                 3
15          2            3                 1
16          2            3                 2

但是到了数据库2  可能只剩下

        variable1 variable2 variable 3
1            1              1               1
2            1             1               3
3            1             2               2
4            1             3               1
5             1            3               4
6            2             1               2
7           2             2               1
8          2              2                3
9          2              3                2       所以我需要去掉数据库1中不包含数据2信息的那些观测值该如何操作?

因为是毕业论文所以比较急 烦请各位帮忙  谢啦
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群