全部版块 我的主页
论坛 计量经济学与统计论坛 五区 计量经济学与统计软件 Stata专版
3597 13
2009-07-08
请问,应该如何combine different variable, same observation at different time point?
(ps:目前做毕业论文中,分析我的研究数据需要用到STATA,才发现这个软件太强大了,有点混乱了!)

数据例子:

我的数据是同一批参与调查的人,在不同的时间里,填了一共5份问卷,现在我想要把所有时间点的数据,COMBINE成一个VARIABLE,应该如何操作?

简单来说,我的问卷是调查, 母亲怀孕的时候,吃FISH的FREQUENCY,就是:

              Never          Less than 1         1-3/m             2-4/w            5-6/w          1/day               2-3/day
FISH        0                        1                       2                      3                   4                   5                       6


Variable                  obs                      Mean                     Std.Dev                 Min                 Max
-------------------------------------------------------------------------------------------------------------------------
fish1                      1205                      xxx                              xx                      xx                  xx
fish2                      1203
fish3                       864
fish4                       868
fish5                       438

参与调查的总人数是1303,经过怀孕期, 所以按照时间点,把问卷做成了5份!我这里就简单的说,譬如,
数据里,fish1, 2, 3, 4, 5,代表了不同的时间点,比如说,fish1=第一个月, fish2=第二个月,etc
(参与调查的人数和人,都是同一批,只是在这5个月里,每个人在每一个月填了一份相同DESIGN的问卷,)

所以现在就得到了同一批参与者有5个时间点的数据,我现在需要把5个时间点的数据COMBINE成整个过程(变成这5个月内的总情况),就是说,把fish1, 2, 3, 4, 5全部combine成一个varible, 比如说, fish_all,  来看整个OVERALL的frequency,就是整个5个月内发生的情况frequency就是看整个怀孕期间,母亲吃FISH的FREQUENCY是怎样的情况。预期COMBINE后的VARIABLE应该是这个样子:(但我不知道怎么操作)

tab fish_all

fish_all                      Freq.                  Percent                   Cum.
------------------------------------------------------------------------------------------
0                                   
1                     
2
3
4
5
6
------------------------------------------------------------------------------
Total                   xx                          xx

请问,是不是应该用merge呢?我试着操作了,总是出现错误!
另外,这种情况下,总数据的人数是1303,所有越到后面的时间点上,参与调查的人,并没有回答这一题,导致了很多数据丢失~
COMBINE后,observations的人数,是不是该是小于438的???意思就是,COMBINE只会把5个月里全部完成问卷的人的数据COMBINE在一起??

可能我解释得有点混乱,研究这个STATA,已经把我弄崩溃了~ 不好意思!
希望大家能帮帮我~ 谢谢~~
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2009-7-8 08:02:04
能否把5份问卷对应的数据结构介绍一下?

似乎涉及的是append
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2009-7-8 08:14:12
简单来说,我的问卷是调查, 母亲怀孕的时候,吃FISH的FREQUENCY,就是:
              Never          Less than 1         1-3/m             2-4/w            5-6/w          1/day               2-3/day
FISH        0                        1                       2                      3                   4                   5                       6

参与调查的总人数是1303,经过怀孕期, 所以按照时间点,把问卷做成了5份!我这里就简单的说,譬如,FISH1是第一个月,FISH2是第二个月,以此类推!

所以现在就得到了同一批参与者有5个时间点的数据,我现在需要把5个时间点的数据COMBINE成整个过程(变成这5个月内的总情况),就是看整个怀孕期间,母亲吃FISH的FREQUENCY是怎样的情况。预期COMBINE后的VARIABLE应该是这样一个:(但我不知道怎么操作)

tab fish_all

fish_all                      Freq.                  Percent                   Cum.
------------------------------------------------------------------------------------------
0                                   
1                     
2
3
4
5
6
------------------------------------------------------------------------------
Total                   xx                          xx
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2009-7-8 08:32:17
也就是说,你的5份问卷对应的数据结构(其中的变量名称与个数)完全相同?

如果这样,把5份数据库用append using并起来即可(从而形成一套面板数据)。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2009-7-8 08:47:14
4# sungmoo


不好意思啊,解释得不好~

就是说一共有1303个母亲,在1-5个月里,每个月填一次相同DESIGN的问卷,如下:

              Never          Less than 1         1-3/m             2-4/w            5-6/w          1/day               2-3/day
FISH        0                        1                       2                     3                   4                   5                      6

第一个月的数据有1205人(fish1),第二个月参与的数据是1203 (fish2),第3个月864人 (fish3),第4个月是868人(fish4),第5个月是438人(fish5)

按照预期来说,每个月参与填的人应该每次都是1303个人(因为是同一批人,在1-5个月里完成的)
但是由于一些原因,可能导致他们空了这一选项,所以越到后面的时间,数据就越少!所以,FISH1,2,3,4,5,虽然是同一批人,但个数是不同的

这种情况下,如果想要看1303个人,总体5个月里,吃这个东西的频率是怎样一个情况~ 而不是单单看她们每一个月里的FREQUENCY~
所以,是该用append还是merge呢???

(不好意思,因为我没有对这个软件没有概念,但是论文必须要整理数据,目前迫在眉睫!谢谢帮助了)
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2009-7-8 08:51:10
你的5份数据库都有个人代码与月份代码吧?

用append using即生成一套不平衡的面板数据。

可以针对这套面板数据设计命令实现你的目标。

“吃东西的频率”是什么意思(用哪些变量表示)?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

点击查看更多内容…
相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群