全部版块 我的主页
论坛 计量经济学与统计论坛 五区 计量经济学与统计软件 统计软件培训班VIP答疑区
3438 4
2008-12-11

问题描述:由于数据来自其他软件导出的格式,比如为txt,但是在存储形式上每家单位的变量被按规则分成若干行存储,并非时间序列数据,仅仅是被截断为固定数目的行,每行对应的变量数也是固定的。

目的:为了批量程序化将每家单位的数据最终合并为一行

数据举例:

company1   a1 a2 a3 a4 a5 a6 a7

company1   b1 b2 b3 b4 b5 b6 b7

……

company1   h1 h2 h3 h4 h5 h6 h7

cpmpany2  a1  a2 a3 a4 a5 a6 a7

company2   b1 b2 b3 b4 b5 b6 b7

……

company2   h1 h2 h3 h4 h5 h6 h7

cpmpany3  a1  a2 a3 a4 a5 a6 a7

company3   b1 b2 b3 b4 b5 b6 b7

……

合并后结果:

company1 a1 a2 a3 a4 a5 a6 a7 b1 b2 b3 b4 b5 b6 b7 c1 ……h1 h2 h3 h4 h5 h6 h7

company2 a1 a2 a3 a4 a5 a6 a7 b1 b2 b3 b4 b5 b6 b7 c1 ……h1 h2 h3 h4 h5 h6 h7

cpmpany3 a1 a2 a3 a4 a5 a6 a7 b1 b2 b3 b4 b5 b6 b7 c1 ……h1 h2 h3 h4 h5 h6 h7

……

其中company字段可以作为每家单位的唯一标识码用来merge

stata中有命令能实现吗?

目前我能想到的办法是用循环程序先将整个数据文件拆分成有顺序的若干个数据文件,上述的例子就是拆成7个文件,第一个文件包括每家单位的第一行,第二个文件包括每家单位的第二行,以此类推,最后按顺序用merge命令将7个数据文件拼起来。

不知道有没有更直接的办法或类似的命令

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2008-12-12 09:12:00

看来也只能如此了,也就几行命令即可搞定。

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2008-12-12 09:50:00
以下是引用arlionn在2008-12-12 9:12:00的发言:

看来也只能如此了,也就几行命令即可搞定。

想想倒是能搞定 现在发现另一个文件比这个还复杂,因为有缺行,而且是随机的,

只好用capture confirm file配合判断return code完成了

每家单位被拆分的数量是不固定的

[此贴子已经被作者于2008-12-12 11:10:03编辑过]

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2008-12-13 11:11:00

findit merge

我看到有很多新的命令出来,不知有没有可以解决你这个问题的快捷方式。

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2008-12-16 07:03:00
以下是引用arlionn在2008-12-13 11:11:00的发言:

findit merge

我看到有很多新的命令出来,不知有没有可以解决你这个问题的快捷方式。

好的

[此贴子已经被作者于2008-12-16 7:03:53编辑过]

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群