全部版块 我的主页
论坛 计量经济学与统计论坛 五区 计量经济学与统计软件 Stata专版
1319 5
2013-05-13
现有这样一列数字:每个值都不唯一,有连续性的重复,也有间隔性的重复。
10011001
1001
1002
1002
1003
1003
1003
1001
1001
1001
1001
1001
1001
1003
1003
1004
1004

现想将它们分组,将连续性重复的值分为一组,当数值出现中断时另外分组,即使后面出现与前面同样的数值,仍新分一组。如下面的第一组和第四组,第三组和第五组。不知道stata中要如何编写命令。求教。。。。多谢!


1001        1
1001        1
1001        1
1002        2
1002        2
1003        3
1003        3
1003        3
1001        4
1001        4
1001        4
1001        4
1001        4
1001        4
1003        5
1003        5
1004        6
1004        6


二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2013-5-13 09:54:40
直接在excel里做就行了吧,在比如数据都在A列,那么在B1输入1,在B2输入公式=if(A2=A1,B1,B1+1),最后自填充(或者一直拖到数据最后就行了)
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2013-5-13 10:08:35
空山空语 发表于 2013-5-13 09:54
直接在excel里做就行了吧,在比如数据都在A列,那么在B1输入1,在B2输入公式=if(A2=A1,B1,B1+1),最后自填充 ...
我为什么会在stata里做呢,是我举的例子简化了,弄懂了这个其他命令就ok了,而且是几千万行的数据,excel拖不起。。。T_T。。。谢谢楼上。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2013-5-13 11:50:38
inp x
1001
1001
1001
1002
1002
1003
1003
1003
1001
1001
1001
1001
1001
1001
1003
1003
1004
1004
end

g k=_n if x[_n-1]!=x[_n]
replace k=k[_n-1] if k==.
egen kk=group(k)
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2013-5-13 12:01:46
多谢楼上!!!!!万分感谢!!!!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2013-5-13 12:03:24
h3327156 发表于 2013-5-13 11:50
inp x
1001
1001
多谢!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群