全部版块 我的主页
论坛 计量经济学与统计论坛 五区 计量经济学与统计软件 Stata专版
5162 5
2014-10-17
我有20个很大的数据  要把凡是包含这10几万种的没有规律的字符串筛选出来,应该怎么实现啊
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2014-10-18 09:10:58
这个可以学习一下                                                                        
                                       
                                                     
                                                     
                                             
                                                                 
                                                                                 
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2014-10-18 09:58:05
比如你把没有规律的字符串放到一个字符变量里面,字符变量的名为是xx,数据名字为data1
你想挑选的数据库为data2,你要根据里面的变量yy,来选择是否要保留某些观测值
可以用下面的命令
use data1,clear
gen obs=_n
save data1,replace
use data2,clear
gen obs=_n
save data2,replace
use data1,clear
merge 1:1 obs using data2
drop _merge
gen aa=0
forvalues i=1/1000 {
replace aa=1 if strpos(yy,xx[`i'])!=0
}
keep if aa==1
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2014-10-20 10:12:23
ermutuxia 发表于 2014-10-18 09:58
比如你把没有规律的字符串放到一个字符变量里面,字符变量的名为是xx,数据名字为data1
你想挑选的数据库为d ...
好像实现不了。。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2018-11-27 14:06:18
楼主,请问你的问题解决了吗?可以告知一下方法吗?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2018-11-27 14:06:21
楼主,请问你的问题解决了吗?可以告知一下方法吗?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群