全部版块 我的主页
论坛 计量经济学与统计论坛 五区 计量经济学与统计软件 Stata专版
5961 7
2015-10-29
如我有两列变量,每一列都为字符串,如a1变量中有“123456”等,a2中有“12345”,“23456”,“234”,“13456”,“1356”等,即列举的四个都为a1的子集,问怎么用stata进行处理。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2015-11-1 09:08:37
你想把他们处理成什么样子?
可以看一下substring()和subinstr()函数。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2015-11-1 10:14:31
substr是选取部分,我是要判断一个字符串是另一个字符串的部分,我用regexm()只能判断出12345,1234,23456是123456的部分,不能判断13456也是123456的部分。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2015-11-1 11:19:18
xingyun1688 发表于 2015-11-1 10:14
substr是选取部分,我是要判断一个字符串是另一个字符串的部分,我用regexm()只能判断出12345,1234,23456 ...
如果是回复我的话记得点帖子右下角的“回复”链接哦~
用substring取出一个字符串的每个字符,在另一个字符串里的这个字符用subinstring删掉。看看最后剩下什么就好了。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2015-11-1 12:30:10
夏目贵志 发表于 2015-11-1 11:19
如果是回复我的话记得点帖子右下角的“回复”链接哦~
用substring取出一个字符串的每个字符,在另一个字 ...
这样还是挺慢的,不知道有没有什么系统的命令可以处理更多这种问题。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2015-11-1 12:32:34
xingyun1688 发表于 2015-11-1 12:30
这样还是挺慢的,不知道有没有什么系统的命令可以处理更多这种问题。
处理文本本来就不是stata的强项,能用更好的软件尽量还是不要用stata吧。自己写python程序不好吗?

不过你要是找到了好方法记得来论坛分享哦!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

点击查看更多内容…
相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群