stata 怎么处理两个字符串的关系？

xingyun1688

6092

收藏 2015-10-29

如我有两列变量，每一列都为字符串，如a1变量中有“123456”等，a2中有“12345”，“23456”，“234”，“13456”，“1356”等，即列举的四个都为a1的子集，问怎么用stata进行处理。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

全部回复

夏目贵志

2015-11-1 09:08:37

你想把他们处理成什么样子？
可以看一下substring()和subinstr()函数。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

xingyun1688

2015-11-1 10:14:31

substr是选取部分，我是要判断一个字符串是另一个字符串的部分，我用regexm()只能判断出12345，1234，23456是123456的部分，不能判断13456也是123456的部分。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

夏目贵志

2015-11-1 11:19:18

xingyun1688 发表于 2015-11-1 10:14
substr是选取部分，我是要判断一个字符串是另一个字符串的部分，我用regexm()只能判断出12345，1234，23456 ...

如果是回复我的话记得点帖子右下角的“回复”链接哦~
用substring取出一个字符串的每个字符，在另一个字符串里的这个字符用subinstring删掉。看看最后剩下什么就好了。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

xingyun1688

2015-11-1 12:30:10

夏目贵志发表于 2015-11-1 11:19
如果是回复我的话记得点帖子右下角的“回复”链接哦~
用substring取出一个字符串的每个字符，在另一个字 ...

这样还是挺慢的，不知道有没有什么系统的命令可以处理更多这种问题。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

夏目贵志

2015-11-1 12:32:34

xingyun1688 发表于 2015-11-1 12:30
这样还是挺慢的，不知道有没有什么系统的命令可以处理更多这种问题。

处理文本本来就不是stata的强项，能用更好的软件尽量还是不要用stata吧。自己写python程序不好吗？

不过你要是找到了好方法记得来论坛分享哦！

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

点击查看更多内容…

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

分享

扫码加好友，拉您进群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群