关于stata删除含有特定字符整行的问题

18598

收藏 2018-09-15

数据已经以.dta格式传至附件。请问如何删除Code里含有queshi所示字符的整行？比如，前八行Code都是HSBA(...)，变量queshi含有字符HSBA，那么前八行都要被删除；第9-16行queshi不包含Code里的字符，则不被删除。感谢各位大佬解惑!

附件列表

RMH6DM%$X_775%3633S_023.png

原图尺寸 42.96 KB

uk.dta

大小:2.71 MB

马上下载

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

全部回复

黃河泉

2018-9-16 07:34:00

你若要问程序，永远附上相关资料；若附上资料，永远用 dataex 印出资料。先 ssc install dataex (并见说明)，将原始 Stata 资料中具有”代表性”的一部分资料列出，以供有意回答者实验之用，并能提供具体操作指令。并请参考 http://www.jianshu.com/p/9870080fe769, https://bbs.pinggu.org/thread-5048204-1-1.html, 与 https://bbs.pinggu.org/thread-5917273-1-1.html。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

空谷中的卫小庄

2019-7-18 13:09:10

您这样有意思吗？人家就是问一个简单的操作问题，已经表述得很清楚了。你知道就回答，不知道不回复就行了。每次都是在这样的帖子下面回复这一段发帖规范，是为了刷经验？难道别人按要求take the trouble发帖了，你就会给出解决方案？

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

Stakiny

2019-7-18 13:25:45

你的揣测不敢苟同。
1.规范的提问，可以提高应助与交流的效率，而现在许多网友的提问并不合理，需要积极引导，这方面黄老师功不可没；
2.黄老师是本论坛难得的积极、热心坛友，回答了大量网友技术性问题，而不是你说揣测的“刷经验”，对比黄老师的帖子与你的帖子，一目了然；
3.以本帖为例，发帖人并没有提供相应的数据，那么如何检验回答是否符合要求？难道要应助者一个字一个字的敲进去吗？应助者基本是无偿提供帮助，在这种前提下还需要花费码字的时间，这显然不利于交流。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

Stakiny

2019-7-18 13:38:41

类型本帖发帖的情形，可以参考一下如下帖子，黄老师是如何一步一步帮助网友的：
https://bbs.pinggu.org/thread-6651262-1-1.html。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

黃河泉

2019-7-18 15:45:04

1. 这样做当然是有原因的，只是一般人不知道而已！你去看看国际 Stata forum，这是标准要求 (只要你没这样做，几乎每个人都要建议你这样做)。 2. 你可能也不知道，本来 dataex 并不是 Stata 自带指令，后来因为它的重要应用性，现在已经是 Stata 之 default。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

点击查看更多内容…

黃河泉

2019-7-18 18:37:19

或许你可以看看连玉君老师较完整的讲法：https://zhuanlan.zhihu.com/p/29911577。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

蓝色

2019-7-19 20:07:12

复制代码

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

老朽非老朽

2019-10-15 14:29:22

学习了谢谢！

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

老朽非老朽

2019-10-15 14:29:56

好的我下次留意，谢谢提醒

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

Zzstarbiubiu

2019-10-17 21:29:40

你太不礼貌

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

卢永泉

2019-11-19 22:22:04

黄老师人超级好，这样规范也是潮流，希望坛友能理解黄老师的良苦用心

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

sungmoo

2019-11-20 13:04:29

u Name Code queshi using uk, clear
g x=substr(Code, 1, strpos(Code, "(")-1)
bys x: egen y=max(queshi==x)
drop if y

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

来年我还在

2022-2-20 00:13:07

不愿答就别答呗，搞的形式主义

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

赵安豆

2024-11-4 17:10:56

在Stata中，你可以使用`egen`命令结合`strmatch()`函数来识别含有特定字符串的观测值，并基于此进行删除操作。以下是一个示例步骤：

1. 首先加载你的数据。

```stata
use yourdatafile.dta, clear
```

2. 使用`egen`命令创建一个新变量，该变量用于标识需要删除的行。这里假设你想要检查的是`Code`列是否包含`queshi`列中的字符：

```stata
egen str_match = anymatch(Code, queshi), str(10)
replace str_match = (str_match == "")
```

在这个示例中，`anymatch()`函数将返回一个字符串列表，其中包含了在`Code`变量中匹配到的`queshi`中的字符。然而，我们想要的是一个二元标识（即，行是否需要被删除）。因此，我们使用`replace`命令来更新这个新创建的`str_match`变量：如果`str_match`是一个空字符串（意味着没有找到匹配），则该值被设定为0；否则，默认情况下保持为1。

3. 接下来，基于`str_match`变量的结果，删除需要去除的行：

```stata
drop if str_match == 1
```

请注意，如果你的`queshi`列包含多个字符串，而你想要检查`Code`是否包含了这些字符串中的任何一个，则可能需要稍微调整上述代码。例如，你可以使用`strlist()`函数来创建一个字符串列表，并且在`anymatch()`中应用这个列表。

下面是一个更为详细的示例：

```stata
use yourdatafile.dta, clear

* 假设 queshi 包含多个字符需要匹配，则先将它们转换成列表
local string_list : subinstr local _b "" " " , all

egen str_match = anymatch(Code', "string_list'")
replace str_match = (str_match == "")

drop if str_match == 1
```

在上述代码中，`subinstr`函数用于移除字符串列表中的空格，并将其转换为一个Stata本地宏（local macro），以便于后续使用。然后通过`anymatch()`与该列表进行匹配操作。

请确保将`yourdatafile.dta`替换为你的实际文件名，并根据需要调整变量名称和具体条件，以符合你数据集的实际情况。

此文本由CAIE学术大模型生成，添加下方二维码，优先体验功能试用

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

分享

扫码加好友，拉您进群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群