全部版块 我的主页
论坛 计量经济学与统计论坛 五区 计量经济学与统计软件 Stata专版
670 2
2024-10-28
求问:如何在文本中提取某类关键词(比如:杭州|宁波|嘉兴),将该关键词提取到已有变量city中,若文本中不含关键词,则city为空值
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2024-10-29 19:39:31
* 示例数据  
clear  
input str50 text  
"我在杭州生活"  
"宁波是个好地方"  
"嘉兴的风景很美"  
"我去过上海"  
"这里是温州"  
end  
  
* 初始化city变量为空字符串  
gen str50 city = ""  
  
* 提取关键词并赋值给city变量  
foreach city_name in 杭州 宁波 嘉兴 {  
    replace city = regexr(text, "^.*?" + city_name + ".*$", "`city_name'") if regexm(text, city_name)  
}  
  
* 清理:如果city变量仍然是空字符串(即未匹配到任何关键词),则设置为空值  
replace city = . if city == ""  
  
* 查看结果  
list
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2024-11-2 14:58:53
att006 发表于 2024-10-29 19:39
* 示例数据  
clear  
input str50 text
谢谢,很有用
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群