全部版块 我的主页
论坛 计量经济学与统计论坛 五区 计量经济学与统计软件 Stata专版
20041 8
2013-10-19
请教各位坛友,stata能不能实现提取变量名称的部分信息呢。
举例:中国银行 1000;中国人寿1000;苏州信贷公司1000;中石油1000。
对文字进行筛选并在其后加一个dummy,文字中含有“银行”“信贷”的项目令其为1。
就要变成:中国银行 1000  1;中国人寿1000  0;苏州信贷公司1000  1;中石油1000  0这样子的表格

还望不吝赐教,最好是给出具体的指令

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2013-10-19 00:36:30
假定上面的中国银行,中国人寿等都是在变量firm_name下的观测值
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2013-10-19 00:46:20
忘记说一共是有几万个观测值了,所以不用给我说直接用gen dummy=1 if firmname==“中国银行”这样的具体到每个观测值的指令哦
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2013-10-19 01:02:40
已经找到了,有需要的同学请自行参照regexm指令
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2013-10-25 10:03:48
正则表达式就over了,其实匹配也可以实现的
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2013-10-25 11:51:25
我最常用strmatch,类似楼主的问题就是这样子啦:
gen bank=1 if strmatch(stringvar,"*银行*") | strmatch(stringvar,"*信贷*")

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

点击查看更多内容…
相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群