全部版块 我的主页
论坛 计量经济学与统计论坛 五区 计量经济学与统计软件 经管代码库
5232 6
2018-02-11
老师同学好,请问一下如何从一串既有文字又有数字的语句中提取数字,
并且每个观察值语句的长短是不一的,不像年月日长短是整齐的,对于不
整齐的有没有什么办法提取?

例如:
id     context
1     有普通员工389名,其中大学以下学历人数占40%,硕士以上学历占12%,博士以上学历占10%  
2     一般员工422名,工作3年以上占61.2%,工作5年以上占43.8%,工作10年以上占9.88%  


提取
id  v1      v2         v3         v4
1  389    40%      12%      10%
2  422    61.2%     43.8%  9.88%


二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2018-2-11 21:21:21
好像有个扫描功能的命令,忽然忘了
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2018-2-12 12:12:11
在线等,哪位大神帮帮忙
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2018-2-16 22:46:20
用Excel。
假设:原始数据“有普通员工……”放在B1单元格
C1单元格输入:=MID(B1,FIND("工",B1)+1,FIND("名",B1)-FIND("工",B1)-1)
D1单元格输入:=MID(B1,FIND("占",B1)+1,FIND("%",B1)-FIND("占",B1))
E1单元格输入:=MID(B1,FIND("占",B1,FIND("占",B1)+1)+1,FIND("%",B1,FIND("%",B1)+1)-FIND("占",B1,FIND("占",B1)+1))
F1单元格输入:=MID(B1,FIND("占",B1,FIND("占",B1,FIND("占",B1)+1)+1)+1,FIND("%",B1,FIND("%",B1,FIND("%",B1)+1)+1)-FIND("占",B1,FIND("占",B1,FIND("占",B1)+1)+1))

其他类推。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2020-6-4 17:09:11
现在找到一个更快的方法,下载方方格子,安装到excel里
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2020-6-4 17:19:20
jingjuan1997 发表于 2018-2-11 21:21
好像有个扫描功能的命令,忽然忘了
regexm  命令
gen day = regexs(0) if regexm(date, "^[0-9]+")
gen month = regexs(0) if regexm(date, "[a-zA-Z]+")
gen year = regexs(0) if regexm(date, "[0-9]*$")
replace year = "20"+regexs(0) if regexm(year, "^[0][0-9]$")
replace year = "19"+regexs(0) if regexm(year, "^[1-9][0-9]$")
gen date2 = day+month+year
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

点击查看更多内容…
相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群