经管之家App
让优质教育人人可得
立即打开
全部版块
我的主页
›
论坛
›
计量经济学与统计论坛 五区
›
计量经济学与统计软件
›
Stata专版
数据处理的一个小问题,请斑竹和高手们帮忙!
楼主
经济人生
1701
4
收藏
2009-08-25
在处理一个住户调查数据的时候,由于行业、职业等信息并没有录入成代码,而大多是以原始答案形式存在的。而且原始答案比较随意,不统一。例如:属于住宿和餐饮业的就有”餐饮业“、”住宿餐饮“、”住宿和餐饮“、”住宿与餐饮“等近二十种答案,这给数据识别带来了较大麻烦。
不知道如何在stata里边能够实现字符串变量的模糊识别?
扫码加我 拉你入群
请注明:姓名-公司-职位
以便审核进群资格,未注明则拒绝
全部回复
沙发
sungmoo
2009-8-25 18:00:18
可不可以先提出你的识别(或标识)规则?
扫码加我 拉你入群
请注明:姓名-公司-职位
以便审核进群资格,未注明则拒绝
藤椅
经济人生
2009-8-26 00:57:17
2#
sungmoo
谢谢斑竹的回复。
举例说明如下,
例如问卷中工人所在的行业,有很多人填写了“
餐饮业”、“住宿餐饮”、“住宿和餐饮”、“住宿与餐饮”等等。
我的规则是只要该变量(字符串类别)出现了“餐饮”或者“住宿”字样,就可以把它们归成一类,再赋值就可以变成一般问卷中的数值,比如 “6 ” 来代表住宿和餐饮业,其他行业依次类推。
如果样本很少,其实我可以一个一个的归类就行了。但问题是有成千上万个样本,答案又千差万别,一个一个归类实在很累又花时间!
扫码加我 拉你入群
请注明:姓名-公司-职位
以便审核进群资格,未注明则拒绝
板凳
sungmoo
2009-8-26 01:21:24
*设行业变量是字符型indu,以上面为例
g x=strpos(indu,"餐饮")+strpos(indu,"住宿")>0
*生成的x是0-1变量,1表示属于餐饮或住宿业,0表示其他。你可以再把1或0换成你想要的数字。其他依此类推。如果你统一给出各行业编码规则,也可以一并完成任务(不必挨个替换)。
扫码加我 拉你入群
请注明:姓名-公司-职位
以便审核进群资格,未注明则拒绝
报纸
经济人生
2009-8-26 21:32:24
谢谢,版主
看来string function里边学问真不少啊!
扫码加我 拉你入群
请注明:姓名-公司-职位
以便审核进群资格,未注明则拒绝
相关推荐
一个数据处理的小问题
数据处理时的一个小问题
请教数据处理
[求助]求助:数据处理的一个小问题,急啊!
[求助]数据处理技术和下结论的一个小问题
急问一个数据处理的小问题
请教一个数据处理的小问题
一个数据处理上的小问题!
一个数据处理的小问题。
数据处理教程
栏目导航
stata专版
行业分析报告
经管文库
文献求助专区
数据交流中心
计量统计软件
热门文章
Stata 最新外部指令(含Meta-Analysis及DAS ...
“木语者”袁宣华:芜湖是我的根!”
电力巡检无人机行业深度报告:智能电网时代 ...
整体微分几何初步 沈一兵
CDA数据分析师:商业数据分析体系构建的核心 ...
对扩散语言模型开启了一次深度思考
CDA数据分析脱产就业班于2025年12月08日开班 ...
财新 周刊26年
杠杆收购 投资银行和私募股权实战指南
中信期货宏观视角大宗商品定价探索之二:产 ...
推荐文章
【必看】【本版版规,欢迎发悬赏贴求助】
26年寒假天津站|Gemini论文写作&数据分析 ...
2026JG学术冬训营:从Stata初高到Python机器 ...
关于如何利用文献的若干建议
关于学术研究和论文发表的一些建议
关于科研中如何学习基础知识的一些建议 (一 ...
一个自编的经济学建模小案例 --写给授课本科 ...
AI智能体赋能教学改革: 全国AI教育教学应用 ...
2025中国AIoT产业全景图谱报告-406页
关于文献求助的一些建议
说点什么
分享
微信
QQ空间
QQ
微博
扫码加好友,拉您进群
各岗位、行业、专业交流群