经管之家App
让优质教育人人可得
立即打开
全部版块
我的主页
›
论坛
›
计量经济学与统计论坛 五区
›
计量经济学与统计软件
›
Stata专版
数据处理的一个小问题,请斑竹和高手们帮忙!
楼主
经济人生
1627
4
收藏
2009-08-25
在处理一个住户调查数据的时候,由于行业、职业等信息并没有录入成代码,而大多是以原始答案形式存在的。而且原始答案比较随意,不统一。例如:属于住宿和餐饮业的就有”餐饮业“、”住宿餐饮“、”住宿和餐饮“、”住宿与餐饮“等近二十种答案,这给数据识别带来了较大麻烦。
不知道如何在stata里边能够实现字符串变量的模糊识别?
扫码加我 拉你入群
请注明:姓名-公司-职位
以便审核进群资格,未注明则拒绝
全部回复
沙发
sungmoo
2009-8-25 18:00:18
可不可以先提出你的识别(或标识)规则?
扫码加我 拉你入群
请注明:姓名-公司-职位
以便审核进群资格,未注明则拒绝
藤椅
经济人生
2009-8-26 00:57:17
2#
sungmoo
谢谢斑竹的回复。
举例说明如下,
例如问卷中工人所在的行业,有很多人填写了“
餐饮业”、“住宿餐饮”、“住宿和餐饮”、“住宿与餐饮”等等。
我的规则是只要该变量(字符串类别)出现了“餐饮”或者“住宿”字样,就可以把它们归成一类,再赋值就可以变成一般问卷中的数值,比如 “6 ” 来代表住宿和餐饮业,其他行业依次类推。
如果样本很少,其实我可以一个一个的归类就行了。但问题是有成千上万个样本,答案又千差万别,一个一个归类实在很累又花时间!
扫码加我 拉你入群
请注明:姓名-公司-职位
以便审核进群资格,未注明则拒绝
板凳
sungmoo
2009-8-26 01:21:24
*设行业变量是字符型indu,以上面为例
g x=strpos(indu,"餐饮")+strpos(indu,"住宿")>0
*生成的x是0-1变量,1表示属于餐饮或住宿业,0表示其他。你可以再把1或0换成你想要的数字。其他依此类推。如果你统一给出各行业编码规则,也可以一并完成任务(不必挨个替换)。
扫码加我 拉你入群
请注明:姓名-公司-职位
以便审核进群资格,未注明则拒绝
报纸
经济人生
2009-8-26 21:32:24
谢谢,版主
看来string function里边学问真不少啊!
扫码加我 拉你入群
请注明:姓名-公司-职位
以便审核进群资格,未注明则拒绝
相关推荐
一个数据处理的小问题
数据处理时的一个小问题
请教数据处理
[求助]求助:数据处理的一个小问题,急啊!
[求助]数据处理技术和下结论的一个小问题
急问一个数据处理的小问题
请教一个数据处理的小问题
一个数据处理上的小问题!
一个数据处理的小问题。
数据处理教程
栏目导航
Stata专版
爱问频道
学术道德监督
国民经济管理
经管类求职与招聘
制度经济学
热门文章
中国金融生成式AI多模态内容鉴伪与安全防御 ...
全球能源转型展望2025—全球和区域预测至20 ...
海外资管机构赴上海投资指南(2025版)
understanding climate change perceptions ...
【全美经典】离散数学
全球能源转型展望2025—全球和区域预测至20 ...
世界机器人2025年报告 World Robotics 2025
甲子光年_2025甲子Cool Vendor人形机器人大 ...
AOM:The Boundaries of Trust in a New Era
气象学-山东大学
推荐文章
AI狂潮席卷学术圈,不会编程也能打造专属智 ...
10月重磅来袭|《打造Coze/Dify专属学术智能 ...
最快1年拿证,学费不足5W!热门美国人工智能 ...
关于如何利用文献的若干建议
关于学术研究和论文发表的一些建议
关于科研中如何学习基础知识的一些建议 (一 ...
一个自编的经济学建模小案例 --写给授课本科 ...
AI智能体赋能教学改革: 全国AI教育教学应用 ...
2025中国AIoT产业全景图谱报告-406页
关于文献求助的一些建议
说点什么
分享
微信
QQ空间
QQ
微博
扫码加好友,拉您进群
各岗位、行业、专业交流群