经管之家App
让优质教育人人可得
立即打开
全部版块
我的主页
›
论坛
›
计量经济学与统计论坛 五区
›
计量经济学与统计软件
›
Stata专版
请问stata有没有模糊分组的命令
楼主
林清越
653
3
收藏
2022-12-01
如题,就是比如按年份分组,就是by year,把年份相同的归为一组。但如果我想按股东名字分组,但是同一个股东可能名字的字符不太一样,比如北京市A公司,和北京A公司,北京A有限公司,这中模糊的情况如何把他们归为一组呢?手动整理工作量是在太大了。
扫码加我 拉你入群
请注明:姓名-公司-职位
以便审核进群资格,未注明则拒绝
全部回复
沙发
917968079
2022-12-2 08:59:44
可以试试先生成一个新的变量,可以是企业简称,比如剔除市、省、自治区、有限公司等可能输入不一致的词。然后用新生成的变量分组
扫码加我 拉你入群
请注明:姓名-公司-职位
以便审核进群资格,未注明则拒绝
藤椅
abelus
2022-12-6 08:40:22
如果组名还比较规范,可以通过正则表达式
定义一个字符编码的相似性度量函数,然后“聚类”下,再手工的处理下,text analysis的的领域了。Python、R等都有现成的函数了,可以试一试。
扫码加我 拉你入群
请注明:姓名-公司-职位
以便审核进群资格,未注明则拒绝
板凳
wtst
2022-12-9 17:24:05
感觉可以拆解为:
1.正则表达式构建相同的变量组
2.根据构建出的变量组再进行聚类或其他处理
其中,STATA中的正则表达式可以用 regexm(s,re) 以及 regexr(s1,re,s2)
扫码加我 拉你入群
请注明:姓名-公司-职位
以便审核进群资格,未注明则拒绝
相关推荐
有没有比较新的STata书籍
关于STATA定义常量
有没有比较好的学习stata的书籍可以推荐?
stata有没有不教编程的,只交如何点点就出结果
stata怎么求版面数据中同一个体两年数据的差,不是相邻的两年的数据,是隔几年的
请问大神,出口技术复杂度怎样用STATA计算,有没有指令
十万加急帖!!!有没有stata的统计大神呀??
【求助】大家有没有做分组的PSM时stata运行特别慢的情况
有没有stata大佬知道stata变量中的“.”代表什么
论文实证
栏目导航
Stata专版
考研专业课
真实世界经济学(含财经时事)
博弈论
经管类求职与招聘
经管文库(原现金交易版)
热门文章
【重磅权威】2000-2024年上市公司人力资本流 ...
求助英文文献一篇
精准匹配,菁英相伴--经管之家单身俱乐部, ...
我该如何记住你?智能体记忆系统的演化之路
CDA数据分析脱产就业班于2026年3月7日开班! ...
表格结构数据的核心特征及具象实例解析
伍德里奇计量经济学导论第六版教材PDF
2026年Agent领域十大趋势判断
湖南统计年鉴2025(Excel版)
中外历史年代对照表
推荐文章
2026JG学术冬训营:从Stata初高到Python机器 ...
【必看】【本版版规,欢迎发悬赏贴求助】
26年寒假天津站|Gemini论文写作&数据分析 ...
关于如何利用文献的若干建议
关于学术研究和论文发表的一些建议
关于科研中如何学习基础知识的一些建议 (一 ...
一个自编的经济学建模小案例 --写给授课本科 ...
AI智能体赋能教学改革: 全国AI教育教学应用 ...
2025中国AIoT产业全景图谱报告-406页
关于文献求助的一些建议
说点什么
分享
微信
QQ空间
QQ
微博
扫码加好友,拉您进群
各岗位、行业、专业交流群