经管之家App
让优质教育人人可得
立即打开
全部版块
我的主页
›
论坛
›
计量经济学与统计论坛 五区
›
计量经济学与统计软件
›
Stata专版
请问stata有没有模糊分组的命令
楼主
林清越
608
3
收藏
2022-12-01
如题,就是比如按年份分组,就是by year,把年份相同的归为一组。但如果我想按股东名字分组,但是同一个股东可能名字的字符不太一样,比如北京市A公司,和北京A公司,北京A有限公司,这中模糊的情况如何把他们归为一组呢?手动整理工作量是在太大了。
扫码加我 拉你入群
请注明:姓名-公司-职位
以便审核进群资格,未注明则拒绝
全部回复
沙发
917968079
2022-12-2 08:59:44
可以试试先生成一个新的变量,可以是企业简称,比如剔除市、省、自治区、有限公司等可能输入不一致的词。然后用新生成的变量分组
扫码加我 拉你入群
请注明:姓名-公司-职位
以便审核进群资格,未注明则拒绝
藤椅
abelus
2022-12-6 08:40:22
如果组名还比较规范,可以通过正则表达式
定义一个字符编码的相似性度量函数,然后“聚类”下,再手工的处理下,text analysis的的领域了。Python、R等都有现成的函数了,可以试一试。
扫码加我 拉你入群
请注明:姓名-公司-职位
以便审核进群资格,未注明则拒绝
板凳
wtst
2022-12-9 17:24:05
感觉可以拆解为:
1.正则表达式构建相同的变量组
2.根据构建出的变量组再进行聚类或其他处理
其中,STATA中的正则表达式可以用 regexm(s,re) 以及 regexr(s1,re,s2)
扫码加我 拉你入群
请注明:姓名-公司-职位
以便审核进群资格,未注明则拒绝
相关推荐
有没有比较新的STata书籍
关于STATA定义常量
有没有比较好的学习stata的书籍可以推荐?
stata有没有不教编程的,只交如何点点就出结果
stata怎么求版面数据中同一个体两年数据的差,不是相邻的两年的数据,是隔几年的
请问大神,出口技术复杂度怎样用STATA计算,有没有指令
十万加急帖!!!有没有stata的统计大神呀??
【求助】大家有没有做分组的PSM时stata运行特别慢的情况
有没有stata大佬知道stata变量中的“.”代表什么
论文实证
栏目导航
Stata专版
经管类求职与招聘
金融实务版
数据分析师(CDA)专版
悬赏大厅
计量经济学与统计软件
热门文章
2026“课题申报”抢跑号角的已吹响!国社科 ...
CDA 认证考试大纲 2025 重磅更新:一二级考 ...
英文书籍
英文书籍
国家级都市圈谁在领跑:2025华高莱斯产城瞭 ...
中国移动:智能体互联网技术白皮书2025
超越普里瓦洛夫无穷乘积与它对解析函数的应 ...
超越普里瓦洛夫数项级数卷
您提出了一个足以获得诺贝尔奖的核心概念— ...
2012-2024年上市公司工业机器人渗透率数据集 ...
推荐文章
10月重磅来袭|《打造Coze/Dify专属学术智能 ...
高校老师和学生都在偷偷上的智能体课,到底 ...
最快1年拿证,学费不足5W!热门美国人工智能 ...
关于如何利用文献的若干建议
关于学术研究和论文发表的一些建议
关于科研中如何学习基础知识的一些建议 (一 ...
一个自编的经济学建模小案例 --写给授课本科 ...
AI智能体赋能教学改革: 全国AI教育教学应用 ...
2025中国AIoT产业全景图谱报告-406页
关于文献求助的一些建议
说点什么
分享
微信
QQ空间
QQ
微博
扫码加好友,拉您进群
各岗位、行业、专业交流群