全部版块 我的主页
论坛 计量经济学与统计论坛 五区 计量经济学与统计软件 Stata专版
564 0
2023-02-22
请问如何在同一组内保留重复值最多的样本?
数据如下(附件截图和代码内容是一样的):
例如前6条样本有着相同的组织机构代码“1”,但企业名称对应着“人寿保险”,“宏远酒店”“恩施国税局”三家企业。三家企业名称在同一组织机构代码“1”这一组内出现的次数分别为4次,1次,1次。现在需要保留出现次数最多的企业名称,例如”人寿保险“出现了4次次数最多,请问用什么命令能使得在组织代码”1“里只保留前四条样本?
样本数据量五百万条,按照组织机构代码分组也有几百万组,所以请问什么命令能批量操作?
复制代码








附件列表
1234.png

原图尺寸 60.4 KB

1234.png

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群