stata分组排序

号头5

3838

收藏 2018-10-15

悬赏 10 个论坛币未解决

我想把这个表里的000001中薪酬按大小排序，取前10个，然后0000004中也是，这个用stata怎么实现哦。就是00001与00004都是同时在一个表里的
数据大致是这样：

Stkcd	Reptdt	D0101b	D0201b	D0301b	D0401b	D0501b	D0701b	D0702b	薪酬
000001	2013-12-31	刘南园	独立董事	男	64	3	2010-12-23		367600
000001	2013-12-31	段永宽	独立董事	男	64	5	2010-12-23		364000
000001	2013-12-31	夏冬林	独立董事	男	52	5	2010-12-23		366800
000001	2013-12-31	储一昀	独立董事	男	49	5	2010-12-23		386200
000001	2013-12-31	马林	独立董事	男	60	3	2011-05-25		321800
000001	2013-12-31	陈瑛明	独立董事	男	49	4	2011-05-25		350400
000001	2013-12-31	刘雪樵	独立董事	男	62	5	2011-05-25		360400
000001	2013-12-31	罗康平	外部监事	男	59	4	2010-12-23		328400
000001	2013-12-31	肖立荣	外部监事	女	51	4	2010-12-23		307100
000004	2013-12-31	王金水	副总经理	男	58	4	2002-07-02	2013-05-10	79100
000004	2013-12-31	蒋伟诚	副总经理	男	44	4	2008-03-07	2013-05-10	99900
000004	2013-12-31	郑起平	副总经理	男	51	3	2012-11-19	2013-05-10	0
000004	2013-12-31	王琦	独立董事	男	46	5	2010-03-31	2013-05-10	18700
000004	2013-12-31	张新凯	董事,总经理	男	44	3	2011-05-13,2011-01-27	2013-05-10,2013-05-10	105200
000004	2013-12-31	唐先华	财务总监	男	50	4	2007-08-02	2013-05-10	102000
000004	2013-12-31	李新华	董事	男	47	4	2010-03-31	2013-05-10	0
000004	2013-12-31	李良智	独立董事	男	49	5	2010-03-31	2013-05-10	18700
000004	2013-12-31	潘秀玲	独立董事	女	49	4	2010-03-31	2013-05-10	18700
000004	2013-12-31	何婷	职工监事	女	27	3	2011-04-18		76600
000004	2013-12-31	余曾培	董事	男	66	2	2008-03-14	2013-05-10	0
000004	2013-12-31	杨斌	常务副总,董事会秘书	男	41	4	2013-05-10,2011-01-26		266800
000004	2013-12-31	陈奕璇	副总经理	女	46	4	2013-05-10		173300
000004	2013-12-31	刘多宏	董事	男	47	1	2012-05-17		0
000004	2013-12-31	徐文苏	非独立董事,财务总监	男	37	2	2013-05-10,2013-05-10		235200
000004	2013-12-31	陈少龙	监事长	男	43	4	2011-05-23		0

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

全部回复

号头5

2018-10-15 21:41:18

数据是这样的
Stkcd Reptdt D0101b D0201b D0301b D0401b D0501b D0701b D0702b 薪酬
000001 2013-12-31 刘南园独立董事男 64 3 2010-12-23 367600
000001 2013-12-31 段永宽独立董事男 64 5 2010-12-23 364000
000001 2013-12-31 夏冬林独立董事男 52 5 2010-12-23 366800
000001 2013-12-31 储一昀独立董事男 49 5 2010-12-23 386200
000001 2013-12-31 马林独立董事男 60 3 2011-05-25 321800
000001 2013-12-31 陈瑛明独立董事男 49 4 2011-05-25 350400
000001 2013-12-31 刘雪樵独立董事男 62 5 2011-05-25 360400
000001 2013-12-31 罗康平外部监事男 59 4 2010-12-23 328400
000001 2013-12-31 肖立荣外部监事女 51 4 2010-12-23 307100
000004 2013-12-31 王金水副总经理男 58 4 2002-07-02 2013-05-10 79100
000004 2013-12-31 蒋伟诚副总经理男 44 4 2008-03-07 2013-05-10 99900
000004 2013-12-31 郑起平副总经理男 51 3 2012-11-19 2013-05-10 0
000004 2013-12-31 王琦独立董事男 46 5 2010-03-31 2013-05-10 18700
000004 2013-12-31 张新凯董事,总经理男 44 3 2011-05-13,2011-01-27 2013-05-10,2013-05-10 105200
000004 2013-12-31 唐先华财务总监男 50 4 2007-08-02 2013-05-10 102000
000004 2013-12-31 李新华董事男 47 4 2010-03-31 2013-05-10 0
000004 2013-12-31 李良智独立董事男 49 5 2010-03-31 2013-05-10 18700
000004 2013-12-31 潘秀玲独立董事女 49 4 2010-03-31 2013-05-10 18700
000004 2013-12-31 何婷职工监事女 27 3 2011-04-18 76600
000004 2013-12-31 余曾培董事男 66 2 2008-03-14 2013-05-10 0
000004 2013-12-31 杨斌常务副总,董事会秘书男 41 4 2013-05-10,2011-01-26 266800
000004 2013-12-31 陈奕璇副总经理女 46 4 2013-05-10 173300
000004 2013-12-31 刘多宏董事男 47 1 2012-05-17 0
000004 2013-12-31 徐文苏非独立董事,财务总监男 37 2 2013-05-10,2013-05-10 235200
000004 2013-12-31 陈少龙监事长男 43 4 2011-05-23 0

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

黃河泉

2018-10-16 10:34:20

你若要问程序，永远附上相关资料；若附上资料，永远用 dataex 印出资料。先 ssc install dataex (并见说明)，将原始 Stata 资料中具有”代表性”的一部分资料列出，以供有意回答者实验之用，并能提供具体操作指令。并请参考 http://www.jianshu.com/p/9870080fe769, https://bbs.pinggu.org/thread-5048204-1-1.html, 与 https://bbs.pinggu.org/thread-5917273-1-1.html。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

赵安豆

2024-6-11 20:55:13

在Stata中实现对特定stkcd（例如000001和000004）下的薪酬进行分组排序并取出前10名的步骤如下：

首先，我们需要确保数据已经加载到Stata中。如果数据还没有加载，可以使用以下命令：
```
use "your_dataset.dta", clear
```

假设你的数据集已经被命名为"your_dataset.dta"。

接下来是实现你所要求的功能的关键代码：
```
* 为000001排序并显示前10名薪酬
sort Stkcd 薪酬 if Stkcd == "000001"
qui su 薪酬, meanonly if Stkcd == "000001"
local N = r(N)

forvalues i= 1/10 {
qui sum 薪酬 [aweight=_N], detail if Stkcd == "000001"
local p`i' = r(p`=`(100 * `i'/`N')')
}

list Stkcd D0101b D0201b D0301b D0401b D0501b D0701b D0702b 薪酬 if Stkcd == "000001" & _p <= `p1' , noobs
* 注意：_p 是Stata内置的排序位置标识符

* 为000004排序并显示前10名薪酬，使用相同步骤
sort Stkcd 薪酬 if Stkcd == "000004"
qui su 薪酬, meanonly if Stkcd == "000004"
local N = r(N)

forvalues i= 1/10 {
qui sum 薪酬 [aweight=_N], detail if Stkcd == "000004"
local p`i' = r(p`=`(100 * `i'/`N')')
}

list Stkcd D0101b D0201b D0301b D0401b D0501b D0701b D0702b 薪酬 if Stkcd == "000004" & _p <= `p1' , noobs
```

这里的代码首先对特定stkcd进行排序，计算出总人数N，并找到前10%的薪酬位置。然后使用list命令展示这些信息。

但是，为了简化这个过程并避免重复代码，可以封装成一个小函数或者更高效地利用循环和条件语句来完成多个stkcd的操作。
在实际应用中，你可能需要根据你的具体数据结构调整列名或添加额外的过滤条件等。
注意：这里的解决方案假定了`Stkcd`与薪酬是直接相关的，并且没有其他的复杂筛选要求。如果存在更复杂的逻辑（如多条件排序），则需要进一步调整代码以满足特定需求。

使用这种方法，你可以针对不同的stkcd值获取排序后的前10名数据，只需替换"000001"和"000004"为你的目标stkcd即可。

此文本由CAIE学术大模型生成，添加下方二维码，优先体验功能试用

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

分享

扫码加好友，拉您进群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群