全部版块 我的主页
论坛 计量经济学与统计论坛 五区 计量经济学与统计软件 Stata专版
5323 4
2015-04-13
如题。我想对面板数据按年份和某个变量数据排序,然后在各年份里分别删掉在前后1%内的数据,我应该怎么做可以较简单的实现这个功能,期待各位大神的解答。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2015-4-13 17:44:10
比如你说的某个变量名字为leverage,年份从2000-2007,那么:

local i=2000
while `i'<=2007{
quietly egen per99`i'=pctile(leverage), p(99)
quietly egen per1`i'=pctile(leverage), p(1)
quietly drop if leverage>per99`i' & leverage!=.
quietly drop if leverage<per1`i' & leverage!=.
quietly drop per99`i' per1`i'
local i=`i'+1
}
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2015-4-14 18:08:21
jose.liupei 发表于 2015-4-13 17:44
比如你说的某个变量名字为leverage,年份从2000-2007,那么:

local i=2000
多谢指点,十分感激。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2015-4-21 16:07:44
jose.liupei 发表于 2015-4-13 17:44
比如你说的某个变量名字为leverage,年份从2000-2007,那么:

local i=2000
您好,用了您的代码未能得出想要的结果。

假定id是10,年份正如您说的2000-2007年,数据已经模拟生成,代码如下:
复制代码
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2015-4-22 04:01:00
SpencerMeng 发表于 2015-4-21 16:07
您好,用了您的代码未能得出想要的结果。

假定id是10,年份正如您说的2000-2007年,数据已经模拟生成, ...
是因为你的样本太少,8年数据,每年只有10个样本,将10个样本进行100%统计分布,取1%和99%的极值,再截取两端的话,是不会drop任何值的
如果每年样本大于100的话,就没有问题
如果每年样本小于100的话,只需要将code里稍微修改一下就可以(>改成>=;<改成<=):
quietly drop if leverage>=per99`i' & leverage!=.
quietly drop if leverage<=per1`i' & leverage!=.
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群