全部版块 我的主页
论坛 计量经济学与统计论坛 五区 计量经济学与统计软件 Stata专版
9890 10
2019-12-06
我的原始数据是一个公司代码(stkcd)对应很多个年份(2008-2018),每个年份下面又对应很多个具体数据(personid),对于缺失值的处理我有两个想法,一是只要含有缺失值,则将整个公司各年的数据全部删除,二是只要含有缺失值,则将缺失值对应的年份下的所有数据都删除,比如如下数据中倒数第二行有一个缺失值,针对这个缺失值我想方法一是可以将stkcd为000002的数据全部删除,方法二是仅将stkcd为000002,year为2012的数据删除,求教大神用stata如何分别实现这两个目的,十分感谢!
复制代码



二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2019-12-7 06:49:55
方法一是可以将stkcd为000002的数据全部删除
drop if stkcd==000002
方法二是仅将stkcd为000002,year为2012的数据删除
drop if stkcd==000002 & year==2012
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2019-12-7 08:36:03
为何要这样做?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2019-12-7 09:56:18
黃河泉 发表于 2019-12-7 08:36
为何要这样做?
因为我要算管理层异质性指数(HHI指数),如果只删除有缺失值的行的话那么算出来的HHI指数就是有误差的,所以必须至少要将有缺失值的年份的数据全部删除,然后我想如果样本量够大的话可以直接将所有含有缺失值的公司数据删掉
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2019-12-7 10:01:16
minkeyqi34 发表于 2019-12-7 06:49
方法一是可以将stkcd为000002的数据全部删除
drop if stkcd==000002
方法二是仅将stkcd为000002,year为2 ...
非常感谢您的回复!按您的代码做的前提是stkcd为00002的数据里面含有缺失值,但是因为数据很多,我没有办法知道那些stkcd和哪些year里面有缺失值,请教这个问题怎么解决呢?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2019-12-7 10:36:37
松小柏 发表于 2019-12-7 09:56
因为我要算管理层异质性指数(HHI指数),如果只删除有缺失值的行的话那么算出来的HHI指数就是有误差的, ...
老实说,这个我不熟。你说的:"如果只删除有缺失值的行的话那么算出来的HHI指数就是有误差的",我也不知道有何依据?一般而言,我很少看到 (当然,文章中通常也不会说有无删除缺失值之后,才计算指标) 你这样的作法!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

点击查看更多内容…
相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群