全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 Excel
10255 15
2012-07-23
比如我研究2000-2010的公司 但是在CSMAR下载后有部分公司只有2006-2010 或者2008-2010的数据 这些公司需要剔出么?要怎么快速剔出啊。。一个个剔出太不显示了 囧 还是可以不用剔出直接做面板数据分析的?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2012-7-23 18:10:02
先弄个你要找的全部公司的列表。
下载的数据如果有个N/A就好说,放到全公司表格里面,筛选下,删掉这一行。
下载的数据,如果这一行干脆就没有,就稍微麻烦点。
把下载的数据和全公司列表放在一起,然后在全公司列表的行里面,运用vlookup函数,从下载数据里面寻找这个公司的数据。返回error的,就是缺失的。然后再筛选,剔除这一行。
可以参看我这个例子,在sheet6里面进行的剔除操作。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2012-7-23 23:09:45
面板数据可以有两种
1.平衡的面板数据,就是说你每个t时间的数据都是完整的没有缺失;
2.非平衡的,就像楼主描述的那样,部分年份缺失;
采用哪种方法就看楼主的数如果在剔除后,还够样本量 那么你可以考虑剔除那些不足年份的样本;反之那就采用非平衡的面板数据处理方法(具体我已经记不得了,可以看下萧政的面板数据PS:台湾大牛)
至于剔除的方法,在Excel中采用筛选的方法会比较方便,或者可以先将数据不全的cell替换成(举个栗子)NA然后用=if(OR(A2=NA,B2=NA...),"缺失","")这样如果有cell内数据为NA,就显示缺失,然后用筛选->对函数所在列排序下就行了
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2012-7-24 16:32:57
wyfhdl 发表于 2012-7-23 23:09
面板数据可以有两种
1.平衡的面板数据,就是说你每个t时间的数据都是完整的没有缺失;
2.非平衡的,就像楼 ...
啊啊 非常感谢 是这样 比如A列是公司代码1-N B列是年份 是公司1完了马上是公司2 比如公司1 右边年份是2000-2010 接着是公司2 2006-2010 这种。。不知如何剔出呢
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2012-7-25 08:21:05
lyly943 发表于 2012-7-24 16:32
啊啊 非常感谢 是这样 比如A列是公司代码1-N B列是年份 是公司1完了马上是公司2 比如公司1 右边年份是200 ...
上图吧。。你写的我理解不了
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2012-7-25 18:40:23
wyfhdl 发表于 2012-7-25 08:21
上图吧。。你写的我理解不了
啊 谢谢你!!我后来用那个分类汇总弄了弄 总算是每年的公司一样了 大概800多个样本 现在开始研究怎么用STATA做面板数据分析 哎 但是完全不懂呀 百度了半天 原来要先设定成面板数据 用 tsset命令 可是我的结果是 panel variable:  code (strongly balanced)
        time variable:  year, 2000 to 2010
                delta:  1 unit
这个。。。不知道哪个delta是什么意思呢 还有那个code strongly balanced...哎呀 很着急~这个是什么意思呢?对了~请问你有STATA方面的东东推荐么?真是不好意思。。。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

点击查看更多内容…
相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群