全部版块 我的主页
论坛 计量经济学与统计论坛 五区 计量经济学与统计软件 统计软件培训班VIP答疑区
5201 2
2018-03-14
连老师好,刚开始学Stata,遇到一个数据处理的问题,希望能得到您的帮忙。
时间序列数据,样本一共有7000+变量,每个变量有9000+观察值。
1. 其中大约有1000个变量的所有观察值都是相同的,需要找到并且删除这些变量,比如comp6,请问如何处理?
2. 另外还有一些变量,从某一天开始,之后所有日期的观察值相同,也需要找到这些变量,同时保留变量而仅仅将后面相同的观察值删除,比如comp7,请问如何处理?


复制代码



二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2018-3-16 18:41:59
我自己检查了数据,感觉第二个点是没法解决的,因为就算观察值相同可能还是又一部分数据可以用,还是应该从数据库着手重新下载另一个类型的数据。
第一点通过excel计算std.dev.,找到值为0的也能删除。不过如果老师看到这个问题的话,希望能告知stata的解决方案,非常感谢。
最后一点问题,如果想针对每个单个日期排序,整个样本的7000+变量,找出每天的前80和末80并且标记,需要用到什么样的命令呢,这方面的知识在初级或者高级里面会有涉及到吗?
希望老师看到能够回答,非常感谢!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2018-3-19 19:05:21
连老师好,之前的问题已经解决,遇到新的问题如下,希望能得到您的帮助。
1.需要每天对变量进行排序,前三的标记为1,末三的标记为-1,都不是的为0
2.每个变量对应三个月度dummy variable,分别是上个月至少一次被标记为1从未被标记为-1的W=1,上个月至少一次被标记为-1从未被标记为1的L=1,上个月既标记为1又标记为-1的WL=1

我实际的数据有200多个月,而且不一定每个月的第一天为1号,命令要怎么写呢?

复制代码

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群