1# hittilehua
我目前在做一个股票收益率波动方面的东西,从WIND上下载的个股历史行情数据都是一个个单独的文件,如何用STATA读取大批量EXECL文件上的数据,(不用复制粘贴,这样的工作太繁琐了!!),然后用STATA将每个个股上的数据进行合并计算呢?跪求各位大哥大姐的求助啊!!
回复:
1,好久没有用wind,忘记里面是否可以一次导入所有代码。如果wind没有这个功能,可以换用国泰安数据库,一次导入所有个股。这样,一只股票一年有约250个观测,一共有不到2000家上市公司,这样的话,一年的观测总数是250*2000=500000=50(万)个,这已经超出了国泰安一次输出数据集观测值的上限(TXT、excel为65000个,VF为20万)。是否可以采用周收益率波动?如果是周数据的话,那么一年一只个股约有50个观测,所有个股一年的数据集共有50*2000=100000个,此时可以采用VF形式输出,如果没有VF,可以分两次导入代码然后输出。按此方法将每一年的数据分别下载出来(假定为excel格式),将这所有的excel格式数据集导入SAS,完了再将这些数据集纵向合并即可。说明:如果你不是要研究全部个股,而只是部分个股,那么输入代码即可。另外,如果你的单个个股的数据已经下载好了的话,可以导入SAS中进行纵向合并即可,很方便。
2,如前所述,笔者并没有涉及到STATA,而是建议你将数据集导入SAS。SAS在处理大型数据集的时候特别强大,stata由于数据只存放在内存中,不方便进行数据集处理。根据笔者的经验,可以用SAS来进行大的数据集处理,而STATA主要是在面板数据方面较为灵活实用,Eviews则是在时间序列建模时很实用。