问题:
下载GTA数据后,有两个文件:一是数据文件,二是变量列表文件。数据文件中的变量都是英文的,可以直接导入Stata,但缺少中文标签。这可以从第二个文件,即变量列表文件中得到。
变量列表文件示例如下:
表1 GTA的变量列表文件
|
Stkcd:证券代码
|
Annodt:公告日期
|
Repttype:公告类型
|
Chgdt:变更日期
|
Position:变更职位
|
Positype:其中:变更类型
|
Positxx:减:销售额
|
对这个列表做简单处理,可以得到变量标签的定义文件。
处理步骤为:
1. 将表1中的变量列表复制-粘贴到Stata数据编辑窗口(输入edit命令可以打开):
2. 执行如下命令:
gen v0 = subinstr(var1,"其中:","其中-",.)
replace v0 = subinstr(v0,"减:","减-",.)
split v0, p(:) gen(s)
gen str20 v1 = " label var "
replace s1 = lower(s1)
replace s2 = `"""' + s2 + `"""'
gen a1 = " "
gen a2 = a1
order a1 v1 s1 a2 s2
keep a1 v1 s1 a2 s2
browse
将data-editor窗口中的内容贴入do-editor文件即可:
label var stkcd "证券代码"
label var annodt "公告日期"
label var repttype "公告类型"
label var chgdt "变更日期"
label var position "变更职位"
label var positype "其中-变更类型"
label var positxx "减-销售额"
对于一次性需要合并大量的 GTA 数据表格的同学而言,这个方法非常省时,且不易出错。
(Source:
http://blog.cnfol.com/arlion/article/28549911.html)