我常用到的 stata 命令 1
最重要的两个命令莫过于 help 和 search 了。 即使是经常使用 stata 的人也很难, 也没
必要记住常用命令的每一个细节, 更不用说那些不常用到的了。 所以, 在遇到困难又没有免
费专家咨询时, 使用 stata 自带的帮助文件就是最佳选择。 stata 的帮助文件十分详尽, 面
面俱到, 这既是好处也是麻烦。 当你看到长长的帮助文件时, 是不是对迅速找到相关信息感
到没有信心?
闲话不说了。 help 和 search 都是查找帮助文件的命令, 它们之间的区别在于 help 用
于查找精确的命令名, 而 search 是模糊查找。 如果你知道某个命令的名字, 并且想知道它
的具体使用方法, 只须在 stata 的命令行窗口中输入 help 空格加上这个名字。 回车后结果
屏幕上就会显示出这个命令的帮助文件的全部内容。如果你想知道在 stata 下做某个估计或
某种计算, 而不知道具体该如何实现, 就需要用 search 命令了。 使用的方法和 help 类似,
只须把准确的命令名改成某个关键词。回车后结果窗口会给出所有和这个关键词相关的帮助
文件名和链接列表。 在列表中寻找最相关的内容, 点击后在弹出的查看窗口中会给出相关的
帮助文件。 耐心寻找, 反复实验, 通常可以较快地找到你需要的内容。
下面该正式处理数据了 。 我的处理数据经验是最好能用 stata 的 do 文件编辑器记下你
做过的工作。 因为很少有一项实证研究能够一次完成, 所以, 当你下次继续工作时。 能够重
复前面的工作是非常重要的。 有时因为一些细小的不同, 你会发现无法复制原先的结果了。
这时如果有记录下以往工作的 do 文件将把你从地狱带到天堂。 因为你不必一遍又一遍地试
图重现做过的工作。 在 stata 窗口上部的工具栏中有个孤立的小按钮, 把鼠标放上去会出现
“bring do-file editor to front” , 点击它就会出现 do 文件编辑器。
为了使 do 文件能够顺利工作, 一般需要编辑 do 文件的“头” 和“尾” 。 这里给出我使
用的“头” 和“尾” 。
/*(标签。 简单记下文件的使命。 ) */
capture clear (清空内存中的数据)
capture log close (关闭所有打开的日志文件)
set mem 128m (设置用于 stata 使用的内存容量)
set more off (关闭 more 选项。 如果打开该选项, 那么结果分屏输出, 即一次
只输出一屏结果。 你按空格键后再输出下一屏, 直到全部输完。 如果关闭则中间不停, 一次
全部输出。 )
set matsize 4000 (设置矩阵的最大阶数。 我用的是不是太大了? )
cd D: (进入数据所在的盘符和文件夹。 和 dos 的命令行很相似。 )
log using (文件名) . log, replace (打开日志文件, 并更新。 日志文件将记录下所有文
件运行后给出的结果, 如果你修改了文件内容, replace 选项可以将其更新为最近运行的结
果。 )
use (文件名) , clear (打开数据文件。 )
(文件内容)
log close (关闭日志文件。 )
exit, clear (退出并清空内存中的数据。 )
这个 do 文件的“头尾” 并非我的发明, 而是从沈明高老师那里学到的。 版权归沈明高老师。
(待续)
我常用到的 stata 命令 2
实证工作中往往接触的是原始数据。 这些数据没有经过整理, 有一些错漏和不统一的地
方。 比如, 对某个变量的缺失观察值, 有时会用点, 有时会用-9, -99 等来表示。 回归时如
果使用这些观察, 往往得出非常错误的结果。 还有, 在不同的数据文件中, 相同变量有时使
用的变量名不同, 会给合并数据造成麻烦。 因此, 拿到原始数据后, 往往需要根据需要重新
生成新的数据库, 并且只使用这个新库处理数据。 这部分工作不难, 但是非常基础。 因为如
果在这里你不够小心, 后面的事情往往会白做。
假设你清楚地知道所需的变量, 现在要做的是检查数据、 生成必要的数据并形成数据库
供将来使用。 检查数据的重要命令包括 codebook, su, ta, des 和 list。 其中, codebook
提供的信息最全面, 缺点是不能使用 if 条件限制范围, 所以, 有时还要用别的帮帮忙。 su