12.2 如何描述您的数据
我们能理解您的数据集的程度取决于您对它的清晰说明。
解释数据的最佳方式是提供一个示例。由社区贡献的命令 dataex 可以轻松地在帖子中展示简单的示例数据集。该命令是为支持 Statalist 编写的,并强烈推荐使用它。通常,从您的数据集中复制大约 20 条观测值就足够展示问题。有关详细信息,请参阅 help dataex。
dataex 从 Stata 16 开始已内置于 Stata 的任何版本中。
如果您使用的是 Stata 14 或 15,可能需要更新您的 Stata 以在系统中安装此命令。
如果您使用的是更早版本的 Stata(9.2 至 13),则必须从 SSC 安装 dataex,在 Stata 中键入 ssc install dataex 即可。
dataex 的优点在于我们可以像您在 Stata 中一样看到您的数据。我们能看出变量是数值型还是字符串型,是否定义了值标签,以及特定显示格式的影响。这对于包含日期变量的数据尤其重要。我们还可以轻松地复制并粘贴到我们的 Stata 中以操作您的数据。
如果您的数据集涉及保密性,请提供一个虚拟的示例代替。
解释您的问题的第二种较好的方法是使用 Stata 自带的数据集并根据您的问题进行调整。例如,auto 数据集和 Grunfeld 数据集(一个简单的面板数据集)都可以使用。这可能需要您做更多的工作,并且不一定能在这些数据集中找到类似您的问题的情况。
解释问题的最差方式是模糊地描述您的数据而不给出具体示例。请注意,即使仅提供变量名称,对我们帮助也不大。这样通常无法清楚地说明您的数据结构、变量是数值型还是字符串型,或者它们的具体内容。如果您解释得不清楚,那么快速回答您的问题,甚至得到任何答案的可能性都会降低。