STATA 练习:题目没有唯一答案,请按照自己的理解解题。请在需要的地方附上STATA输出结果,并辅以必要的解释。
请利用CGSS2005 的村级数据(见附件),检验教育程度与收入的关系。
Q1:形成关于教育程度与村民收入的研究假设。(可以基于简单的文献回顾,也可以不需要)
Q2: 阅读CGSS2005的村级调查问卷,找到测量村级教育程度与村民收入的变量以检验上述假设,指出自变量和因变量。(可以有不同的测量方法)
Q3:是否需要控制其他变量?如果需要,请列出你认为需要控制的变量,并说明为什么,同时说明各个控制变量与因变量的预期关系。
Q4:描述所有变量。(STATA命令:des , sum;如果是定性变量则用tab)
Q5:用STATA进行村民收入对教育水平的二元回归分析;如果你认为需要控制其他变量则加入控制变量后再使用多元回归分析。(STATA命令:reg, 如果自变量中有分类变量则使用 xi:reg)分别报告二元回归分析和多元回归分析的结果(附上STATA回归结果)。
a, 对回归结果分别进行解释(包括系数、模型拟合程度)。
b, 比较教育水平的测量变量在两个模型中结果的不同。
c, 对于多元回归,比较不同的解释变量对收入影响程度的差异。(STATA命令 beta)