全部版块 我的主页
论坛 计量经济学与统计论坛 五区 计量经济学与统计软件 Stata专版
1504 10
2023-12-24
数据和编程小白一枚,整理了一些STATA做数据分析的一些基本学习资料,仅供参考,不定期更新。

STATA数据分析实操的一些示例解释 - Duanduan的文章 - 知乎
https://zhuanlan.zhihu.com/p/673877900

如何用stata做正态性检验报告 - Duanduan的文章 - 知乎
https://zhuanlan.zhihu.com/p/673871998

STATA里线性回归里的各项数据代表什么? - Duanduan的回答 - 知乎
https://www.zhihu.com/question/636312482/answer/3336482678







二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2023-12-24 12:14:27
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2023-12-24 12:26:31
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2024-1-6 19:12:48

拿到数据后,开始分析前需要做的一些前期准备和数据清洗工作
/*清空存储和前期设置*/
clear all
set more off
cap log use
sysdir set PLUS "/Users/xxx" /*设置结果保存路径*/


/*导入数据*/
import excel "/Users/data.xlsx", sheet("Sheet1") firstrow

/*将第一行的内容设置为标签*/
labone, nrow(1)

/*初步数据清洗*/
drop in 1  /*删除第一行,行=varlist,列=observation*/
destring varname-vaname,replace /*去字符化,replace是替换原列,generate()可以新建一列并重命名*/
missings dropvars, force /*删除所有值为是缺失值的变量(删除空列)*/
missings dropobs, force /*missings dropobs(删除整行都没有数值的空行)*/


如果程序里没有missings命令,需要使用ssc install命令进行安装
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2024-1-6 19:32:19
fionababy_23 发表于 2024-1-6 19:12
拿到数据后,开始分析前需要做的一些前期准备和数据清洗工作
/*清空存储和前期设置*/
clear all
/*生成标题和引言*/
qui{
/*建立一个word文件,并从STATA输出论文标题*/
putdocx begin
putdocx paragraph, style(Title)
putdocx text ("论文标题文字"), font("宋体",, black)
putdocx save Thesis.docx , replace

/*在word文件中,输入第一章标题*/
putdocx begin
putdocx paragraph, style(Heading1) /*设置格式为word标题1*/
putdocx text ("一、引言"), font("宋体",, black)
putdocx save 想要存储的文件名,下面就用A来代替.docx , append

/*在word文件中,输入引言内容*/
putdocx begin
putdocx paragraph
putdocx text ("引言内容"), font("宋体",10.5)
putdocx save A.docx , append

}
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2024-1-6 20:36:34
做量化分析的一些思路:
首先,先对数据进行描述性统计计算,展示对被解释变量、解释变量以及控制变量的描述性统计分析,常用的命令是
/*描述性统计计算*/       
sum 变量名称, detail


/*更高阶的做表方式*/
table (command) (result), ///
command(Obs=r(N) Min=r(min) Median=r(p50)  Max=r(max)  Mean=r(mean) Variance=r(Var) StdDev=r(sd): sum 变量1, detail) ///
command(Obs=r(N) Min=r(min) Median=r(p50)  Max=r(max)  Mean=r(mean) Variance=r(Var) StdDev=r(sd): sum 变量2, detail) ///
command(Obs=r(N) Min=r(min) Median=r(p50)  Max=r(max)  Mean=r(mean) Variance=r(Var) StdDev=r(sd): sum 变量3, detail) ///

nformat(%10.2g) sformat(%7s) /*计算描述性统计的结果*/
/*以此类推,有几个想要展示的变量就重复几次*/

/*输出描述性统计结果表*/
putdocx paragraph
collect style putdocx, layout(autofitcontents) title("表1.XXXX情况描述性统计表") indent(8 pt)
return list
collect label list command, all  /*列出每一行的内容并报告行号*/
collect label levels command 1 "变量1的标签", modify
collect label levels command 2 "变量2的标签", modify
collect label levels command 3 "变量3的标签", modify
collect preview
putdocx collect /*将表格插入到word文档中*/



/*生成对描述性统计的文字说明*/
putdocx paragraph
putdocx text ("表1给出了对被解释变量、解释变量以及控制变量的描述性统计分析结果。"), font("宋体",10.5)
putdocx save A.docx , append



接下来,进入实证分析的部分
/*实证分析*/
gen inter= 解释变量1*调节变量2 /*通过解释变量1与调节变量2相乘,生成交乘项inter*/
reg 被解释变量 解释变量1 inter 解释变量2
predict e, residual


putdocx begin
putdocx paragraph, style(Heading1) /*设置格式为word标题1*/
putdocx text ("三、实证分析"), font("宋体",, black)


在报告计量结果之前,首先需要检验数据变量是否满足最小二乘法的基本假定,这些假定包括线性性、正态性、独立性和同方差性。可以通过以下几种图形检验的方法进行。
1. 残差分布分位正态图
检验回归误差项e偏离参考线的程度,具体命令为
/*正态性检验*/
/*分位正态*/
putdocx paragraph
quantile e, graphregion(fcolor(white) lcolor(white)) b1("图1. 残差分布分位正态图") xsize(8) ysize(6) scale(1.4)
graph export qua.png , replace
putdocx image qua.png, width(8 cm) height(6 cm)


/*说明*/
putdocx paragraph
putdocx text ("由图1可以看出,回归误差项e在均值点前半部分高于参考线,在均值点后半部分低于参考线,这表明回归误差项基本满足对称性,但在均值两侧的分布相比正态分布的数据更加集中,与正态分布存在一定差异。"), font("宋体",10.5)

2. 残差分布直方图(附参考线)
检验残差项e偏离正态分布的情况,具体命令为
/*正态拟合*/
putdocx paragraph
hist e, bin(7) percent normal graphregion(fcolor(white) lcolor(white)) b1("图2.残差分布直方图(附参考线)") fcolor(dknavy) lc(black) xsize(8) ysize(6) scale(1.4)
graph export hist.png , replace
putdocx image hist.png, width(8 cm) height(6 cm)


/*说明*/
putdocx paragraph
putdocx text ("图2的结论与图1结论类似。由图2可以明显看出,相较于正态分布,回归误差项在靠近均值附近的分布集中趋势更高,表现出有别于正态分布的形态,但是偏离程度不大。"), font("宋体",10.5)


3. 残差散点图
检验残差项e在随着X的变化是否没有明显变化规律,具体命令为
/*线性性与同方差性检验*/
putdocx paragraph
scatter e Dep01, graphregion(fcolor(white) lcolor(white)) yline(0) b1("图3.残差散点图(附参考线)")
graph export escatt.png , replace
putdocx image escatt.png, width(8 cm) height(6 cm)


/*说明*/
putdocx paragraph
putdocx text ("由图3可以看出,回归误差项较为均匀的分布在X轴两侧,且没有明显的证据表明随机误差项的均值随着X的变化而有规律的而变化,因此原模型满足线性性假定和独立性假定。但是,随着X的增加,回归误差项e的离散程度有轻微扩大的趋势,因此在最终模型当中,应当对方差进行修正,以避免异方差问题对显著性的影响"), font("宋体",10.5)


putdocx save A.docx, append



二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

点击查看更多内容…
相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群