regression Y X // 因变量 自变量
twoway scatter R001 R0002 || lfit R001 R0002 // 和直线图拼接
predict e, residual //生成变量e作为残差
summarize var, detail // 列出数据的基本统计量 如均值 标准差等
tabulate var //
reg R001 R0002 //
predict e, r // 提取残差
predict yhat, xb // 把x的系数算出来
scatter e R0002, xtitle(R0002) mc(red) // 残差和R0002的关系,点改为红色
scatter e R0002 if R0002<=2000 //去掉大于2000的点
scatter R001 R0002 || lfit R001 R0002
reg R001 R0002, r 修正方差
corr R001 R0002 R0003 //计算几个变量的相关系数 结果是一个对称矩阵
/*注释:上课程序do文件*/
clear all
cap log use
/*导入数据*/
import excel "/Users/vitoria/Desktop/外经贸MBA/02 21年秋季学期/数据模型与决策/stata do file及作业/上课用数据4.xlsx", sheet("Sheet1") firstrow
/*删除第一行*/
drop in 1
/*将描述性数据转化为数值型数据*/
destring R001, replace
destring, replace
/*删除无效数据*/
drop if code==.
/*增加标签*/
la var code " 当年行政区划编码 "
la var county " 当年行政区域名称 "
la var code_2009 " 2009年行政区划编码 "
la var county_2009 " 对应的2009年行政区域名称 "
la var province " 所在省代码 "
la var prefecture " 所在地市代码 "
la var R001 " 一般预算收入合计 "
la var R0002 " 增值税 "
la var R0003 " 营业税 "
la var R0005 " 个人所得税 "
la var R0007 " 城市建设税 "
la var R0021 " 农业五税 "
la var R0024 " 企业收入 "
la var E001 " 一般预算支出合计 "
la var E0001 " 基本建设支出 "
la var E1008 " 支援农村生产支出 "
la var E1009 " 农林水气事业费 "
la var E0005 " 教育事业费 "
la var E1005 " 社会保障补助支出 "
la var E1006 " 行政管理费 "
la var E1007 " 公检法司支出 "
la var R01 " 一般预算收入总计 "
la var R111 " 返还性收入合计 "
la var R1101 " 增值税、消费税税收返还补助 "
la var R201 " 一般性转移支付收入小计 "
la var R2001 " 原体制补助 "
la var R301 " 专项补助 "
la var R2002 " 转移支付补助 "
la var R2011 " 增发国债补助 "
la var R2004 " 增发工资补助 "
la var R2008 " 各项结算补助 "
la var R2024 " 调整收入任务增加或减少补助 "
la var R401 " 上年结余收入 "
la var R501 " 调入其他资金 "
la var E01 " 一般预算支出总计 "
la var E201 " 一般性转移支付上解合计 "
la var E2001 " 原体制上解 "
la var E301 " 专项上解 "
la var E401 " 增设预算周转金 "
la var E501 " 调出资金 "
la var SP01 " 滚存结余 "
la var SP02 " 其中:净结余 "
la var FR001 " 收入合计 "
la var FR0001 " 工业交通部门基金 "
la var FR0002 " 文教部门基金 "
la var FR0004 " 农业部门基金 "
la var FR0005 " 土地有偿使用收入 "
la var FR0007 " ZF住房基金收入 "
la var FR0006 " 地方财政税费附加 "
la var FE001 " 支出合计 "
la var FE0001 " 工业交通部门基金 "
la var FE0002 " 商贸部门基金 "
la var FE0003 " 文教部门基金 "
la var FE0005 " 农业部门基金 "
la var FE0006 " 土地有偿使用支出 "
la var FE0008 " ZF住房基金支出 "
la var FE0007 " 地方财政税费附加 "
la var FR01 " 收入总计 "
la var FR201 " 补助收入 "
la var FR301 " 上年结余 "
la var FE01 " 支出总计 "
la var FE301 " 上解支出 "
la var FSP01 " 滚存结余 "
la var VAT75 " 增值税75% "
la var Excise " 消费税 "
la var GDP " 国内生产总值 "
la var Eco01 " 农业总产值 "
la var Eco02 " 工业总产值 "
la var POP " 人口(万人) "
la var APOP " 其中:农业人口 "
la var Dep01 " 财政供养人口小计 "
la var Dep02 " 在职人员 "
la var Dep03 " 国家职工 "
la var Dep04 " 集体职工 "
la var Dep05 " 离休 "
la var Dep06 " 退休 "
la var Dep07 " 财政预算拨款及财政补助开支的年末人数 "
la var Dep08 " 自收自支单位年末人数 "
/*su R001 - Dep08, detail */
/*descriptive statistics*/
su R001 - Dep08
gr pie R001, over(prefecture)
gr pie R001, over(prefecture) plabel(_all percent)
graph pie E001, over(prefecture) plabel(_all percent) sort descending
graph pie E001 , pie(6,explode(3.8)) over(prefecture) plabel(_all percent) sort descending angle(0) legend(cols(1) position(3)) ptext("aaaa")
// 创建地市名称变量 prefectureName 并赋值
generate str prefectureName = "喀什地区" if prefecture == 653100 , after(prefecture)
replace prefectureName = "和田地区" if prefecture == 653200
replace prefectureName = "吐鲁番地区" if prefecture == 652100
replace prefectureName = "巴音郭楞蒙古自治州" if prefecture == 652800
replace prefectureName = "克孜勒苏柯尔克孜自治州" if prefecture == 653000
replace prefectureName = "哈密地区" if prefecture == 652200
replace prefectureName = "阿克苏地区" if prefecture == 652900
//画饼图,按大小排列,从0°开始显示,6号片区突出,Legend在右,7行显示
graph pie E001, over(prefectureName) sort descending angle(0) /*
*/ pl(_all per) pie(6, color(cranberry) explode(small)) /*
*/ legend(position(3) row(7)) /*
*/ subtitle(分地区一般预算支出分布图, size(8pt) position(6) orientation(horizontal)) /*
*/ title(数据来源:国家统计局《全国地市县财政统计资料》, size(5pt) position(6))
graph twoway scatter E0005 E001 if E001>10000, scheme(s1mono, white)
graph twoway scatter E0005 E001 if E001>10000, scheme(s1mono, white)/*
*/ mlabel(county) mcolor(blue) mlabsize(vsmall) /*
*/|| lfit E0005 E001, lcolor(red)/*
*/title(分县一般预算支出与教育支出散点图,size(10pt)) ytitle(教育事业支出) cap(数据来源:国家统计局《全国地市县财政统计资料》,size(5pt)) subtitle((仅统计年度预算支出超1亿元县级区域),size(8pt))
ci mean E0005, level(99)
reg R001 R0002, r
/*修正误差项和X的标准差*/
reg R001 R0002
predict e, residual
/*生成了一个新的变量,预测前面估计值就是xb,预测残差就是residual*/
scatter e R0002
/*画残差对照X的散点图*/