教材《Stata
数据分析与建模》,数据和代码
Stata数据分析与建模
教材目录如下:
前言
第1章 Stata的环境设置 1
1.1 Stata的界面认识与参数设定 1
1.1.1 Stata的界面概述 1
1.1.2 Stata的界面调整 2
1.1.3 系统参数的查看与设定 2
1.1.4 Stata的基本语法 3
1.2 工作路径设置与文件操作 4
1.2.1 工作路径设置命令 5
1.2.2 文件/文件夹操作命令 5
1.2.3 列印与显示 6
1.2.4 清空命令 6
1.3命令的安装与更新 6
1.3.1 命令的安装 7
1.3.2 命令的更新 7
1.4 帮助命令与相关资源 7
1.4.1 帮助文档 8
1.4.2 官方资源 8
1.4.3 国内资源 8
1.5 do文档及其注释 9
1.6 系统文件路径与profile设置 10
1.6.1 系统文件路径 10
1.6.2 profile设置 10
1.7 日志命令 11
习题 12
第2章 数据导入导出与基本分析 13
2.1 手工导入数据 13
2.2 dta格式文件的导入与导出 13
2.2.1 sysuse和webuse命令 13
2.2.2 use命令 14
2.3 文本文件的导入与导出 14
2.3.1 字符分隔文本的导入 15
2.3.2 固定格式文本的导入 15
2.3.3 文本文件的导出 16
2.4 Excel文件的导入与导出 17
2.4.1 Excel文件的导入 17
2.4.2 Excel文件的导出 18
2.4.3 labone命令与nrow命令 18
2.4.4 xls2dta命令 19
2.5 数据检查与数据校对 19
2.5.1 describe命令 19
2.5.2 codebook命令 20
2.5.3 summarize命令 20
2.5.4 sumup命令 21
2.5.5 inspect命令 21
2.5.6 count命令 21
2.5.7 distinct命令 21
2.5.8 tab与fre命令 22
2.5.9 center命令 23
2.5.10 assert命令 23
2.5.11 unique命令 23
2.5.12 lookfor命令 24
2.5.13 list命令 24
2.5.14 levelsof命令 24
2.6 统计报表与统计分析 24
2.6.1 tabstat命令 25
2.6.2 table命令 25
2.6.3 tabulate命令 26
2.6.4 分位数命令 27
2.6.5相关性分析 27
2.6.6 点估计与区间估计 28
2.6.7 假设检验 28
2.6.8 方差分析 28
2.6.9 正态分布检验 28
2.6.10 线性回归分析 29
习题 29
第3章 变量的生成与设定 30
3.1 运算符 30
3.1.1 算数运算 30
3.1.2 比较运算 31
3.1.3 逻辑运算 31
3.2 标量及操作 32
3.3 变量的命名 32
3.3.1 _n与_N 33
3.3.2 Stata文档中的变量符号 34
3.4 gen、replace与egen命令 35
3.5 变量操作 37
3.5.1 变量的保留与删除 37
3.5.2 变量值的提取 38
3.5.3 变量顺序的调整与观测值的排序 38
3.6 变量重命名与变量标签 39
3.6.1 变量的重命名 39
3.6.2 变量标签的设定 40
3.7 生成分组变量 41
3.7.1 利用gen与replace生成分组变量 41
3.7.2 利用cond()函数生成分组变量 42
3.7.3 利用recode命令生成分组变量 42
3.7.4 inlist()、inrange()函数与inlist2命令 43
3.7.5 利用mod()函数实现顺序分组 45
3.7.6 利用egen与group()实现交叉分组 45
习题 46
第4章 变量的类型与操作转化 47
4.1 变量类型的转化 47
4.1.1 变量类型转化的命令 47
4.1.2 变量类型转化的函数 49
4.2 特殊数据的处理 49
4.2.1 重复值的处理 50
4.2.2 缺失值的处理 52
4.2.3 离群值 54
4.3 变量格式的设定 54
4.3.1 format命令简介 54
4.3.2 format设定格式的常见类型 55
4.4 时间序列变量操作符 56
4.5 因子变量操作符 58
习题 59
第5章 数据重构 61
5.1 数据拆分 61
5.1.1 横向拆分数据 61
5.1.2 纵向拆分数据集 62
5.2数据合并 62
5.2.1 纵向合并数据 62
5.2.2 横向合并与匹配 64
5.2.3交叉合并 70
5.3数据长宽转化 74
5.3.1 reshape命令 74
5.3.2 spread与gather命令 76
5.4数据转置 79
5.4.1 数值型变量转置 79
5.4.2 字符型变量转置 79
5.5 变列操作 80
5.5.1 一列变多列 80
5.5.2 多列变一列 83
习题 84
第6章 函数 86
6.1 日期函数 86
6.1.1 日期数据的形式与格式设定 86
6.1.2 字符型日期的提取 89
6.1.3 数值型日期的提取与合并 93
6.2 数学函数 94
6.3 统计函数 95
6.3.1 分布函数与概率密度函数 95
6.3.2 正态分布 96
6.3.3 t分布 98
6.3.4 卡方分布 101
6.3.5 F分布 102
6.3.6 快速呈现常用分布的临界值表 104
6.4 随机数函数 104
6.5 字符串函数 105
6.5.1 字符与数值转换函数 106
6.5.2 字符串的缩写与扩展 107
6.5.3 字符示性函数 107
6.5.4 替换函数 108
6.5.5 截取函数 109
6.5.6 匹配函数 111
6.5.7 字符统计类函数 112
6.5.8 删除字符串中的空格 113
6.5.9 字符大小写转化 114
6.5.10 转码函数 114
习题 115
第7章 矩阵 116
7.1 矩阵的生成 116
7.1.1 矩阵的定义 116
7.1.2 生成特定格式矩阵 117
7.1.3 矩阵行和列的命名 117
7.1.4 矩阵和变量的转化 118
7.2 矩阵元素的提取 118
7.3 矩阵的运算 119
7.4 矩阵中的函数 120
习题 125
第8章 宏与返回值 126
8.1 local与global 126
8.1.1 局部宏local 126
8.1.2 全局宏global 128
8.2 宏扩展函数dir的用法 129
8.3 临时文件的创建与恢复 131
8.4 标量scalar 132
8.4.1 标量的定义 133
8.4.2 local与scalar的区别 133
8.5 Stata命令的返回值 134
8.5.1 r类返回值 134
8.5.2 e类返回值 135
8.5.3 c类返回值 136
8.5.4 s类命令 137
习题 137
第9章 Stata循环与判断语句 138
9.1 while语句 138
9.2 forvalues语句 139
9.3 foreach语句 141
9.4 continue与break语句 150
9.5 嵌套循环与if语句 152
习题 153
第10章 Stata程序编写 155
10.1 程序文件do与ado 155
10.2 程序的定义program 156
10.3 程序的参数输入 157
10.4 在程序中定义语法 158
10.5 confirm语句 159
10.6 capture语句 160
10.7 marksample 161
10.8 tokenize 163
10.9 综合案例 163
习题 167
第11章 数据分析应用专题 168
11.1 字符变量处理综合 168
11.1.1 字符串变量处理常用命令 168
11.1.2 正则表达式 171
11.2 滚动窗口 173
11.2.1 移动平均与滚动平均 174
11.2.2 移动平均的简单命令 174
11.2.3 滚动窗口统计 176
11.2.4 滚动窗口回归 181
11.3 分组计算处理综合 184
11.3.1 组内元素个数统计 184
11.3.2 分组统计与回归 186
11.3.3 按类别求除自身之外的平均值 193
11.3.4 HHI类指数的计算 194
11.3.5 分组回归提取残差 195
11.4 地理计算与近邻地区匹配 197
11.4.1 基于经纬度的地理距离计算 197
11.4.2 相邻地区匹配与计算 201
习题 204
第12章 数据可视化 205
12.1 图形的类型 205
12.2 图形管理 207
12.3 graph twoway系列命令介绍 209
12.4 graph twoway的graph region选项 212
12.4.1 scheme(schemename) 213
12.4.2 title_options 214
12.4.3 legend_options 217
12.4.4 axis_options 219
12.4.5 added_line_options 224
12.4.6 added_text_options 224
12.4.7 by(varlist,…) 225
12.4.8 scale(#) 227
12.4.9 region_options 227
12.4.10 aspect_options 227
12.4.11 name(name,…) 227
12.4.12 saving(filename,…) 227
12.5 graph twoway的plot region选项 229
12.5.1 散点图 230
12.5.2 线图 232
12.5.3 条形图 234
12.5.4 直方图 239
12.5.5 函数图 244
12.6 绘图综合案例 247
习题 251
第13章 数据分析结果的报告 252
13.1 数据分析结果汇报命令 252
13.1.1 x2docx类命令 252
13.1.2 esttab命令 258
13.1.3 outreg2命令 264
13.2 综合案例 267
13.2.1 案例背景 267
13.2.2 数据介绍 267
13.2.3 研究设计 267
13.2.4 数据分析 268
13.2.5 案例小结 276
习题 276
第14章 蒙特卡洛模拟与自抽样 278
14.1 抽样的常用命令 278
14.1.1 sample 278
14.1.2 bsample 278
14.1.3 splitsample 279
14.1.4 drawnorm 279
14.2 蒙特卡洛模拟 280
14.2.1 蒙特卡洛模拟简介 280
14.2.2 蒙特卡洛模拟的基本命令 280
14.2.3 蒙特卡洛模拟案例 281
14.3 自抽样 287
习题 289
附录A Stata发展历程简介 290
附录B egen中的函数简介 291
参考文献 297