Python 已经成为越来越多美国大学的计算机编程入门语言了。美国计算机排名的麻省理工学院和加州大学伯克利分校已经将他们的计算机编程入门教学语言改为了 Python。
作为一门“赶时髦”&“实用”的计量工具课程,本次Python统计与计量分析会跟大家讲授使用Python如何完美构造各种计量模型,并针对结果给出合理的解释。
这门课不需要太多计量基础,我们会用大白话告诉大家,什么样的分析数据适用于什么样的计量模型,什么样的模型匹配什么样的检验方法;也不需要太多编程基础,有没有学过C语言,有没有其他语言基础,都不要紧。
Python社会统计与计量分析
Python培训时间:2017年7月14-17日 (四天)北京/8月11-14日(四天)上海
Python培训地点:北京市海淀区厂洼街3号丹龙大厦B座二层/上海市南京东路培训教室
Python培训费用:3200元 / 2600元 (仅限全日制本科生和硕士研究生)
Python授课安排:上午9:00至12:00; 下午1:30至4:30; 答疑4:30至5:00
Python特别赠送:Python统计计量视频(价值1500元)
我要报名
Python讲师简介:
阎老师,长期从事数据分析的理论研究、教学和实践工作。
长期关注Python的发展和国内外各行业的应用情况,一直保持着与统计应用前沿的密切接触,在数据挖掘应用、市场研究应用等领域经验丰富。
擅长企业数据分析和企业诊断,参与多项、省级课题的科研工作,曾任多家电商企业的运营顾问和培训师,积累了大量实战经验。
Python课程大纲:
Part-1 Python初探
01. Python语法结构概览
教学内容:兼顾应用广泛的Python 2.x与日益兴盛的Python 3.x,从基本的原理和语法格式入手, 教授Python基础内容。
教学目的: 深入Python流程控制语句,夯实基础,这部分内容将贯穿课程始终,熟练到就算没有开放的扩展库,自己也能根据公式做模型。
1.1 一个概览式的例子
1.2 基本语法与数据
1.3 条件与条件语句
1.4 循环与嵌套
1.5 循环控制语句
02. Python函数与数据结构
教学内容: Python基础的核心内容。
教学目的: 了解各类函数、参数和变量的区别和联系,能够提升编程质量,使内容更加完善与流畅。
2.1 认识与定义函数
2.2 参数形式与返回值
2.3 内置函数形式
2.4 变量类型及应用
2.5 数据结构及应用
03. 数据处理与计算
教学内容: 介绍的丰富且成熟的第三方扩展库,解读数据分析的逻辑和分析结果。
教学目的:学会使用Python进行更加便捷的数理统计与计量分析,结果更加全面,解释性更强。
3.1 常用模块概览
3.2 数据的导入与导出
3.3 描述性数据统计
3.4 两总体对比推断
3.5 方差分析
3.6 卡方检验
3.7 非参数统计分析
04. 数据清洗
教学内容: 检查数据一致性、处理无效值和各种填补缺失值的方式。
教学目的: 迈出数据处理的步,能够识别并处理不清洁的数据,使数据更有利于后续的数据分析与挖掘。
4.1 数据的整理
4.2 数据的集成
4.3 原始数据变换
4.4 数据归约
4.5 处理缺失值
Part-2 关于截面数据
05. 线性回归模型
教学内容: 学会使用单纯也是实用且频频出现在Top期刊中的线性回归模型。
教学目的:学会使用Python固定语句进行回归,合理地构建模型、选择变量、解释结果。
5.1 小样本&大样本OLS
5.2 使用虚拟变量
5.3 非线性回归处理
5.4 异方差
5.5 自相关
5.6 主成分分析(PCA)与因子分析(FA)
06. 内生性的解决办法
教学内容: 处理各类研究中如影随形的内生性问题。
教学目的:能够完爆一个内生性,并使用Python处理内生性,使论文轻松达到“A-level”。
6.1 工具变量法(IV)
6.2 两阶段最小二乘拆解内生性(2SLS)
6.3 广义矩估计(GMM)
6.4 倍分法
07. 离散变量模型
教学内容: 介绍较早的离散选择模型——Logit/Probit模型,这是很多0/1选择问题的主要方法,也是社会学、心理学、经济学、市场营销等统计实证分析的常用方法。
教学目的:学会针对不同的问题选择合适的离散选择模型解决问题,并解释结果。
7.1 二值型Logit/Probit模型
7.2 多值型Logit/Probit模型
7.3. 定序Logit/Probit模型
7.4 计数模型
Part-3 关于时间序列
08. 平稳时间序列分析
教学内容: 时间序列分析的基础,一般的时间序列分析往往都是针对平稳序列,对于一些非平稳序列,也会通过某些变换转成平稳序列来处理。
教学目的: 学会识别平稳时间序列,并使用Python进行一系列后续分析与预测,得出并解释分析结果。
8.1 时间序列特征
8.2 ARMA基本逻辑及应用
8.3 自回归分布滞后模型
8.4 自相关与偏自相关
8.5 向量自回归
09. 非平稳时间序列
教学内容: 与平稳时间序列具有截然不同的非平稳时间序列的原理与应用。
教学目的:学会识别经济数据形成的时间序列的平稳性,使用Python进行后续处理、分析与预测,并解释结果。
9.1 ARIMA基本逻辑及应用
9.2 单位根问题
9.3 单整&协整
Part-4 关于面板数据
10. 面板数据回归
教学内容: 使用日益广泛的面板数据的原理、应用与建模。
教学目的: 掌握模型的基本思想和使用方法,灵活使用固定效应和随机效应,更准确地解读数据背后的经济含义。
10.1 静态面板模型
10.2 动态面板模型
10.3 非线性面板模型
================学术研究只用过Stata?!没关系,往下看========================
Stata特训_2017年7月
暑假现场班
核心内容:断点回归分析(RDD);合成控制法(Synthesis Control Methods);面板门槛模型;
面板VAR模型;自科标书的撰写;一篇经典论文的Stata重现(Journal of Finance) 等.
时间:初级:2017年7月12-15日 (四天)
高级:2017年7月17-20日 (四天)
地点:北京市海淀区首都体育学院
安排:上午9:00-12:00;下午2:00-5:00;答疑5:00-5:30
费用:基础:3600元 /3200元 (仅限全日制本科生和硕士研究生优惠价)
高级:4000元 /3600元 (仅限全日制本科生和硕士研究生优惠价)
全程:7000元 /6200元 (仅限全日制本科生和硕士研究生优惠价)
(食宿自理)
我要报名
讲师介绍:
连玉君,经济学博士,副教授。2007年7月毕业于西安交通大学金禾经济研究中心,现任教于中山大学岭南学院金融系。主讲课程为“金融计量”、“计量分析与Stata应用”、“实证金融”等。
已在《China Economic Review》、《经济研究》、《管理世界》、《经济学(季刊)》、《金融研究》、《统计研究》等期刊发表论文60余篇。连玉君副教授主持国家自然科学基金项目(2项)、教育部人文社科基金项目、广东自然科学基金项目等课题项目10余项。
目前已完成Panel VAR、Panel Threshold、Two-tier Stochastic Frontier等计量模型的Stata实现程序,并编写过几十个小程序,如xtbalance、winsor2、bdiff、hausmanxt、ttable3、hhi5等。
课程大纲:
初级班课程大纲
专题名称 | 授课内容 |
第1讲(3小时) Stata简介
| 数据的导入和导出 执行指令和基本统计分析 do文件和log文件的使用 帮助文件的使用和外部命令的获取 一篇范例文档 |
第2讲(3小时) 数据处理
| 数据的横向合并和纵向追加 重复样本值、缺漏值和离群值的处理 基本统计量的呈现 基本统计分析(组间均值差异和中位数差异检验) 文字变量的处理 大型数据的处理范例(GTA数据库和工业企业数据库) |
第3讲(3小时) Stata程序
| 局域暂元和全局暂元(local, global) 控制语句(条件语句、循环语句) Stata中的各类函数 分组回归分析 范例:盈余管理程度的估算、现金持有调整系数的估算 |
第4讲(3小时) 普通最小二乘法 (OLS)
| 线性回归模型估计方法(OLS) 假设检验和统计推断 Bootstrap、Jackknife及稳健性标准误的获取 虚拟变量 |
第5讲(3小时) 模型的设定和解释
| 交乘项和平方项的使用及解释 R2分解和贡献度分析 分组回归和组间系数差异检验 估计结果的呈现和分析 范文2篇 |
第6讲(3小时) 内生性问题及估计方法: IV-GMM 倍分法(DID, D-in-D)
| 工具变量法(IV) 广义矩估计法(GMM)简介 内生性检验:是否存在内生性 过度识别检验:工具变量的合理性 倍分法(Difference in Difference)简介 PSM-DID 应用实例(介绍2篇论文) |
第7讲(3小时) 静态面板数据模型
| 静态面板模型:固定效应和随机效应 基于Bootstrap的Hausman检验 异方差和序列相关(Bootstrap、Cluster调整标准误) 包含内生变量的固定效应模型 实证分析中的常见问题 应用实例(介绍3篇论文) |
第8讲(3小时) 论文写作与发表专题
| Endnote和Google Scholar的使用 论文的选题 如何梳理和评述文献 研究贡献的陈述 研究设计与论文的修改 修改报告的撰写 (与审稿人有效沟通) |
高级班课程大纲
第1讲(3小时) 动态面板模型 面板VAR模型 | 一阶差分GMM估计量(FD-GMM) 序列相关检验和过度识别检验(Sargan检验) 面板VAR模型简介 冲击反应函数 (IRF)、方差分解 (FEVD) 应用实例(介绍3篇论文) |
第2讲(3小时) 面板门槛模型
| Bootstrap简介 截面门槛模型(Cross-sectional Threshold Model) 面板门槛模型(Panel Threshold Model) 应用实例(介绍2篇论文) |
第3讲(3小时) Logit模型 | Logit模型简介 模型设定、估计方法和结果的解释 多元Logit模型 (Multinomial Logit) 有序Logit模型 (Ordered Logit) 应用实例(介绍2篇论文) |
第4讲(3小时) 内生性问题专题I: Heckman选择模型 处理效应模型 倾向得分匹配分析(PSM) | Heckman选择模型(Heckman Selection Model) 处理效应模型(Treatment Effect Model) 倾向得分匹配分析(Propensity Score Matching, PSM) 配对方法:配对、半径匹配、最近邻匹配等 共同支撑假设和平行假设 应用实例(介绍2篇论文) |
第5讲(3小时) 内生性问题专题II: 合成控制法 (Synthetic control methods)
| 合成控制法简介 精讲一篇经典论文(Stata实现过程):Abadie, A., A. Diamond, J. Hainmueller, 2010, Synthetic control methods for comparative case studies: Estimating the effect of california's tobacco control program, Journal of the American Statistical Association, 105 (490): 493-505. |
第6讲(3小时) 内生性问题专题III: 断点回归分析(RDD) | Regression Discontinuity Design (RDD) 简介 明确断点RDD分析 (Sharp RDD) 模糊断点RDD分析 (Fuzzy RDD) 范例:2篇文章 |
第7讲(3小时) 学术论文精讲 Faulkender and Wang (2006, JF) | Faulkender, M., R. Wang, 2006, Corporate Financial Policy and the Value of Cash, Journal of Finance, 61 (4): 1957-1990.
- 计量方法:OLS、稳健性分析、衡量偏误、交叉项的应用和解释
- 亮点:选题视角和研究设计值得借鉴,衡量偏误和模型设定等也处理的很妥当
- 主题:现金持有、融资约束。
- 这篇文章在谷歌学术的引用率超过1100次,引申出了一系列新的话题,很多论文则采用该文的方法研究其他领域的问题。
|
第8讲(3小时) 课题标书的撰写
| 评审专家的习惯和偏好 关于选题和子课题的设定 研究基础、研究目标、研究内容、研究难点 特色和创新点的提炼 标书的结构和标书的修改 经验分享:一份中标的自科标书 |
优惠:
现场班老学员9折优惠;
同一单位三人以上同时报名9折优惠;
以上优惠不叠加。
报名流程:
1:点击“我要报名”,网上填写信息提交;
2:网上订单缴费;
3:给予反馈,确认报名信息;
4:缴费后发送课程电子版讲义,软件准备及交通住宿指南。
联系方式:
魏老师
QQ:1143703950 
Tel:010-68478566
Mail:vip@pinggu.org