这里大部分都是英文的书。国内对于R的书籍的翻译中文几乎可以忽略的说。
1.入门级读物
R的帮助文档中提供了一些入门的读物,比如《Anintroduction to R》,是R早期入门的权威读物,这本书有中文版,叫做《R导论》 。另一本早期的著名入门读物是《R for beginners》,也有中文版,译名《R入门》 。国内关于R的一本早期的经典读物是《统计建模与R软件》,写得比较全面,特别是适合做概率统计和多元统计的参考书来用。
新近的一些比较好的入门书比如《R in action》,是Manning出版社in action 系列的一本。这本书从R 的编程初步到一般线形模型,因子分析等比较高阶的方法都有系统的介绍,很值得一读。《R Cookbook》 ,是大名鼎鼎的O’REILLY出版社动物系列书的一本,偏重于R语言的操作。从这两本书的出处也能窥见,R已经成为了一种相当主流的数据分析和开发工具了。《Rin a Nutshell》,也是动物系列的一本。据说出身人大的一个R语言团队正在翻译。题外话,人大统计可以算是R在国内的一个重要基地,他们组织的中国R语言会议影响越来越大。
针对统计应用为主的入门书,比如《The R book》,《Introductory Statistics with R》,等等,比较全面的介绍R语言作于一种数据分析工具在统计的各个分支的运用。我的收藏里类似的还有《Statistics and Data with R》 。
喜欢编程的可以研究《THE ART OF R PROGRAMMING》
然后就该到一些比较专门的领域了。捡我熟悉的说一说。
2.多元统计与数据挖掘
这是数据分析的一个重要舞台,相关的书籍也很多。
多元统计方面,《Multivariate Statistics with R》 ,介绍了多元统计的经典方法,聚类,判别,因子,主成分,典型相关等等,可惜新方法涉及的不多。《Exploratory Multivariate Analysis by Example Using R》就比它要全面。还有专门的多元统计书籍,如Härdle 和 Simar《Applied Multivariate Statistical Analysis》的第3版,以R作为例题的主要工具,这本书第2版有中文版,也有R的应用。
数据挖掘方面,《Data Mining with R:learing with case studies》 ,里面给出4个不同领域的案例。还有《Data Mining with Rattle and R》,使用Rattle软件,结合了数据可视化。这一方面,包括相关的如机器学习,模式识别等等方向,还很有待提高啊(动物系列2012年出了新书《Machine learningfor hackers》)。
3.计量经济学和时间序列分析
关于计量经济学,《Econometrics In R》 ,入门小书。然后《AppliedEconometrics with R》, R包是AER,比较全面。
时间序列是计量经济学的一个重要部分,特别涉及金融数据分析,也是一个书籍众多的方向。《TimeSeries Analysis and Its Applications :with R examples》是关于时间序列的一个比较全面的介绍,这个有中文译本,机械工业出版社的华章系列。金融时间序列的,Rmetrics推出的《TimeSeriesFAQ》,这本书是金融时间序列入门的东西,但是很难懂。 其他的比如 《Advanced Topics in Analysis of Economic andFinancial Data Using R》以及《ModellingFinancial Time Series With S-plus》 (S+ 是R的长辈啦),还有 《Time Series:Applications toFinance with R and S-Plus》 。另外蔡瑞胸的《金融时间序列分析》的第2版和第3版也是采用了R语言。
一些比较专门的,比如协整的《Analysis of Integrated andCointegrated Time Series with R》,小波的《WaveletMethods in Statistics with R》。
4.金融工程
这个领域更多的是利用R的开发功能了。金融衍生工具的建模对于相关的数学以及金融知识要求是很高的,不用我这个学统计的人罗嗦,做过的人都知道呵呵。我直接列书单。投资组合《Portfolio Optimization with R》 ,衍生品定价《Option Pricing and Estimation ofFinancial Models with R》 ,随机微分方程《Simulation Inference Stochastic Differential Equations:with R examples》 , 随机模拟 《Simulation Techniques in Financial Risk Management》 ,《Introducing MonteCarlo Methods with R》。
金融数据分析可以参见上面时间序列的条目。
5.图形和数据可视化
R提供了强大的图形工具,可以制作各种经典以及个性化的数据分析图形。这是个很有意思的领域,大家都爱看图有没有?
入门经典《R Graphics》,全面介绍了R中绘图系统,对应的有一个网站,有兴趣的自己google之。《R graph cookbook》适合速成。关于R的作图系统的专门介绍:《Lattice:MultivariateData Visualization with R》,《ggplot2:Elegant Graphics for Data Analysis》前面那本是普通的,后面这本比较文艺。
6.统计的其他方向
关于线性模型的《Linear Models with R》 ,这是统计学生都该读的吧。
其他的方向,专业所限,不敢妄言了。
7.数据分析的应用领域
数据分析是这个时代的一个关键技术,有数据的地方,自然少不了R的应用。经济和金融的在上面列过了,再放几本自己的收藏。《Advances in SocialScience Research Using R》 ,这一本包括了目前很多常用的社会科学研究方法,比较深。《Biostatistics with R》就是入门级的了。《Chemometricswith R》 ,这个嘛,纯属收藏。
Springer出版社的use R!系列还有很多关于各领域的R著作。总会有适合你的那一本。
如何找到这些书,我们都知道,网络是的嘛,但是使用的时候还是要注意尊重版权的啊。
2021年1月24-28日“机器学习及R应用”集中短训现场班
授课方式:思想原理 + 数学精髓 + R经典案例
讲师介绍:
本课程由山东大学经济学院陈强教授亲授。陈强教授获得北京大学经济学学士、硕士,美国Northern Illinois University数学硕士、经济学博士,现为数量经济学博士生导师,在统计学、计量经济学及机器学习领域具有深厚的功底,2010年入选教育部新世纪优秀人才支持计划。陈强老师著有畅销研究生教材《高级计量经济学及Stata应用》(第2版,高教社,2014),并特别擅长深入浅出、直指人心地介绍数据分析原理,深受广大学生们的喜爱,其现场班常常人满为患、好评如潮。
开课信息:
时间:2021年1月24-28日(五天)
地点:北京市海淀区
费用:5200元/ 4500元(本科及硕士在读优惠价);食宿自理
安排:上午9:00-12:00;下午2:00-5:00;答疑
报名:http://www.peixun.net/main.php?mod=buy&cid=1436
培训目的和特色:
机器学习早期为人工智能的分支,后来也有不少统计学家加入,最近一、二十年因为其预测精度迅速提高而走红,并在业界有着广泛的应用。可以预见,在未来三十年,几乎所有行业都会因机器学习的深刻冲击而改变。MIT名誉校长Eric Grimson曾预言,机器学习会成为像Word一样的工具。而谁先掌握此工具,则可占得先机,成为时代的弄潮儿(至少不会落伍)。
基于机器学习的通用性,本次“机器学习及R应用”五天现场班将面向所有行业与学科的人士、老师与学生(包含经管社科、医学卫生等领域)。
本课程的最大特色在于“一站式服务”,从机器学习的原理、数学推导,到R语言命令与经典案例,无不精心设计、丝丝入扣,理论联系实操,让学员们迅速理解机器学习的精髓,并掌握最为流行的数据科学软件R语言操作。
陈强老师将从零开始,介绍R语言的精华,让你迅速上手!
Why R?
√ R是统计学家发明的专门用于统计计算的语言
√ R是统计学家的母语
√ R中的统计“包”(package)最多,且增长迅速
√ 统计学顶级期刊的新发表论文一般带有相应的R包
√ R是免费开源的,在学界与业界均有很多用户
培训内容目录:
第1讲 机器学习引论
(1) 什么是机器学习
(2) 机器学习的分类与术语
(3) 案例:垃圾邮件过滤;手写体数字识别;图像识别;自动驾驶
第2讲 R语言快速入门
(1) Why R?
(2) 安装R与RStudio
(3) R的对象(vector, matrix, data frame,list)
(4) 面向对象的函数式语言
(5) R语言画图
第3讲 数学回顾
(1) 梯度向量
(2) 方向导数
(3) 梯度下降
(4) 向量微分
(5) 最优化
第4讲 线性回归
(1) OLS
(2) 过拟合与泛化能力
(3) 偏差与方差的权衡
(4) 交叉验证
(5) R案例:多项式回归的过拟合;波士顿房价
第5讲 逻辑 回归
(1) Logit
(2) 几率比
(3) 灵敏度与特异度
(4) ROC与AUC
(5) 科恩的kappa
(6) R案例:泰坦尼克号旅客的存活
第6讲 多项逻辑 回归
(1) 多项Logit
(2) R案例:识别玻璃类别
第7讲 判别分析
(1) 线性判别分析(LinearDiscriminant Analysis)
(2) 二次判别分析(QuadraticDiscriminant Analysis)
(3) 费雪判别分析(FisherDiscriminant Analysis)
(4) R案例:鸢尾花品种的归类
第8讲 朴素贝叶斯
(1) 朴素贝叶斯(Naive Bayes)
(2) 拉普拉斯修正(LaplacianCorrection)
(3) R案例:垃圾邮件的识别
第9讲 惩罚回归
(1) 高维回归的挑战
(2) 岭回归(Ridge Regression)
(3) 套索估计(Lasso)
(4) 弹性网估计(Elastic Net)
(5) R案例:前列腺癌的影响因素
第10讲 K近邻法
(1) 回归问题的K近邻法
(2) 分类问题的K近邻法
(3) R案例:摩托车撞击实验数据;模拟混合数据;威斯康辛乳腺癌的诊断
第11讲 决策树
(1) 分类树(Classification Tree)
(2) 分裂准则(错分率、基尼指数、信息熵)
(3) 成本复杂性修枝
(4) 回归树(Regression Tree)
(5) R案例:波士顿房价;葡萄牙银行市场营销
第12讲 随机森林
(1) 集成学习(Ensemble Learning)
(2) 装袋法(Bagging)
(3) 随机森林(Random Forest)
(4) 变量重要性(Variable Importance)
(5) 偏依赖图(Partial Dependence Plot)
(6) R案例:波士顿房价;声呐信号的分类
第13讲 提升法
(1) 自适应提升法 (AdaBoost)
(2) AdaBoost的统计解释
(3) 梯度提升法 (Gradient Boosting Machine)
(4) XGBoost
(5) R案例:波士顿房价;过滤垃圾邮件;识别玻璃类别
第14讲 支持向量机
(1) 最大间隔分类器(MaximalMargin Classifier)
(2) 软间隔分类器(Soft MarginClassifier)
(3) 支持向量机(Support Vector Machine)
(4) 核技巧(Kernel Trick)
(5) 支持向量回归(SupportVector Regression)
(6) R案例:模拟数据;过滤垃圾邮件;识别手写数字;波士顿房价
第15讲 人工神经网络
(1) 人工神经网络的思想
(2) 感知机(Perceptron)
(3)前馈神经网络(Feedforward Neural Network)
(4) 激活函数(Activation Function)
(5) 反向传播算法(Back-propagation Algorithm)
(6) 随机梯度下降(Stochastic Gradient Descent)
(7) 神经网络的过拟合与正则化
(8) 卷积神经网络(Convolution Neural Network)
(9) 深度学习的发展
(10) R案例:波士顿房价;声呐信号的分类;鸢尾花品种的分类
第16讲 非监督学习之主成分分析
(1) 总体中的主成分分析
(2) 样本中的主成分分析
(3) 方差分解与降维
(4) 主成分回归(PrincipalComponent Regression)
(5) R案例:左右耳听力;香港回归的经济效应
第17讲 非监督学习之聚类分析
(1) K-均值聚类(K-meansClustering)
(2) 分层聚类(Hierarchical Clustering)
(3) 树状图
(4) 基于相关系数的距离
(5) R案例:模拟数据;鸢尾花品种的归类
第18讲 数据科学的R语言
(1) 何为数据科学
(2) 管道算子(Pipe Operator)
(3) R包tidyverse(输入数据、数据清理、数据变换)
(4) R包ggplot2(高阶画图)
(5) R包caret(机器学习的统一接口)
(6) R案例:R包tidyverse的自带案例;威斯康辛乳腺癌的诊断
第19讲(Bonus Lecture) 机器学习在经管社科的应用
精读几篇在经管社科顶刊发表的经典机器学习论文
不难看出,本次课程可谓干货满满、奇货可居。更难得可贵的是,主讲老师陈强教授具有丰富的教学经验、激情与魅力,是广大计量学子心目中真正的“计量男神”,尤其擅长化繁为简、直指人心,让学员们迅速上手新知识与技能。
跟着陈强老师,五天入门机器学习,登堂入室,立竿见影,赶上时代的步伐!
优惠:
现场班老学员9折优惠;
同一单位三人以上同时报名9折优惠;
同一单位六人以上同时报名8折优惠;
以上优惠不叠加。
报名流程:
1:点击“http://www.peixun.net/main.php?mod=buy&cid=1436”,网上填写信息提交;
2:给予反馈,确认报名信息;
3:网上订单缴费(需要刷卡或对公转账的请报名后与我们联系);
4:开课前一周发送课程电子版讲义,软件准备及交通住宿指南。
联系方式:
尹老师
电话: 010-53352991
QQ: 42884447
邮箱: yinna@pinggu.org
微信:yinyinan888

陈强老师Python机器学习2021年暑期班:2021年8月12-16日(五天)同步热招,详情请咨询尹老师↑