全部版块 我的主页
论坛 计量经济学与统计论坛 五区 计量经济学与统计软件
7768 21
2015-01-07

R语言的优点

R是一个强大的脚本语言。

      最近被邀请去分析一次概略研究的结果。这些研究者翻阅了1600篇研究论文,并把这些内容用几种标准来编码——事实上是大量的标准,并且这些标准还包括多个选项和分支。他们的数据曾经放到微软的Excel表格中,这表格中居然包括8000列,然后这些列大多是是空的。

       这些研究者们想要在不同的类别和标题下对总数进行压缩,R是一种强大的脚本语言,它能够像Perl的正则表达式一样来处理文本。凌乱的数据需要编程语言这样的资源,尽管SAS和SPSS有处理那些超越下拉菜单任务的脚本语言,但是R是被用作一门编程语言来写的,因此,对于这一目的,R是一种更好工具。


R领导新的方式。

       许多新的统计学方面的产品在成为商业平台之前,最初是作为R的包而出现的。最近得到关于病人回访的医学研究的数据。对于每一个病人,我们有医生曾经建议的治疗条目的数量,同时也有病人实际记住的条目数量。

      自然模型是β-二项分布。自20世纪50年代以来,这一点已经被广泛熟知,但是把估计程序与感兴趣的协变量关联起来却是最近的事情。通常,像这样的数据都要用一般估计方程来处理,但GEE方法是渐进的,并且假设前提是样本足够大。我曾经希望R能够拥有处理广义线性模型与β-二项式的能力。恰好最近的一个包估计了这个模型:BenBolker所写的β-二项式。SPSS都没有完成这个功能。


与文档整合在一起发布。

       R能够很好的与LaTex文档发布系统整合在一起,这意味着来自于R的统计输出和图形可以嵌入到可出版级的文档中。这并不是适合每一个人,除非你想写一本关于数据分析的书,或者你是不喜欢把你的结果拷贝到一个字符处理文档中,最短和最优雅的途径是通过R和LaTex来实现。


没有花费。

       作为一个小企业的老板,我很喜欢R是免费的这一特点。甚至对于一个大企业,要知道你可以带一个有临时基础的人来,然后快速的让他们坐到工作站旁来使用领先的分析软件是一件很美妙的事情。没必要担心预算问题。


       R的包添加新的功能到R,并通过这些软件包,研究人员可以很容易地分享他们的同龄人之间的计算方法。某些软件包是范围有限的,其他代表统计学的整个领域,含有其他一些包含了前沿的发展。事实上,许多统计学方面的开发包在变成商业软件之前最开始都是以R的包的形式出现的。

       R是开源的。R的实现花了20年以上的时间,它是一个论证过了的概念和产品。但是,任何开放源码的产品,它的可靠性依赖于透明度。我们相信代码,因为我们可以检查代码,并且别人也可以检查代码进而报告错误。这与那些采取它在自己的基准,并验证其软件的公司项目是不同的。



大数据时代数据分析的必备技能

——R数据挖掘与机器学习

时间2017年7月22-24日 (三天)初级;7月26-28日 (三天)高级

地点北京市海淀区首都体育学院

费用

初级:3300元 / 2800元 (仅限全日制本科生及硕士研究生优惠价)

高级:3600元 / 3100元 (仅限全日制本科生和硕士研究生优惠价)

全程:6600元 / 5600元 (仅限全日制本科生和硕士研究生优惠价)

(食宿自理)

安排上午9:00-12:00;下午2:00-5:00;答疑

我要报名


讲师介绍:
      
方匡南老师,统计学教授,博士生导师,耶鲁大学博士后。主要研究:数据挖掘、应用统计。       2007年出版了国内本R语言中文教程《R语言统计分析软件简明教程》,并于2015年2月出版了《R数据分析:方法与案例详解》,该书在同类书籍中销售名列前茅,并被引入到台湾地区出版。有10多年的R语言使用经验和丰富的数据挖掘和机器学习实战经验。曾先后在在 Journal of Multivariate Analysis、Scientific Reports(Nature子刊)、Computational Statistics and Data Analysis等国内外权威期刊发表论文70多篇。先后主持了国家自然科学基金、国家社科基金等多个项目。承担了多个企业数据挖掘项目,有丰富的实战经验。
       长期讲授《数据挖掘》、《机器学习》等课程,讲课生动活泼、深入浅出、以实际案例引出统计方法,再通过编程讲解实际操作和结果分析。

课程配套资料:
(1)提供一份精心准备的非常全面的R软件入门和数据挖掘与机器学习讲义。
(2)提供课程源代码1份和相应数据若干份。
Special大礼包:赠送方老师主讲的R初级和高级视频,价值1000元!

R简介:
        R语言由新西兰奥克兰大学ross ihakarobert gentleman 开发。R语言是自由软件,可以放心大胆地使用,且具有非常强大的统计分析和作图功能,而且更重要的是R软件具有非常丰富的网上资源,目前R软件有3000多种贡献包,几乎可以实现所有的统计方法,目前大部分的统计学家和计量经济学家都使用R语言,而且越来越多的数据分析实务人员也开始使用R语言。R语言具有简单易学,功能强大,体积小(仅40m左右),完全免费,可自由开发等特点,且R语言和S语言语法基本相同,绝大部分程序是互相兼容的。学习R软件正成为一种趋势。
       R软件最优美的地方是它能够修改很多前人编写的包的代码做各种你所需的事情,实际你是站在巨人的肩膀上。——Google首席经济学家Hal Varian


学员对象:

金融、医疗、通讯、咨询、电子商务等领域的数据分析人员、数据挖掘工程师、数据科学家;

高校硕士生、博士生、青年教师等。


培训目的和特色:
【初级班】

(1)让学员快速入门并熟练掌握R语言,掌握如何利用R丰富的网上资料和帮助系统,学会基本的编程方法。

(2)结合统计分析的思想和实际案例,深入浅出地讲解如何使用R语言进行实际数据的统计分析,让学员不仅掌握R语言的使用,更重要的是学会统计分析的思想。

(3)学完本课程后,使学员基本上可以使用R语言进行实际的统计分析工作。尤其学会使用R语言对批量处理的实务数据分析,大大提高工作效率。


【高级班】

(1)让学员快速入门并熟练掌握R语言,掌握如何利用R丰富的网上资料和帮助系统,学会高级的编程方法。

(2)本结合数据挖掘的思想和实际案例,深入浅出地讲解如何使用R语言进行实际数据挖掘。

(3)学完本课程后,使学员基本上可以使用R语言进行实际的数据挖掘工作,可以直接应聘各大公司的数据挖掘岗位。


培训内容目录:

【初级班】

专题名称

授课内容

第1讲 (3小时)

R语言入门


目标:掌握R语言的基本用法

1.R语言介绍

2.编辑软件Rstudio使用

3.R程序包的载入与使用

4.数据对象及运算(向量、矩阵、数组、列表与数据框处理)


23小时)

数据读写

R基本编程


目标:掌握用R编写函数和数据的读写

1. R数据读入与读出 (读入txt、xls、SPSS、SAS、stata以及数据库文件)

2.R 函数编写

3.R的条件与循环函数

4.高效编程技巧介绍

5.利用R做迭代优化求解


33小时)

数据预处理

探索性分析


目标:掌握数据预处理与探索性分析

1. 数据预处理

2. 缺失值处理

3. 随机数生成

4. 常用统计方法的蒙特卡洛模拟

5. 随机抽样

6.单变量数据分析与作图

7.双变量数据分析与作图

8.多变量数据分析与作图

案例1:统计作图在调查数据中的应用

案例2:统计作图在临床医学中的应用


43小时)

数据挖掘与机器学习入门

KNN方法


目标:数据挖掘与机器学习入门介绍

1.何为数据挖掘与机器学习

2.数据挖掘与机器学习的主要研究内容

3.有监督学习与无监督学习区别

4.KNN方法

案例1:统计作图在调查数据中的应用


53小时)

线性回归


目标:掌握线性回归方法与实际的建模分析

1. 一元线性回归

2.多元线性回归

3. 逐步回归

案例1:广告营销计划案例

案例2:信用卡债务预测案例

案例3:房价预测案例

第6讲3小时)

线性分类方法

互动交流讨论


目标:掌握经典线性分类方法及其应用

1.Logistic模型

2.LDA判别分类

3.QDA判别分类

案例1:信用卡违约预测案例

案例2:股价涨跌方向预测案例

互动交流讨论


【高级班】

专题名称

授课内容


1

重抽样方法


目标:掌握经典重抽样方法

1.验证集方法

2.交叉验证

3.Bootstrap方法

案例1:量化投资资产配置案例

案例2:汽车每加仑汽油里程数预测案例


23小时)

决策树

组合预测


目标:掌握决策树和组合预测方法及其实际应用。

1.CART决策树

2.Bagging,

3.随机森林

4.Boosting算法

案例1:棒球运动员薪水预测案例

案例2:心脏病预测案例

案例3:信用卡违约预测案例


33小时)

支持向量机


课程目标:掌握支持向量机分类方法

1.间隔分类器

2.支持向量分类器

3.支持向量机

案例1:基因表达数据案例

案例2:股票涨跌方向预测


43小时)

变量选择与高维数据


课程目标:掌握数据挖掘中高维数据分析方法及其实际应用。

1.LASSO

2.SCAD

3.MCP

4.Group  LASSO

案例1:基因筛选

案例2股票选股


53小时)

无监督学习

主成分分析

主成分回归

聚类分析


目标:掌握无监督学习方法及其应用。

1.主成分分析

2.主成分回归

3.Kmeans聚类分析

4.系统聚类分析

案例1:广告支出主成分分析

案例2犯罪率主成分分析

案例3学生考试成绩主成分分析

案例4:客户细分聚类案例


63小时)

关联规则

互动交流讨论


目标:掌握大数据分析中常用的关联规则方法及其应用。

1.关联规则方法

2.Aprior算法

案例1:超市购物篮分析

案例2:杂货店商品推荐分析


优惠:

现场班老学员9折优惠;
同一单位三人以上同时报名9折优惠;

以上优惠不叠加。


报名流程:
1:点击“我要报名”,网上填写信息提交,注明报全程还是阶段
2:给予反馈,确认报名信息
3:网上缴费
4:开课前一周发送课程电子版讲义,软件准备及交通住宿指南

联系方式:

魏老师
QQ:1143703950 点击这里给我发消息
Mail:vip@pinggu.org
Tel: 010-68478566

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2015-1-7 13:19:10
支持R语言~ 强大又潮流
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2015-1-7 13:19:50
新春之前赶紧再学一门技能
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2015-1-7 13:20:34
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2015-1-7 15:14:25
R语言很不错
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2015-1-7 19:11:23
我很喜欢这个R语言。。。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

点击查看更多内容…
相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群