全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 数据分析师(CDA)专版
2999 3
2017-08-18
妙趣恒生的统计学奠定数据分析基础
03.png
一、开课时间
时间:2017年11月29日-12月1日(三天)

二、课程定价
费用:600元/天 (赠送录制视频)

学习方式

1、上课方式:同步现场直播学习+录播学习+在线答疑 +1万次反复观看

2、课程时间:上午9:00-12:00;下午1:30-4:30;答疑4:30-5:00

3、直播课程,开课即学

4、在线反复观看,1万次反复观看


四、报名福利(优惠)

1、现场班老学员可以享受9折优惠;

2、同一机构3人以上报名,9折优惠;

3、同一机构6人以上报名,8折优惠;

4、赠送统计学课程视频;

5、专业老师在线答疑;

6、精致课程练习题供学员课后操作更易于学员理解与掌握所受知识,提高实战能力;

7、报名成功后发送老师课程讲义供学员提前预习;

8、提供就业培训、就业指导、就业面试题;

9、免费参加CDA数据分析研究院俱乐部活动。

10、赠送经管之家(原人大经济论坛)论坛币1000

(前三项优惠不叠加)


五、讲师介绍

CDA数据分析讲师徐老师

       国内著名高校数学系讲师,计算数学专业博士学位。

       1996年9月~2000年7月,上海大学数学系,本科。

       2000年9月~2002年7月,上海大学数学系,计算数学专业硕士研究生。

       2002年9月~2005年7月,上海大学数学系,计算数学专业博士研究生。

       2005年12月~至今,上海师范大学数学系讲师,主要承担《C++程序设计》、《SAS与数据挖掘》和《高等数学》等课程的教学任务。  


CDA数据分析讲师Michael Liu老师

       中国精算师,北美准精算师,金融数据分析师,中级经济师,研究生毕业于中央财经大学,拥有期货、证券、银行类资格证书以及广泛的金融保险行业从业经验,同经管之家相识多年,擅长于数据分析,有长期的SAS、SPSS、EXCEL实战经验和授课经历,为人和善,始终相信能帮助和影响他人变得更好才是人生的意义所在。


CDA数据分析讲师熊巍老师  

       统计学专业博士,加州大学伯克利分校统计学院高级访问学者,对外经济贸易大学大数据与风险管理中心成员、中国人民大学应用统计研究中心成员、具有丰富的统计学及数学教学经验,人大经济论坛讲师,研究方向为数据挖掘、机器学习、稳健高维降维、应用统计模型等,在国外SCI及国内核心外期刊上发表论文二十余篇并参与完成多项著作。目前致力于大数据、超高维数据在交叉学科的前沿领域研究,主持并参与了包括国家自然科学基金项目在内的多项国家级课题及北京市自然科学基金、社会哲学规划项目等重大省部级课题,其中在研的有自己主持的教育部人文科学项目“基因与环境的交互效应对复杂疾病的影响及稳健地识别分析与应用”、以及参与的“大数据的统计学基础理论与分析技术创新研究”、“大数据下Leverage重要性抽样的稳健改进”等大数据项目。在学校承担多项课程,精通各种软件,正在编写《实用数据挖掘讲义》及《商务应用统计案例》。


CDA数据分析讲师傅老师

       国内著名高校副教授,数学系博士,研究领域:金融数学,曾担任咨询公司数据分析顾问,互联网金融公司风控模型顾问


CDA数据分析讲师白老师

       著名高校博士学位,主要研究领域包括概率论、数理统计、经济最优化、风险管理及衍生品定价等方面,有着多年的授课经验,发表了SCI及核心期刊论文多篇,多次指导学生参加全国数学建模竞赛并获得国家级奖及省级奖。

                                                                                                                             

六、课程简介

       统计学是通过搜索、整理、分析数据等手段,以达到推断所测对象的本质,甚至预测研究对象未来的一门综合性科学。其中用到了大量的数学及其它学科的专业知识,它的使用范围几乎覆盖了社会科学自然科学的各个领域。

       本课程从最基础的统计理论(描述性统计、区间估计、假设检验等),到基本的统计分析(T检验、方差分析等),最后到商业常用的模型(回归、因子分析、时间序列)。以深入浅出的方法,带大家逐步了解统计。


七、课程大纲

一章:统计基础

第一节:描述性统计

1、集中趋势

(1)众数

(2)中位数

(3)分位数

(4)平均数

2、离散测度

(1)、异众比率

(2)、四分位差

(3)、方差

(4)、标准差

(5)、离散系数

(6)、偏态

(7)、峰态


第二节:统计量及其抽样分布

1、统计量

(1)常用统计量

(2)次序统计量

(3)充分统计量

2、分布

(1)抽样分布

(2)渐进分布

(3)近似分布

(4)卡方分布

(5)t分布

(6)F分布

3、样本均值的分布与中心极限定理

4、样本比例的抽样分布

5、两个样本均值之差的抽样分布

6、关于样本方差的分布


第三节:参数估计

1、参数估计

(1)估计量与估计值

(2)点估计与区间估计

(3)评价估计量的标准

(4)点估计

2、一个总体参数的区间估计

3、两个总体参数的区间估计

4、估计量的求法

(1)矩估计法

(2)最大似然估计法

5、样本量的确定


第四节:假设检验

1、假设检验

(1)假设的表达式

(2)两类错误

(3)假设检验的流程

(4)p值

(5)单侧检验

2、单个样本t检验

3、配对样本的t检验、两独立样本t检验


第五节:分类数据分析

1、分类数据与卡方统计量

2、拟合优度检验

3、列联分析、独立性检验

4、列联分析相关测量


第二章:统计高级

第一节:回归分析

1、简单线性回归

(1)最小二乘估计

(2)拟合优度的度量

(3)可决系数

(4)回归系数的区间估计和假设检验

(5)回归模型预测

2、逻辑回归

(1)逻辑回归参数估计

(2)逻辑回归分析思路

(3)逻辑回归中的混杂因素

(4)逻辑回归中的交互作用


第二节:主成分分析和因子分析

1、主成分分析

(1)数学模型

(2)主成分的推导及性质

(3)主成分回归的应用

2、因子分析

(1)因子分析的目的

(2)因子分析的基本理论

(3)因子分析的基本步骤

(4)因子分析的旋转方法


八、课程重点

       集中趋势的度量、离散程度的度量、偏态与峰态的度量、统计量的概念、几个分布的概念、正态分布导出的几个概念(卡方分布、t分布、F分布)、样本均值的分布与中心极限定理、样本比例的抽样分布、两个样本均值之差的抽样分布、样本方差的分布、参数估计的一般问题(最大似然估计)、一个总体参数的区间估计、两个总体参数的区间估计、样本量的确定、假设检验(2类错误)、一个总体参数的检验、两个总体参数的检验、分类数据分析、主成分分析、线性回归、相关关系、回归分析的目的、最小二乘估计、拟合优度的度量、可决系数、回归系数的区间估计和假设检验、logistic回归的主要用途、logistic回归参数估计、logistic回归分析思路、logistic回归中的混杂因素、logistic回归中的交互作用、因子分析的概念和基本步骤、因子载荷矩阵求解的方法、因子旋转。


九、课程目标

1、统计理论中了解一些常用的统计术语,能运用数据分析常用的一些统计方法(相关分析,列联分析,主成分分析,因子分析等

2、深入浅出的讲课方式,了解并掌握最基本的统计理论(描述性统计、区间估计、假设检验等)


十、报名流程及咨询
1. 提交报名信息:http://www.peixun.net/main.php?mod=buy&cid=1065
2. 给予反馈,确认报名信息
3. 交费
开户行:北京农商银行四季青支行万寿寺分理处
户名:北京国富如荷网络科技有限公司
卡号:0404 1001 0300 0003 092
支付宝:guofuruhe@126.com
户名:北京国富如荷网络科技有限公司
4. 邮递发票



咨询方式

龚加勇
电话:010-53605625
手机:17773656856

Q  Q: 1281241407

邮 箱:gongjiayong@pinggu.org


二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2017-8-20 21:47:20
支持一下
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2017-8-31 11:31:26
t检验、卡方检验、方差分析


t检验有单样本t检验,配对t检验和两样本t检验。

单样本t检验:是用样本均数代表的未知总体均数和已知总体均数进行比较,来观察此组样本与总体的差异性。

配对t检验:是采用配对设计方法观察以下几种情形,1,两个同质受试对象分别接受两种不同的处理;2,同一受试对象接受两种不同的处理;3,同一受试对象处理前后。


卡方检验

是对两个或两个以上率(构成比)进行比较的统计方法,在临床和医学实验中应用十分广泛,特别是临床科研中许多资料是记数资料,就需要用到卡方检验。


方差分析

用方差分析比较多个样本均数,可有效地控制第一类错误。方差分析(analysis of variance,ANOVA)由英国统计学家R.A.Fisher首先提出,以F命名其统计量,故方差分析又称F检验。

其目的是推断两组或多组资料的总体均数是否相同,检验两个或多个样本均数的差异是否有统计学意义。我们要学习的主要内容包括

单因素方差分析即完全随机设计或成组设计的方差分析(one-way ANOVA):

用途:用于完全随机设计的多个样本均数间的比较,其统计推断是推断各样本所代表的各总体均数是否相等。完全随机设计(completely random design)不考虑个体差异的影响,仅涉及一个处理因素,但可以有两个或多个水平,所以亦称单因素实验设计。在实验研究中按随机化原则将受试对象随机分配到一个处理因素的多个水平中去,然后观察各组的试验效应;在观察研究(调查)中按某个研究因素的不同水平分组,比较该因素的效应。

两因素方差分析即配伍组设计的方差分析(two-way ANOVA):

用途:用于随机区组设计的多个样本均数比较,其统计推断是推断各样本所代表的各总体均数是否相等。随机区组设计考虑了个体差异的影响,可分析处理因素和个体差异对实验效应的影响,所以又称两因素实验设计,比完全随机设计的检验效率高。该设计是将受试对象先按配比条件配成配伍组(如动物实验时,可按同窝别、同性别、体重相近进行配伍),每个配伍组有三个或三个以上受试对象,再按随机化原则分别将各配伍组中的受试对象分配到各个处理组。值得注意的是,同一受试对象不同时间(或部位)重复多次测量所得到的资料称为重复测量数据(repeated measurement data),对该类资料不能应用随机区组设计的两因素方差分析进行处理,需用重复测量数据的方差分析。


方差分析的条件之一为方差齐,即各总体方差相等。因此在方差分析之前,应首先检验各样本的方差是否具有齐性。常用方差齐性检验(test for homogeneity of variance)推断各总体方差是否相等。本节将介绍多个样本的方差齐性检验,本法由Bartlett于1937年提出,称Bartlett法。该检验方法所计算的统计量服从X2分布。

经过方差分析若拒绝了检验假设,只能说明多个样本总体均数不相等或不全相等。若要得到各组均数间更详细的信息,应在方差分析的基础上进行多个样本均数的两两比较。




二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2017-8-31 14:07:30
统计学中为什么要对变量取对数?
对数据做一些变换的目的是它能够让它符合我们所做的假设,使我们能够在已有理论上对其分析。
对数变换(log transformation)是特殊的一种数据变换方式,它可以将一类我们理论上未解决的模型问题转化为已经解决的问题。我将说两类比较有代表性的模型。
理论上:随着自变量的增加,因变量的方差也增大的模型。
先给个很经典的例子,如分析美国每月电力生产数。

左边是正常数据,可以看到随着时间推进,电力生产也变得方差越来越大,即越来越不稳定。这种情况下常有的分析假设经常就不会满足(误差服从独立同分布的正态分布,时间序列要求平稳)。

这必然导致我们寻求一种方式让数据尽量满足假设,让方差恒定,即让波动相对稳定。而这种目的可以通过对数转换做到。

理论上,我们将这类问题抽象成这种模型,即分布的标准差与其均值线性相关。
即\sqrt{Var(Z_{t})} =\mu _{t}\times \sigma ,其中E(Z_{t}) =\mu _{t} 。
由定义可推:Z_{t}=\mu _{t}\left( 1+\frac{Z_{t}-\mu _{t}}{\mu _{t}}  \right) ,利用log函数的性质:log(1+x)\approx x(当x足够小)
那么log(Z_{t})\approx log(\mu _{t})+\frac{Z_{t}-\mu _{t}}{\mu _{t}} .
那么很容易就知道E(log(Z_{t})) \approx log( \mu _{t})和Var(log(Z_{t})) \approx \sigma ^{2} .

所以对数变换能够很好地将随着自变量的增加,因变量的方差也增大的模型转化为我们熟知的问题。
经验上:研究数据的增长率分布存在一定规律的模型。
再给个例子:实际研究中,某一研究对象自身性质难以研究,但其增长率是服从一定分布。例如说:Z_{t}=(1+X_{t}) \times Z_{t-1},其中X_{t}是每年增长率(不很大)。
我们可以考虑对数变换:log(Z_{t})-log(Z_{t-1})=log\left(  \frac{Z_{t}}{Z_{t-1}}  \right)=log\left( 1+X_{t} \right)\approx X_{t}
这样,我们又可以将研究数据的增长率分布存在一定规律的模型转化为我们熟知的问题。

在对数转换后,人们又思考了很多其他的转换方式(如Cox-Box转换)。但总而言之,每一种转换方式都是为了让数据符合我们的假设,来对其进行分析。我所说的对数变换原因只是冰山一角,如有不正确的地方还请各位多多指正。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群