基于常用的办公软件Excel,挑选能够提高工作效率的常用工具来讲解。本节介绍Excel数据分析工具库-3。
1、 回归分析:
1) 回归:研究自变量与因变量之间关系形式的分析方法,主要通过建立因变量Y与自变量Xi(i=1,2,3,……)之间的回归模型,来预测因变量Y的发展趋势。
2) 相关分析与回归分析的联系:均为研究与测量两个或两个以上变量之间关系的方法。
3) 相关分析与回归分析的区别:
Ⅰ相关分析:随机变量,不区分自变量和因变量;描述两个变量之间线性关系的密切程度
Ⅱ回归分析:区分自变量和因变量,自变量是确定的普通变量,因变量是随机变量;揭示变量X对变量Y的影响大小,由回归模型进行预测
4) 线性回归分析的五个步骤:
Ⅰ根据预测目标,确定自变量和因变量
Ⅱ绘制散点图,确定回归模型类型
Ⅲ估计模型参数,建立回归模型
Ⅳ对回归模型进行检验
Ⅴ利用回归模型进行预测
5) 简单线性回归:
Ⅰ也称一元线性回归,回归模型中只含一个自变量,否则为多重线性回归。
Ⅱ简单线性回归模型:Y=a+bX+ε
Y-因变量;X-自变量;a-常数项,回归直线在总坐标轴上的截距;b-回归系数,回归直线的斜率;ε-随机误差
6) 绘制散点图:
Ⅰ【数据】—【分析】—【数据分析】—【回归】—【确定】
Ⅱ弹出后,对各类参数进行设置:
A. 输入:
a. Y值输入区域:输入需要分析的因变量数据区域
b. X值输入区域:输入需要分析的自变量数据区域
c. 标志:勾选【标志】
d. 常数为零:表示该模型属于严格的正比例模型
e. 置信度:按照需要是否需要勾选
B. 输出选项:
a. 输出区域:可选当前工作表的某个活动单元格、新工作表组或新工作簿
b. 残差:观测值与预测值(拟合值)之间的差,也称剩余值
c. 标准残差:指(残差-残差的均值)/残差的标准差
d. 残差图:绘制的点在以0为横轴的直线上下随机散布,则表示拟合结果合理,否则重新建模
e. 线性拟合图
f. 正态概率图
Ⅲ【确定】,输出结果
7) 回归统计表:
回归模型的拟合效果:
Ⅰ Multiple R:Y与X之间的相关系数绝对值
Ⅱ R Square:判定系数R2,越接近1,表示越好
Ⅲ Adjusted R Square:调整判定系数Adjusted R2,在多重线性回归时才有意义。
Ⅳ 标准误差:剩余标准差,值越小,表示越好
Ⅴ 观测值:估计回归模型的数据个数(n)
8) 方差分析表:
Ⅰ主要作用:通过F检验来判断回归模型的回归效果。
Ⅱ五大指标:Df(自由度)、SS(误差平方和)、MS(均方差)、F(F统计量)、Significance F(P值)
A. F:衡量变量间线性关系是否显著
B. Significance F:实在显著性水平α(常用取值0.01或0.05)下的F的临界值
9) 回归系数表:用于回归模型的描述和回归系数的显著性检验。
10) 多重线性回归:
Ⅰ包含一个因变量和多个自变量的回归模型
Ⅱ多重线性回归模型:Y=a+b1X1+b2X2+^+bnXn+ε
Xn-第n个自变量;bn-第n个偏回归系数
2、 时间序列预测:
1) 基本特点:假设事物发展趋势会延伸到未来;预测所依据的数据具有不规则性;不考虑事物发展之间的因果关系
2) 主要包括的预测方法:移动平均法、指数平滑法、趋势外推法、季节变动法等
Ⅰ移动平均法:
A. 根据时间序列逐期推移,依次计算包含一定期数的平均值,形成平均值时间序列,以反映事物发展趋势
B. 基本思想:适合短期预测
C. 公式:Yt=(Xt-1+Xt-2+Xt-3+……+Xt-n)/n
Yt-对下一期的预测值;n-移动平均的时期个数;Xt-1-前期实际值;Xt-n-前n期的实际值
Ⅱ指数平滑法:
A. 使用阻尼系数(β),β越小,近期实际值对预测结果影响越大。
B. 阻尼系数根据时间序列的变化特性来选取。
C. 公式:Yt=αXt-1+(1-α)Yt-1=(1-β)Xt-1+βYt-1
Yt-时间t的平滑值;Xt-1-时间t-1的实际值;Yt-1-时间t-1的平滑值;α-平滑系数;β-阻尼系数