→Y值所在区域:预测值所在列的第一行开始至最后一行;X值所在区域:其余变量所在列的第一行开始至最后一行→勾选标志→勾选残差→确定
→筛选出<0.05的P值
导盲犬:统计学家普遍的共识,p<0.05的时候,自变量对预测y才有用.
→开始→条件格式
→突出显示单元格规则→小于→0.05→确定
为了预测更加准确,这里还需考虑多重共线性,利用半相关矩阵检查。
导盲犬:如果说两个或多个自变量是高度相关的,很可能产生多重共线性。
→返回数据源→数据→数据分析→相关系数→确定
除预测值外的所有数据)→标志位于第一行→确定
→开始→条件格式→突出显示单元格规则
→大于→0.998→确定
→删除字段下单父订单数、无线端支付父订单数。
导盲犬:所谓多重共线性(Multicollinearity)是指线性回归模型中的解释变量之间由于存在精确相关关系或高度相关关系而使模型估计失真或难以估计准确。
→源数据→数据→数据分析→回归→确定
→观察R方与P值
导盲犬:所有自变量共同作用具有显著性的结论,通俗的讲,只有R方大于0.6的时候,预测y才有意义。
→选中所有变量的P值→开始→条件格式→突出显示单元格规则→小于
→0.05→确定→删除其它P值>0.5的变量
→源数据→数据→数据分析→回归→确定
→Y值所在区域:预测值所在列的第一行开始至最后一行;X值所在区域:其余变量所在列的第一行开始至最后一行→勾选标志→确定
→观察R值和P值,均符合要求。
→得出公示:预测值无线端下单金额=-84341.91323+无线端下单买家数*365.259139-392.2248391*无线端支付买家数+1.200575347*无线端支付金额
导盲犬:Intercept为截距的意思。
→返回测试集验证
通过验证发现预测的点跟测试集的点高度吻合,该模型可以使用。
预测是商业分析的核心,企业之所以能产生利润主要就是因为企业获得了信息差,而预测就是帮助企业创造信息差。因此,预测能力是最能体现数据分析师价值的点。
作者联系方式(微信):anzhi1111(暗之)
快速问答——
问:零一工具箱的下载地址在哪?
答:https://pan.baidu.com/s/1c1HlyLi问:零一工具箱是否收费?
答:零一工具箱是一款提供给电商运营轻量级的免费工具。
问:零一会是一个什么样的机构?
答:零一会是一个专业数据人才培养基地。
问:零一会有哪些业务?
答:培训孵化——通过系统的培训,一对一小班指导培养数据化运营人才,毕业后就业仍然会享受信息和知识的互通。
人才认证与输送——学习期满颁发权威机构专业证书,为企业输送数据分析师和数据运营人才。
电商运营——为企业提供代运营服务,提高店铺业绩。