捕获时间序列的预测误差的5种最受欢迎??的方法
本文摘自我的一篇有关使用Python进行Arima时间序列预测的博客文章, 它是一本相当广泛的教程,除非您对ARIMA时间序列预测的学习和学习没有真正的兴趣,否则不要打扰。
但是我确实想分享这5个非常有用的指标列表,以快速了解如何在使用时间序列数据时评估预测误差。在这里,我们还学习了一种措施失败而另一种措施成功的情况。希望您喜欢这个卡盘。我很懒惰,只是复制粘贴了原始文章中的一些有趣的观点,希望能以新的和更新的信息吸引到数据科学中心的读者。
误差是实际值与其预测值之间的差。由于两个原因,此处的残差与预测误差不同。在训练数据集上计算第一个残差,而在测试或验证数据集上计算预测误差。其次,预测涉及多个步骤,而残差则涉及单个步骤。下面提供了一些可用于总结预测误差的指标。但是在此之前,让我们看一下计算误差的公式。在此,P代表预测/预测值。
平均绝对误差(MAE) – MAE是最流行,易于理解和计算的指标之一。值越低越好是我们的预测。试图最小化MAE的模型导致了预测中位数。
均方根误差(RMSE) – RMSE也是统计学家用来了解预测效果的流行方法之一。与MAE相比,数字的解释要困难得多。试图最小化RMSE的模型导致了均值的预测。
MAE和RMSE都是与比例有关的错误。这意味着错误和数据都在同一范围内。这对我们意味着什么?这意味着我们无法使用这些度量来比较两个具有不同单位的不同时间序列预测的结果。
平均绝对百分比误差(MAPE) – MAPE优于MAE或RMSE,因为它是无单位的,因此可以安全地用于比较不同单位的时间序列预测值的性能。如果您同时使用快速和慢速移动的产品,则不应使用此措施。原因是它不了解快速移动产品和慢速移动产品之间的区别。通常,与缓慢移动的产品相比,我们期望对快速移动的产品给予更高的权重。
如果仔细看一下公式,您将意识到,如果Y为零,则MAPE趋于变为无限或不确定(典型的除以零的问题)。这是什么意思?这意味着如果我们的时间序列值为零,则不应使用MAPE。MAPE的另一个缺点是,对负错误的处罚要比对正错误的处罚更大。
加权平均绝对百分比误差(WMAPE) – WMAPE是一种非常有用且流行的用于操作目的的方法。它对快速发展的产品更加重要,并且提供了解决MAPE的零除问题的解决方案。
对称平均绝对百分比误差(SWAPE) –解决MAPE “ 除以零问题 ”的另一种方法,但是该度量可以具有负值,这使其难以解释。
平均绝对标度误差(MASE) –我们讨论的所有上述误差均取决于标度,因此在比较不同单位的时间序列结果时会受到限制。引用这些限制,Hyndman&Koehler(2006)提出了另一种度量标准,称为MASE。MASE的公式很复杂,因此我们现在跳过它。
现在,我们已经简要介绍了一些计算预测误差的最流行方法,让我们看一下可以在Python中使用哪些包和函数来生成这些统计信息。
#计算MAEmae = np.mean(np.abs(实际-))#计算MAPE
映射= np.mean(np.abs(实际-预测)/np.abs(实际))
#计算WMAPE
wmape = sum(np。绝对(实际-预测)/总和(实际)

关注 CDA人工智能学院 ,回复“录播”获取更多人工智能精选直播视频!