全部版块 我的主页
论坛 经济学人 二区 外文文献专区
2022-6-1 12:04:15
即使是10%的外围函数也不会扭曲功能中值和功能方框图的中心区域,这在功能方框图上是可以辨别的(见图7和8)。-400400 20 40 60级别100%95%50%5%0%-500501000 20 40 60水平100%95%50%5%0%图7:维纳HFT顶层预测误差的函数箱线图,无异常值(左)和10%形状异常值(右)。已应用聚合函数中值法,窗口长度k=10,DepthProc R包。-400400 20 40 60级别100%95%50%5%0%-500501000 20 40 60水平100%95%50%5%0%图8:维纳HFT顶层预测误差的函数箱线图,无异常值(左)和10%形状异常值(右)。已采用移动平均法,窗长k=10,DepthProrc软件包。表5:移动函数平均值和聚合中值法的MAFE,其中维纳过程样本被10%的异常值所污染,这些异常值是形状和大小异常值。异常值由fs(t)过程生成。移动平均聚合mediank窗口长度3 5 10 3 5 10底层2.80 0.68 0.68 2.01 0.72 0.73层2 6.29 0.93 0.78 5.15 1.04 0.91层3 13.18 1.50 1.25 12.03 1.70 1.47顶层19.12 2.19 1.77 19.56 2.45 2.05表6:移动函数平均值和聚合中值方法的MAFE,其中维纳过程样本被40%的异常值所污染,这些异常值是形状和幅度异常值。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-1 12:04:19
异常值由fs(t)过程生成。移动平均聚合mediank窗口长度3 5 10 3 5 10底层5.72 5.62 5.13 4.57 4.49 4.36层2 11.15 10.86 10.26 10.05 9.80 9.59层3 20.63 20.43 19.58 19.50 19.19 18.85顶层28.40 29.76 28.67 28.69 28.46 28.076实证研究为了证明我们的建议的实证有用性,我们分析了一个真实的数据集,其中包含在某个著名的波兰互联网服务(webportal)中对互联网用户行为进行昼夜监控的信息。web门户分为四个子服务。我们已收到数据,其中包括整个服务及其四个子服务(下文称为服务1-4)的每小时用户数。数据来自2015年365天。我们将观测值视为连续函数。作为所考虑数据集的统计描述,可以有效地使用图9中所示的功能箱线图(参见[37,17])。对互联网用户数据的初步分析包括一个检测功能量异常值的程序(见图9),以及为检测子服务1-4和整个服务(见图14)的功能形状异常值(见图1013)而准备的外部图。有关异常值图的定义和解释,请参见Arribas Gil和Romo的文章【1】。我们现在可以指出功能观测值(即2015年的一天指数),即震级异常值,即服务1的第164、203、222、235242、249、255、262、263、296和305天,夏季大部分是晴天(11天中有9天),11天中有8天是周六或周日;第212天(7月31日星期五)和第306天(11月31日星期一)。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-1 12:04:22
2) 对于服务2,似乎没有显示模式;服务3多达94天的时间主要是周六、周日和节假日,令人惊讶的是,该方法没有显示服务4的异常值。该方法也不会指示整个服务的功能量异常值。服务1的功能形状异常值为第266天(9月23日星期三)、第279天(10月6日星期二)和第352天(12月18日星期五),我们得出结论,它们如图9所示:四个子服务用户数量的功能箱线图,DepthProrc包。无共同模式;服务2的第143天(5月23日星期六)、第200天(7月19日星期日)和第358天(平安夜——波兰全年最庆祝的一天);服务3的第12、101、112、120、122、136、157、164、178、181、197、198、205和206天(请注意,14天中有8天是节假日);服务4的第4天,第4、8、10、46、53、54、57、58、63、66、67、68、76、81、82、86、94、95、100、117、121、136139、151、162、186、199、200、205、209、221、226、245、250、275、294、296、297311、313、317、341、342和352天。请注意,44天中有18天是波兰的节假日,另外,44天中有15天是节假日之前或之后的日子。最后,第10、46、66、163、205和336天(6天中有3天是冬季的周末,6天中有3天是工作日)是整个服务的形状异常值。第3节中描述的聚合媒体预测器的性能可从图15、17和19中推断出,该预测器应用于所分析的互联网服务用户数。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-1 12:04:25
函数箱线图中代表函数中值的实线应接近于零函数(中值无偏),而方框的体积应相对较小(替代有效性)。或者,可以使用Shang和Hyndman的方法进行预测,也可以使用长度等于10的移动窗口。我们将我们的方法与Shang和Hyndman的方法进行了比较【35】。其预测器的性能如图16所示。图10:服务1 roahd R包的形状异常值和异常值图。图11:服务2 roahd R包的形状异常值和异常值图。图12:服务3 roahd R包的形状异常值和异常值图。图13:服务4 roahd R包的形状异常值和异常值图。图14:整个分析服务的函数形状异常值和异常图,roahd R包。综上所述,我们通过比较观察曲线和预测曲线之间的差异之和,将我们的预测质量与Shang和Hyndman的预测进行了比较【35】。我们根据经验比较了观察到的曲线和用这两种方法预测的曲线之间的差异值。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-1 12:04:28
我们还比较了观测曲线和预测曲线之间积分差的中值绝对偏差(MAD)。在图17中,我们给出了观测曲线与双功能中值法预测曲线之间每小时平均差值之和的四个箱线图,以及服务用户数量预测的功能箱线图。在图18中,我们给出了观察曲线和双功能中值法预测曲线之间差异平方和的中值的四个箱线图。在图19中,我们给出了五个函数箱线图,用于观察曲线与使用聚合函数中值法预测的四个子服务商的预测曲线之间的差异值,而在图20中,我们提供了五个函数箱线图,用于观察到的曲线与使用Shang和Hyndman方法预测的四个子服务商的预测曲线之间的差异数量。0 5 10 15 200 20000 40000 60000 80000所有服务PRED 2 MedHourusers 0 5 10 15 200 5000 10000 15000 200000服务1 MED PredHourusers 0 5 10 15 200 5000 10000 15000 200000服务2 MED PredHourusers 0 5 10 15 200 5000 10000 15000 200000服务3 MED PredHourusers 0 5 10 15 200 5000 15000 200000服务4 MED PRED Hourusers图15:互联网服务用户的聚合中值预测值。图16:Shang和Hyndman对互联网服务用户的预测。5 10 15 20-10000 0 10000 20000 30000预测2 Medhourusers-5000 0 5000 10000SERV 1-4000 0 2000 4000 6000SERV2-2000 0 2000 4000 6000 8000SERV3-6000-2000 0 2000serv4图17:观测曲线与用双函数中值法预测的曲线之间每小时平均差值之和的四个箱线图。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-1 12:04:31
上图为预测服务用户数量的功能方框图,fda R包。图18:观察曲线与使用聚合函数中值法预测的曲线之间差异的平方和中值的四个箱线图。表7:Internetservice用户估算质量比较——MAD计算。预测子服务1子服务2子服务3子服务4整体服务和H 75691911 93756602 53231453 82312911 324824422我们的预测38363817 42643286 21726639 37247856 1198788725已进行观察曲线和预测曲线之间差异的功能箱线图比较(见图10),以比较我们的方法与Shang和Hyndman的方法的“有效性”方法表7包含了我们的预测与Shang和Hyndman对四个子服务和整个服务的预测的比较。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-1 12:04:35
我们的结论是,我们的方法对每个单个子服务都更有效,而Shang和Hyndman的方法在整个服务预测中似乎更好。5 10 15 20-50000 0 50000 1000000 2M预测的质量-所有用户shourUsers-pred5 10 15 20-40000-20000 0 40000服务1 hourUsers-pred5 10 15 20-40000-20000 0 40000服务2 hourUsers-pred5 10 15 20-40000-20000 0 40000服务3 hourUsers-pred5 10 15 20-40000-20000 0 40000 40000服务4 hourUsers pred图19:五个功能箱线图,用于计算四个子服务用户的观测曲线和预测曲线采用聚合功能中值法(fda R软件包)进行预测。图20:Shang和Hyndman方法fda R包预测的四个子服务用户的观察曲线和预测曲线之间差异值的五个功能箱线图。7结论本文提出了一种新的层次函数时间序列预测方法。我们的建议包括由功能深度引起的移动功能中介的迭代计算。我们从层次结构的底层开始,向上移动层次结构,计算相关的移动功能中介,从底层中介一直到顶层。考虑到模拟研究和实证调查的结果,我们得出结论,在i.i.d.和弱时间依赖模型具有强大价值调整的情况下,我们的建议对形状和幅度异常值都是稳健的。我们的建议可以通过应用不同的功能深度轻松调整,以应对特定的功能异常值。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-1 12:04:38
我们建议对由形状异常值组成的数据集使用GBD,对由震级异常值组成的数据集使用MBD。考虑到实证例子的分析,我们得出结论,我们的方法对层次结构的每个子层次都更有效,而Shangand Hyndman的方法似乎在顶层预测中更好。使用我们的方法,我们能够正确预测大多数门户网站用户的行为。决策者可以使用的历史数据可能包含功能异常值,并且可能在一定程度上依赖于时间。Shang和Hyndman【35】基于非稳健广义最小二乘法进行预测,但该方法似乎在全局上是稳健的,而SOUR方法在局部,即在每个子级上更稳健。值得庆幸的是,我们的方法比Hyndman和Shang的方法快几倍。对于中等规模的数据集,我们面临着Hyndman和Shang方法的巨大挑战。这一事实在该提案应用于电子经济分析的背景下非常重要。该方法的实现可以通过简单的R脚本轻松地准备,该脚本适用于DepthProc R包。该数据包还包括所考虑的经验数据集。AcknowlementsJPR和DM的研究得到了AGH本地grantno的部分支持。2004年11月11日,DK的研究得到了CUE管理学院2017年和2018年科学资源保护拨款的部分支持。参考文献【1】Arribas Gil A,Romo J(2014)《功能数据的形状异常检测和可视化:异常图》。生物统计学,15(4):603–619。[2] Aue A,Norinho D D&H"ormann S(2015),《平稳函数时间序列预测》,美国统计协会杂志,110(509):378-392。[3] Bosq D(2000)函数空间中的线性过程。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-1 12:04:41
Springer【4】Brown GW(1947)关于小样本估计。《数学统计年鉴》18(4):582-585【5】Damon J,Guillas S(2016),“far”包,网址:https://github.com/Looping027/far[6] Didericksen D、Kokoszka P和Zhang X(2012年),函数自回归模型预测的经验性质。计算机统计,27(2):285-298。[7] Gijbels I,Nagy S.(2015)《功能数据非综合部门的一致性》。J、 Multivar。肛门。140:259-282 URL:http://dx.doi.org/10.1016/j.jmva.2015.05.012.[8] Górecki T、Krzy'sko MK、Wolynski W、WaszakL为多元函数数据选择数据分析的统计方法,统计论文。DOI10.1007/s00362-016-0757-8。[9] H"ormann S,Kokoszka P(2010)《弱相关函数数据》。安。统计学家。38(3): 1845-1884.[10] Horváth L,Kokoszka P(2012)《功能数据推断与应用》。Springer,New York【11】Hyndman RJ,Shang HL(2009)预测功能时间序列(带讨论)。韩国统计学会杂志38199-211。[12] Hyndman RJ、Ahmed RA、Athanasopoulos G、Shang HL(2011)《分层时间序列的最优组合预测》。计算统计与数据分析55(9):2579-2589【13】Kahn KB(1998)重温自上而下与自下而上预测。《商业预测方法与系统杂志》(TheJournal of Business Forecasting Methods&Systems):17(2):14-19【14】Kohn R(1982年),When是一个时间序列的集合,它能有效地预测过去的时间序列。《计量经济学杂志》18(3):337-349[15]Kosiorowski D(2014)经济时间序列短期预测中的函数回归。过渡统计-新系列15(4):611-626。[16] Kosiorowski D(2016)《经济数据流稳健分析的困境》,数学科学杂志(Springer),218(2),167–181。[17] Kosiorowski D,Zawadzki Z(2017)《深度过程:多维经济现象稳健探索的R包》。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-1 12:04:44
《统计软件杂志》,正在审查中[18]Kosiorowski D,Bocian M(2015)《互联网服务管理中的功能分类》,摘自:第九届Aleksander Zelia's教授会议论文集,克拉科夫市CUE。[19] Kosiorowski D,Rydlewski JP,Snarska M(2017年),使用局部Wilcoxon统计量检测功能时间序列的结构变化。统计文件。DOI 10.1007/s00362-017-0891-y【20】Kosiorowski D,Mielczarek D,Rydlewski JP(2018a)西里西亚地区昼夜空气污染宏观模型示例的分层功能时间序列预测-关键概述。中央罗马经济建模和计量经济学杂志。10(1), 53–73.[21]Kosiorowski D,Mielczarek D,Rydlewski JP,Snarska M(2018b)分层时间序列预测中的广义指数平滑。《转型中的统计——新系列》,19(2):331-350,DOI10.21307/stattrans-2018-019【22】Kosiorowski D,Mielczarek D,Rydlewski JP(2018c)《功能时间序列中的异常值——稳健统计理论和应用的挑战》,摘自:M.Papiez&S.'Smiech(编辑),第12届Aleksander Zelia's教授关于社会经济现象建模和预测的国际会议。会议记录。克拉科夫:克拉科夫经济大学基金会,第209-218页。[23]Liu R,Parelius JM,Singh K(1999)《数据深度的多元分析:描述性统计、图形和推理》(附讨论)。Ann Stat27(3):783–858。[24]López Pintado S,J"ornsten SR(2007)《通过频带深度扩展的功能分析》,载于《IMS课堂讲稿-专著系列复杂数据集和反问题:层析成像、网络和超越》,第54卷:103-120,数理统计研究所[25]López Pintado S,Romo J(2009),关于功能数据深度的概念。J、 美国。统计学家。协会。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-1 12:04:47
104: 718-734.[26]López Pintado S,Romo J,Torrente A(2010年)用于分析基因表达数据的基于深度的强大工具。生物统计学,11(2):254-264。【27】Mosler K,Polyakova Y(2016)《功能数据深度的一般概念》。ArXiv预印本ArXiv:1208.1981v2【28】Nagy S,Gijbels I Omelka M,Hlubinka D(2016)《功能数据的综合深度:统计特性和一致性》。ESIAM概率和统计20:95-130。DOI:10.1051/ps/2016005【29】Nieto Reyes A,Battey H(2016)功能数据深度的拓扑有效定义。统计科学31(1):61-79【30】Pfanzagl J(1970),关于中值无偏估计的渐近有效性。安。数学统计学家。41(5):1500-1509【31】Pfanzagl J(1979),关于存在干扰参数的最优中值无偏估计量。《统计年鉴》7(1):187-193【32】Ramsay JO,Hooker G,Graves S(2009)使用R和Matlab进行功能数据分析,Springer【33】Rana P,Aneiros G,Vilar JM(2015)功能时间序列中异常值的检测。EnvironmentMetrics 26:178-191【34】Rousseeuw,P.J.、Perrotta,D.、Riani,M.和Hubert,M.(2018)时间序列的稳健监控,并应用于欺诈检测。arXiv:1708.08268v4【35】Shang HL,Hyndman RJ(2017)《分组功能时间序列预测:特定年龄死亡率的应用》。计算与图形统计杂志26(2):330-343【36】Shang HL(2018)平稳函数时间序列的自举方法。统计与计算28:1–10https://doi.org/10.1007/s11222016-9712-8【37】Sun Y,Genton MG(2011)功能箱线图。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-1 12:04:50
计算和图形统计杂志20(2):316-334。【38】功能数据分析中的Tarabelloni稳健统计方法。米兰理工大学博士论文和R包roahd。【39】Valencia D、Lillo RE和Romo J(2013)功能依赖性的Kendall相关系数。工作文件,13-32统计和计量经济学系列,马德里卡洛斯IIIde大学教育部。[40]Vinod HD,de Lacalle JL(2009)《timeseries的最大熵引导:meboot R包》,J Stat Softw 29(5)。【41】Weale M(1988)《国家账户中价值、数量和价格的调节》。皇家统计学会杂志A 151(1):211
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群