全部版块 我的主页
论坛 经济学人 二区 外文文献专区
2022-6-13 22:06:12
我们已经在静态回溯测试实验中注意到,只有当我们使用足够数量的数据时,经验方法才是可接受的。加什。EVT:预报员在GARCH上使用了一个变体。HS中,EVT尾部模型用于获得小样本中条件分位数的更精确估计。加什。norm:预测者估计一个具有正态创新分布的GARCH(1,1)模型。拱门。t: 预测员通过选择ARCH(1)模型错误地描述了损失的动态,但正确地猜测了创新是t分布的。拱门。norm:就像GARCH一样。正常,但预报员错误地描述了比尔奇的动态(1)。HS:预测员将标准经验分位数估计应用于数据,行业建模师在第3.2节中使用的方法。这种方法不仅完全忽略了市场损失的动态性,而且容易出现小样本下经验分位数估计的缺点。3.3.2结果我们总结了表6中的结果,首先考虑了真实模型(oracle),然后是好模型(GARCH.t、GARCH.HS、GARCH.EVT),最后是差模型(GARCH.norm、ARCH模型和HS)。请注意,我们将包括GARCH。HS在基于我们在第3.2节静态实验中的假设的良好模型中,n=500的adata样本对于经验分位数估计是有效的;这显然是一种武断的判断。我们观察到,总体而言,这三个测试能够更好地区分模型的尾部(重尾与轻尾),而不是不同形式的动力学(GARCH与ARCH)。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-13 22:06:15
二项检验(N=1)无法区分GARCH模型中的学生t和正态创新分布;稍微取N=2可以改善结果,但我们需要N≥ 4为了真正揭示当真实过程具有较重尾创新时,正态创新分布的不足。当动力学的选择和创新分布的选择都是错误的(ARCH.norm)时,对于任何N的选择,所有测试都是非常强大的。皮尔逊试验。考虑到我们之前的实验以及当N太大时Pearson检验尺寸性能的恶化,本试验似乎是可取的,当N=500时,应严格注意N=4的情况,或当N=1000时,应注意N=8的情况。我们发现,当N=500时,拒绝优秀建模者的概率在N>4时开始增加,当N=1000时,拒绝优秀建模者的概率在N>8时开始增加。皮尔逊检验对创新模式的区分优于对不同动态的区分。拒绝GARCH的权力。norm(错误定义的创新分布)随着N的增加而增加,并从N=4得出合理的结果(无着色);再次注意,二项检验(N=1)的功效非常低。用于ARCH。t(误判动力学),测试的威力小于GARCH。正常,但如果N<8,则可接受。对于HS,功率结果对于任何N都是合理的,这表明该测试有一定的能力检测忽略动力学建模的模型。总的来说,N=4似乎是最佳选择,有合理的权力拒绝使用GARCH的糟糕预测。norm,ARCH。t和HS。请注意,对于N=500和N=1000的估计窗口,N=4的皮尔逊检验结果具有广泛的可比性。Nass测试。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-13 22:06:19
颜色编码显示,Nass测试显示出与Pearson测试非常相似的模式,但大N(N=32或64)的测试大小没有恶化。对于大多数N值的优秀建模者,以及GARCH的情况下,Nass测试具有可接受的低拒绝率。HS,对于N<16。鉴于我们之前的讨论,我们重点讨论了N=4和N=8的情况。对于N=4,我们获得了与N=4的皮尔逊检验具有广泛可比性的结果,但拒绝GARCH的能力仅略有下降。norm,ARCH。t和HS。轻轨。该测试倾向于对N的所有值进行非常稳定的推断;这可以从以下事实中看出:许多行图形都是均匀的绿色或白色(对于大N,使用nodeterioration)。这种稳定性有助于通过Pearson和Nass测试验证N=4、8的结果。首先考虑到优秀的建模者,并与Pearson和Nass测试进行比较,当n=500时(静态情况下),theLRT略微过大,但当n=1000时,其尺寸最佳。它为GARCH提供了最好的结果。t略有改善,从n=500到1000。它为GARCH提供了稳定且低的拒绝率。对于N=500,HS直到N=32;对于N=1000,HS直到N=64;它还为搜索提供了稳定且低的拒绝率。任何N的EVT。考虑到建模能力差,LRT的功率随着GARCH的N而增加。标准与其他测试相比,N的功率超过了70%的阈值≥ 8当nn=500和N时≥ n=1000时为16。用于ARCH。t和HS所有N的拒收率都是合理的,并且或多或少与其他两个试验给出的值一致;可以注意到,当使用更长的估计窗口时,拒绝率略高。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-13 22:06:22
拱门。norm被强烈拒绝,就像Pearson-andNass测试一样。总之,本实验证实,使用N=4或8个分位数进行有效的多项式检验;如果使用Pearson或Nass测试,则N=4是合适的;如果使用LRT,则N=8给出了经验功率。4隐式回测ESI的程序鉴于第3节中获得的数值结果,我们转向建议在实践中使用测试程序的问题如果我们认为测试的简单性和易于向管理层和监管人员解释是压倒一切的因素,那么可以推荐N=4的皮尔逊测试。这是对二项测试或使用2个分位数的测试的显著改进,并且易于使用标准软件实现N=4或N=8的Nass检验是一种不太为人所知的检验,但就其尺寸特性而言,它似乎比Pearson检验更为稳健,N=4时的功效与Pearson相当,N=8时的功效略优于Pearson检验。虽然其功率小于LRT,但对于≤ 8使Nass成为可行且有吸引力的测试。o最强大的测试是LRT,它为N提供了良好且稳定的结果≥ 然而,估计至少500的样本量不能过大。此外,由于我们必须进行优化,以确定(2.5)中u和σ的最大似然估计值,因此该测试需要执行更多的工作。现在,我们可以为ES提出一种隐式回溯测试,根据我们迄今开发的多项式方法确定决策标准。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-13 22:06:25
事实上,从amodel得到的ES估计没有被我们的多项式测试所拒绝,它被我们的后验测试所隐含地接受。因此,我们可以对ES使用与多项式检验中的零假设H0相同的拒绝准则。巴塞尔银行监管委员会(2016年)提出了一个tra-light系统,用于确定是否应根据基于n=250天的回溯测试长度的简单例外二项测试结果应用资本乘数。我们解释了如何将转换光系统扩展到我们的任何一个多项式测试,并说明了当N=2时的结果(只是因为这种情况适合于图2:基于N=250、α=0.975和α=0.9875的三项式测试(N=2)的转换光。O并计算落在两个上部箱中的观测值数量(下部箱包含O=250- O- Oobservations)。O1O20123456789101112130 1 2 3 4 6 7 8 9 10 12 13图形显示)。设B为一个250天的交易年中99%水平的异常数,设GB表示二项B(250,0.01)随机变量的cdf。在巴塞尔体系中,如果GB(B)<0.95,则交易指示灯为绿色,基本乘数1.5适用于银行资本;这是B提供的情况≤ 4、如果0.95≤ GB(B)<0.9999,则指示灯为黄色,并在[1.70,1.92]范围内增加乘数;这是B的情况∈ {5, . . . , 9}. 如果GB(B)≥ 0.9999,指示灯为红色,应用最大倍增器2;如果B≥ 红灯也提示监管干预。我们可以应用完全相同的哲学。在我们所有的多项式检验中,检验统计量n(或LRT的sn)在零假设下具有一定自由度(比如θ)的(渐近)卡方分布。设Gθ表示卡方分布的cdf。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-13 22:06:28
如果Gθ(SN)<0.95,我们将把交通灯设置为绿色;如果Gθ(SN)≥ 0.95,我们会将交通灯设置为(至少)橙色;如果Gθ(SN)≥ 0.9999,我们会将交通灯设置为红色。我们可以基于一组更丰富的阈值,轻松为欧元区开发一个资本乘数系统。图2显示了N=2和N=250时的交通灯系统。使用的特殊测试是Nass测试。显然,N>2的值对应于不太容易显示的立方体和超立方体,但我们将使用相同的逻辑根据数据(O,O,…,on)指定颜色。5在实际数据上应用我们的模型验证测试在总结分析时,我们将我们的多项式测试应用于实际数据。我们考虑对标准普尔500指数的一项虚假投资,其中损失由每日对数收益的时间序列给出。我们在1976年至2016年的40年期间进行了一次回溯测试,在每4年期间(约1000天)进行一次多项式测试,并将其与99%水平的VaR例外单侧二项得分测试的功效进行比较;这是第3.1.2节中考虑的最有力的二项检验,在尺寸为n=1000的样本中具有正确的尺寸(见表4)。(请注意,当我们将二项检验视为多项式的特例时,我们考虑了97.5%水平的双边例外,与多水平检验相比,这是一个较弱的检验。)对于多项式测试,我们选择N=8个等距水平的LRT,从α=0.975开始计算,这是一个特别强大的测试。在表7中,我们给出了第3.3节中考虑的四个预测者的结果:HS,GARCH。norm,GARCH。t、 加什。HS。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-13 22:06:31
在所有方法中,使用n=500天的滚动窗口从样本中导出一天的分位数估计,并将其与第二天的实际损失进行比较。GARCH的参数。norm和GARCH。tmodels每10天更新一次。这与第3.3节的dynamicbacktesting研究中使用的程序相同。显然,为了开始分析,我们需要1976年之前500天的数据。在表中,标记为B的列给出了99%VaRestimate的超标数量,标记为O的列,将观察到的同等规模销售的数量提高到97.5%以上;pB和pM分别给出99%水平的单侧二项评分测试和多项式LRT的p值。我们根据第4节中所述的交通灯系统在单个4年期间和整个期间对结果进行着色。因此,小于0.05的p值为黄色,小于0.0001的p值为红色;两者都对应于对无效假设的拒绝。应该强调的是,与本文中的所有其他表格相比,表7包含p值,而不是对功率或大小的估计。对于HS和GARCH。常模预测者、二项检验和多项式检验得出了相似的结论。HS预报员的结果在10个周期中的4个周期以及整个周期内被拒绝;GARCH的结果。在10个周期中的7个周期内以及整个周期内,定额预报员被拒绝。两种测试的转换光颜色相同,但多项式测试的p值通常高于二项式测试的p值。正是对其他两位预测者来说,多项式检验的增强能力是显而易见的。多项式检验拒绝了GARCH。t预测2008-2011年期间的金融危机,而二项检验没有。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-13 22:06:34
加西亚。t模型可能忽略了这一波动期内收益过程的不对称性,这一点已被多项式检验所揭示。多项式检验也否定了该预报员在整个时期的结果。多项式检验也拒绝了GARCH。hs预测员在一个额外的时期(1976年至1979年),在2004年至2007年期间具有更高的重要性(红色与黄色)。综上所述,虽然这只是一组使用单一时间序列的结果,但它表明了多项式检验对二项式检验的增强能力。每个分位数估计值O。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群