全部版块 我的主页
论坛 经济学人 二区 外文文献专区
2022-5-5 08:46:58
导致伦敦银行同业拆借利率的利率在大多数情况下p值仍然为零,但另一个方向的p值在一开始的几个连续窗口中都低于0.1水平,模型的解释力在最大0.07水平上得到了提高;我们的解释是因果关系是非线性的。图6。Kernelised Geweke的因果关系度量。左图显示了当考虑具有一个滞后的模型时,通货膨胀在统计上导致伦敦银行同业拆借利率(蓝线)或反过来导致伦敦银行同业拆借利率(红线)的假设的p值集。右图显示了P值和因果关系度量值的散点图。00.10.20.30.40.50.60.70.80.91p-数值01/31/8602/29/8803/31/9004/30/920 0.05 0.1 0.15 0.200.10.20.30.40.50.60.70.80.91因果关系度量图7。线性Geweke因果关系度量。(左)美国消费者价格指数方向统计因果关系假设的p值集→ 一个月的伦敦银行同业拆借利率(蓝线)或另一个月的伦敦银行同业拆借利率(红线),当考虑具有线性核和滞后1的模型时。(右)p值和因果测量值的散点图。00.10.20.30.40.50.60.70.80.91p-值01/31/8602/29/8803/31/9004/30/920 0.02 0.04 0.0600.10.20.30.40.50.60.70.80.91因果关系度量图8。Kernelised Geweke的因果关系度量。(左)美国CPI方向统计因果关系假设的p值集→ 当考虑具有高斯核和滞后2的模型时,一个月伦敦银行同业拆借利率(蓝线)或另一个月伦敦银行同业拆借利率(红线);(右)p值和因果测量值的散点图。00.10.20.30.40.50.60.70.80.91p-值01/31/8602/29/8803/31/9004/30/920 0.02 0.04 0.06 0.0800.10.20.30.40.50.60.70.80.91因果关系度量图9。线性Geweke因果关系度量。(左)美国方向统计因果关系假设的p值集。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-5-5 08:47:01
居民消费价格指数→ 当考虑具有线性核和滞后7的模型时,一个月伦敦银行同业拆借利率(蓝线)或另一个月伦敦银行同业拆借利率(红线);(右)p值和因果测量值的散点图。00.10.20.30.40.50.60.70.80.91p-数值01/31/8602/29/8803/31/9004/30/920 0.02 0.04 0.06 0.0800.10.20.30.40.50.60.70.80.91因果关系测量图8中给出的第二个滞后的结果不再像图6中的滞后1(两种情况下均为高斯核)那样清晰。导致通货膨胀的利率假说在大多数情况下仍有接近于零的p值,但另一个方向的p值也很小。这一次,因果关系的值较低,达到略低于0.08。使用线性核,我们得到了不太清晰的结果,我们的解释是因果方向CPI→ 伦敦银行同业拆借利率更强,但也可能有一些反馈。图9显示了使用线性核的结果,它显示了两个方向更好的分离,适用于滞后7的模型。对于滞后8和9的模型,可以看到非常相似的结果。对于这些大滞后,没有明显的原因说明线性核比高斯核表现得更好。我们提供的解释是,没有任何非线性因果关系是足够强和一致的,而这一点通过使用非线性核得到了进一步的掩盖。本文的结论是,模型选择是检测因果关系的一个重要方面,需要进一步研究。在我们的分析中,我们没有获得转移熵或HSNCIC的显著结果。图10和图11分别显示了转移熵和HSNCIC的滞后1结果。对于滞后1,在美国CPI的方向上存在显著的统计因果关系→ bothGeweke的措施支持的一个月伦敦银行同业拆借利率。这在转移熵和HSNCIC中几乎看不到。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-5-5 08:47:04
转移熵的p值仅与随机效应略有偏离,而对于HSNCIC,它们通常是显著的;然而,这两个方向并没有很好地分开。更高滞后的结果往往更难解释。我们必须强调,HSNCIC传输熵和参数选择的不同实现可能会带来更好的性能(请参阅第5.1节和第5.2节)。图10。转移熵。(左)美国CPI方向统计因果关系假设的p值集→ 考虑滞后1时,一个月伦敦银行同业拆借利率(蓝线)或另一个月伦敦银行同业拆借利率(红线);(右)p值和因果测量值的散点图。00.10.20.30.40.50.60.70.80.91p-值01/31/8602/29/8803/31/9004/30/920 0.1 0.2 0.3 0.400.10.20.30.40.50.60.70.80.91因果关系度量图11。HSNCIC。(左)美国CPI方向统计因果关系假设的p值集→ 考虑滞后1时,一个月伦敦银行同业拆借利率(蓝线)或另一个月伦敦银行同业拆借利率(红线);(右)p值和因果测量值的散点图。00.10.20.30.40.50.60.70.80.91p-价值01/31/8602/29/8803/31/9004/30/920 0 0.5 1 1.5 200.10.20.30.40.50.60.70.80.91因果关系的衡量4。1.2. 权益对套利交易货币对我们分析了六种汇率(澳元兑日元、加元兑日元、新西兰元兑日元、澳元兑瑞士法郎、加元兑瑞士法郎、新西兰元兑瑞士法郎和标准普尔指数),并调查了任何“领头羊-跟随者”类型的模式。我们的期望是标准普尔应该领先。我们使用了汤森路透2008年7月18日至2013年10月18日期间的每日数据。我们研究了货币与标准普尔之间的成对依赖关系,并分析了添加芝加哥期权交易所市场波动率指数(VIX)辅助信息的结果。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-5-5 08:47:07
在所有情况下,我们都使用对数返回。图12显示了应用高斯核的kernelised Geweke测度的结果。每25天移动一个窗口的250个点的数据系列。与之前的利率和通货膨胀情况不同,线性和高斯核方法之间几乎没有实际差异。然而,在少数情况下,使用阿加西核可以更好地分离两个方向,尤其是CADCHF→ 标准普尔和标准普尔→ CADCHF给定VIX。除CADCHF外,在分析对标准普尔的因果影响时,所有货币对都表现出类似的行为。这种行为由少数窗口组成,对于这些窗口,当P值低于0.1时,因果关系显著,但不会持续。CADCHF是唯一一种对标准普尔有持续显著因果影响的货币,2008年和2009年开始出现这种情况。至于另一个方向,对于AUDCHF、CADCHF和NZDCHF,有一些时期标准普尔对它们的影响是显著的,以P值衡量。图12。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-5-5 08:47:10
假设汇率导致股票指数的p值集合,标准普尔(蓝色)或反之(红色)。澳元兑日元为00.51蓝色-> 标准普尔和红色代表标准普尔->AUDJPYp-价值07/18/0811/20/0803/25/0907/28/0911/30/0904/04/1008/07/1012/10/1004/14/1100.51 CADJPY蓝色-> 标准普尔和红色代表标准普尔->卡德皮普-NZDJPY的数值07/18/0811/20/0803/25/0907/28/0911/30/0904/04/1008/07/1012/10/1004/14/1100.51蓝色-> 标准普尔和红色代表标准普尔->NZDJPYp-价值07/18/0811/20/0803/25/0907/28/0911/30/0904/04/1008/07/1012/10/1004/14/1100.51澳元蓝色-> 标准普尔和红色代表标准普尔->CHFP AUDP-CADCHF的值07/18/0811/20/0803/25/0907/28/0911/30/0904/04/1008/07/1012/10/1004/14/1100.20.40.60.81蓝色-> 标准普尔和红色代表标准普尔->CADCHFp-NZDCHF的数值07/18/0811/20/0803/25/0907/28/0911/30/0904/04/1008/07/1012/10/1004/14/1100.20.40.60.81蓝色-> 标准普尔和红色代表标准普尔->NZDCHFp-价值07/18/0811/20/0803/25/0907/28/0911/30/0904/04/1008/07/1012/10/1004/14/11我们获得了所有主要的“制度”:汇率或标准普尔中任何一个具有更大解释力的时期(一个方向的P值比另一个方向低得多),以及两者都表现出低或高P值的时期。接近1的p值并不一定意味着纯粹缺乏因果关系:在这种情况下,在特定滞后时间内,测试因果关系的时间序列的随机排列似乎比该滞后时间序列本身具有更高的解释力。关于数据、测量和排列测试本身的性质,几乎没有可能的解释。我们在模拟数据上观察到,当不存在因果关系时,自相关会给排列测试带来偏差:p值高于我们对随机样本的预期,但也有更高的可能性将相关性解释为因果关系。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-5-5 08:47:14
此外,假设一个模型的滞后时间与数据的滞后时间不同,这两种偏差都可能导致。相应地,如果数据是用瞬时耦合模拟的,并且没有因果关系,这也会导致高p值。在所有四种方法中,转移熵似乎最容易产生这些偏差。图13显示了与图12类似的信息,但将VIX作为次要信息考虑在内。其基本原理是,标准普尔对套利交易货币的因果效应可能与感知的市场风险水平有关。然而,图表并没有显示包含VIX后因果效应的消失。虽然这些模式没有发生显著变化,但我们观察到,汇率已经失去了对标准普尔的大部分解释力,其中对CADCHF的解释力最大。另一个方向的p值几乎没有差异;因此,这两个方向之间的区别变得更加重要。图13。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-5-5 08:47:18
假设汇率导致股票指数S&p,假设波动率指数(VIX)作为辅助信息(蓝色)或反过来(红色),p值集。00.51kGC,假设VIX,澳元兑日元为蓝色-> 标准普尔和红色代表标准普尔->AUDJPY07/18/0811/20/0803/25/0907/28/0911/30/0904/04/1008/07/1012/10/1004/14/1100.51kGC,给定Vix,CADJPY为蓝色-> 标准普尔和红色代表标准普尔->CADJPY07/18/0811/20/0803/25/0907/28/0911/30/0904/04/1008/07/1012/10/1004/14/1100.20.40.60.81kGC,给定Vix,NZDJPY为蓝色-> 标准普尔和红色代表标准普尔->NZDJPY07/18/0811/20/0803/25/0907/28/0911/30/0904/04/1008/07/1012/10/1004/14/1100.51kGC,给定Vix,蓝色代表澳元CHF-> 标准普尔和红色代表标准普尔->AUDCHF07/18/0811/20/0803/25/0907/28/0911/30/0904/04/1008/07/1012/10/1004/14/1100.51kGC,给定Vix,蓝色代表CADCHF-> 标准普尔和红色代表标准普尔->CADCHF07/18/0811/20/0803/25/0907/28/0911/30/0904/04/1008/07/1012/10/1004/14/1100.51kGC,给定Vix,NZDCHF为蓝色-> 标准普尔和红色代表标准普尔->NZDCHF07/18/0811/20/0803/25/0907/28/0911/30/0904/04/1008/07/1012/10/1004/14/115。讨论和展望虽然科学界通常会问一些关于因果关系的问题,但在不同的情况下,量化因果关系的适当方法还没有得到很好的发展。首先,通常情况下,答案是用不专门用于此目的的方法制定的。有一些科学领域,例如营养流行病学,通常通过相关性推断因果关系[48]。经济学中一个被称为“米尔顿·弗里德曼恒温器”的经典例子,描述了在评估联邦储备的背景下,如何将缺乏相关性与缺乏因果关系混为一谈[49]。其次,问题通常是按照(对称的)依赖性来表述的,因为它涉及到既定的方法,并允许明确的解释。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-5-5 08:47:22
这可能是manyrisk管理应用中的一种情况,在这种应用中,什么导致损失的问题应该是核心问题,但通常不会用因果方法解决[50]。目前正在开发的量化因果关系的工具有助于更好地量化因果推理,更好地理解结果。在本节中,我们对这些方法进行了评论,以帮助理解它们的缺点,并使读者能够为预期用途选择最合适的方法。这也将为未来的研究指明可能的方向。本节第一部分描述了两种方法之间的主要差异,然后对模型选择和与置换测试相关的问题进行了一些评论。本节总结了对未来研究方向的建议。5.1. 理论差异线性与非线性:最初的Granger因果关系及其Geweke度量公式是用来评估线性因果关系的,它们非常稳健且有效。对于具有线性相关性的数据,使用线性格兰杰因果关系很可能是最佳选择。当相关性不是线性的,但具有强线性分量时,测量也可以很好地工作。由于金融数据通常不会表现出平稳性、线性或高斯性,因此不应使用线性方法对其进行分析。在实践中,对数据集大小和模型选择差异的要求优先,这意味着仍应考虑线性方法。直接和间接因果关系。格兰杰因果关系是不可传递的,这可能是不直观的。尽管及时性会使因果关系度量更接近于对该术语的共同理解,但它也可能导致无法区分直接原因和间接原因。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-5-5 08:47:25
因此,它可能会使度量对于降维和重复信息的目的无效。然而,直接因果关系和间接因果关系之间的区别并不一定很明确。这是因为添加条件变量既可以引入变量,也可以消除变量之间的依赖关系[51]。因此,直接和间接因果关系的概念与整个信息系统有关,如果我们向系统中添加新的变量,它可能会发生变化。使用图形建模的方法[1]有助于定义直接因果关系和间接因果关系的概念,因为这两个术语在因果网络中定义得很好。在某些情况下,Geweke和kernelised Geweke的措施可以区分直接和间接原因。以Ambrard[9]为例,我们建议比较条件因果测量和非条件因果测量,以此区分线性因果关系和核格兰杰因果关系的直接和间接因果关系。像HSNCIC这样的措施,明确地建立在这样一种方式上,即它们以次要信息为条件,因此,只针对直接原因;然而,这并没有达到预期效果,因为我们注意到HSNCIC对数据的维度非常敏感。传递熵(我们使用的形式)根本不考虑边信息。提出了一种称为部分转移熵[52,53]的新方法来区分直接原因和间接原因。虚假因果关系:在前一点关于直接和间接原因的部分内容中,虚假因果关系的问题是一个更广泛的问题。如前所述,因果关系是根据给定的数据推断出来的,引入更多的数据可以增加和消除(虚假的)因果关系。另一个问题是,数据可能表现出多种类型的依赖性。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-5-5 08:47:28
我们在本文中讨论的方法都不能同时管理几种类型的依赖,无论是瞬时耦合、线性还是非线性实用性。我们请感兴趣的读者参考在频域或使用滤波器对格兰杰因果关系和转移熵建模的文献[31,54,55]。数值估计:已经提到,Granger因果关系和核Granger因果关系对小样本和高维具有鲁棒性。这两种方法都优化了二次成本,这意味着它们对异常值很敏感,但基于核的Geweke方法可以通过参数选择来实现这一点。二元数据的Granger因果关系具有良好的统计显著性检验,而其他数据则没有,并且需要计算昂贵的置换检验。此外,在岭回归的情况下,还有另一层优化参数,这在计算上也是非常昂贵的。计算核函数在计算上也相对昂贵(除非数据是高维的),但它们对小样本很稳健。HSNCIC有一个很好的估计量,在有限数据的限制下,它不依赖于核的类型。另一方面,转移熵面临着与估计分布相关的问题:小样本量和高维度的问题。选择正确的估计器有助于减少问题。[35]中详细概述了估算熵的可能方法。Trentool是计算转移熵的较流行的开放获取工具箱之一,它使用最近邻技术来估计联合概率和边际概率,这是Kraskov等人首次提出的[27,39,56]。最近邻技术是一种数据高效、自适应且偏差最小的技术[35]。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-5-5 08:47:33
这种方法的重要方面是,它取决于嵌入参数的正确选择,因此,不允许分析任意标签的信息传输。它还涉及额外的计算成本,对于低维数据可能会更慢。我们在几个数据集上测试了Trentool,发现对样本大小的要求比原始直方图的要求更高,计算速度也更慢,结果具有可比性。然而,朴素直方图在更高维度上没有很好的性能[35],在这种情况下,建议采用最近邻法。非平稳性:这是未来研究中最重要的领域之一。所有被描述的度量都在一定程度上受到无法处理非平稳数据的影响。原始线性公式中的格兰杰因果关系是唯一明确假设平稳性(更准确地说,是协方差平稳性[5,7])的度量,渐近理论就是针对这种情况发展起来的。Geweke在[57]中描述了仍然可以在标准框架内分析的非平稳过程的特殊情况,以及使线性格兰杰因果关系框架适用于被积或协整过程的相应文献[58]。在所有这些情况下,需要知道非平稳性的类型,这是新偏差的潜在来源[58]。用于计算格兰杰因果关系的GCCA工具箱[59]提供了一些工具,用于检测非平稳性,并在一定程度上用于管理非平稳性[29]。在Granger因果关系的向量自回归设置中,可以运行参数测试来检测非平稳性:ADF测试(增强Dickey–Fuller)和KPSS测试(Kwiatkowski、Phillips、Schmidt、Shin)。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-5-5 08:47:36
为了管理非平稳性,《GCCA工具箱手册》[31]建议分析较短的时间序列(窗口)和差分,尽管这两种方法都可能带来新问题。还建议对数据进行降级和降级,对于经济数据,也可以进行季节性调整。本文中描述的其他度量没有明确假定平稳性;然而,一些关于平稳性的假设对于方法的正确运行是必要的。Schreiber在假设一个被分析的系统可以被平稳的马尔科夫过程近似的情况下发展了传递熵[26]。在实践中,如果时间序列高度非平稳,可能会影响传递熵,因为概率密度估计的可靠性会有偏差[39],但由于参数变化缓慢,非平稳性不一定是一个问题[60]。根据我们的知识,对于其他两种方法,即基于核的Geweke测度和HSNCIC,估计收敛的结果仅适用于静态数据。然而,对于i.i.d.数据的过于严格的情况,HSNCIC的渐近结果已经得到了发展[61]。givenby[62]的核岭回归结果是针对阿尔法混合数据得出的。参数选择:每种方法都需要参数选择;与第5.2节所述型号选择有关的问题。所有方法都需要选择滞后数(滞后顺序),而核方法还需要选择核、核参数(核大小)和正则化参数。在高斯核的情况下,核大小对数据平滑的影响可以理解为如下[63,64]。高斯核k(x,y)=exp(-kx- yk/σ)对应于由输入特征的所有可能单项式组成的有限维特征图。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-5-5 08:47:39
如果我们将阿克内尔表示为泰勒级数展开式,使用基1,u,u,u。。。,随机变量X和Y可以用RKHS表示为:Φ(X)=k(X,·)~ (1,cX,cX,cX,…)TΦ(Y)=k(Y,·)~ (1,cY,cY,cY,…)因此,核函数可以表示为:k(x,y)=1+cxy+cxy+cxy+。。。(29)交叉协方差矩阵将包含所有高阶协方差的信息:∑XY~0 0 0 0 0 0 0 0 0 cCov[X,Y]ccCov[X,Y]ccCov[X,Y]。。。0 ccCov[X,Y]ccCov[X,Y]ccCov[X,Y]。。。0 ccCov[X,Y]ccCov[X,Y]cCov[X,Y]。。。0。。。(30)根据Fukumizu等人[15]的说法,HSNCIC度量不依赖有限数据中的核。然而,其他参数仍然需要选择,这显然是一个缺点。核化的Geweke测度通过交叉验证显式优化参数,而HSNCICF则专注于将分布嵌入具有任何特征核的RKHS中。此外,对于AIVE直方图方法,转移熵需要选择估计密度和分块大小的方法。另一个重要方面是滞后顺序和滞后数量的选择。我们观察到第3.2.1节。这两个Geweke的测量值对滞后的选择不敏感,我们能够正确地识别在使用较小和较大滞后范围的情况下的因果关系。然而,其他两项措施表现不同。HSNCIC通常无法在一次分析更多滞后的情况下观察因果关系,但在单个滞后的情况下表现良好。在一个滞后与“真实”滞后相去甚远的情况下,转移熵表现出虚假的因果关系。然而,对于结构更复杂的实际数据,滞后的选择可能对所有测量都很重要(见第5.2节)。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-5-5 08:47:42
模型选择对于核心度量,我们观察到模型选择是一个重要问题。一般来说,核的选择影响所考虑的函数类的平滑度,而正则化器的选择控制着函数平滑度和函数误差之间的权衡。欠拟合可能是正则化器过大和核大小过大的结果(在阿加西核的情况下);相反,过度匹配可能是正则化器太小和内核大小太小的结果。其中一种有助于模型选择的方法是交叉验证[9]。这种方法特别受欢迎,并且对于脊灰过程中选择核大小和正则化子非常方便(见附录E)。考虑到非平稳数据,拟合参数似乎是合理的;然而,我们得出结论,交叉验证在计算意义上过于昂贵,无法提供预期的效益。模型选择(以及参数选择)的另一个方面是确定适当的滞后顺序。对于内核方法,增加滞后数并不会增加问题的维数,这在显式表示数据的方法中是可以预期的。如第2.1.3节所述,在核化Geweke测度的情况下,增加滞后数会降低问题的维数,因为数据是用(n)表示的-p) ×(n)-p) 两两比较,其中n是观察数,p是滞后数。另一方面,增加滞后的数量将减少自由度的数量。对于将较小的权重分配给较大滞后的核方法,这种下降将不那么明显(高斯核就是这样,但线性核则不是这样)。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-5-5 08:47:45
除了交叉验证,文献中建议的选择滞后顺序的其他方法都是基于对自相关函数或偏自相关的分析[27,65]。我们认为需要对模型选择进行更多的研究。5.3. 不仅在应用因果关系度量时,而且在测试这些度量时,可以生成虚假因果关系的测试条件。第3.1节中描述的排列测试涉及所有类型的依赖性的破坏,而不仅仅是因果依赖性。在实践中,这意味着,例如,如果由于因果关系的存在而导致的预测改进与由于间接耦合而导致的改进相混淆,那么瞬时耦合的存在可能会导致对因果推理的错误推断。然而,简单性是支持排列测试的决定性因素,而不是其他方法。几位作者[9,18,25]建议在子样本上重复排列测试以获得可接受性,这是我们在实际应用中不赞成的方法。使用接受率的基本原理是,通过计算多个子样本的多个置换测试,减少样本大小所造成的重大损失将得到弥补。我们认为,在初始样本较大且平稳性假设合理的情况下,这可能是合理的,但我们的数据并非如此。相反,我们决定报告重叠运行窗口的p值。这使我们能够额外评估结果的一致性,并且不需要我们为所有窗口选择相同的识别率。5.4. 展望在讨论中,我们强调了许多仍然需要更多研究的领域。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-5-5 08:47:48
核化的Geweke测量、转移熵和HSNCIC比原始Granger因果关系更好地检测非线性相关性,但没有改善其另一个缺点:非平稳性。岭回归是在线学习中一种方便的工具,它可能有助于处理非平稳性[9]。这显然是一个值得探索的领域。表3。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-5-5 08:47:52
总结了不同措施的主要特点。测量属性线性与非线性Ranger因果关系假设线性;线性数据的最佳方法,非线性的最坏情况线性和非线性数据传输熵线性和非线性数据传输熵线性和非线性数据NCIC线性和非线性数据如果低维区分直接和间接因果关系通过比较有和没有边信息的度量在一定程度上改变因果关系通过比较测量有侧信息和无侧信息的传递熵在一定程度上不能(考虑部分传递熵)HSNCIC,因为它被设计来调节旁侧信息虚假的因果关系游荡者因果关系易受影响的Kernelised Geweke的易受影响的转移熵易受影响的NCIC易受影响的好的数值估计器Granger因果关系Yeskenelised Geweke的yestransfer熵noHSNCIC YesOnStationAriger因果关系v.敏感的;使用ADF(增强Dickey–Fuller)进行测试,KPS(Kwiatkowski、Phillips、Schmidt、Shin)使用加窗、差分、大滞后的Geweke比较敏感;在线学习是一种很有前途的方法。传递熵有点敏感NCIC有点敏感参数的选择Ranger因果关系滞后核化Geweke核,核大小,正则化参数,滞后;使用交叉验证传递熵滞后、分块大小(如果使用直方图方法)HSNCIC内核、内核大小、正则化参数、滞后对于金融数据的应用至关重要,需要了解更多关于测量具有多种依赖性的时间序列中的因果关系的信息。我们不知道有任何研究能解决这个问题。我们认为,这应该首先通过分析合成模型来实现。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-5-5 08:47:55
这里研究的一个可能方向是在应用因果测量之前使用过滤来准备数据。一种可能性是基于频率的分解。一种不同类型的过滤被分解为负冲击和正冲击,例如,Hatemi-J提出了一种基于Ranger因果关系的“非对称因果关系度量”[66]。建议研究的第三个主要方向是建立因果网络。有大量关于基于干预的因果关系因果网络的文献,用图形模型描述。基于预测的因果关系已较少用于描述因果网络,但这种方法正变得越来越流行[29,46,67,68]。成功地建立一个复杂的因果网络需要特别注意次要信息以及直接和间接原因之间的区别。这是一个非常有趣的研究领域,在金融领域有着各种应用,尤其是投资组合转换、因果套利投资组合、投资风险管理等。基于机器学习理论和计量经济学的因果关系方法。在分析了它们的理论性质和实验结果后,我们得出结论,没有一种测量方法明显优于其他测量方法。然而,我们相信,基于岭回归的kernelisedGeweke测度是最实用的,对线性和非线性因果结构,以及二元和多元系统都表现相对较好。对于这两个真实数据集,我们能够确定因果方向,证明了方法和时间窗口之间的一些一致性,并且不符合经济原理。这两个实验指出了一系列需要解决的局限性,以便更广泛地将这些方法应用于金融数据。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-5-5 08:47:57
此外,这两个数据集都不包含更高频率的数据,使用高频率的数据可能会产生额外的并发症。另一个我们仅简要提及的问题是使用任何因果关系度量的相关性和实用性。说谎在很大程度上是一个科学领域的问题。归根结底,正是研究人员的解释和他们对数据的信心,才有可能将一种关系标记为因果关系,而不仅仅是统计上的因果关系。然而,虽然我们分析的度量不能发现真正的原因,也不能明确区分真因果关系和假因果关系,但它们在实践中仍然非常有用。格兰杰因果关系经常被用于经济模型中,自2003年格兰杰获得诺贝尔奖以来,格兰杰因果关系得到了更广泛的认可。关于在金融或经济学中使用格兰杰因果关系的非线性推导的文献很少。我们认为,一方面,它有巨大的潜力,另一方面,还有许多问题有待回答。虽然我们预计其中一些问题可以通过在线学习方法和数据过滤来解决,但需要更多关于非平稳性、噪声数据和最佳参数选择的研究。附录A。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-5-5 08:48:02
求解岭回归正则化成本函数为方程(9):β*= argminβmnXi=p+1((wi-圆周率-1) Tβ- 现在解方程(9)得到:L=mnXi=p+1((wi-圆周率-1) Tβ- xi)+γβTβ=m(Wβ- x) T(Wβ)- x) +γβTβ==m(βtwβ- 2xTWβ+xTx)+γβTβLβ=m(2WTWβ- WTx)+2γβ=0<=><=> WTWβ*+ γmβ*= WTx<=><=> β*= (WTW+γmIm)-1WTx(32),其中IMI是一个m×m单位矩阵。重量,β*, 被称为原始解,下一步是引入对偶解权重。WTWβ*+ γmβ*= WTx<=> β*=γmWT(x- Wβ*) (33)对于某些人来说也是如此*∈ Rn,我们可以这样写:β*= WTα*(34)从上面的两组方程中,我们得到:α*=γm(x)- Wβ*)<=> γmα*= 十、- Wβ*= 十、- WWTα*<=><=> (WWT+γmIm)α*= x(35)这给出了双重权重的理想形式:α*= (WWT+γmIm)-1x(36),取决于正则化参数γ。B.函数分析和希尔伯特空间的背景以下是定义和定理[13,18,69]。所有向量空间都在R上,而不是c上;然而,它们都可以在C中推广,几乎不需要修改。定义8(内积)设F是R上的向量空间。函数h·,·iF:F×F→ R被认为是Fif的内积:(i)hf+f,fi=hf,fi+hf,fi,对于所有的f,f,f∈ F(ii)hαF,fi=αhf,对于所有F,F∈ F、 α∈ R(iii)hf,fi=hf,fi代表所有f,f∈ F(iv)hf,fi≥ 0和hf,fi=0当且仅当f=0(37)定义9(希尔伯特空间)如果h·,·i是f上的内积,如果f与内积所诱导的度量是完备的,则对(f,h·,·i)称为希尔伯特空间[70]。我们将使用的泛函分析的基本概念之一是连续线性算子:对于两个向量空间,F和G,R上,一个映射T:F→ 如果G满足所有α的T(αf)=αT(f)和T(f+f)=T(f)+T(f),则称G为(线性)算子∈ R、 f,f∈ F
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-5-5 08:48:05
在本文的其余部分中,我们使用标准的符号约定tf:=T(f)。下列三个条件是等价的:(1)线性算子T是连续的;(2) T在零处是连续的;(3)T是有界的[71]。这个结果,以及后面给出的Riesz表示定理,是再生核Hilbert空间理论的基础。应该强调的是,虽然我们使用的算子,如平均元素和互协方差算子,是线性的,但它们所作用的函数通常不是线性的。线性算子的一个重要特例是线性泛函,它是算子T:F→ R.定理2(Riesz表示定理)在希尔伯特空间F中,对于某些F,所有连续线性泛函[72]的形式为h·,fi∈ F.在附录A中,我们使用了“内核技巧”,但没有解释为什么它是允许的。下面给出的解释是代表定理。该定理指的是损失函数L(x,y,f(x)),它描述了预测f(x)和观测y在点x处的差异成本。与损失L和数据样本S相关的风险RL,S被定义为预测函数f的平均未来损失。定理3(再输入定理)[69]设L:x×y×R→ [0, ∞) 是凸损失,S:={(x,y),…,(xn,yn)}∈ (X×Y)nbe一组观察结果和RL,SDE记录相关风险。此外,设F是X上的RKHS。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-5-5 08:48:09
然后,对于所有λ>0,存在唯一的经验解函数,我们用fS,λ表示∈ F、 满足等式:λkfS,λkF+RL,S(fS,λ)=inff∈FλkfkF+RL,S(F)(38)此外,还存在α、·αn∈ R、 使得:fS,λ(x)=nXi=1αik(x,xi),对于x∈ 下面的X(39),我们给出了希尔伯特-施密特标准化条件独立性标准的基本定义。定义10(Hilbert–Schmidt范数)设F是函数从X到R的再生核Hilbert空间(RKHS),由严格正核k:X×X诱导→ 设G是由严格正核l:Y×Y诱导的从Yto到R的函数的RKHS→ R[73]。用C:G表示→ F是线性算子。算子C的Hilbert–Schmidt范数定义为kCkhs:=Xi,jhCvi,ujiF(40),假设和收敛,其中Ui和ujare分别为F和G的正交基;高压、uiF、u、v∈ F表示F[13,18]中的内积,让Hw表示由严格正核kW:W×W诱导的RKH→ R.设X是X上的随机变量,Y是Y上的随机变量,(X,Y)是X×Y上的随机向量。我们假设X和Y是拓扑空间,可测性是关于相关σ定义的-场地。边际分布用PX,py表示,而(X,Y)的联合分布用PXY表示。期望值EX、Ey和EXY分别表示对PX、Py和PXY的期望值。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-5-5 08:48:12
为了确保HX和Hy分别包含在L(PX)和L(PY)中,我们只考虑随机向量(X,Y),因此期望值EX[kX(X,X)]和EY[kY(Y,Y)]是确定的。定义11(希尔伯特-施密特算子)线性算子C:G→ F是希尔伯特-施密特,如果它的希尔伯特-施密特范数存在。希尔伯特-施密特算子集HS(G,F):G→ F是一个内积为hC,DiHS:=Xi,jhCvi,ujiFhDvi,ujiF(41)的可分Hilbert空间,其中C,D∈ HS(G,F)。定义12(张量积)设f∈ F和g∈ G然后,张量积算子f g:g→ f定义如下:(f) g) h:=fhg,hiG,代表所有h∈ G(42)上述定义使用了两个标准的符号缩写。第一个问题涉及在表示运算符的应用时省略括号:(f) g) h而不是(f) g) (h)。第二个1与一个标量的乘法有关,我们写fhg,hiG而不是f·hg,hiG。张量积的希尔伯特-施密特范数可以计算为:kf gkHS=hf g、 f giHS=hf(f) g) giF=hf,fiFhg,giG=kfkgkg(43)当引入互协方差算子时,我们将对张量积使用以下结果。给定一个希尔伯特-施密特算子L:G→ F和F∈ F和g∈ G、 hL,f giHS=hf,LgiF(44)是等式(44)的一个特例,其符号如前所述和u∈ F和v∈ G、 高频 g、 u viHS=hf,uiFhg,viG(45)定义13(平均元素)鉴于上述符号,我们定义关于概率测度PX的平均元素uX,作为RKHS HXfor的一个元素:huX,fiHX:=EX[hφ(X),fiHX]=EX[f(X)](46)式中φ:X→ HXis是一个特征图,f∈ HX。平均元素是存在的,只要它们各自的范数是有界的,如果相关核是有界的,就会满足其条件。C.希尔伯特——施密特独立性标准(HSIC),如第2.1.4节所述。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-5-5 08:48:15
,在[13,18]之后,让FX,fy表示由严格正欧内斯kX:X×X诱导的RKH→ R和kY:Y×Y→ R.设X是X上的随机变量,Y是Y上的随机变量,(X,Y)是X×Y上的随机向量。边际分布用px,py表示,(X,Y)的联合分布用PXY表示。定义14(Hilbert–Schmidt独立性准则(HSIC)根据前面介绍的FX、FY、PX、Pyas符号,我们将Hilbert–Schmidt独立性准则定义为互协方差算子的平方Hilbert–Schmidt范数,∑XY:HSIC(PXY,FX,FY):=k∑XYkHS(47)。我们引用[13]中的引理1(核符号中的HSIC)HSIC(PXY,FX,FY):=EX,Y,Y[kX(X,X)kY(Y,Y)]+EX,X[kX(X,X)]EY,Y[kY(Y,Y)]-2EX,Y[EX[kX(X,X)]EY[kY(Y,Y)](48)其中X,X和Y是同一随机变量的独立副本。D.螺旋平均元素的估计量:^m(n)X=nnXi=1kX(·,Xi)^m(n)Y=nnXi=1kY(·,Yi)(49)经验互协方差算子:^∑(n)XY=nnXi=1(kY(·,Yi)- ^m(n)Y)hkX(·,Xi)- ^m(n)X,·iHX=nnXi=1{kY(·Yi)- ^m(n)Y} {kX(·,Xi)- ^m(n)X}(50)经验归一化互协方差算子:^V(n)XY=(^∑(n)XX+nλIn)-1/2∑(n)XY∑(n)Y+nλIn)-1/2(51),其中nλi被添加以确保可逆性。经验归一化条件互协方差算子:^V(n)XY |Z=^V(n)XY-^V(n)XZ^V(n)ZY(52)对于表示任何变量(XZ),(yz)或Z的U,我们用以KUa为中心的Gram矩阵表示,这样每个元素等于:KU,ij=hkU(·Ui)- ^m(n)U,kU(·,Uj)- ^m(n)UiHU;设RU=KU(KU+nλI)-1.使用这种符号,HSNCIC的经验估计可以写成:HSNCICn:=tr[r(XZ)r(yz)- 2R(XZ)R(Y Z)RZ+R(XZ)RZR(Y Z)RZ](53)E.交叉验证过程获取内核(或更准确地说,一个Gram矩阵)需要大量计算。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-5-5 08:48:18
执行交叉验证需要为网格的每个点计算两个内核(一个用于测试数据,另一个用于验证数据)。同时为测试和验证数据计算一个内核是最有效的。这是通过对数据进行排序来实现的,以便训练数据点是后续的(验证点是后续的),计算整个(但顺序适当)数据集的内核,并选择内核的适当部分进行测试和验证:\'\'K=K(Wtrain,Wtrain)K(Wtrain,Wval)K(Wval,Wtrain)K(Wval,Wval)(54)验证点的内核现在是使用训练点和验证点的内核的一部分:\'Kval=K(Wval,Wtrain)(55)这种方法很重要,因为它允许我们使用为测试数据计算的双参数,而不会出现尺寸问题。回想等式(14),我们现在可以将误差表示为:m(`Kvalα)*- x) T(`Kvalα)*- x) (56)即使有一种计算核的有效方法,交叉验证仍然很昂贵。如下文所述,为了获得特定因果关系测量的显著水平,有必要计算置换测试,并获得移动窗口的接受率或一系列p值。在实践中,为了在合理的时间内运行多个实验,使用多个测量值,合理的折衷办法不是在每个步骤后进行交叉验证,而是在所有试验中进行一次试验并使用这些参数。我们认为,内核化Geweke方法的优点之一,以及Ykernels经常用于在线学习的原因之一,在于可以优化参数,但不必每次都优化参数。Geweke的测量基于最佳线性预测。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-5-5 08:48:21
虽然我们将它们推广到使用非线性预测,但如果我们采用交叉验证,我们仍然可以使用最优预测。在本文描述的应用中,我们使用了高斯核,其定义如下:k(x,y)=exp(-kx- ykσ)(57),线性核定义为k(x,y)=xTy。我们使用随机五次交叉验证来选择调节和核参数的最佳参数γ。设(xt,yt,zt),t=1。。。,n是时间序列。我们想计算Gy→xkz。基于给定的时间序列,我们创建了一个滞后(嵌入)等于p的学习集,并按照第2.1.3节的符号准备了一个学习集:(十一、wi)-圆周率-1) ,因为i=p+1。。。,n、 学习集随机分成五个大小相同的子集。对于每个k=1。。。,5.我们得到一个第k个验证集和一个第k个测试集,其中包含不属于第k个验证集的所有数据点。接下来,创建一个网格,给定参数γ和内核参数的值范围(值以对数刻度变化)。对于每个训练集和网格上的每个点,我们计算双重权重α*. 这些双重权重用于计算该特定网格点的验证分数和预测误差。对五个验证分数进行平均,以获得网格上每个点的预测误差估计值。我们选择与网格点相对应的参数,并对预测误差进行最小估计。最后,在给定最优参数的情况下,计算整个学习集的预测误差。如前所述,我们从中选择最佳参数的参数集分布在整个演算尺度上。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-5-5 08:48:25
整个交叉验证在计算上可能相对昂贵,因此,不必要的大网格是不可取的。感谢Kacper Chwialkowski(英国伦敦大学学院)对手稿进行的有用讨论和宝贵反馈。特别感谢Maciej Makowski对初稿进行校对并提供一般性意见。我们还想感谢Dynamic Devices AG的首席技术官Max Lungarella提供[28]的代码,尽管没有在本文所述的任何实验中使用该代码,但它为我们提供了有关转移熵和替代方法的重要见解。确认经济及社会研究理事会(ESRC)对系统性风险中心的支持(ES/K002309/1)。作者贡献所有作者都对研究的概念和设计、数据的收集和分析以及结果的讨论做出了贡献。利益冲突作者声明没有利益冲突。参考文献1。《因果关系:模型、推理和推理》;剑桥大学出版社:纽约,纽约,美国,2000年2月。格兰杰,C.W.J.因果关系检验:个人观点。J.经济。戴恩。控制1980,2329–352.3。诺伯特·W.《预测理论》。工程师的现代数学;贝肯巴赫,E.F.,Ed。;麦格劳·希尔:1956年,美国纽约州纽约市;第1.4卷。涉及经济反馈,格兰杰过程。知会控制。1963, 6, 28–48.5. Granger,C.W.J.通过计量经济学模型和交叉谱方法研究因果关系。计量经济学1969年,37424-438.6。Geweke,J.多个时间序列之间线性相关性和反馈的测量。杰姆。统计协会1982年,77304-313.7。Geweke,J.F.时间序列之间条件线性依赖和反馈的度量。杰姆。统计协会1984年,79907-915.8。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-5-5 08:48:28
对所用术语的评论:“格兰杰因果关系”一词在文献中有一系列不同的含义,从统计测试到我们这里所说的“统计实用性”的同义词。在本文中,我们主要使用术语“格兰杰因果关系”作为特定依赖类型概念的名称,但每当我们量化这种依赖时,我们都会提到特定的衡量标准9。安伯拉德,P。;文森特,R。;米歇尔,O。;Richard,C.Kernelizing Geweke的格兰杰因果关系度量。2012年9月在西班牙桑坦德举办的IEEE信号处理机器学习国际研讨会(MLSP)上发表;第1-6.10页。安伯拉德,P.O。;Michel,O.J.J.格兰杰因果关系与定向信息理论之间的关系:综述。熵2012,15113–143.11。然而,这种混淆可能并不一定是不利的。如果我们将瞬时耦合解释为共享公共信息,我们可能会感兴趣地了解到,X与Y共享同步信息,而不管它们是否与Z共享同步信息。没有来自时间结构的方向性,我们无法区分直接和间接效应,这是在测量因果关系时包含次要信息的基本原理之一。12.格雷顿,A。;赫布里奇,R。;斯莫拉,A。;布斯克,O。;Schoelkopf,B.测量相关性的核方法。J.马赫。学2005年6月2075-2129.13号决议。格雷顿。;布斯克,O。;斯莫拉,A。;Schoelkopf,B.用Hilbert–Schmidt范数测量统计依赖性。算法学习理论;Springer Verlag:柏林/海德堡,德国,2005年;p、 63-77.14。太阳,X。;Janzing,D。;Schoelkopf,B。;一种基于内核的因果学习算法。2007年6月21日至23日在美国俄勒冈州俄勒冈州举行的第24届国际机器学习会议记录;ACM:美国纽约州纽约市,2007年;第855-862.15页。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-5-5 08:48:33
英国福水。;格雷顿。;太阳,X。;Schoelkopf,B.条件依赖的核心度量。美国国家统计局,2007年,20489-496.16。格雷顿。;英国福水。;Teo,C.H。;宋,L。;Schoelkopf,B。;斯莫拉,A.J.独立的核心统计专家;神经信息处理系统进展20:2007年第21届神经信息处理系统年度会议;麻省理工出版社:美国马萨诸塞州剑桥,2008.17。盖恩,我。;Janzing,D。;因果关系:目标和评估。J.马赫。学2010年决议,6 1–42.18。Sun,X.从多元时间序列评估非线性格兰杰因果关系。在机器学习和数据库中的知识发现方面;达勒曼,W.,戈塔尔,B.,莫里克,K.,编辑。;计算机科学课堂讲稿中的数字5212;施普林格:柏林/海德堡,德国,2008年;第440-455.19页。马里纳佐,D。;佩利科罗,M。;Stramaglia,S.Kernel Granger因果关系和动态网络分析。菲斯。牧师。E、 非线性软物质物理。2008, 77, 056215.20. Schoelkopf,B。;Tsuda,K。;Vert,J.P.计算生物学中的核方法。麻省理工学院出版社:美国马萨诸塞州剑桥,2004.21。黑斯蒂,T。;蒂布什拉尼,R。;弗里德曼,J.H.《统计学习的要素——数据挖掘、推理和预测》;斯普林格:纽约,纽约,美国,2009.22。Renyi,A.关于依赖性的测量。数学学报。阿卡德。Sci。挂。1959, 10, 441–451.23. 格雷顿。;斯莫拉,A。;布斯克,O。;赫布里奇,R。;贝利茨基。;奥加特,M。;村山,Y。;Pauls,J。;Schoelkopf,B。;Logothetis,N.依赖性测量的核约束协方差。《艺术情报与统计学会会刊》,巴巴多斯黑斯廷斯,2005年1月。霍夫曼,T。;Schoelkopf,B。;Smola,A.J.机器学习中的核心方法。安。统计数据2008,361171-1220.25。塞思,S。;普林西比,J.使用条件独立性的非参数度量评估格兰杰非因果关系。IEEE Trans。神经网络。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-5-5 08:48:36
学系统。2012, 23, 47–59.26. Schreiber,T.测量信息传输。菲斯。牧师。莱特。2000, 85, 461–464.27. 林德纳,M。;维森特,R。;普里斯曼,V。;Wibral,M.TRENTOOL:一个Matlab开源工具箱,用于使用传递熵分析时间序列数据中的信息流。BMC神经症。2011, 12, 119.28. 伦加拉,M。;石黑浩。;库尼约希,Y。;《量化二元时间序列因果结构的方法》。内J.分叉。混沌2007,17903–921.29。安伯拉德,P.O。;Michel,O.J.J.关于有向信息理论和格兰杰因果图。J.计算机。神经症。2011, 30, 7–16.30. 巴内特,L。;巴雷特,A.B。;Seth,A.K.Granger因果关系和转移熵对于高斯变量是等价的。菲斯。牧师。莱特。2009, 103, 238701.31. Seth,A.K.Granger因果连接性分析的MATLAB工具箱。J.神经症。方法2010186262–273.32。Anil Seth密码。Aviable online:http://www.sussex.ac.uk/Users/anils/aks密码htm(2014年4月20日查阅)。33。该代码可在http://www.sohanseth.com/Home/publication/causmci(于2014年4月20日查阅)。当数据较短或分析的时间窗口较短时,使用置换比旋转更为普遍。35.Hlavackova Schindler,K。;帕卢斯,M。;维梅尔卡,M。;Bhattacharya,J.基于时间序列分析中信息理论方法的因果关系检测。菲斯。众议员2007,441,1-46.36。查韦斯,M。;Martinerie,J。;le van Quyen,M.非线性因果关系的统计评估:癫痫脑电图信号的应用。J.神经症。方法2003、124、113–128.37。克努特,克努特。;戈莱拉,A。;咖喱。;休瑟,K.A。;K.R.惠勒。;Rossow,W.B.用信息论揭示了相关气候变量之间的相关性。《地球太阳系统技术会议记录》(ESTC 2005),加利福尼亚州奥兰治县,美国,2005年1月38日。古尔·埃维奇,B。;艾格蒙特,J.J。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群