全部版块 我的主页
论坛 经济学人 二区 外文文献专区
1076 21
2022-06-14
英文标题:
《Determining the number of factors in a forecast model by a random matrix
  test: cryptocurrencies》
---
作者:
Andr\\\'es Garc\\\'ia Medina and Graciela Gonz\\\'alez-Far\\\'ias
---
最新提交年份:
2019
---
英文摘要:
  We determine the number of statistically significant factors in a forecast model using a random matrices test. The applied forecast model is of the type of Reduced Rank Regression (RRR), in particular, we chose a flavor which can be seen as the Canonical Correlation Analysis (CCA). As empirical data, we use cryptocurrencies at hour frequency, where the variable selection was made by a criterion from information theory. The results are consistent with the usual visual inspection, with the advantage that the subjective element is avoided. Furthermore, the computational cost is minimal compared to the cross-validation approach.
---
中文摘要:
我们使用随机矩阵检验确定预测模型中统计显著因素的数量。应用的预测模型是降秩回归(RRR)类型,特别是,我们选择了一种可以被视为典型相关分析(CCA)的模式。作为经验数据,我们使用小时频率的加密货币,其中变量选择是根据信息论的标准进行的。结果与通常的目视检查一致,优点是避免了主观因素。此外,与交叉验证方法相比,计算成本最小。
---
分类信息:

一级分类:Quantitative Finance        数量金融学
二级分类:Statistical Finance        统计金融
分类描述:Statistical, econometric and econophysics analyses with applications to financial markets and economic data
统计、计量经济学和经济物理学分析及其在金融市场和经济数据中的应用
--

---
PDF下载:
-->
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2022-6-14 15:44:46
通过arandom矩阵检验确定预测模型中的因素数量:cryptocurrenciesAndr'es Garc'a-Medina1,2*,Graciela Gonz'alez Far'as,1 Consejo National de Sciencia y y Tecnolog'a,Av。叛乱分子Sur 1582,Col.Cr'editoConstructor 03940,墨西哥进出口城。瓦伦西亚36240,瓜纳华托,墨西哥*安德烈斯。garcia@cimat.mxAbstractrandom矩阵测试。应用的预测模型属于缩减RankRegression(RRR)类型,特别是我们选择了一种可以被视为典型相关分析(CCA)的风格。作为经验数据,我们在hourfrequency使用加密货币,其中变量的选择是根据信息论的标准进行的。结果与通常的目视检查一致,优点是避免了主观因素。此外,与交叉验证方法相比,计算成本最小。简介加密货币是基于锁链技术的新型金融工具。硬币被定义为一系列数字签名。每个拥有者通过数字签名前一笔交易的哈希值和下一个拥有者的公钥并将其添加到硬币的末尾,将硬币转移到下一个拥有者。这种新的金融工具通过17000多个交易所以较低的交易费用、2000多种全球虚拟货币和600亿美元的交易额轻松获得,这使得加密货币成为了对普通民众非常有吸引力的投资工具。此前曾有人试图将货币的集体行为描述为工作的特征[3]。研究表明,一组以日为频率的大型货币数据集偏离了马尔琴科牧场的普遍结果【4】。此外,研究表明,生成树结构是随时间变化的。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-14 15:44:54
此外,在这项工作中[5]分析了比特币在一分钟到一天的长时间和不同频率水平下的幂律行为。他们得出结论,比特币在2<α<范围内表现出重尾。5跨多个交易所。他们的发现支持使用标准财务方法,因为结果的方差影响有限。相反,这项工作的目的是通过结合显然不相关的数学工具,并以新的加密货币工具为样本,提供与预测和投资问题相关的工具。因此,所提出的方法是通用的,可以应用于任何有兴趣分析的数据集。下一节将介绍加密货币数据集的预处理。接下来,在“变量选择”一节中,建议使用转移熵May 3,2019年1月17日ARXIV:1905.00545v1【q-fin.ST】2,2019年5月,从信息论的角度衡量,以区分预测变量集和响应变量集,即解决任何预测模型固有的变量选择问题。在预测模型部分,介绍了一般回归模型,其中构建了所研究的模型。然后,在高维水平上工作时,利用随机矩阵理论在所提出的多响应回归模型中选择适当数量的因子。然后,在因子数部分,针对典型相关分析的特殊情况,描述了高维统计中某些结果与降秩选择问题之间的数学关系。最后,在结论部分总结了主要研究结果,并提出了未来的工作。数据使用CoinMarketCap【2】的API,对ofp=100加密货币进行抽样,总ofn=4533次观察(见S1文件和S1表)。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-14 15:44:58
我们计算每种加密货币(k=1,…,p)和时间(t=1,…,n)的标准价格szk(t)=Zk(t+t)- Zk(t)Zk(t),(1)通过这种方式,增广Dickey-Fuller检验[6]确保所涉及的时间序列是平稳的,对于所有考虑的返回时间序列k(k=1,…,p),p值小于0.01。变量选择在尝试设置预测模型时,首先要解决的问题之一是变量选择问题。通常,在计量经济学方法中,经济理论规定哪些变量必须被视为预测变量,哪些变量必须被视为响应变量。然而,加密货币是一种新的金融工具,其背后的经济模型并不多。因此,我们采用信息方法来解决变量选择问题。2000年,T.Schreiber在信息论的背景下引入了量传递熵(TE),目的是以非对称的方式测量从一个过程到另一个过程的信息流。Letxi=x(i)和yi=y(i),i=1,N、 表示系统X和Y的观测序列。TE定义为[7]TY→X(k,l)=Xi,jp(xt+1,X(k)t,y(l)t)logp(xt+1 | X(k)t,y(l)t)p(xt+1 | X(k)t),(2)TE背后的思想是通过关联之前的样本xind yi来预测下一个值Xi+1,并量化与广义马尔可夫性质p(Xi+1 | Xi,yi)=p(Xi+1 | Xi)的偏差,其中pDenotes表示转移概率密度。如果广义马尔可夫性质没有偏差,则y对X.TE没有影响,X.TE表示为p(xi+1 | xi,yi)和p(xi+1 | xi)之间的Kullback-Leibler熵[8],量化了该假设的不正确性,并且在xind-yi交换下显式不对称。TE的一个有趣特性是,在某些条件下,它可以被视为Granger因果关系的非线性推广。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-14 15:45:01
在计量经济学中,格兰杰因果关系在向量自回归(VAR)模型的参数估计中起着重要作用。2019年5月3日2/17格兰杰因果关系假设因果关系先于结果,并且因果关系中包含唯一且不存在于其他变量的有关结果的信息。考虑联合平稳随机过程Xt,Yt。让Fxt | x(k)t-1,y(l)t-1.表示目标变量X的分布函数,条件是关节(k,l)-历史X(k)t-1,Y(l)t-那么,变量Y被称为Granger因果变量x(滞后于k,l),当且仅当[9,10]Fxt | x(k)t-1,y(l)t-1.6=Fxt | x(k)t-1.. (3) 因此,可以说,当且仅当X不独立于Y的历史时,Y-Granger导致X。存在一系列结果[11-13],表明Granger因果关系和TE统计数据之间在数据生成过程的不同方法和假设下是完全等价的,这使得TE能够构建为纯Granger因果关系的非参数检验。这种联系可以看作是自回归模型下数据因果关系与信息论方法之间的桥梁。在继续之前,我们想强调的是,对于高度非线性和非高斯数据,如许多金融工具的情况,最好通过信息方法来处理因果关系,而不是传统的格兰杰因果关系检验[10]。在实际数据应用中,我们需要根据观测数据估计TE。有几种技术可以根据观测数据估计TE,但大多数技术对数据有很大的需求,因此由于样本效应较小,通常存在偏差,从而限制了TE在实际数据应用中的使用。为了避免这种估计。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-14 15:45:08
符号转移熵(STE)已被引入置换熵的概念中【14】。在【14,15】之后,通过对时间序列xind yi的振幅值重新排序来定义符号。因此,对于给定的i,m任意振幅值,元素{x(i),x(i+l),…,x(i+(m- 1) l)},(4)按升序{x(i+(ki1)排列- 1) l)≤ x(i+(ki2- 1) l)≤ ··· ≤ x(i+(kim- 1) l)},(5),其中l表示时间延迟,m表示嵌入维数。符号被定义为^xi=(ki1,ki2,…,kim),符号的相对频率是这个过程的一个例子,让我们用时间序列{,,,,,}来估计信息论的相关香农熵测度[16]。首先,我们需要根据五对邻居的相对值来组织它们。因此,发现三对xt<xt+1{}两对,其中xt>xt+1代表置换{10}。然后,m=2的香农熵由h(2)=-(3/5)日志(3/5)- (2/5)日志(2/5)≈ 0.971. (6) 现在让我们回到TE估计的原始问题。给定符号序列{xi xi}和{yi},STE在数学上定义为[15]TSY→X=Xi,jp(^Xi+δ,^Xi,^yi)logp(^Xi+δ| Xi,^yi)p(^Xi+δ| Xi),(7)其中总和在所有符号上运行,δ表示时间步。日志以2为基数,因此TSY→Xis以位表示。2019年5月3日2017年3月3日,此时的问题是,给定的STE经验测量值是否在统计上不同于0,是否代表变量之间存在直接关系的充分证据。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

点击查看更多内容…
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群