全部版块 我的主页
论坛 经济学人 二区 外文文献专区
2022-5-6 07:00:01
尽管如此,DBHT、CL和k-medoids之间也存在差异:特别是在2008年危机之后的时期,DBHT和k-medoids出现了与CL不同的峰值。此外,对于k-medoids来说,相似性的下降似乎比2007年开始的时间早了一年多。所有这些特性对投资组合优化和系统风险评估都有重要意义。我们计划在未来的工作中研究这些影响。图9(f)显示了在每个时间窗口Tk中最大化前面图中所示的AdjustedRand索引的集群数量。正如我们所看到的,SL的NCL总是最高的,其次是AL、CL、k-medoids和DBHT。这与我们在“静态分析”一节中发现的情况一致:不同的聚类方法“隐藏”了层次结构不同层次的行业信息。SL andAL产生更高的Ncl(即层次结构中的较低水平),也是显示与行业分类相似程度最低、差异程度最高的方法。无花果。10 a)-f)我们展示了去趋势情况下的同一组图。与非去趋势情况的主要差异如下:o所有方法与工业分类的平均相似性均上升;这证实了我们在动态情况下发现的静态情况所有方法的平均NCL都较低:市场模式的缺失将行业分类“移动”到更高层次2001年9月11日和2002年的经济衰退对SL和AL模式的强烈影响似乎已经显现,而2007-2008年的危机在所有五种方法中仍然很明显。这可以解释为,前者是市场中的全球事件,而后者也表现出“局部”动态AL在动力学行为上表现出最明显的变化,显示出与DBHT和CL更相似的趋势。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-5-6 07:00:06
同样就Ncl而言,它显示的值更接近DBHT、CLand k-medoids,而不是SL。在“检索工业部门”的静态分析中也进行了类似的观察,结果表明,一旦市场模式取消,AL的表现与DBHT、CL和k-medoids类似。2000年2002年2004年2006年2008年2010年2012年20140.10.20.30.40.5tRadj(Tk)平均联系08/07:全球信贷紧缩蔓延美国官方宣布的经济衰退2000年2004年2008年2010年2012年20140.10.20.30.40.5tRadj(Tk)平均联系08/07:全球信贷紧缩蔓延雷曼兄弟违约11/09/0107/02:美国官方宣布的经济衰退降级;欧盟债务危机2000年2002年2004年2006年2010年2012年20140.10.20.30.40.5tRadj(Tk)c)完整链接08/07:全球信贷危机蔓延斯莱曼兄弟违约美国经济衰退官方宣布2000年2002年2004年2008年2010年2012年20140.10.20.30.40.5tRadj(Tk)d)单一链接雷曼兄弟违约美国降级;欧盟债务危机07/02:市场低迷美国经济衰退官方宣布08/07:全球信贷危机蔓延2000 2002 2004 2008 2010 20140.10.20.30.40.5tRadj(Tk)e)k-medoids08/07:全球信贷危机蔓延降级;欧盟债务危机美国经济衰退正式宣布2000 2002 2004 2006 2008 2010 2012 2014050100150200250300350tNcl f)DBHTSingle LinkageAverage LinkageComplete Linkagek Medoids图9。聚类和ICB相似性的动态演化。它显示了调整后的兰德指数Radj,在聚类和CB划分之间的每个时间窗口Tk(k=1,…,n)计算,对于a)DBHT,b)AL,c)CL,d)SL和e)k-medoids方法。2007-2008年危机期间,所有方法的相似性都有所下降。在其他财务事件中,AL和SL显示也有所下降。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-5-6 07:00:09
在每个时间窗口中,选择聚类数Ncl,以最大化Radjitself:在f)中,我们为每个聚类方法绘制这些Ncl值。很明显,根据聚类方法,在不同的层次上达到最大相似性聚类ICB。相关性是根据未去趋势的日志返回进行计算的。2000年2002年2004年2006年2008年2010年20140.20.30.40.5tRadj(Tk)a)DBHT08/07:全球信贷危机蔓延雷曼兄弟违约美国经济衰退官方宣布2000年2002年2004年2008年2012年20140.30.40.5tRadj(Tk)b)平均联系雷曼兄弟违约美国经济衰退官方宣布2008/07:全球信贷危机蔓延2000年2004年2008年2010年2012年20140.20.30.40.5tRadj(Tk)c)完整链接雷曼兄弟违约美国经济衰退官方宣布2000 2002 2004 2006 2008 2010 2012 20140.20.30.40.5tRadj(Tk)d)单一链接雷曼兄弟违约美国降级;欧盟债务危机08/07:全球信贷危机蔓延经济衰退官方宣布2000年2002年2004年2008年2010年2012年20140.20.30.40.5tRadj(Tk)e k-medoidsLehman Brothers违约2000年2002年2004年2008年2010年2012年2014050100150200250300tNcl f)DBHTSingle LinkageAverage LinkageComplete Linkagek Medoids图10。聚类和ICB之间相似性的动态演化,具有去趋势的日志返回。a) -f):与图9中的图相同,但使用DetrendLog返回的相关性。DBHT的稳健性:一个自举分析为了测试DBHT聚类对统计噪声的敏感性,不可避免地会出现不完全相关的估计,我们对数据集进行了自举测试[42]。该方法通过对日志返回矩阵进行随机重采样,生成每个原始相关矩阵的一组NBOOT副本。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-5-6 07:00:12
在相关矩阵的每个副本上,我们可以计算出一个新的DBHT聚类,最后得到一个NBootclustering样本,我们可以对其进行统计分析。详细描述2000年、2002年、2004年、2006年、2008年、2010年、2012年、201446810121416tNcla)经验回报率系列自举回报率系列2000年、2004年、2006年、2008年、2010年、2012年、20141214161820222426TNCLB)经验回报率系列自举回报率系列图11。动态DBHT聚类的稳健性测试。a) 聚类数ncl作为时间t的函数:黑色方块对应于通过使用经验(非去趋势)日志返回获得的DBHT聚类,蓝色圆点是100个自举副本相关矩阵给出的100个ncl的平均值(有关更多详细信息,请参阅文本)。蓝色点图中的条形误差是在同一组100 Ncl中计算的标准偏差。正如我们可以看到的那样,经验性CLI对自举测试非常强大。b) 与a)中的绘图相同,但使用DetrendLog返回。自举方法可以在SI中找到。在图11中,我们展示了在覆盖整个周期的所有100个时间窗口上执行的动态自举的结果。我们选择nboot=100:因此,每个时间窗口都有100个副本DBHTclustering。蓝点是DbHtClustering的nbootreplicas上的平均簇数,而误差条是在同一样本上计算的标准偏差。黑方块是DBHT产生的团簇的经验数量。左侧曲线图(a)通过使用非去趋势对数返回值获得,右侧曲线图(b)通过使用去趋势对数返回值获得。集群的经验数量图与我们在图中所示略有不同。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-5-6 07:00:15
8a)因为在这种自举分析中,我们没有对相关性使用指数平滑,而只使用裸相关性。事实上,指数平滑在每个时间序列的点之间造成了不对称,这使得自举测试不适用。总的来说,去除指数平滑平均会对每个NCL值产生20%的影响。从图中我们可以观察到,该方法在统计上是稳健的,大多数经验点与复制品的平均值只有一个标准差。更重要的是,复制品的平均值遵循经验点的总体趋势;即,在市场模式下呈下降趋势,在去趋势化的情况下,在2007-2008年危机后退出。讨论在本文中,我们提出了一组静态和动态分析,以量化通过不同层次聚类方法从相关矩阵中过滤的信息量。通过将行业分类基准(ICB)作为基准社区划分,我们对真实数据进行了定量分析,没有对回报分布进行任何假设。特别是,我们考虑了三种不同的链接方法(单一、平均和完全)和k-medoids,并将其与定向气泡层次树(DBHT)进行了比较,这是首次应用于财务数据的一种水平聚类方法。这些方法在检索ICB中编码的经济信息方面表现出显著不同的性能,甚至在链接方法之间也存在很大差异。我们建议,这些差异应与对市场模式动态的不同敏感度有关,而这反过来又应归因于工作原理基础方法的差异。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-5-6 07:00:19
此外,根据聚类方法,经济信息似乎隐藏在不同层次的层次结构中。DBHT和k-medoids方法表现出最好的性能,但后者受噪声的影响似乎比DBHT和链接方法大得多。结果证明,DBHTD是k-medoids和连杆机构优点的良好结合。动态分析还证明,这些方法对金融危机表现出不同程度的敏感性。这又是一个新的结果,可以深入了解此类事件的动态,并表明哪种聚类方法对金融应用更为稳健。我们还按照文献[27][40]中的标准程序,对市场模式下的原木收益率进行了分析。有趣的是,这种破坏趋势的效果与不同的方法非常不同,最薄弱的方法(平均和单一联系)显著提高了他们恢复工业部门的能力。一般来说,去趋势增加了聚类方法检索的经济信息的程度。这也使得集群更加同质化,这表明SL和AL的高度异质性一定是由于市场模式的动态。在未来的工作中,我们计划将目前的研究扩展到其他数据集,涵盖不同时期和不同证券交易所,并考虑其他依赖性指标,包括非线性依赖性,如肯德尔秩相关[43]和互信息[44][45]。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-5-6 07:00:22
最后,由于基于相关性的网络和聚类方法已被证明是投资组合优化的有用工具[20],[46,47],我们还计划利用这些对层次结构的新见解,进一步改善投资组合优化工具的当前性能。感谢作者感谢彭博社提供的数据。TDM希望感谢COST Action TD1210部分支持这项工作。TA感谢英国经济和社会研究委员会(ESRC)对系统性风险中心(ES/K002309/1)的资助。参考文献1。Mantegna RN(1999)金融市场的等级结构。欧洲物理杂志11:193.2。Onnela JP、Chakraborti A、Kaski K、Kert’esz J、Kanto A(2003)金融市场中的资产树和资产图。Phys Scr T106:48.3。Aste T,Di Matteo T,Hyde ST(2005)双曲面上的复杂网络。Physica A 346:20.4。Tumminello M,Aste T,Di Matteo T,Mantegna RN(2005)一种过滤复杂系统信息的工具。Proc Natl Acad Sci 102:10421-10426.5。Di Matteo T,Aste T(2002)欧洲美元利率表现如何?J Theoret ApplFinance 5:122-127.6。Di Matteo T,Aste T,Mantegna RN(2004)利率聚类分析。Physica A 339:181-188.7。迪马特奥T,Aste T,海德街,拉姆斯登S(2005)利率等级结构。Physica 335:21-33.8。Bartolozzi M,Mellen C,Di Matteo T,Aste T(2007)不同未来市场的多尺度相关性。欧洲物理杂志58:207-220.9。Onnela JP,Chakraborti A,Kaski K,Kert\'esz J(2003)动态资产树和黑色星期一。Physica A 324:247-252.10。Tola V,Lillo F,Gallegati M,Mantegna RN(2008)投资组合优化的聚类分析。杰肯·戴恩控制中心32:235-258.11。Fenn DJ,Porter MA,Mucha P,McDonald M,Williams S等(2012)汇率的动态聚类。定量金融12:1493.12。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-5-6 07:00:25
Di Matteo T,Pozzi F,Aste T(2010)利用动态网络检测金融市场部门的层级组织。欧洲物理杂志73:3-11.13。Tumminello M、Di Matteo T、Aste T、Mantegna RN(2007年)基于相关性的不同时间范围内采样的equityreturns网络。欧洲物理杂志B 55:209-217.14。Morales R,Di Matteo T,Aste T(2014)相关金融时间序列的依赖结构和标度特性。Sci Rep 4:4589.15。Aste T,Shaw W,Di Matteo T(2010)波动市场中的相关性结构和动态。纽约物理学院12:085009.16。Tumminello M、Lillo F、Mantegna RN(2010)金融市场中的相关性、等级和网络。J经济行为器官75:40-58.17。Anderberg MR(1973)应用聚类分析。学术出版社。18.Tumminello M,Coronnello C,Lillo F,Michich\'e S,Mantegna RN(2007)基于相关网络的生成树和自举可靠性估计。国际分岔混沌17:2319-2329.19。Aste T(2012)。一种计算平面最大过滤图(PMFG)的算法。统一资源定位地址http://www.mathworks.com/matlabcentral/fileexchange/38689-pmfg.20.Pozzi F,Di Matteo T,Aste T(2013)金融市场风险的扩散:更好地投资于周边地区。Sci报告3:1665.21。Song WM,Di Matteo T,Aste T(2012)通过拓扑嵌入图进行分层信息聚类。PLoS ONE 7:e31929。22.Aste T(2014)。一种计算有向气泡层次树(DBHT)聚类的算法。统一资源定位地址http://www.mathworks.com/matlabcentral/fileexchange/46750-dbht.23.Song WM,Di Matteo T,Aste T(2011)平面图中的嵌套层次结构。离散应用数学159:2135.24。Fortunato S(2010)图中的社区检测。物理报告486:75-174.25。Kaufman L,Rousseeuw PJ(1987)通过Medoid进行聚类。基于L-范数和相关方法的统计数据分析:405-416.26。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-5-6 07:00:28
MacQueen J(1967)多元观测分类和分析的一些方法。第五届伯克利数理统计与概率研讨会论文集1:281297.27。Borghesi C,Marsili M,Miccich\'e S(2007)通过市场模式的减法在金融回报中出现时距不变的相关结构。物理版E 76:026104.28。Hubert L,Arabie P(1985)比较分区。分类杂志2:193-218.29。Tumminello M,Michich\'e S,Lillo F,Varho J,Piilo J,等(2011)异质复杂系统的群落特征。J统计机械P01019。30.Coronnello C、Tumminello M、Lillo F、Michich e S、Mantegna RN(2011)在伦敦证券交易所交易的一组股票收益时间序列中的行业识别。波兰物理学报36:2653-2680.31。Tumminello M,Lillo F,Mantegna RN(2007)Kullback-Leibler距离作为从多变量数据中过滤信息的度量。物理版次E统计诺林软物质物理76:031123.32。Cont R(2001)资产回报的经验性质:程式化事实和统计问题。定量金融1:223-236.33。Mantegna RN,Stanley HE(2000)《经济物理学导论:金融中的相关性和复杂性》。剑桥大学出版社。34.Bonanno G,Caldarelli G,Lillo F,Mantegna RN(2003)真实和模型市场中基于相关性的最小生成树的拓扑。物理版次E统计诺林软物质物理68:046130.35。Wagner S,Wagner D(2007)比较聚类——综述。技术报告,ITI Wagner,卡尔斯鲁厄大学信息学院(第36届)。Feller W(2008)《概率论及其应用概论》,第2卷。约翰·威利父子公司。37.Tumminello M,Michich\'e S,Lillo F,Piilo J,Mantegna RN(2011)在二部复杂系统中的统计验证网络。公共科学图书馆一号6:e17994。doi:10.1371/期刊。波内。0017994.38.
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-5-6 07:00:31
Pearson K(1895)对双亲情况下的回归和遗传进行了说明。《伦敦皇家学会会刊》58:240-242.39。Pozzi F,Di Matteo T,Aste T(2012)指数平滑加权相关性。欧洲物理杂志B85:6.40。Ross G(2014)金融网络的动态多因素聚类。物理版次E统计诺林软物质物理89:022809.41。行业分类基准指南。统一资源定位地址http://www.icbenchmark.com/.42.Efron B(1979)引导法:另一种刀切法。Ann Stat 7:1-26.43。Kendall MG(1938)提出了一种新的等级相关性度量。Biometrika 30:81-93.44。Shannon CE(1948)通信的数学理论。贝尔系统技术期刊27:379.45。Fiedor P(2014)基于互信息率的金融市场网络。Phys Rev EStat Nonlin软物质物理89:052801.46。Nanda S,Mahanty B,Tiwari MK(2010)为porfolio管理对印度股市数据进行聚类。带应用程序的专家系统37:8793-8798.47。Pai GAV,Michel T(2009)为porfolio管理对印度股市数据进行聚类。小港口多样化的约束K-均值聚类资产进化优化13:1030-1053。支持信息1。数据集分析2%4%2%4%2%4%5%7%16%5%4%6%7%2%10%10%1%2%7%汽车和零部件银行基本资源计划建筑和材料金融服务食品和饮料健康护理工业产品和服务保险中介石油和天然气个人和家居用品房地产技术通信水平和休闲实用工具图12。饼图显示了按ICB超级部门划分的整套股票的构成。选择这组股票是为了提供市场上不同工业部门的重要样本。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-5-6 07:00:35
我们选择了ICB行业分类,该分类产生19个不同的超级部门,这些超级部门依次聚集在10个行业中:图12中报告了属于每个ICB超级部门的股票百分比。图13显示了两个图,总结了该数据集的主要特征。图表显示了平均价格P(t)≡价格的平均回报率≡NPiri(t),作为时间的函数。从这些图中,我们可以看到,互联网泡沫破裂(2002年)和信贷紧缩(2007-08年)都是由市场动态表现出来的。尤其明显的是,这两个时期的波动性都急剧增加,在时间上具有很强的自相关性:这是对数收益动态的一个众所周知的特征[32]。在2010年和2012年的信贷危机之后,也可以观察到这种波动性。S2。聚类方法:简要回顾我们的重点是最能描述市场相互依赖关系的层次结构(树状图),以及这种结构的聚类特征。为此,第一步是确定股票对之间的适当距离,了解它们之间的相关性。适当的函数[1]是Dij=p2(1- Cij):可以证明,通过这种选择,距离度量的三个属性是不同的。1996 1998 2000 2002 2004 2006 2008 2010 2012 20142025303540455055t’P(t)平均价格a)1996 1998 2000 2002 2004 2006 2008 2010 2014-0.2-0.15-0.1-0.0500.050.10.15t’r(t)平均原木返回量b)图13。1997年1月至2012年12月数据集的平均价格和日志回报。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-5-6 07:00:38
a) 数据集中342只美国股票的平均价格P(t);b) 相同价格的平均对数回报率r(t)。然后,我们最终得到一组N×N距离矩阵D(tk)和DR(tk),我们应用两种不同的、众所周知的工具来揭示隐藏的(未知的)依赖结构:o单链接(SL),这是一种分层聚类算法。给定距离矩阵,它开始为每个对象分配自己的簇,然后在每一步将最近(即最少持续)的簇对合并为一个新簇,直到只剩下一个簇。两个通用聚类A和B之间的距离每次都根据公式B=mina定义和更新∈A、 b∈BD(a,b)(15)SL被称为凝聚簇,因为它从N个簇的划分开始,然后进行合并。该方法的最终输出是一个树状图,该树状图显示了SL发现的层次结构。该树状图中定义的距离度量是超度量距离[1]。通过选择聚类数(这是一个自由参数)并在适当的水平上切割树状图,可以获得股票的适当聚类划分。该算法与给定距离矩阵D的最小生成树(MST)算法密切相关。MST是一种以股票为节点的树图,自Mantegna[1]的工作以来,它一直被用作经济物理学中的拓扑工具。它可以从一个空图开始生成:将C中的所有相关性按降序排序后,在相关性最高的两个股票/节点之间添加一个加权链接,然后继续进行下一对相关性;每当要添加的新链接生成循环时,不要添加该链接并跳到下一个链接,直到选中所有列表。这棵树正好含有N- 1链接。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-5-6 07:00:41
可以看出[16]MST算法基本上是SL过程,直到图形完全连接。因此,这两种工具之间存在着严格的关系。然而,MST保留了SL树状图丢弃的一些信息[16]。o平均链接(AL)是一种类似于SL的分层聚类算法。该算法与SL下的算法相同,但等式17替换为:dA,B=meana∈A、 b∈BD(a,b)(16)o完全连接(CL)是SL的第三种变体,其中等式17被替换为:dA,b=maxa∈A、 b∈BD(a,b)(17)o定向气泡层次树(DBHT)[21],一种新的层次聚类方法,利用PMFG(平面最大过滤图)的拓扑特性来发现聚类。PMFG是MST的推广,它作为子图包含在PMFG中。其构造遵循MST的相同程序,但非环路条件与较弱的平面性条件(即每个添加的链路不得切割预先存在的链路)不同。由于这种更宽松的拓扑约束,PMFG能够比MST保留更多的链接和信息。特别是,可以证明每个HPMFG正好包含3(N- 2) 链接。PMFG的基本元素是三个团,由三个节点组成的子图,所有节点都相互连接(即三角形)。DBHT利用这种拓扑结构,尤其是分离和非分离三个派系之间的区别,来识别PMFG中所有节点的聚类分区[21]。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-5-6 07:00:44
然后,通过传统的聚集聚类过程,得到完整的层次结构(树状图),包括簇间和簇内。链接算法查看已排序的距离列表,并通过收集距离最小的股票子集来构建树状图;然后,如我们所说,在选择参数“簇数”后,从树状图中获得聚类。DBHT相反地颠倒了顺序:首先通过平面图上的拓扑考虑来识别所有簇,然后构建簇间和簇内的层次结构。因此,差异既包括所利用的信息类型,也包括方法论方法k-medoids是一种与k-means密切相关的划分聚类方法[26]。它将集群的数量作为输入。该算法就是所谓的围绕medoid的划分(PAM),具体如下:1。在N个元素中随机选择Ncl“medoids”;2.将每个元素指定给最近的medoid;3.对于每个medoid,用分配给它的每个点替换medoid,并计算每个配置的成本;4.选择成本最低的配置;5.重复2)-4)直到没有变化。这种方法和这里考虑的其他方法一样,不是分层方法,因此不提供树状图,而只提供分区。集群标签库存数量单联汽车和零件银行基本资源计划建筑和材料金融服务食品和饮料健康护理工业产品和服务保险中介石油和天然气个人和家居用品房地产技术企业通讯水平和休闲设施1 2 3 4 6 7 8 10111213116170102040506070DBHTC库存数量集群标签图14。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-5-6 07:00:47
基于非去趋势对数回报的ICB超行业DBHT集群的股票数量和组成。构图是用不同的颜色表示的。S3。聚类组合:非去趋势的caseDBHT聚类组合在图14中,我们报告了通过使用非去趋势的日志返回,将DBHT方法应用于整个数据时间窗口(1997-2012)获得的聚类的图形摘要。DBHT返回的簇数Ncl等于17。第四大类由62只股票组成,约占股票总数的18%;第9组最小,包含4只股票。集群的平均规模为20.1只股票。正如我们所看到的,四个集群显示了只属于一个ICB超级部门的股票组成:集群9和13(石油和天然气)、11(技术)和14(公用事业)。类似的例子包括第8组,其中科技股超过86%,第15组,其中91%的股票来自零售,第16组(75%的股票来自医疗保健)和第17组(87.5%的股票来自食品和饮料)。此外,还有一些集群,虽然呈现出混合的组成,但由严格相关的超级部门组成:第6个由银行、金融服务和保险组成,所有超级部门都是ICB在同一行业(金融)的上级层级中聚集的。对于某个特定的超级部门或行业,有一些集群没有表现出过度表达:这一事实指出,集群毕竟提供了一种信息,不能仅限于行业分类。特别是集群1、3和12的组成不均匀,几乎覆盖了所有19个超级部门,没有哪个部门主导其他部门。集群4是一个中间案例,因为尽管它过度表达工业产品和服务(75%),但它包含属于9个不同超部门的库存。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-5-6 07:00:51
有趣的是,最大的集群(4、12、1和10)都是这些类型的“混合”集群。其他聚类组合我们在这里对相同的数据应用其他聚类方法,并将结果与DBHT聚类进行比较。考虑的聚类方法有单连杆法(SL)、平均连杆法(AL),完整链接(CL)1 2 3 4 5 6 7 8 9 1011121314151617050100150200250300350StocksCluster labelNumber of stocksCluster Labela)1 2 3 4 5 6 7 8 1011121314151617050100150200250300350 stocksCluster labelb的平均链接编号1 2 3 4 5 6 8 10111241516141516170702040608010140140 stocksCluster labelc的完整链接编号1 2 3 4 5 6 6 8 1011121314151617020408010120140k medoidsNumberstocksCluster labeld)图15。对于不同的聚类方法,在非去趋势对数回报上,根据ICB超部门的聚类组成。x轴代表单个集群标签,y轴代表每个集群中的股票数量。每种颜色对应一个ICB超反射体(图例与图14相同。图表显示了a)SL聚类的结果,b)AL,c)forCL和d)k-medoids。和k-麦迪奥德。后者不是一种层次聚类方法,因此它不提供树状图:然而,我们对其进行了分析,以将我们的结果与一种成熟的聚类方法进行比较。与DBHT不同的是,聚类数是这些方法的自由参数,在这些情况下选择为17,以便将条形图与DBHT的图14进行比较。我们在无花果中绘图。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-5-6 07:00:54
15 a)、b)、c)和d)通过使用这四种聚类方法获得的簇组成,即SL、AL、CLand k-medoids。首先,我们可以观察到,对于它们中的每一个,集群的大小都有很强的异质性:SL和AL分别显示了323和322个股票的两个巨大集群(几乎相同,共有318个股票),其他集群由一个、两个或三个股票组成。对于这两种算法,这个巨大的集群包含所有ICB部门的股票。对于CL和k-medoids,情况截然不同。对于CL来说,巨型集群(集群编号10)的规模大大缩小(136只股票),其他三个集群(数字12、9和5)也包含相应数量的股票(分别为50、33和25只):过度表达的主要超级群体是技术(集群12)、公用事业(集群5)、零售(集群9)、石油和天然气(集群16)和医疗(集群2)。k-medoids的结构非常相似,但巨型星团进一步分裂成两个大星团(7和10)。然而,DBHT聚类显示了ICB超切分体的大小和过度表达的最大程度的同质性,至少对于这个数量的聚类来说是如此(比较见图14)。将这些结果与对去趋势对数收益率的相同分析(本文中的图3和图4)进行比较,我们可以得出结论,市场模式的减法使所有聚类方法(SL除外)在规模上更加同质,并且更能够检索ICB分区。SL clusteringinstead似乎对这种减法不敏感,即使在去趋势的情况下,也不会过度表达任何ICB超反射体(图4a))。S4。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-5-6 07:00:57
稳健性的自举测试自举技术的基本思想如下[42]:假设,对于长度为L的给定时间窗口,我们有N个时间序列(每个股票一个),每个时间序列的长度为L。我们可以把这些数据放在一个N×L矩阵中,比如X,然后计算它的相关矩阵,比如ρ,以及使用DBHT的聚类,比如Y。现在,让我们为矩阵X创建一个副本XO,这样X的每一行在X的行中随机绘制,允许相同行的多个图形。从X我们可以再次计算相关矩阵ρ和聚类Y。通过不时重复这个过程,我们最终得到了一系列聚类,由于X和其副本之间的差异,每一个聚类都与原始聚类略有不同。该复制扫描样本可用于测试原始聚类Y中测量的任何数量的稳健性,例如聚类数。这可以通过检查原始度量值是否与副本的分布相兼容来实现,例如执行统计假设检验。0 100 200 300 400051015202530NclNDBHTa)0 100 200 300 400051015202530NclNAverage Linkage b)0 100 200 300 400051015202530NCLcomplete Linkage c)0 100 200 300 400051015202530NCLsingle Linkaged)集群标签库存数量单联汽车和零件银行基本资源计划建筑和材料金融服务食品和斜面健康护理工业产品和服务保险业GasPersonal&Home Goods Real EstatereTailtechnology ytelecommunications Strave&Leisure Utilities 0 100 200 300 400051015202530 NCLK Medoidise)图16。ICB超抗原在不同层次上过度表达。根据超几何假设检验(即被拒绝的检验次数),每个条形图显示了一个ICB超反射体被一个簇过度表达的次数(N),改变了簇Ncl的数量。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-5-6 07:01:00
每种颜色显示每个ICB超切面的过度表达数量。图a)-e)分别显示了DBHT、AL、CL、SL和k-medoids聚类的结果。相关性是根据非去趋势日志返回计算的。50 100 150 200 250 30000.10.20.30.40.5NclN′DBHTa)50 100 150 200 250 30000.10.20.30.40.5NclN′完整链接b)图17。ICB超射体在超几何测试中以成对簇/超射体的百分比过度表达。每个条形图显示,根据超几何刺激试验(即被拒绝的试验数量),不同簇Ncl的数量,ICB超切分体被簇过度表达的次数(N)除以执行的超几何试验总数(0.5×Ncl×NICB,含NICB ICB超切分体的数量):N=2nnl×NICB。每个颜色显示每个ICB超切面的过度表达数量。图a)-b)分别显示了BHT和CL聚类的结果。相关性是根据DetrendLog返回值计算的。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群