全部版块 我的主页
论坛 经济学人 二区 外文文献专区
2022-6-1 18:02:12
我们还感谢朱利亚·利维耶里(Giulia Livieri)和巴黎科尔理工学院(cole Polytechnique)数据科学暑期学校(Data Science Summer School)、卡利亚里的XLI AMASES年会(XLI AMASES Annual Meeting)以及米兰的第十八届量化金融研讨会(XVIII Workshop in Quantitative Finance)的与会者提出的建议。参考文献【Abadi等人,2015年】Abadi,M.、Agarwal,A.、Barham,P.、Brevdo,E.、Chen,Z.、Citro,C.、Corrado,G.S.、Davis,A.、Dean,J.、Devin,M.、Ghemawat,S.、Goodfello,I.、Harp,A.、Irving,G.、Isard,M.、Jia,Y.、Jozefowicz,R.、Kaiser,L.、Kudlur,M.、Levenberg,J.、Mane,D.、Monga,R.、Moore,S.、Murray,D.、Olah,C.、Schuster,M.、Shlens J.、Steiner B.、Sutskever I.、Talwar K.、Tucker、,P.、Vanhoucke,V.、Vasudevan,V.、Viegas,F.、Vinyals,O.、Warden,P.、Wattenberg,M.、Wicke,M.、Yu,Y.和Zheng,X.(2015)。TensorFlow:异构系统上的大规模机器学习。tensor Flow提供的软件。组织。【Acemoglu等人,2012年】Acemoglu,D.、Carvalho,V.M.、Ozdaglar,A.和Tahbaz Salehi,A.(2012年)。聚合函数的网络起源。《计量经济学》,80(5):1977-2016年。【A ffinito和Pozzolo,2017】A ffinito,M.和Pozzolo,A.F.(2017)。跨全球金融危机的银行间网络:来自意大利的证据。《银行与金融杂志》,80:90–107。【Altman等人,1994年】Altman,E.I.,Marco,G.,和Varetto,F.(1994年)。企业困境诊断:使用线性判别分析和神经网络进行比较(意大利经验)。《银行与金融杂志》,18(3):505–529。【Arcagni等人,2017年】Arcagni,A.、Grassi,R.、Stefani,S.和Torriero,A.(2017年)。复杂网络中的高阶分类。《欧洲运筹学杂志》,262(2):708–719。【Bargigli等人,2015年】Bargigli,L.、di Iasio,G.、Infante,L.、Lillo,F.和Pierobon,F.(2015年)。银行间网络的多元化结构。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-1 18:02:15
定量金融,15(4):673–691。【Battiston等人,2012年】Battiston,S.、Puliga,M.、Kaushik,R.、Tasca,P.和Caldarelli,G.(2012年)。Debtrank:太中心而不能失败?金融网络、美联储和系统性风险。科学报告,2。【Bergstra和Bengio,2012】Bergstra,J.和Bengio,Y.(2012)。超参数优化的随机搜索。机器学习研究杂志,13(2月):281-305。【Blondel等人,2008年】Blondel,V.D.,Guillaume,J.-L.,Lambiotte,R.,和Lefebvre,E.(2008年)。大型网络中社区的快速发展。统计力学杂志:理论与实验,2008(10):P10008。【Boginski等人,2005年】Boginski,V.,Butenko,S.,和Pardalos,P.M.(2005年)。金融网络的统计分析。计算统计与数据分析,48(2):431–443。[Boss等人,2004年]Boss,M.、Elsinger,H.、Summer,M.和Thurner 4,S.(2004年)。银行间市场的网络拓扑。定量金融,4(6):677–684。【Chawla等人,2002年】Chawla,N.V.,Bowyer,K.W.,Hall,L.O.,和Kegelmeyer,W.P.(2002年)。Smote:合成少数超采样技术。《艺术情报研究杂志》,16:321–357。【Chollet等人,2015年】Chollet,F.等人(2015年)。凯拉斯。【Cimini等人,2015年】Cimini,G.、Squartini,T.、Garlaschelli,D.和Gabrielli,A.(2015年)。重建经济和金融网络的系统风险分析。科学报告,5:15758。【Clauset et al.,2009】Clauset,A.、Shalizi,C.R.和Newman,M.E.(2009)。经验数据中的幂律分布。暹罗评论,51(4):661–703。【Crouhy等人,2000年】Crouhy,M.,Galai,D.,和Mark,R.(2000年)。当前信用风险模型的比较分析。《银行与金融杂志》,24(1):59–117。【Crouhy等人,2001年】Crouhy,M.,Galai,D.,和Mark,R.(2001年)。原型风险评级系统。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-1 18:02:18
《银行与金融杂志》,25(1):47–95。[DErrico等人,2017年]DErrico,M.、Battiston,S.、Peltonen,T.和Scheicher,M.(2017年)。信用违约掉期市场的风险如何流动?金融稳定杂志。【Elliott等人,2014年】Elliott,M.、Golub,B.和Jackson,M.O.(2014年)。金融网络和传染。《美国经济评论》,104(10):3115–53。【Friedman等人,2001年】Friedman,J.、Hastie,T.和Tibshirani,R.(2001年)。统计学习的要素,第1卷。纽约统计局的斯普林格系列。【福山和马托塞克,2016】福山,H.和马托塞克,R.(2016)。银行绩效建模:网络dea方法。《欧洲运筹学杂志》,259(2):721–732。【Garcia Bernardo等人,2017年】Garcia Bernardo,J.,Fichtner,J.,Takes,F.W.,andHeemskerk,E.M.(2017年)。揭示离岸金融中心:全球企业所有权网络中的渠道和汇。科学报告,7(1):6246。【Garlaschelli和Loff redo,2005年】Garlaschelli,D.和Loff redo,M.I.(2005年)。世界贸易网络的结构和演变。Physica A:统计力学及其应用,355(1):138–144。【Greene,2003】Greene,W.H.(2003)。经济计量分析。培生教育(印度)。【Grunert等人,2005年】Grunert,J.、Norden,L.和Weber,M.(2005年)。非财务因素在内部信用评级中的作用。《银行与金融杂志》,29(2):509–531。【Gupte等人,2011年】Gupte,M.、Shankar,P.、Li,J.、Muthukrishnan,S.、Iftode,L.(2011年)。在定向在线社交网络中查找层次结构。《第20届万维网国际会议记录》,第557-566页。ACM。【Huang等人,2009年】Huang,W.-Q.,Zhuang,X.-T.,和Yao,S.(2009年)。中国股市的网络分析。Physica A:统计力学及其应用,388(14):2956–2964。【Huremovic和Vega Redondo,2016】Huremovic,K.和Vega Redondo,F.(2016)。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-1 18:02:21
生产网络。[Kim等人,2002年]Kim,H.-J.,Lee,Y.,Kahng,B.,和Kim,I.-m.(2002年)。财务相关性中的加权无标度网络。《日本物理学会杂志》,71(9):2133-2136。[科古特和沃克,2001年]科古特,B.和沃克,G.(2001年)。德国的小世界和国家网络的持久性。《美国社会学评论》,66(3):317–335。[Lee,2007]Lee,Y.-C.(2007)。支持向量机在企业信用评级预测中的应用。专家系统与应用,33(1):67–74。【Mann和Whitney,1947年】Mann,H.B.和Whitney,D.R.(1947年)。测试两个随机变量中的一个是否随机大于另一个。《数学统计年鉴》,第50-60页。【纽曼,2010】纽曼,M.(2010)。网络:简介。牛津大学出版社。[纽曼,2002]纽曼,M.E.(2002)。网络中的分类混合。物理评论,89(20):208701。【Nier等人,2007年】Nier,E.,Yang,J.,Yorulmazer,T.,和Alentraft,A.(2007年)。网络模型和财务稳定性。《经济动力与控制杂志》,31(6):2033–2060。[Ohnishi等人,2009年]Ohnishi,T.、Takayasu,H.和Takayasu,M.(2009年)。日本企业间网络的中心和管理机构:大型DirectedNetwork中节点的特征描述。理论物理进展补充,179:157–166。【Parnes,2012】Parnes,D.(2012)。用软信息近似违约概率。《信贷风险杂志》,8(1):3。【Pedregosa等人,2011年】Pedregosa,F.、Varoquaux,G.、Gramfort,A.、Michel,V.、Thirion,B.、Grisel,O.、Blondel,M.、Prettenhofer,P.、Weiss,R.、Dubourg,V.、Vanderplas,J.、Passos,A.、Cournapeau,D.、Brucher,M.、Perrot,M.和Duchesnay,E.(2011年)。Scikitlearn:Python中的机器学习。机器学习研究杂志,12:2825–2830。【Pozzi等人,2013年】Pozzi,F.,Di Matteo,T.,和Aste,T.(2013年)。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-1 18:02:24
风险在整个金融市场的扩散:最好投资外围地区。科学报告,3:1665。【Romei等人,2015年】Romei,A.、Ruggieri,S.和Turii,F.(2015年)。公司共享网络的分层结构。IEEE数据科学和高级分析,DSAA-2015,第1-10页。IEEE。【Rodam等人,2009年】Rodam,K.B.,Bech,M.L.,等人(2009年)。danishinterbank money Flows的拓扑结构。银行和银行系统,4:48–65。【Serrano和Bogun\'a,2003年】Serrano,M.a.和Bogun\'a,M.(2003年)。世界贸易网的拓扑结构。物理复习E,68(1):015101。【Simon,1991】Simon,H.A.(1991)。复杂性的架构。《系统科学的各个方面》,106(6):457–476。[斯米尔诺夫,1939年]斯米尔诺夫,N.V.(1939年)。关于两个独立样本的经验分布曲线之间差异的估计。公牛数学莫斯科大学,2(2)。【Soram–aki等人,2007年】Soram–aki,K.、Bech,M.L.、Arnold,J.、Glass,R.J.和Beyeler,W.E.(2007年)。银行间支付流程的拓扑结构。Physica A:统计力学及其应用,379(1):317–333。【Souma等人,2006年】Souma,W.,Fujiwara,Y.,和Aoyama,H.(2006年)。日本所有权网络的变化。《经济物理学的实际成果》,第307-311页。斯普林格。【塔蒂,2017】塔蒂,N.(2017)。对等层:发现分层加权网络的实用算法。数据挖掘与知识发现,31(3):702-738。【Treacy和Carey,2000年】Treacy,W.F.和Carey,M.(2000年)。大型美国银行的信用风险评级系统。《银行与金融杂志》,24(1):167–201。【Tumminello等人,2011年】Tumminello,M.、Michich\'e,S.、Lillo,F.、Varho,J.、Piilo,J.、andMantegna,R.N.(2011年)。异构复杂系统的群落特征。统计力学杂志:理论与实验,2011(01):P01019。【Vitali等人,2011年】Vitali,S.、Glattfelder,J.B.和Battiston,S.(2011年)。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-1 18:02:27
全球公司控制网络。《公共科学图书馆一号》,6(10):e25995。【Watanabe等人,2012年】Watanabe,H.、Takayasu,H.和Takayasu,M.(2012年)。日本企业间交易网络的偏差扩散:从网络结构估计销售额。《新物理学杂志》,14(4):043034。【Wilson和Sharda,1994年】Wilson,R.L.和Sharda,R.(1994年)。利用神经网络进行破产预测。决策支持系统,11(5):545–557。数据集和网络度量A。1数据集该数据集是根据意大利一家主要银行支付平台的交易数据构建的,共有4700万条记录。表3按客户状态列出了交易量的详细信息。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-1 18:02:31
表4显示了各公司的评级分布,并根据客户状态对其进行了分类。表3:按客户状态划分的交易量百分比,该行表示付款人的状态,列收件人月份否ex NA否ex NA monthJan 0.000 0.036 0.001 0.001否0.000 0.014 0.000 0.000 Feb0.009 0.604 0.030 0.110 yes 0.027 0.543 0.037 0.1540.000 0.046 0.002 0.003 ex 0.000 0.037 0.000 0.0020.000 0.149 0.002 0.006 NA 0.000 0.184 0.001 0.000Mar 0.000 0.015 0.000 0.000 no 0.000 0.000 0.018 0.000 0.000 Apr0.023 0.541 0.037 0.151是0.023 0.525 0.033 0.1550.000 0.036 0.0000.002 ex 0.000 0.040 0 0.000 0.0020.000 0.193 0.001 0.000 NA 0.000 0.199 0.003 0.000 5月0.000 0.018 0.000 0.000 no 0.000 0.015 0.000 0.000 0.000 6月0.023 0.542 0.035 0.144是0.018 0.534 0.037 0.1720.000 0.040 0 0 0 0 0 0 0.001 ex 0.033 0.000 0.0010.000 0.194 0.001 0.000 NA 0.000 0.000.189 0.001 0.000 7月0.000 0.014 0.000 0.000否0.000 0.014 0.000 0.000 Aug0.019 0.538 0.031 0.181是0.018 0.591 0.0290.1400.000 0.031 0.000 0.002 ex 0.000 0.029 0.000 0.0010.000 0.183 0.001 0.000 NA 0.000 0.172 0.005 0.000Sep 0.000 0.015 0.000 0.000 0.000 no 0.000 0.013 0.000 0.000 Oct0.019 0.599 0.027 0.131是0.022 0.581 0.029 0.1410.000 0.032 0.000 0.001 ex 0.000 0.037 0.0010.175 0.001 0.000 NA 0.000 0.175 0.000 0.000 11月0.000 0.015 0.000 0.000否0.000 0.014 0.000 0.000 12月0.013 0.578 0.037 0.165是0.012 0.578 0.036 0.1940.000 0.031 0.000 0.001 ex 0.000 0.028 0.001 0.0010.000 0.158 0.000 0.000 NA 0.000 0.137 0.000 0.000A。2时间聚合从时间数据中定义网络时,选择分析的时间尺度至关重要,因为它会对拓扑产生深刻影响。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-1 18:02:34
较短的时间尺度(每日或每周)强调不同的行为,例如,一旦流动性可用,将首先向哪个供应商付款。更长的时间尺度有助于更稳定地描述企业之间的供应链结构。表4:按客户状态和评级划分的节点每月平均分布情况。状态等级计数%%,等级为2121 0.000,非客户M 4592 0.003 0.010incl。NA H 305 0.000ND 676762 0.990customerL 87801 0.305M 95893 0.333 0.702H 18811 0.065ND 85841 0.298 FORMERL 3901 0.017M 7850 0.179 0.340H 926 0.017ND 41775 0.767总计1026577 0.217为了直观地了解不同的行为,可以考虑两个数量。第一个是链接和节点的持久性,通过计算节点或边在不同时间聚合的网络中出现的次数来衡量。从图6可以看出,大多数节点仅在几天内处于活动状态,而一小部分核心企业全年都非常活跃。其次,图7显示了不同时间聚合的网络大小,包括节点数和链路数。有趣的是,对于每日聚合,请参见左面板,两个数量都显示出很高的周期性,峰值非常高(系数~ 5)每个月底。这种影响在每周汇总中也很明显,见(中央面板),但在每月时间尺度中则不明显。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-1 18:02:38
最后一个观察结果表明,选择每月网络作为本次分析的重点。0 100 200 300天10 20 30 40 50周1 6 12个月设计链接图6:天数、周数的柱状图,不同时间聚合的节点活动月数(蓝色)和边缘存在月数(绿色)Janfebmar Apr May JunJulAug Sep Oct Nov Dec0.20.40.60.81.2·10天Janfebmar Apr May JunJulAug Sep Oct Nov Dec0.51.5·10周Janfebmar Apr May JunJulAug Sep Oct Nov Dec·10个月图7:每天、每周和每月的节点数(蓝色)和链接数(绿色)。只有使用更长时间的聚合,才能消除周期性。A、 3网络度量网络的组件是节点的子集,这样任何一对节点之间都有路径,无论是无向的(弱连接组件),还是有向的(强连接组件)。从网络的定义可以清楚地看出,没有孤立的节点,因为最小的弱组件至少包括两个节点,即付款人和受款人。由于这在许多其他真实网络中很常见,因此可以识别一个弱组件,其数量级与整个网络的数量级相当。在我们的例子中,这个giantcomponent(GC)平均包含98%的节点。相反,考虑到最大的强连接组件(SCC),它包括大约20%的节点,但超过一半的链路。因此,强连接组件的密度比整个网络或弱连接组件的密度大一个数量级。有关这些数量的更多详细信息,请参见中的表5。在网络蝴蝶结结构的标准定义中,GCB中但强连接组件外部的节点被划分为In组件(链路到达强连接组件的节点)和out组件(可从SCC到达的节点)。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-1 18:02:41
in组件中没有传入链接的节点代表每月约一半的活跃企业,其活动是零星的。表5:最大弱连接(GC)和强连接(SCC)组件的百分比大小(%n)和密度(ρ)。最后一列(%w)包含SCC中节点之间传输的相对体积相对于总体积。GC SCC月%nρ%nρ=mn(n-1) %wJan 0.989 3.4·10-60.232 3.29 · 10-50.75年2月0.989 3.21·10-60.237 2.99 · 10-50.69年3月0.980 3.15·10-60.235 2.98 · 10-1980年4月50日3.16·10-60.231 3.09 · 10-50.67 5月0.981 3.16·10-60.232 3.06 · 10-50.696月0.980 3.11·10-60.230 3.03 · 10-50.69年7月0.982 3.05·10-60.237 2.88 · 10-2010年8月50日970年8月3日-60.204 3.23 · 10-1981年9月0日3月31日10月50日-60.233 3.23 · 10-1981年10月0日3.00·10月50日-60.237 2.81 · 10-2010年11月0日-60.227 3.00 · 10-50.65Dec 0.979 2.81·10-60.228 2.69 · 10-50.67表6:使用【Clauset al.,2009】中描述的算法获得的所有月份度和强度分布的幂律拟合结果。α参数是拟合指数,Kmin和Wmin参数是估计的最小值,之后分布的行为与幂律尾一致。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-1 18:02:44
由于支付量是按比例计算的,因此wmin的值没有多少信息,因此对于strengthF(wmin)=1- 改为报告EDCF(wmin)。学位强度月αinkinminαoutkoutminαinF(winmin)αOUT(woutmin)一月2.55 159 2.85 24 1.89 0.03 1.89 0.01二月2.56 148 2.80 19 2.10 0.03 1.99 0.01三月2.53 125 2.70 44 2.11 0.03 1.97 0.01四月2.67 257 2.82 22 2.14 0.03 2.01 5月2.66 227 2.83 23 2.12 0.03 2.07 0.01六月2.58 135 2.83 23 2.07 0.03 1.96 0.01 7月2.52 124 2.80 21 2.07 0.03 2.02 0.01 8月2.62 236 2.74 14 2.07 0.03 1.94 0.01 9月2.64 187 2.83 32 2.09 0.04 2.03 0.01 10月2.53 129 2.75 25 2.05 0.03 1.95 0.01 11月2.59 134 2.83 19 2.06 0.03 2.04 0.01 12月2.55 180 2.62 41 2.06 0.03 1.98 0.01表7:度和强度的分类系数。具有额定值的列指具有已知额定值的节点的子图。列customers指的是customer status为yes的节点的子图。所有评级客户的属性度强度节点均为评级客户jan-0.035-0.035-0.046-0.036-0.031-0.046Feb-0.027-0.029-0.036-0.030-0.031-0.039Mar-0.025-0.030-0.038-0.027-0.027-0.037Apr-0.027-0.030-0.029-0.041可能-0.026-0.033-0.039-0.027-0.026-0.035Jun-0.025-0.027-0.032-0.028-0.030-0.037Jul-0.025-0.028-0.036-0.028-0.028-0.038Aug-0.027-0.035-0.040-0.032-0.034-0.041Sep-0.024-0.027-0.030-0.028-0.030-0.036Oct-0.028-0.028-0.037-0.032-0.033-0.043Nov-0.023-0.028-0.031-0.026-0.028-0.035Dec-0.027-0.030-0.034-0.031-0.035-0.041B风险分配b。1度和风险多项式logistic回归旨在对具有两种以上结果的分类问题的概率进行建模。在这里,我们将反应(L、M、H)视为分类和有序。实际上,这意味着要找到最适合modellog的参数P(r≤ 五十) P(r>L)= aL+bLX。。。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-1 18:02:48
+bpLXp+日志P(r≤ M) P(r>M)= aL+bMX…+bpMXp+。a和bi·是预测因子,a和bi·是系数。我们考虑了p=1的情况,其中预测因子是X=k的程度,以及p=2的情况,其中大小也用作预测因子X=s。下表8显示了b系数,以及统计显著性的指标。表8:多项式逻辑回归系数。前两列是指与作为唯一预测因子的程度的回归。最后四列指的是回归,其大小也是预测值。上标表示预测值:k表示度,s表示大小。下标表示风险评级。星号表示显著性:如果p值<0.05,则为一颗星,如果p值<0.01BKLBKKBKLBSLBSLBKMBSMJAN 0.258**0.352**0.261**-0.007 0.312**0.091**2月0.221**0.305**0.210**0.024**0.233**0.159**3月0.226**0.314**0.220**0.013 0.237**0.173**4月0.243 0.328**0.240**0.007 0.270**0.131**5月0.229 0.324**0.206**0.050 1**0.237**0.195**6月0.239**0.325**0.232**0.017*0.237**0.199**7月0.238**0.344**0.227**0.026**0.263**0.187**8月0.183**0.272**0.175**0.020*0.179**0.211**9月0.238**0.355**0.218**0.046 0.255**0.228**10月0.220**0.329**0.207**0.030**0.232**0.220**11月0.226**0.338**0.211**0.034**0.233**0.234**12月0.219**0.331**0.220**-0.002*0.231**0.227**B.2风险分类表9:风险分类系数评级具有额定值的列是指具有已知额定值的节点的子图。列customers指的是customer status为yes的节点的子图。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-1 18:02:51
在最后两列中,对分类性指标进行了修改,以考虑权重,具体而言,eijis是以体积分数计算的,而不是边缘数(有关更多详细信息,请参阅正文)。公制标准权重节点(所有带有评级客户端)JAN-0.063 0.025 0.035 0.073 0.115 0.109Feb-0.066 0.026 0.038 0.106 0.181 0.188Mar-0.067 0.025 0.039 0.073 0.150 0.150Apr-0.067 0.026 0.036 0.069 0.154 0.156May-0.067 0.025 0.038 0.065 0.146 0.139Jun-0.068 0.026 0.039 0.060 0.150 0.1287月-0.072 0.025 0.037 0.046 0.142 0.137 8月-0.078 0.025 0.040 0 0.078 0.1490.224Sep-0.067 0.025 0.040 0 0.087 0.168 0.216Oct-0.076 0.024 0.037 0.080 0.151 0.213Nov-0.072 0.024 0.039 0.070 0 0.175 0.149Dec-0.082 0.024 0.040 0.037 0.199 0.151要测试节点在传入和传出付款之间是否显示不同的偏好,我们定义数量(in)i(X)=w(in)i(X)- aX  br(i)1- aX▄br(i),X∈ {L,M,H}(out)i(X)=w(out)i(X)- ar(i)bX1- ar(i)bX,X∈ {L,M,H}。该符号与(1)中的定义一致:r(i)是节点i的风险;aX,bx是整个网络中从或到额定值为X的节点的体积百分比,w(out)i(X)(w(in)i(X))是从(到)节点i到(从)额定值为X的节点的体积百分比。通过按额定值分组节点获得样本,共有18(=(3个额定值)·2个方向)分布。例如,从L到Mis的超额体积百分比分布如下所示:{i(M)(out)| i∈ L}~ F(out)L(M)。类似地,从H输入M的过量体积百分比由下式得出{i(H)(in)| i∈ M}~ F(in)M(H)。请注意,通常,F(in)X(Y)6=F(in)Y(X)。我们进行了两组测试。在第一种情况下,我们确定一个评级,并比较某个评级的超额和超额百分比。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-1 18:02:54
在所有情况下,零假设都被很低的p值所拒绝,但要给出总体结果的经济学解释并不容易:对于所有评级,向L的超额百分比大于流入量的类似百分比,而向H和从H支付的超额百分比则相反。在第二组测试中,我们确定了评级和方向(向内或向外),我们比较了所有评级的超额百分比。此外,在这种情况下,所有测试都会以非常低的p值拒绝null,因此我们可以对分布进行排序,并评估相关的偏好。对于出货量,在所有情况下,评级L优先于风险更高的产品。对评级为M的节点的付款优先于风险为M和H的节点,但对于评级为L的节点,付款顺序为最后。对于收入付款,情况略有不同。评级为M和H的节点首选评级为M,其次是L。而评级为DL的节点的付款则相反。B、 3社区内风险分布的检验正文中采用的统计检验旨在评估给定的比率在某一子集中的代表性是否过低或过高,这是通过本文描述的一种划分方法获得的。一般来说,这意味着测试单个子集中的评级分布是否与考虑整个样本获得的无条件分布有统计学差异。为此,我们计算p值,该p值表示在无效假设下观察每个社区中给定数量评级的概率,即评级在社区中分布,如同在整个样本中一样。如【Tumminello等人,2011年】所示,零位下的概率是超几何分布。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-1 18:02:57
此外,由于对每个社区进行了多个测试(每个评级和社区一个测试),因此对多个假设测试的p值进行了修正。特别是,选择了Bonferroni校正,即固定了p值的阈值Ps,校正后的阈值由PSNR给出,其中Nr是测试次数。校正前,ps=1%时的is通量阈值。具体地说,给定一个分区{Ci},计算以下数量Kx,i={Ci中的节点,等级x}ni={Ci中的节点}Kx={Ci中的节点}N={节点},p值由p=(p(y>Kx,ikx,ini>KxN)p(y<Kx,ikx,ini<KxN),y~ 超几何KLN、KMN、KHN;N.请注意,{Kx}和Nare是在考虑中的特定月度网络中计算的。在以距离为条件的分布情况下,通过考虑节点对来获得子集。例如,计算距离kfrom H处等级为L的节点的分数asp(k)HL=|{(i,j):d(i,j)=k,i∈ H、 j∈ 五十} | |{(i,j):d(i,j)=k,i∈ H} |。其他方法产生的分区在子集的数量和大小方面非常不同,因此为了使测试具有可比性,只有社区包括至少500个已知等级的节点。在模块化的情况下,子集按大小降序排列。请注意,由于每个月活动节点集和子集的标签都会发生变化,因此无法轻松地跨月比较子集的行为。表10和表11给出了测试的总结,记录了每个月和风险等级无效假设被拒绝的次数,分为超过(+)和低于(-) 代表性。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-1 18:03:00
最后两列包含分别测试的数字类,以及总计(nC)。表10:测试结果汇总:模块化M H+++-+测试nC95%nCJan 4 9 8 6 5 17 19 71 2月5日9 9 9 7 20 1900Mar 5 13 7 2 8 4 20 20 20 70APR 4 9 7 7 7 7 6 19 20 20 20 2年5月3 9 8 7 5 18 18 18 1856年6月5 11 6 21 15 2148 7月6 10 5 3 18 18 18 1862 UG 5 12 8 8 8 5 26 08 9 9 9 2 4 4 4 12 1879年10月11 9日12 12 12 12 12 12 12 1922Nov 5 9 9 4 4 4 4 5 18 18 18 8 12 12 12 10 3 7 3 19 152323表11:测试结果总结:分层M H+++-+测试的nC95%nC hJan 5 5 4 3 5 12 11 18 0.75Feb 5 4 4 5 12 11 17 0.74Mar 4 4 4 4 4 4 12 18 0.74Apr 4 4 3 6 12 10 0.75May 6 4 4 3 6 12 18 0.74Jun 5 3 4 4 6 12 11 17 0.75Jul 4 3 3 3 3 4 5 5 12 11 10.74Aug 6 3 5 5 5 5 5 5 5 14 10 0.789月5 4 4 4 4 4 4 4 4 6 10 10 10 0.7410 5 3 4 3 5 12 11 17 0.73 11月5日3 4 3 5 12 10 180.75Dec 4 3 4 3 7 12 12 19 0.75C分类。1数据预处理众所周知【Friedman et al.,2001】重新缩放/转换数据,以便∈ [0,1]或∈ [-1,1]或标准化,通常可以提高分类的性能,尤其是当不同的预测因素具有非常不同的规模时。所以,在训练模型之前,我们进行数据预处理,特别是:i.对于入度和出度,我们使用度对数的分位数变换。上述这些量的幂律尾部分布解释了这种选择,目的是避免数据过于分散;二。分类的预测因素已经∈ [0,1]不需要预处理;iii.将节点分布到层次类中是标准化的,即每个秩被移位并重新缩放为平均值0 ad方差1;iv.模块是唯一的分类变量。通常的二进制转换会为每个可能的值生成一个新的二进制变量。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-1 18:03:03
如前所述,模块的数量非常多,但其中一小部分包含几乎所有的节点,因此我们只保留那些节点数超过500个的模块,并将所有剩余的模块合并为一个剩余类;v、 分位数变换也适用于大小的对数分布。C、 2模型训练和超参数优化模型训练使用已实施的软件包进行:对于多项式逻辑和分类树,使用了Scikit learn Python软件包【Pedregosa等人,2011年】,而对于神经网络,使用了Keras Python软件包【Chollet等人,2015年】和Tensor Flow【Abadi等人,2015年】。然而,在优化过程中,定义模型架构的参数,即所谓的超参数,保持不变。因此,通常的做法是使用这些超参数的不同值来训练许多模型,并根据所选指标比较性能。关于这一主题的深入讨论超出了本文的范围,我们参考【Bergstra和Bengio,2012】和相关文献以获取详细信息。这里,我们对感兴趣的超参数应用一个简单的网格搜索。这对于一步和两步分类都已完成。我们采用的指标考虑了风险类别的领域特定解释。特别是,我们希望对低风险类别的更多错误分类进行处罚,即→\'L,H→\'M,H→\'L和towardsdistant类,即L→\'\'H,H→L.因此,除了标准精度和调用外,我们还考虑精度wsacc、召回wsrec、精度wspr的加权分数,这是混淆矩阵C的函数。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-1 18:03:06
带符号Cx,y=|{x→ y}|,C·,y=XxCx,y,x、 y型∈ {L,M,H}X表示实际类,而'X表示预测类。wsacc=C·、·Xx、y∈{L,M,H}Cx,yPaccx,y,Pacc=1.-0.25-0.5-零点七五一-0.25-1.-零点七五一wsrec=Xx,y∈{L,M,H}Cx,yCx,·Precx,y,Prec=1.-0.25-0.75-零点七五一-0.25-1.-0.75 1.75wspr=Xx,y∈{L,M,H}Cx,yC·,yPprx,y,Ppr=1.-0.25-0.75-零点七五一-0.25-1.-0.75 1.75对于分类树,感兴趣的超参数是深度,即分类需要满足的最大条件数(或从根到叶的最长路径的长度)。深度值越高,训练误差越小,但可能导致过度拟合。我们考虑了深度值从3到10。对于一步模型,深度为6的树是最佳选择,而对于两步模型,第一步树的深度为9,第二步树的深度为5,获得了最佳结果。对于神经网络来说,感兴趣的超参数是隐藏层的数量和大小。与之前一样,这些值增加太多可能会导致过度拟合。为了避免在添加层时参数数量过多,我们会随着它们数量的增加不断减小它们的大小(直观地说,参数的数量增加为qi | li |,其中| li |是第i层的大小)。例如,对于1(隐藏)层,节点数在10到100之间,而对于两个层,每个节点数从5到10。对于一步模型,使用1层50个节点可获得最佳结果,而对于2步模型,最佳选择是第一步使用2层5个节点,第二步使用1层10个节点。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群