全部版块 我的主页
论坛 经济学人 二区 外文文献专区
2022-6-11 06:51:13
考虑到标准差,表2表明,与A-book客户相比,B-book客户的交易行为稍有波动,这支持了采访中的结论,即优秀的交易员遵循一致的策略。表2还强调了处置效应是一个潜在的区别因素。前十大特征中有几个旨在通过对比交易者保持胜负头寸的持续时间来捕捉处置效果。最后,特征分布的第三和第四时刻暗示了好交易者和坏交易者之间的一些差异。然而,如逻辑回归的失败所示,将这些差异转化为分类规则是困难的,并且可能不可能用线性模型。为了进一步证实这一解释,在线附录提供了使用射频分类器对特征重要性的分析【11】。基于RF的重要性权重(见在线附录第3节)与表2明显不同,根据RF,Fisher评分中十个最重要的特征仅达到中等重要性等级。这可能证明特征响应关系或特征相互作用中存在非线性,这两者都是菲舍尔分数无法适应的。在使用基于信息融合的敏感性分析重新评估特征重要性时,我们在第6.1节中进一步阐述了这一点【58,59】。5.4. 数据组织、评估标准和基准分类我们使用n倍交叉验证来评估ML模型的预测性能。与将数据单独划分为训练集和测试集相比,重复n次建模和评估可以提高结果的稳健性。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-11 06:51:16
在随后的比较中,我们考虑了n=10和n=5的设置。客户分类问题表现出类别不平衡和不对称的错误成本。假阴性(FP)错误对应于将A-book客户端错误分类为B-book客户端。一个假阳性(FP)错误描述了另一种情况,即B客户被误分类为高风险交易员。FP错误的经济含义是做市商对冲B客户的交易。这不太合适,因为B类客户平均亏损。这些客户的损失代表了市场制造商的利益,但如果交易被对冲,则损失将为零。FN的错误更为严重,因为未能对冲高风险交易员的交易可能会给做市商带来巨大损失。为了反映这种成本不对称,我们根据模型预测,根据对冲交易产生的收益或损失(P&L)评估了分类模型。损益表说明了每笔交易的实际利润/损失。此外我们对交易中的损益进行了平均值稳定2:前十大特征的描述性统计FeatureMean标准偏差描述A book B book A book B book A book B BookProfxdur20 0.325 0.332 0.172 0.178 0.994 0.962利润与持续时间的交互作用20 Harperatio20 0.443 0.446 0.081 0.085 1.097 1.131回报率平均值/标准偏差20 0.496 0.504 0.241 0.248 0.346 0.328平均利润客户利率WinTradeRate 20 0.621 0.626 0.203 0.207-0.203-0.210客户平均赢利率Avgopen 0.534 0.539 0.218 0.228-0.345-0.311损益平均值amongtrader的前20个交易持续率20 0.319 0.322 0.119 0.121-0.148-0.161客户离开赢家与输家持仓的平均时间20 0.251 0.244 0.357 0.353 1.151 1.197theFTSE100DurationRatio20 0.127 0.128 0.067 0.070 3.398 3.812平均交易持续时间(分钟)/标准偏差。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-11 06:51:19
交易持续时间平均卖空20 0.487 0.482 0.269 0.274-0.027-0.018空头头寸份额平均回报20 0.502 0.503 0.052 0.057-0.295 0.065。从A客户和B客户返回最近20笔交易。所得平均数分别提供FN错误cFN和FP错误cFP的平均成本估计。然后,我们计算每个交易类别的平均、类别相关误分类成本为:cFN·F N R+cFP·F P R,以获得第二个货币绩效测量。基于类别平均值而非交易水平利润/损失,平均误分类成本(AMC)对于模型分类正确且异常值的特定交易更为稳健,而损益反映了在我们的数据样本中部署分类器的真实货币影响。因此,这两项措施相辅相成。最后,有几个标准指标可用于评估分类模型的性能。为了全面了解模型性能,我们考虑了接收机工作特性曲线(AUC)、灵敏度、特异性、精度、G均值和F测度下的面积。绩效指标的选择从以前的文献[60,61]中汲取了灵感,涵盖了一系列流行的指标。对其优缺点的详细讨论超出了本文的范围,但可在文献[11]中找到。粗略地说,AUC评估分类师区分a和B类客户的能力。敏感性和特异性描述了班级级别的分类准确度,因此是AMC测量的基础。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-11 06:51:22
精确性强调模型检测高风险交易者的能力,而G均值和偏离度量则是为了对类别不平衡的稳健性而设计的。为了将DNN的性能与基准进行比较,我们选择了五个ML分类器作为基准,包括logistic回归、ANN、RF、自适应boosting(Adaboost)和支持向量机(SVM)。有关分类的全面描述,请参见,例如,【11】。我们在在线附录的第2节中报告了我们在模型选择过程中考虑的超参数设置,我们还详细介绍了超参数调整。6、实证结果实证分析将DNN与体现领域知识的基准分类和基于规则的对冲策略进行了比较。它还揭示了DNN性能的起源。6.1. 基于DNN和ML的基准分类的预测准确性我们首先在表3中给出了关于不同分类在不同评估标准下的预测性能的结果。粗体字根据评估标准突出显示性能最佳的模型。损益和资产管理公司价值以英镑计量,并指单个交易。例如,我们观察到的DNN的P&L值为121.67,这意味着根据DNN推荐对传入交易进行对冲,做市商平均每笔交易将赚取121.67英镑。另一方面,AMC的值为483.84,表明甲骨文模型知道每一笔交易的结果并进行相应的对冲,将为做市商每笔交易产生483.84英镑的收益。显然,oracle模型的最优套期保值是一个理论基准。表3中的所有值代表平均值,我们从10倍交叉验证中获得。表3:DNN与。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-11 06:51:25
基准ML ClassifierSP&L AMC AUC敏感度特定精度G-均值F-得分N 121.67 483.84 0.814 0.631 0.994 0.987 0.792 0.661登录111.67 926.45 0.705 0.293 0.997 0.982 0.540 0.402ANN 109.14 915.73 0.635 0.301 0.997 0.982 0.545 0.408随机森林107.18 928.61 0.720 0.291 0.997 0.983 0.538 0.404AdaBoost 101.24 937.48 0.638 0.284 0.996 0.981 0.532 0.383SVM 68.34 825.56 0.691 0.3700.995 0.984 0.598 0.430表3提供了建议DNN优越性的证据。它在多个性能指标上的性能大大优于ML基准。唯一的例外是规格,所有分级器的性能接近完美,RF与其他型号相比有一点优势。就STX最相关的指标损益而言,我们观察到与logitmodel相比,有9%的改善;第二个货币指标AMC的改善更为显著。DNN的性能大约是ML基准的两倍。表3中的其他指标阐明了AMC结果的来源。所有分类器都实现了高规格和高精度,同时我们观察到在灵敏度方面存在很大差异。精度接近1表明,每当模型将交易分类为高风险并建议对冲时,这种分类通常是正确的。这对于比较中的每个分类都是正确的。然而,DNN具有更高的敏感性,这意味着它在此类高风险交易中识别出了更大的比例。因此,DNN对冲了来自A-book客户的更多交易,避免了相应的损失。在这方面,可以将表3解释为DNN实施了比基准更为谨慎的风险管理战略的证据。结果在G-均值和F-测度方面证实,DNN分别在灵敏度、特异性和精度之间实现了更好的平衡。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-11 06:51:28
AUC结果补充了评估,并表明DNN实现了更好的排名性能。根据模型估计的类别概率对交易进行排名,DNN比基准更准确地区分A客户和B客户的交易,实现了比(次优)RF分类高13%的AUC。就货币表现而言,有意思的是,考虑一下为什么DNN在AMC方面比在损益方面显示出更大的边缘基准。这两个指标因结构不同而不同。损益表考虑交易的实际回报,而资产管理公司则分别基于a客户和B客户交易的平均回报。考虑到做市商面临巨大损失的交易,损益将比资产管理公司更严重地惩罚该交易的错误分类。因此,表3表明,DNN对一些大额亏损交易进行了错误分类,基准模型预测正确。这可能表明,DNN和其他分类器的组合可以比单独使用NN表现得更好。然而,如果不同类别的个体表现非常不同,那么利用它们之间的协同作用并非微不足道。例如,从表3可以清楚地看出,DNN和其他一个分类的简单平均预测将降低预测精度。考虑到表3中DNN的外观表现,我们将对预测组合的评估留给未来研究,并将重点放在澄清DNN表现的来源上。分类器的性能取决于特征及其预测值。explanatorydata分析没有识别出具有高预测能力的单一特征。一个简单的logit模型,仅使用表2的特征,几乎是随机的。为了更清楚地了解特征响应关系,我们采用了基于信息融合的敏感性分析(IFBSA)。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-11 06:51:31
IFBSA最初由【58】提出,已在多个研究中使用,通过多重分类的视角来检验特征重要性【60、62、63】。IFBSA首先评估单个特征的重要性,即没有该特征的模型误差与包含该特征的模型误差的百分比比率【62】。IFBSA对所有特征重复此评估。在评估特征对模型性能的边际影响时,IFBSA的第一步与基于RF的特征重要性权重具有相似性,感兴趣的读者可以在在线附录中找到。IFBSA和基于RF的特征之间的一个重要区别在于前者考虑了几种不同的分类模型(即我们案例中表3的分类)。设st(x)表示预测的分类t=1。。。,T表示特征向量x(例如,p(A-client | x))。然后,我们可以将T分类委员会的组合预测写成:^yffuse=ψ(s(x),s(x)。。。,sT(x))(9),其中ψ表示融合单个分类预测的机制。考虑到归一化权重ωtsuch为ptt=1ωt=1的线性融合函数,方程(9)变为【59】:如果BSA根据分类器的预测性能确定分类器权重ωt,则^yffuse=TXt=1ωtst(x)(10)。这确保了更好的分类(如表3中的DNN)获得更高的权重,同时考虑了所有分类者对特征的意见。更具体地说,让Vt、kdenote表示分类t中特征k的归一化特征重要性权重。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-11 06:51:34
然后,将(10)中的预测st(x)替换为Vt,k,我们得到最终的图5:根据IFBSA的特征重要性【58,8】图6:每个特征组的IFBSA重要性。该特征的融合重要性权重为【60】:Vk(fused)=TXt=1ωtVt,k(x)(11)。将IFBSA应用于表3的分类结果,我们得到了融合特征重要性权重的分布,如图5所示。我们强调了基于Fisher评分的重要性分析(见表2)确定为前十大最重要特征的特征。图5描述了我们数据集中五组特征的聚合FBSA重要性权重。图5中的特征重要性分布显示了两个断点。有一小部分信息量大的功能。我们还观察到,在重要性等级适中的情况下,一个大集合覆盖了大约一半的剩余特征。IFBSA将相对较低的重要性权重赋予其余特征。Fisher得分评估的前十大特征(见表2)属于第二组。IFBSA认为这些是中等重要的。鉴于IFBSA和Fisher评分从根本上不同的角度考虑了功能重要性,因此他们的重要性排名之间存在差异。我们将图5作为二进制响应和特征之间复杂依赖关系的证据,Fisher分数无法捕捉到这一点。例如,Fisherscore排名没有纳入IFBSA发现最相关的特征。将图5中的三组特征分别描述为与预测目标非线性相关、线性相关和不相关的特征。然而,表3对这一解释提出了挑战,因为线性logit模型的性能与非线性分类器相当。ANN、SVM、RF等。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-11 06:51:37
应该能够从图5中排名靠前的特征中提取预测值,如果这些特征与目标非线性相关,则logit模型能够提取预测值。然而,在多个预测绩效指标中,他们的预测似乎并不比logit模型的预测更准确。回想一下,IFBSA折扣是所有分类的特征重要性信号,但在通过(10)和(11)计算最终融合特征重要性权重时,根据分类性能对这些信号进行加权。表3显示,DNN的表现明显优于基准。因此,融合权重略微倾向于DNN结果(ωDN N≈ 20%)。因此,我们希望图5中的等级也能反映出特征对潜在的、抽象的交易者行为特征表示的贡献,DNN通过其深层架构从数据中提取。然而,这种解释需要进一步分析,以更好地了解DNN成功的起源及其与特征的联系。随后的章节阐明了这些问题。为了总结使用IFBSA的自然重要性评估,我们从图6中注意到,特征中的预测信息总量均匀分布在五类特征中。6.2. DNN预测准确度的先例表3证明,对于此处使用的特定数据集,DNN优于ML基准。为了检验模型性能的稳健性,澄清神经网络成功的前因很重要。DNN的一个特点是其多层-深层结构。先前的研究建立了模型深度与其表达能力之间的联系,这表明深度是预测准确性的决定因素。使用无监督的预培训也将DNN与ML基准区分开来。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-11 06:51:40
通过发现更抽象、更具生成性的特征来帮助模型训练,我们期望预测准确性能从预训练中受益。第三个有趣的因素是classimbalance。倾斜的类别分布是分类的一个众所周知的障碍。因此,DNN对阶级不平衡更为稳健也可以解释表3的结果。在下文中,我们将检查这三个因素的影响和重要性。6.2.1. 深层结构DNN在最后一层生成预测,其中最后一层输出神经元接收来自SDA前几层的组合输入,并使用softmax函数将这些信号转换为类概率预测。此网络配置相当于对隐藏层的输出运行LogisticRetression。为了阐明深层结构的价值,我们将DNN预测与普通logistic回归预测进行比较,并将原始特征作为协变量。logistic模型代表了一种从DNN中去除深层隐藏层并仅维持最后一层的方法。这有助于评估分布式表示(distributedrepresentation)的优点,深度隐藏层从原始特征中提取分布式表示。图7显示了DNN和简单logit模型的接收机工作特性(ROC)和精度召回(PR)曲线。情节强调,深层架构实质上提高了网络的辨别能力。logit模型在原始特征上的性能几乎是随机的。DNN的AUC值为0.812,这表明对DNN从原始特征中学习到的高级表示进行相同的回归,有助于可靠地检测阳性类别。因此,DNN成功地从输入数据中提取预测特征。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-11 06:51:44
在评估图7时,重要的是要注意,logit模型并不是要对astrong基准做出贡献。如表3所示,具有特征选择的正则化logit模型的性能优于随机模型。图7的目的是评估深层架构的整体效果,并将其与使用原始特性进行比较,这促使使用普通logit模型进行比较。分析得出的总体结论是,深层架构会影响DNN的预测性能。ROC/精度-召回曲线调用/假阳性率精度0.0 0.2 0.4 0.6 0.8 1.00.2 0.4 0.6 0.8真阳性率0.00.20.40.60.81.0Logistic[0.092,0.481]深度学习[0.286,0.812]图7:DL和logit的ROC(黑色)、精度召回曲线(灰色)。6.2.2. 无监督预训练提出的DNN使用无监督预训练进行表征学习和特征提取。为了证实预训练的优点,我们在无监督的预训练阶段检查每个神经元的辨别力。我们的目的是检查DNN是否学习分布式表示,以帮助区分A和B-book客户机与未标记数据。为此,图8提供了DNN第一dA层神经元激活值的组织图。柱状图显示,当从B-book客户处收到交易时,ActivationValue往往小于0.4。来自A-book客户的交易通常会导致激活值为0.4及以上。虽然激活值的大小无关紧要,但不同类型客户的交易激活值的差异说明,即使使用未标记的数据,第一dA层的神经元也不同于B-book客户交易。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-11 06:51:47
由于激活值和输入信号之间的关系不再是单调的,层之间复杂的非线性变换禁止了这种分析在更高层的复制。然而,图8提供了初步证据,表明利差交易数据有助于使用预训练提取更高层次的生成性特征。为了更深入地了解激活值与不同类型交易者的交易之间的联系,我们研究了在神经元中触发高激活值的交易是否值得对冲。我们首先计算第一层每个神经元的最大和最小激活值,以及这些边界之间的20个等距阈值。后续分析基于单个神经元。我们选择了神经元和相应的阈值,通过手动检查,可以在A和Bbook客户端交易之间进行最纯粹的分离(见图8)。使用这个神经元,我们找到了100个最能激活神经元的交易。图9绘制了这些交易的总体损益分布图。结果表明,在少数假阴性的情况下,97%的交易最大程度地激活了神经元激活值密度0.0 0.2 0.4 0.6 0.8 1.00 0.5 1.0 1.5 2.0 2.50.0 0 0.2 0.4 0.6 0.8 1.00.0 0.5 1.0 1.5 2.0 2.5图8:a-book(深色)和B-book(浅色)客户交易的第一dA层激活值直方图。-5000 0 50000.0000 0.0005 0.0010 0.0015利润与亏损约翰逊苏美:-97.35,倾斜:-88.02,峰度:753381图9:测试集的前100个最佳神经元刺激结束,让做市商损失惨重。如神经元的激活水平所示,对冲这些交易在经济上是明智的。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-11 06:51:50
虽然最终的对冲决策是基于DNN的整体预测,但单神经元分析提供了进一步的证据,证明SdA层的无监督预训练可以提取指示交易风险的模式。这证实了DNN从输入数据中学习分布式表示,这最终有助于区分其他客户的高风险交易员。6.2.3. 阶级不平衡效应的分析越来越多关于深度不平衡学习的文献表明,DL模型继承了其ML祖先对阶级不平衡的脆弱性【64】。另一方面,预训练可以使所提出的DNN对类倾斜具有一定的鲁棒性。预培训是在无监督的情况下进行的,这样班级不平衡就不会妨碍模型培训。图8表明,在没有类别标签的情况下,预培训提取了有助于区分高风险交易员和B-book客户的模式。只有DNN可以访问此信息,这可能会使其在表3的比较中优于ML基准。为了测试这一点,我们在使用SMOTE(合成少数类过采样技术)算法解决类不平衡后重复比较。通过在实际少数群体案例附近创建艺术少数群体案例,打击补救措施类倾斜【65】。我们执行SMOTE,直到arti-ficially createdA book客户端的数量与B-book客户端的数量相等,然后重复对过采样数据进行分类比较。由于SMOTE增加了观察次数,进而增加了训练amodel的时间,我们将交叉验证次数减少到5次。请注意,过采样仅在训练数据中发生。验证折叠反映了数据中真实的类分布,从而对模型性能给出了无偏的看法。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-11 06:51:53
表4详细说明了分类器对过采样数据的预测性能。我们发现SMOTE可以改善所有分类。除了极少数例外,表4中的结果显示出比表3更高的性能,而且改进的幅度通常很大。表4:应用SMOTEP&L AMC AUC敏感度规格精度G-均值F-得分DNN 283.31 243.17 0.889 0.815 0.996 0.992 0.896 0.804Logit 260.45 525.57 0.806 0.600 0.983 0.979 0.751 0.397ANN 233.55 484.19 0.858 0.632 0.974 0.967 0.785 0.438随机森林262.85 581.22 0.792 0.557 0.988 0.979 0.742 0.519AdaBoost 259.45484.19 0.803 0.632 0.974 0.967 0.785 0.438SVM 204.35 930.26 0.825 0.619 0.992 0.984 0.779 0.522例如,使用SMOTE时,DNN的AUC高出9%(0.889 c.f.0.814)。其他分类机构也有类似或更大的改进。例如,使用SMOTE(0.858 c.f.0.635)时,ANN分类器的anAUC值比使用SMOTE时高35%。敏感性结果实质上更好,这证实了SMOTE提高了一个阶层对少数族裔的认识。更高的灵敏度往往以降低规格和精度为代价。然而,表4显示,分类性能在规格和精度方面几乎与应用Smote之前一样好。因此,G-mean和F-score强调,SMOTE分别在敏感性(回忆)和特异性与精确度之间实现了更好的平衡。同样,损益表和资产管理公司对SMOTE的评级也更高。我们还发现一些证据表明,DNN优于ML基准的利润率下降。例如,考虑到AUC对分类者的辨别能力进行了全面评估,过采样后最强的基准是ANN,DNN的表现优于3.6%(0.889 c.f.0.858)。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-11 06:51:56
在表3中,DNN相对于AUC亚军的优势为13%(RF为0.814立方英尺0.720)。对这种趋势的一种解释是,表3给出了NN性能的乐观图。DNN和ML基准之间的精度差距小于表3所示的精度差距,如果ML基准以使用SMOTE补救类不平衡的形式接受辅助调整。然而,这一观点也意味着DNN对类不平衡更为稳健。虽然得益于SMOTE,但与ML基准相比,SMOTE准确识别高风险交易者的能力较少依赖于对少数群体的过度抽样。这一解释源于表4与表3相比,表4中的性能改进幅度,表3通常比ML基准更接近DNN。对不平衡的更高鲁棒性与图8中关于无监督预训练优点的结果一致。6.3. 风险管理的影响基于模型的对冲政策包括对冲按模型分类为A-book的客户的交易,并承担所有其他交易的风险。为了阐明拟议DNN的管理价值,我们将其损益与基于规则的对冲策略进行了比较。一种基于规则的方法是STX当前的政策,该政策涉及在前20次交易中获得5%以上回报的客户的对冲交易。此外,我们还开发了三种自定义套期保值启发式算法。我们的第一项政策Custom 1依赖于图10:DNN的平均每笔交易损益(以英镑计)和基于规则的对冲政策Sharpe比率,并挑选出在过去20笔交易中达到高于平均Sharpe比率的交易员。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-11 06:51:59
我们认为,确保风险调整后的回报高于平均水平表明交易员的专业技能。由于专业精神只是成功交易历史的一个原因,Custom 2启发式解决了另一组交易者,我们将其描述为过度自信。此类交易者可能会表现出比其他市场参与者更高的收益,并表现出积极的交易行为,表现为更大的批量、更高的频率和更短的时间间隔交易【66】。因此,自定义2启发式方法考虑了平均交易持续时间和交易次数,以推断出可能构成更大风险的交易者。第三种策略,Custom 3,对冲自与STX交易以来业绩良好的客户的交易。理由是,在早期经历中失败的交易员可能会退出。有长期记录的交易者要么是真正成功的(应该对冲),要么是预期价值为负的赌徒(不应该对冲)。按照这一思路,STX面临的最重要的挑战来自新的A-book客户。与Custom 3的比较揭示了DNN识别此类新客户的能力,因为相比Custom 3的改进表明DNN认识到Custom 3基于跟踪记录的逻辑无法捕获的高风险交易员。我们还考虑了一组通过多数投票构建的自定义基于规则的启发式算法。基于规则的策略利用领域知识,采用演绎方法。为了补充分析,我们以分类树的形式添加了归纳法。树木被视为一种美丽的分类植物。然而,决策者对树的理解程度取决于树的深度。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-11 06:52:02
为了便于解释,我们考虑了两个层次的分类树(ctree)。图10显示STX的当前政策是最合适的演绎对冲策略。《习惯逻辑1-3》借鉴了金融理论。然而,这三种方法中的每一种,以及其中的一个组合,都比STX不会对冲任何交易的假设基线设置表现更差。观察自定义1-3的性能低于此基线支持这样一种观点,即focaltrader分类任务是一个具有挑战性的问题。按照这条推理路线,图10我们感谢一位匿名评论员,他提出了Custom 3启发式的逻辑。还强调STX政策的合理性。与演绎STX方法不同,基于树的启发式方法从过去的数据中学习。我们观察到这棵树使用了三个特征:交易员在与STX的最初20次交易中的平均损益,在过去20次交易中直到平仓的最小分钟数,以及过去20次交易中的平均夏普比率。这些特性显示出与自定义启发式的相似性。例如,考虑交易者的初始表现遵循Custom 3的逻辑。风险调整回报的会计处理类似于自定义1。最后,考虑到交易者对损失的反应,该树使用其中一个变量来捕捉处置效果。我们观察到两级树产生的P&L略大于STX启发式。这表明,交易员过去的平均表现(体现在TSX方法中)在一定程度上近似于更复杂的树规则集。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-11 06:52:06
尽管利差交易市场中准确套期保值的重要性表明,STX方法采用基于树的方法进行了修订,但图10中的另一个结论是,与当前政策和我们考虑的其他基于规则的套期保值策略相比,实施基于DNN的套期保值策略使STX能够进一步改善损益。与STX启发式方法相比,DNN将每笔交易利润提高121.67-88.28=33.40英镑,这意味着大幅改善。STX启发法代表了合作公司的既定业务实践,反映了多年的行业经验。此外,启发式算法执行速度非常快,并且完全透明。DNN的情况截然不同。对传入交易进行更准确的分类,基于DNN的对冲政策比基于规则的方法更具可行性。提高准确性和可靠性的主要成本是相应风险管理系统的黑箱特性。DNN中的客户分类规则源自自动提取的高风险交易员分布式表示。决策者无法解释这些规则中封装的业务逻辑,这也禁止测试这些规则与领域知识的一致性。DNN性能的改善使风险经理有责任决定性能改进是否足够大,以弥补DNN的不透明性和相关缺点,如缺乏公正性、较高的计算要求等。对于STX,我们期望准确对冲交易的必要性以及从其数据中观察到的绩效改善的幅度,以证明采用基于DNN的复杂对冲策略的合理性。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-11 06:52:09
其他利差交易公司可能也是如此,尽管这些公司首先需要复制本研究的结果,以证实DNN的有效性。论文中对DNN配置的详细描述,尤其是在线附录,将简化此任务(参见在线附录中的算法1)。一个更具战略性的考虑是,如果竞争对手部署相应的解决方案并利用它们为散户投资者提供更好的价格,那么不愿采用新技术(如基于DNN的虚拟对冲政策)可能会损害STX的竞争地位。同时,我们警告不要对基于DL的高级决策辅助工具过于乐观。本研究中观察到的实证结果来自一个单一的数据源,虽然数据量很大,但反映了STX市场地位和客户结构的可靠性,并且需要在未来的研究中复制不同的数据,以提高我们在这里观察到的DL优势的可信度。图11:散户交易员在差价交易市场上不同类别投资的平均赢家比率和平均损益点(黑暗中盈利,灰色中亏损)。讨论实证结果表明,DNN优于基于规则和ML的基准。它比其他分类更准确地识别高风险交易员,并在用于对冲决策时提供更高的财务收益。为了解释ML基准的劣质表现,我们注意到预测交易者在动态市场条件下的风险承担行为和未来盈利能力是一项艰巨的任务。交易者的特征和交易行为有所不同,随着时间的推移,两者都可能发生变化。由于行为(输入)和绩效(输出)的高度差异,识别非熟练交易员尤其困难。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-11 06:52:12
与真正优秀的交易者相比,很难为差劲的交易者确定统一的交易模式。对STX Staff的采访暗示,熟练的交易员具有某些特征,如捕捉市场反弹的能力、遵循一致的策略、设置和调整限额等。穷人交易员有无数种方式赔钱,包括忽视上述规则。在高维行为空间中,穷人交易者的潜在变异数量是数不清的。这与ML方法先前的假设相矛盾,即分布P(标签特征)是平滑的,并且在训练数据中表现良好。尽管基于经济理性,但与过去风险调整后回报、交易频率等相关的输入特征不利于准确区分虚假交易者和真正的优秀交易者。这是因为几个特征值可能重合。在交易者特征的行为特征空间中,虚假和真实的好交易者的纠缠使交易者分类问题复杂化。此外,在价差交易市场获利的机会非常嘈杂。即使是差劲的交易者也能幸运地赢钱。事实上,图11显示,与STX交易的大多数客户的赢/输比率都超过了五分之一。然而,图11还显示,平均亏损比平均盈利大得多。因此,将交易员归类为B客户并避免对冲他们的交易通常是明智的,即使他们之前的许多交易都以盈利结束。深层架构为DNN配备了更高的表达能力,以存储交易行为的大量变化。深度的增加使DNN能够实现行为变量的新组合,并推广到培训数据中较少表示的新交易模式。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-11 06:52:15
此外,我们用于交易员分类的特定DNN组件是无监督的预培训。观察结果证实,预训练使DNN能够构建特征检测器层,捕获潜在的生成因素,解释不同交易行为的差异。将多层逐渐复杂的特征检测器堆叠在一起,DNN学会从输入分布中分离这些因素。对随后的区分很重要的变化被放大,而输入数据中的无关信息被抑制【67】。我们在图7、8和9中检查了这种能力。经过预训练后,更高级别的特征层次结构存储了健壮、信息丰富和可概括的表示,这些表示不太可能被误导,因此对输入空间中的交易模式纠缠保持不变。总之,DNN利用了原始特征,并从这些特征中创建了合理的抽象,这些特征与目标具有更强的联系,并有助于以更高的精度预测该目标。结论我们着手检查DL在管理支持方面的有效性。相应的应用程序通常涉及从结构化数据开发规范的决策模型。我们专注于财务风险承担行为预测,并开发了基于DNN的风险管理系统。通过多次实验获得的结果证实了DL的能力,以及我们提出的DNN的特定体系结构,以自动方式提取信息特征。我们还观察到,基于这些特征的基于DNN的交易员行为预测要比基准分类的预测准确得多。最后,我们的结果表明,预测精度的提高转化为运营利润的大幅增长。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-11 06:52:18
这证实了拟定DNN在我们的风险管理案例研究中有效支持(对冲)决策的能力。更一般而言,我们提供的证据表明,DL的特征可以概括为零售金融和企业决策支持中常用的结构化数据集。特别是,我们证明,可以以自动方式成功建模与个人行为(可能是可变的、不稳定的和动态的)相关的模式,以生成决定目标度量的特征(例如可预测性)。对于这里探讨的案例研究,我们面临着classimbalance、概念漂移(在动态环境中产生)、维度诅咒以及开发和修改手工特征以应对外部变化的高昂成本等挑战。这些挑战中的许多都是那些试图预测相关领域人类行为的人所面临的。到目前为止,这些任务中的大多数都是使用一系列统计和ML技术来完成的。我们的发现揭示了采用与本文所采用的DL架构类似的DL架构来处理一系列与消费者相关的预测任务的可能性,例如通过做出有效的信贷批准决策和预测企业借款人的偿付能力来帮助银行改进其风险控制,帮助ZF预测消费者将如何应对税收和监管变化,并支持公司做出涉及客户流失预测、响应建模和交叉/追加销售的营销决策。其中许多任务都依赖于结构化数据,我们已经证明,在需要基于结构化数据预测人类行为的环境中,我们提出的DL方法可以提高预测的准确性。我们案例研究的一个显著特点是,一小群人具有极高的风险。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-11 06:52:21
理论上,单一交易可能会在价差交易市场中造成无限损失。高风险个人(A客户)仅占人口的一小部分,但在很大程度上决定了做市商的整体风险敞口。这一特点使我们的研究区别于标准信用评分设置和其他损失通常有限的金融应用。因此,我们的研究有助于管理来自少数民族个人的重大风险的新方法。DNN可能特别适合开发决策支持系统,以应对具有类似特征的挑战,如内幕或恶意行为检测、欺诈建模或网络攻击,其中只有一小部分专业人员可能会给企业造成重大损失。未来研究的一个富有成效的领域将是探索此处采用的架构在多大程度上证明有效,和/或需要在多大程度上进行调整以满足其他人类行为相关预测任务的特定需求。我们特别感兴趣的是,未来的工作是探索具有监管层和非监管层(如SdA)的网络在多大程度上能够很好地进行风险分析,因为当标记数据稀疏时,无监管学习具有优势。我们已经证明,在一个涉及人类行为预测的环境中,预测精度可以取得显著的提高,我们希望这将导致未来的研究,证明DL可以帮助解决许多与人类行为不可预测相关的世界问题。致谢我们感谢编辑Teunter教授为处理我们的论文所做的努力,并感谢三位匿名评论者,他们的反馈极大地帮助改进了论文的早期版本。我们特别感谢J.C.Moreno Paredes在数据准备方面提供的宝贵帮助。参考文献参考文献[1]Y.LeCun,Y。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-11 06:52:24
Bengio,G.Hinton,《深度学习》,自然521(7553)(2015)436–444。[2] R.Geng,I.Bose,X.Chen,《财务困境预测:利用数据挖掘对中国上市公司的实证研究》,欧洲运筹学杂志241(1)(2015)236–247。[3] Y.Bengio,学习人工智能、基础和趋势的深层架构 机器学习2(1)(2009)1–127。[4] J.Schmidhuber,《神经网络的深度学习:概述》,神经网络61(2015)85–117。[5] W.Liu,Z.Wang,X.Liu,N.Zeng,Y.Liu,F.E.Alsaadi,《深层神经网络结构及其应用研究》,神经计算234(2017)11-26。[6] 陈志勇、范志平、孙敏,《一种多核支持张量机器,用于多类型多路数据分类和交叉销售建议应用》,欧洲运筹学杂志255(1)(2016)110–120。[7] W.Verbeke,K.Dejaeger,D.Martens,J.Hur,B.Baesens,《电信行业客户流失预测的新见解:一种专业驱动的数据挖掘方法》,欧洲运营研究杂志218(1)(2012)211–229。[8] A.Oztekin,R.Kizilaslan,S.Freund,A.Iseri,《预测新兴市场每日股票收益的数据分析方法》,欧洲运筹学杂志253(3)(2016)697–710。[9] P.du Jardin,《破产预测的两阶段分类技术》,欧洲运营研究杂志254(1)(2016)236–252。[10] S.Lessmann,B.Baesens,H.-V.Seow,L.C.Thomas,《信贷评分的最新基准分类算法:研究更新》,欧洲运营研究杂志247(1)(2015)124–136。[11] T.Hastie、R.Tibshirani、J.H.Friedman,《统计学习的要素》,第二版,斯普林格,纽约,2009年。[12] J.N.Crook,D.B.Edelman,L.C。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-11 06:52:27
Thomas,《消费者信贷风险评估的最新发展》,欧洲运筹学杂志183(3)(2007)1447–1465。[13] G.L.Lilien,《弥合学术从业者在营销决策模型上的分歧》,《营销杂志》75(4)(2011)196–210。[14] C.Hsinchun,R.H.L.Chiang,V.C.Storey,《商业智能和分析:从大数据到比格影响》,MIS季刊36(4)(2012)1165–1188。[15] M.Kraus、S.Feuerriegel、A.Oztekin,《商业分析和运筹学深度学习:模型、应用和管理含义》,即将出版的《欧洲运筹学杂志》。[16] J.B.Heaton,N.G.Polson,J.H.Witte,《金融深度学习:深度投资组合,商业和工业应用随机模型》33(1)(2017)3–12,asmb。2209.[17]J.Sirignano,《限价订单书的深度学习》,CoRR abs/1601.01987。统一资源定位地址https://arxiv.org/abs/1601.01987[18] M.Kraus,S.Feuerriegel,《利用深度神经网络和转移学习的财务披露决策支持》,决策支持系统104(2017)38–48。[19] T.Fischer,C.Krauss,《金融市场预测的长短记忆网络深度学习》,欧洲运筹学杂志270(2)(2018)654–669。[20] N.哈克,《配对选择与排名优势:标准普尔100指数的应用》,《欧洲运筹学杂志》196(2)(2009)819–825。[21]Y.Deng,F.Bao,Y.Kong,Z.Ren,Q.Dai,《金融信号表示与交易的深度直接强化学习》,IEEE神经网络与学习系统交易28(3)(2017)653–664。[22]R.Xiong,E.P.Nichols,Y.Shen,《利用谷歌国内趋势深入学习股票波动性》,CoRRarXiv:1512.04916v3。【23】S.P.Chatzis,V.Siakoulis,A.Petropoulos,E.Stavroulakis,N。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-11 06:52:32
Vlachogiannakis,《利用深度和统计机器学习技术预测股市危机事件》,专家系统与应用112(2018)353–371。【24】P.M.Addo,D.Guegan,B.Hassani,《利用机器和深度学习进行信用风险分析》,风险6(2)(2018)1-20。【25】J.A.Sirignano、A.Sadhwani、K.Giesecke,《抵押贷款风险深度学习》(2016)。统一资源定位地址https://people.stanford.edu/giesecke/【26】G.F.Montufar、R.Pascanu、K.Cho、Y.Bengio,《深层神经网络的线性区域数量》,载于:《神经信息处理系统的进展》,2014年,第2924-2932页。【27】Y.Bengio、I.Goodfello、A.Courville,《深度学习》,麻省理工学院出版社,2016年。【28】C.L.Giles,S.Lawrence,A.C.Tsoi,《使用递归神经网络和语法推理进行噪声时间序列预测》,机器学习44(1)(2001)161–183。【29】A.Oztekin,R.Kizilaslan,S.Freund,A.Iseri,《预测新兴市场每日股票收益的数据分析方法》,欧洲运筹学杂志253(3)(2016)697–710。[30]C.Brady,R.Ramyar,《利差博彩白皮书》,伦敦。Cass总线。附件。【31】N.哈克,《配对交易与排名领先:多步预测案例》,欧洲运筹学杂志207(3)(2010)1702–1716。[32]沈福林,赵建超,赵建超,利用深度信念网络和共轭梯度法预测汇率,神经计算167(2015)243–253。【33】M.Dixon,D.Klabjan,J.H.Bang,《利用深度神经网络进行基于分类的金融市场预测》,算法金融6(3-4)(2017)67–77。【34】W.Bao,J.Yue,Y.Rao,《利用堆叠式自动编码器和长-短期记忆的金融时间序列深度学习框架》,公共科学图书馆综合版12(7)。[35]C.Krauss,X.A.Do,N。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-11 06:52:35
哈克,《深层神经网络》,《梯度增强树》,《随机森林:标准普尔500指数的统计套利》,《欧洲运筹学杂志》259(2)(2017)689–702。[36]Y.Zhao,J.Li,L.Yu,《原油价格预测的深度学习集成方法》,能源经济学66(2017)9-16。【37】Y.Baek,H.Y.Kim,Modaugnet:一个新的股市指数预测框架,带有一个防过度lstm模块和一个预测lstm模块,应用专家系统113(2018)457–480。[38]H.Y.Kim,C.H.Won,《预测股价指数的波动性:将LSTM与多个garch类型模型集成的混合模型,专家系统与应用103(2018)25–37》。【39】N.哈克,《大数据集和机器学习:统计套利的应用》,欧洲运筹学杂志278(1)(2019)330–342。【40】B.Ribeiro,N.Lopes,《金融预测的深层信念网络》,载于:B.-L.Lu,L.Zhang,J.Kwok(编辑),《神经信息处理国际会议程序》(ICONIP\'2011),神经信息处理,施普林格-柏林-海德堡,柏林,海德堡,2011年,第766–773页。[41]S.H.Yeh,C.J.Wang,M.F.Tsai,《预测公司违约的深层信念网络》,载于:第24届无线和光通信会议论文集,IEEE ComputerSociety,2015年,第159-163页。[42]J.Lee,D.Jang,S.Park,基于深度学习的企业绩效预测模型,考虑技术能力,可持续性9(6)(2017)899–911。【43】C.Luo,D.Wu,D.Wu,《利用信用违约掉期进行信用评分的深度学习方法》,Arti-ficial Intelligence工程应用65(2017)465–470。【44】J.Jurgovsky,M.Granitzer,K.Ziegler,S.Calabretto,P.-E.Portier,L.He Guelton,O。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-11 06:52:39
Caelen,《信用卡欺诈检测序列分类》,专家系统与应用100(2018)234–245。【45】M.Pryor,《金融价差投注手册2e:交易价差投注赚钱指南》,哈里曼豪斯有限公司,2011年。【46】T.Serre,G.Kreiman,M.Kouh,C.Cadieu,U.Knoblich,T.Poggio,《即时视觉识别的定量理论》,脑研究进展165(2007)33–56。【47】A.Ula,O.T.Yldz,E.Alpaydn,《组合相关分类的特征分类》,信息科学187(0)(2012)109–120。【48】Y.Bengio、P.Lamblin、D.Popovici、H.Larochelle等,《深度网络的贪婪分层训练》,神经信息处理系统进展19(2007)153。【49】H.Larochelle,Y.Bengio,J.Louradour,P.Lamblin,《探索深层神经网络训练策略》,机器学习研究杂志10(2009)1-40。【50】J.Luo,X.Yan,Y.Tian,无监督二次曲面支持向量机及其在信用风险评估中的应用,欧洲运筹学杂志280(3)(2020)1008–1017。【51】G.Hinton,S.Osindero,Y.-W.Teh,《深层信念网络的快速学习算法》,神经计算18(7)(2006)1527–1554。【52】Y.Bengio,O.Delalleau,《对比差异的证明与推广》,神经计算21(6)(2009)1601-1621。【53】P.Vincent,H.Larochelle,Y.Bengio,P.-A.Manzagol,《使用去噪自动编码器提取和合成鲁棒特征》,载于:第25届国际机器学习会议记录,ACM,2008年,第1096-1103页。【54】N.Srivastava,G.Hinton,A.Krizhevsky,I.Sutskever,R.Salakhutdinov,《辍学:防止过度匹配的神经网络的简单方法》,《机器学习研究杂志》15(1)(2014)1929-1958。【55】年。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-11 06:52:42
Bengio,《基于梯度的深层建筑培训实用建议》,载于《神经网络:交易技巧》,Springer,2012年,第437-478页。[56]K.Dowd,《调整风险:改进的夏普比率》,《国际经济与金融评论》9(3)(2000)209–222。【57】M.Weber,C.F.Camerer,《证券交易中的处置效应:实验分析》,《经济行为与组织杂志》33(2)(1998)167–184。[58]D.Delen,R.Sharda,P.Kumar,《电影预测大师:好莱坞经理人基于网络的决策支持系统》,决策支持系统43(4)(2007)1151–1170。[59]A.Oztekin,D.Delen,A.Turkyilmaz,S.Zaim,基于机器学习的在线学习系统可用性评估方法,决策支持系统56(2013)63–73。【60】A.Oztekin,《基于信息融合的etf绩效元分类预测建模》,信息系统前沿20(2)(2018)223–238。【61】A.Oztekin,L.Al Ebbini,Z.Sevkli,D.Delen,《预测肺移植受者生活质量的决策分析方法:基于混合遗传算法的方法》,欧洲运筹学杂志266(2)(2018)639–651。【62】C.Sevim,A.Oztekin,O.Bali,S.Gumus,E.Guresen,《开发货币危机预警系统》,欧洲运筹学杂志237(3)(2014)1095–1104。【63】A.Oztekin,M.R.Khan,《确定量化学科中关键因素的商业分析方法》,计算机信息系统杂志54(4)(2014)60–70。【64】J.M.Johnson,T.M.Khoshgoftaar,《关于班级不平衡的深度学习的调查》,BigData杂志6(1)(2019)27。【65】H.He,E.A.Garcia,《从不平衡数据中学习,知识和数据工程》,IEEETransactions on 21(9)(2009)1263–1284。【66】A.V。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-11 06:52:44
贝诺斯,《过度自信交易员的进取性和生存》,金融市场杂志1(3)(1998)353–383。[67]D.Erhan,Y.Bengio,A.Courville,P.-A.Manzagol,P.Vincent,S.Bengio,为什么无监督的预培训有助于深度学习?,《机器学习研究杂志》11(2010)625–660。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群