全部版块 我的主页
论坛 经济学人 二区 外文文献专区
1071 23
2022-06-11
英文标题:
《The ETS challenges: a machine learning approach to the evaluation of
  simulated financial time series for improving generation processes》
---
作者:
Javier Franco-Pedroso, Joaquin Gonzalez-Rodriguez, Maria Planas, Jorge
  Cubero, Rafael Cobo, Fernando Pablos
---
最新提交年份:
2018
---
英文摘要:
  This paper presents an evaluation framework that attempts to quantify the \"degree of realism\" of simulated financial time series, whatever the simulation method could be, with the aim of discover unknown characteristics that are not being properly reproduced by such methods in order to improve them. For that purpose, the evaluation framework is posed as a machine learning problem in which some given time series examples have to be classified as simulated or real financial time series. The \"challenge\" is proposed as an open competition, similar to those published at the Kaggle platform, in which participants must send their classification results along with a description of the features and the classifiers used. The results of these \"challenges\" have revealed some interesting properties of financial data, and have lead to substantial improvements in our simulation methods under research, some of which will be described in this work.
---
中文摘要:
本文提出了一个评估框架,试图量化模拟金融时间序列的“真实度”,无论模拟方法是什么,目的是发现这些方法无法正确再现的未知特征,以改进它们。为此,评估框架被视为一个机器学习问题,其中一些给定的时间序列示例必须分类为模拟或真实的金融时间序列。“挑战赛”是一项公开比赛,类似于在Kaggle平台上发布的比赛,参赛者必须发送其分类结果以及所使用的特征和分类器的描述。这些“挑战”的结果揭示了金融数据的一些有趣特性,并导致我们正在研究的模拟方法有了实质性的改进,其中一些将在本文中描述。
---
分类信息:

一级分类:Quantitative Finance        数量金融学
二级分类:Computational Finance        计算金融学
分类描述:Computational methods, including Monte Carlo, PDE, lattice and other numerical methods with applications to financial modeling
计算方法,包括蒙特卡罗,偏微分方程,格子和其他数值方法,并应用于金融建模
--

---
PDF下载:
-->
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2022-6-11 04:10:35
O R I G I N A L A R T I C L ETS挑战:评估模拟金融时间序列以改进发电流程的机器学习方法Javier Franco Pedroso | Joaquin Gonzalez Rodriguez | Maria Planas | Jorge Cubero | Rafael Cobo | Fernando PablosAudias Research Group,EscuelaPolitécnica Superior,Universidauto de Madrid,28049,SpainETS资产管理工厂,Pozuelode Alarcón,Madrid,28223,SpainCorrespondenceJavier Franco Pedroso,Madrid,SpainEmail:javierfrancopedroso@gmail.comFundinginformationETS资产管理工厂,项目名称:“Tecnologías de tratamiento de se~nalpara mercados fifinanciaros”表示模拟金融时间序列的“真实度”,无论模拟方法是什么,目的是发现这些方法无法正确再现的未知特征,以改进它们。为此,评估框架被视为一个机器学习问题,其中一些给定的时间序列示例必须分类为模拟或真实金融时间序列。“挑战”是一项开放式竞赛,类似于Kaggle平台上发布的竞赛,参赛者必须发送其分类结果以及所用特征和分类者的描述。这些“挑战”的结果揭示了正在研究的使用方法的一些有趣的特性,其中一些特性将在本工作中描述。中国式学习;经验性质;多元时间序列;金融工程;资产模拟ARXIV:1811.07792v1【q-fin.CP】2018年11月19日JAVIER FRANCO-PEDROSO ET AL.1 |简介模拟方法广泛用于多种目的的金融应用;例如,如果将资产价格建模为某种给定类型的随机过程,则可以在给定的未来时间估计其周围的置信区间。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-11 04:10:38
这些数据生成过程的优度通常是通过检查它们是否与时间序列的时间演化相关(例如,收益的自相关或绝对收益)未被评估来评估的。此外,金融时间序列的其他一些特性可能完全未知,因此我们不知道在哪里可以查看模拟序列是否与真实序列一样。在本文中,我们提出了一种相反的方法:我们不是检查真实财务数据的某些已知特性是否在模拟数据中观察到,而是解决一些模拟序列是否可以与真实序列区分的问题。这可以看作是一个二元分类问题,我们必须将其分为两类,即真实金融时间序列和模拟金融时间序列。因此,机器学习技术基于这些特征分析了这两个类之间的差异。这样,在不同的生成过程之间进行比较的过程就变得完全真实,并且可以使用许多特征(可能是一些未知的鉴别特征)。此外,如果一个特定的系统获得了非常好的分类结果,那么我们可以研究这些特性及其与生成过程的关系,以改进模型或模拟方法,或者可以了解到一些到目前为止未知的真实金融时间序列的有趣特性。在第2节中,我们进一步激发了对此类评估框架的需求,并介绍了其特点。挑战中的两个结果用于比较第5节中的不同生成方法,作为第5节中总结的客观评估??。ETS挑战概述和一般评估框架“[续(2001,2007)],[Chakraborti等人。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-11 04:10:41
(2007年)])的方法,但这种方法存在几个问题。程式化的事实是,回报率分布呈现出比高斯分布更重的尾部【Mandelbrot(1963)】,而这一统计数据和其他统计数据,作为足够数量的样本,必须可用,以便正确估计,因为统计数据可能不会收敛于给定的样本大小。此外,在不同的时间尺度上偏离正态分布的程度,可能需要不同的样本量才能使统计收敛,这需要检查几个属性。这涉及到单独比较真实和模拟时间Javier FRANCO-PEDROSO等人3系列之间的许多度量,并决定观察到的差异是否可接受,通常通过确定真实和模拟时间系列是否可区分来总结一些更好的方法。我们已经知道,我们只是寻找模拟和实时序列之间的差异,我们可能会发现真实金融数据共享的一些有趣的属性或行为。为了实现这一目标,通过公开竞争解决了检验模拟方法优劣的目标,该竞争被视为二元分类问题,其中包括原始回报值的一组示例必须被分类为真实或模拟金融时间序列。对于每个挑战,将向参与者提供两个平衡的真实和模拟时间序列集:其中一个(训练集)与真实的类标签一起提供,用于开发目的,而另一个未标记(测试集)。对于后一组,参与者应运行其特征提取器和分类器,包括对所用特征提取器和分类器的描述。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-11 04:10:44
每个提交系统的分类结果指向相反的类别)。来自同一市场(同一类型的投资基金或同一指数)。生成方法在整个real上进行培训(每个投资基金或股票的模拟次数相同)。然而,测试的生成方法可能不是针对特定的时间序列,而是针对一组时间序列,因此真实时间序列和模拟时间序列之间可能不存在一一对应关系。图1显示了如何生成培训和测试子集。TA B L E 1所提供数据集的组成。子集#示例/类段长度类标签序列6000 260提供测试6000 260未提供4 JAVIER FRANCO-PEDROSO ET AL.F I G U R E 1数据分区方案。2016年挑战:在投资基金的背景下进行检测ETS挑战的第一版侧重于投资基金的生成方法。图2显示了From的时间序列,显示了价格(上面板)和收益(下面板)的时间序列。为了更好的服务化,价格被迫从价格值p(t=0)=1开始。(a) 固定收益基金。(b) 股票基金。2016年ETS挑战赛中使用的固定收益和股票基金。JAVIER FRANCO-PEDROSO等人5首先利用合并两种类型投资基金的时间序列构建发电流程部分。3.1 |测试模拟方法第一版ETS挑战中使用的模拟方法是[Franco Pedroso et al.(2018)]中描述的早期版本。生成过程可总结如下:o分析阶段:将整个多变量训练数据集(每个维度是不同的时间序列)拆分为市场指数)。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-11 04:10:47
然后,对于每个趋势,使用一个不重叠的滑动窗口来计算平均向量和趋势的“模型”。o综合阶段:首先,假设在分析阶段获得的交替趋势(向上和向下)的随机序列。然后,对于每个趋势,通过从高斯分布中提取多变量样本生成随机多变量回报,其参数根据分析阶段观察到的窗口序列进行更新新资产生成阶段:通过遵循前两个阶段,可以生成原始数据集的模拟版本,通过协方差矩阵保持给定时间序列之间的相关性。为了生成具有类似相关性的其他艺术资产,使用了基于主成分分析的程序。首先执行PCA,以便将原始时间序列集R分解为特征向量(变换矩阵,W)和分量(投影时间序列,R)。然后,通过将从多元高斯分布生成的部分特征向量与从W获得的均值和协方差矩阵相加,扩大变换矩阵,得到一个新的变换矩阵W,其特征向量数与所需的时间序列数相同。模拟数据集具有所需的维数。股票时间序列的性质见[Franco Pedroso et al.(2018)]。从现在起,这将被称为方法1,以区别于ETS挑战第二版(第4节描述)中遵循的生成过程。3.2 |提交了实时和模拟时间序列之间的系统和结果,并附有参与者遵循的开发过程的简要描述。对于这些系统,没有进行进一步的分析。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

点击查看更多内容…
相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群