全部版块 我的主页
论坛 经济学人 二区 外文文献专区
835 21
2022-06-25
英文标题:
《Managing the Complexity of Processing Financial Data at Scale -- an
  Experience Report》
---
作者:
Sebastian Frischbier, Mario Paic, Alexander Echler, Christian Roth
---
最新提交年份:
2019
---
英文摘要:
  Financial markets are extremely data-driven and regulated. Participants rely on notifications about significant events and background information that meet their requirements regarding timeliness, accuracy, and completeness. As one of Europe\'s leading providers of financial data and regulatory solutions vwd processes a daily average of 18 billion notifications from 500+ data sources for 30 million symbols. Our large-scale geo-distributed systems handle daily peak rates of 1+ million notifications/sec. In this paper we give practical insights about the different types of complexity we face regarding the data we process, the systems we operate, and the regulatory constraints we must comply with. We describe the volume, variety, velocity, and veracity of the data we process, the infrastructure we operate, and the architecture we apply. We illustrate the load patterns created by trading and how the markets\' attention to the Brexit vote and similar events stressed our systems.
---
中文摘要:
金融市场是高度数据驱动和监管的。参与者依赖于有关重大事件的通知和背景信息,以满足他们在及时性、准确性和完整性方面的要求。作为欧洲领先的金融数据和监管解决方案提供商之一,大众汽车每天平均处理来自500多个数据源的180亿条通知,涉及3000万个符号。我们的大型地理分布系统每天处理100多万条通知/秒的峰值速率。在本文中,我们就我们处理的数据、我们操作的系统以及我们必须遵守的监管约束所面临的不同类型的复杂性提供了实际见解。我们描述了我们处理的数据的数量、种类、速度和准确性、我们操作的基础设施以及我们应用的体系结构。我们举例说明了交易产生的负荷模式,以及市场对脱欧投票和类似事件的关注如何给我们的系统带来压力。
---
分类信息:

一级分类:Computer Science        计算机科学
二级分类:Databases        数据库
分类描述:Covers database management, datamining, and data processing. Roughly includes material in ACM Subject Classes E.2, E.5, H.0, H.2, and J.1.
涵盖数据库管理、数据挖掘和数据处理。大致包括ACM学科类E.2、E.5、H.0、H.2和J.1中的材料。
--
一级分类:Computer Science        计算机科学
二级分类:Distributed, Parallel, and Cluster Computing        分布式、并行和集群计算
分类描述:Covers fault-tolerance, distributed algorithms, stabilility, parallel computation, and cluster computing. Roughly includes material in ACM Subject Classes C.1.2, C.1.4, C.2.4, D.1.3, D.4.5, D.4.7, E.1.
包括容错、分布式算法、稳定性、并行计算和集群计算。大致包括ACM学科类C.1.2、C.1.4、C.2.4、D.1.3、D.4.5、D.4.7、E.1中的材料。
--
一级分类:Quantitative Finance        数量金融学
二级分类:General Finance        一般财务
分类描述:Development of general quantitative methodologies with applications in finance
通用定量方法的发展及其在金融中的应用
--

---
PDF下载:
-->
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2022-6-25 07:18:51
管理大规模处理财务数据的复杂性-经验报告?Sebastian Frischbier、Mario Paic、Alexander Echler和Christian Rothvwd:Vereinigte Wirtschaftsdienste GmbH,法兰克福a.M.,德国文摘。金融市场是高度数据驱动和监管的。参与者依赖于有关重大事件的通知和背景信息,以满足他们在及时性、准确性和完整性方面的要求。作为欧洲领先的金融数据和监管解决方案提供商之一,大众汽车每天平均处理来自500多个数据源的180亿条通知,处理3000万个符号。我们的大型分布式系统每天处理100多万条通知/秒的峰值速率。在本文中,我们就我们处理的数据、操作的系统以及我们必须遵守的监管约束所面临的不同类型的复杂性提供了实际见解。我们描述了我们处理的数据的数量、种类、速度和准确性,我们操作的基础设施,以及我们应用的体系结构。Weill举例说明了交易产生的负荷模式,以及市场对脱欧投票和类似事件的关注如何给我们的系统带来压力。1简介决定金融市场投资的方法有很多:直觉、心理学、利用社交媒体、遵循分析人士和影响者的建议,或对趋势和相关性进行定量分析。虽然前一种方法听起来更有趣,因为它们带有一定的谜团,但金融数据的定量分析是市场参与者常用的工具。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-25 07:18:54
因此,获得可靠、准确、新鲜和完整的金融市场信息对参与者至关重要。一般公众通常更熟悉通过公共网站、teletext、电视或日报财务页面上的日终汇总提供的延迟市场数据。然而,对于专业用户来说,可以使用更加多样化的数据驱动解决方案来支持他们的决策。这些解决方案提供了具有高信息密度的有针对性的见解。例如,投资组合管理系统可以根据实时数据不断检查具有单个投资策略的投资组合,以提供重新部署资本的建议(并在批准后直接管理后续订单)或市场数据终端,使专家能够将实时市场数据洞察与历史和参考数据结合起来进行深入分析。?预印提交的版本。修订版将由Springer在第10届复杂系统设计与管理会议(CSD&M\'19)上发布。2 Frischbier等人。推动这些解决方案的原始数据是由各种来源(如交易所、金融机构、资本管理和投资公司以及评级机构)提供的连续结构化和非结构化数据流。财务数据供应商和解决方案提供商(如vwd)在以不同的信息质量(QoI)级别向订阅者提供最终的精简信息之前,会收集、清除和丰富这些数据。大众汽车是欧洲领先的数据驱动金融解决方案提供商之一。我们直接连接到大多数源,以便自己处理数据。我们成立于1949年,是一家通讯社,我们的产品及其供应链如今完全数字化。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-25 07:18:57
我们提供各种解决方案,从市场数据密集型产品到以云计算软件即服务(SaaS)形式提供的咨询和监管解决方案,帮助我们的客户在遵守法规的同时专注于其核心业务。我们的客户包括私人和公共金融机构、投资和投资组合经理、印刷和电视新闻媒体以及公众。作为一个集团,大众汽车在六个国家的14个地点为其客户提供服务。虽然我们的一些子公司直接向最终用户提供解决方案,但我们的大多数客户都是金融市场的中间人。3000万用户每天直接或间接依赖我们的信息来形成对金融市场的看法。在本文中,我们对金融数据大规模处理的复杂性给出了切实可行的见解,以适应高度监管和竞争的行业。我们举例说明了我们处理的数据的数量、种类、速度和准确性、我们运营的历史上不断增长的异构IT应用程序环境以及我们作为金融解决方案提供商必须遵守的主要监管约束所带来的十大挑战。特别是,我们以英国脱欧投票和特朗普对克林顿(2016)的最终投票为例,展示了规则模式和市场对单一关键事件的关注如何反映金融数据流的需求和供给。以秒为单位。2我们通过描述财务数据的多样性(第2.1节)和大众汽车公司处理的数据流(第2.2节)、IT合规水平上的重大挑战(第2.3节)和我们运营的IT系统的异构性(第2.4节),确定了挑战C1-C10。以秒为单位。3我们概述了vwd如何解决由此产生的复杂性:我们描述了我们运营的基础设施和我们应用的架构模式(第。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-25 07:19:00
3.1),以及我们为软件开发、创新管理和合规性所采取的组织措施(第3.2节)。我们总结了我们在Sec的贡献。4.2大规模处理金融数据的复杂性作为金融业的国际解决方案提供商,我们确实必须面对几个挑战——主要来自我们处理的金融数据源、我们必须遵守的监管约束以及我们运营的历史上不断增长的异构IT系统。因此,我们首先简要介绍与本文范围相关的财务数据方面。预印本:处理规模为32.1的财务数据的复杂性背景:财务数据反馈总括术语财务数据表示各种非结构化和结构化数据,关于金融工具及其发行人的信息密度差异很大。金融工具(简称:工具)的例子有证券/股票、基金、期货、货币或指数。请注意,大多数但并非所有工具都通过交易所或其他平台进行交易——以柜台(OTC)证券为例。非结构化和半结构化的财务数据范围从一般新闻和公司信息到上市公司(如合并、收购)的特定绩效相关决策通知,这些信息必须立即以特别消息的形式发布。结构化财务数据作为不同级别的市场数据提供,并量化某一工具的价值和前景。Inits最纯粹、最细粒度的表格市场(tick)数据承载特定交易所或交易平台上特定工具实例(也称为符号)在给定时间点的当前交易价值信息。用于表示此值的最常见属性是bid、ask、bid size、ask size、timestamp。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-25 07:19:03
市场数据还可以包含具有高信息密度的聚合(如加权平均数)或关键绩效指标(KPI),这些信息基于使用历史数据和参考数据(元数据)的复杂推理,量化给定环境下(如利差、beta)工具的风险/绩效。处理财务数据时,最重要的复杂性驱动因素是其信息的价值、信息的供应方式以及信息的表示方式。信息的质量和价值。市场数据的QoI可以通过粒度、正确性、完整性、及时性、订单和可用性等客观指标进行量化。对于数据提供商,QoI属性是成本驱动因素,其成本与所需的QoI水平成比例关联。在consumerside上,具有特定QoI属性的市场数据的信息价值(VoI)取决于每个消费者打算使用这些信息的目的【6】。因此,当数据提供者为大量消费者提供数据时,它具有高度的主观性,并且会造成复杂性。资源调配。市场数据以基于订阅的方式作为流或批量加载提供。典型的数据来源是各种交易所,也包括国家银行等金融机构。数据作为feed提供,其中feed是特定数据源和/或细分市场的事件类型的连续流。Afeed可以由一个交易所/发行人提供,也可以由一个中间财务数据供应商提供,该供应商将来自多个提供商的提要捆绑在一起。如果提供的数据在时间线或粒度上没有任何人为退化,则提要表示为完整。相比之下,如果某个因素延迟了通知的交付,而只有某些通知是根据隐藏式提要中的优先级转发的,则提要会延迟。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

点击查看更多内容…
相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群