全部版块 我的主页
论坛 经济学人 二区 外文文献专区
1352 20
2022-05-30
英文标题:
《Clustering Approaches for Financial Data Analysis: a Survey》
---
作者:
Fan Cai, Nhien-An Le-Khac, Tahar Kechadi
---
最新提交年份:
2016
---
英文摘要:
  Nowadays, financial data analysis is becoming increasingly important in the business market. As companies collect more and more data from daily operations, they expect to extract useful knowledge from existing collected data to help make reasonable decisions for new customer requests, e.g. user credit category, confidence of expected return, etc. Banking and financial institutes have applied different data mining techniques to enhance their business performance. Among these techniques, clustering has been considered as a significant method to capture the natural structure of data. However, there are not many studies on clustering approaches for financial data analysis. In this paper, we evaluate different clustering algorithms for analysing different financial datasets varied from time series to transactions. We also discuss the advantages and disadvantages of each method to enhance the understanding of inner structure of financial datasets as well as the capability of each clustering method in this context.
---
中文摘要:
如今,财务数据分析在商业市场中变得越来越重要。随着公司从日常运营中收集越来越多的数据,他们希望从现有收集的数据中提取有用的知识,以帮助对新客户的请求做出合理的决策,例如用户信用类别、预期回报的信心等。银行和金融机构已应用不同的数据挖掘技术来提高其业务绩效。在这些技术中,聚类被认为是捕获数据自然结构的重要方法。然而,对于财务数据聚类分析方法的研究并不多。在本文中,我们评估了用于分析不同金融数据集(从时间序列到交易)的不同聚类算法。我们还讨论了每种方法的优缺点,以增强对金融数据集内部结构的理解,以及在这种情况下每种聚类方法的能力。
---
分类信息:

一级分类:Quantitative Finance        数量金融学
二级分类:General Finance        一般财务
分类描述:Development of general quantitative methodologies with applications in finance
通用定量方法的发展及其在金融中的应用
--

---
PDF下载:
-->
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2022-5-30 12:24:14
摘要当今,财务数据分析在商业市场中变得越来越重要。随着公司从日常运营中收集越来越多的数据,他们希望从现有收集的数据中提取有用的知识,以帮助对新客户的请求做出合理的决策,例如用户信用类别、预期回报的信心等。银行和金融机构已应用不同的数据挖掘技术来提高其业务绩效。在这些技术中,聚类被认为是捕获数据自然结构的重要方法。然而,对于财务数据聚类分析方法的研究并不多。在本文中,我们评估了用于分析不同金融数据集(从时间序列到交易)的不同聚类算法。我们还讨论了每种方法的优缺点,以增强对金融数据集内部结构的理解,以及在这种情况下每种聚类方法的能力。关键词聚类;划分聚类;基于密度的聚类;金融数据集I.简介今天,我们有大量的金融数据集。更快、更便宜的存储技术使我们能够存储更多的数据。由于数据源的规模很大,人类分析师不可能提供有助于决策过程的有趣信息(或模式)。全球竞争、动态市场以及信息和通信技术的快速发展是当今金融业面临的一些主要挑战。例如,金融机构不断需要更多的数据分析,数据分析变得越来越庞大和复杂。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-5-30 12:24:17
随着可用数据量的不断增加,我们处理数据的能力变得越来越困难。因此,从这些数据集中高效地发现有用的知识正成为一项挑战和巨大的经济需求。另一方面,数据挖掘(DM)是从大型数据集(数据库或数据)中提取有用的、通常是以前未知的信息,即所谓的知识的过程。这些挖掘出来的知识可用于各种应用,如市场分析、欺诈检测、客户保留等。最近,DM被证明非常有效,N-A.Le Khac:爱尔兰都柏林大学计算机科学与信息学院(通讯作者:an。lekhac@lucd.ie)。F、 Cai:爱尔兰都柏林大学学院计算机科学与信息学院(caifan。home@gmail.com)。M-T.Kechadi:爱尔兰都柏林大学学院计算机科学与信息学院(塔哈尔)。kechadi@ucd.ie)。分析金融数据集有利可图[1]。然而,挖掘财务数据带来了特殊的挑战;复杂性、外部因素、机密性、异质性和规模。数据挖掘者面临的挑战是在趋势有效的时候快速找到它们,以及识别趋势不再有效的时间。此外,设计一个适当的过程来发现财务数据中的有价值的知识是一项非常复杂的任务。文献中提出了不同的数据挖掘技术,用于各种金融应用中的数据分析。例如,在股票选择中使用了决策树[2]和一阶学习[3]。神经网络【4】和支持向量机【5】技术用于预测破产,最近邻分类【6】用于欺诈检测。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-5-30 12:24:20
用户还使用这些技术来分析金融时间序列【7】、估算金融数据【8】、异常值检测【9】等。然而,与分类和回归等其他技术相比,该领域应用的聚类技术并不多【2】。在本文中,我们调查了不同的聚类算法,用于分析各种应用的不同金融数据集;信用卡欺诈检测、投资交易、股票市场等。我们讨论了每种方法的优缺点,以更好地理解金融数据集的内部结构以及每种聚类方法在这方面的能力。换句话说,本研究的目的是概述基本聚类方法是如何应用于财务数据分析的。本文的其余部分组织如下。在第二节中,我们简要介绍了文献中可以找到的不同金融数据挖掘技术。第三节简要介绍了该领域中使用的不同聚类技术。我们在第四节中评估并讨论了这些聚类方法的优缺点。我们在第五节第二节中总结并讨论了一些未来的方向。关联规则关联规则是一种被称为关联分析的数据挖掘技术,它有助于发现隐藏在大型数据集中的有趣关系。这些关系可以用关联规则或频繁项集集的形式表示[2]。该技术可应用于金融、地球科学、生物信息学、医学诊断、web挖掘和科学计算等不同领域的数据分析。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-5-30 12:24:24
在金融领域,关联分析被用于包括财务数据分析的方法:SurveyFan Cai、Nhien An Le Khac、M-Tahar Kechadi、都柏林大学学院计算机科学与信息学院、IrelandTcustomer profiling,这些方法从公司现有的客户数据库中构建不同群体的配置文件。从这个过程中获得的信息有助于了解业务绩效、制定新的营销计划、分析风险和修订公司客户政策。此外,贷款支付预测、客户信用政策分析、营销和客户关怀也可以进行关联分析,以识别重要因素并消除不相关因素。B、 分类分类是另一种DM方法,它将对象指定给预定义的类别之一。它使用训练示例,例如输入和输出目标对,来找到适当的目标函数,也就是非正式的分类模型。分类模型对于描述和预测建模都很有用[2]。在金融领域,分类方法还通过构建预测模型(其中预测值是分类的)用于客户分析。金融市场风险、信用评分/评级、投资组合管理和交易也将此方法应用于将类似数据分组。分类是计算金融学中重要的分析方法之一。基于规则的方法[2][3]可用于股票选择。此外,破产预测可以使用其几何方法[4][5],其中分类函数用一组通过优化某些错误标准构建的决策边界来表示。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-5-30 12:24:26
其他方法,如Na"ive Bayes分类器【10】、最大熵分类器【11】被应用于债券评级,基于原型的分类方法(如最近邻分类)也被用于欺诈检测。C.类似聚类的分类,聚类分析将相似的数据对象分组为聚类[2],然而,这些类或聚类没有事先定义。通常情况下,聚类分析是数据汇总等其他目的的有用起点。数据对象集群可以看作是数据压缩的一种形式。不同的领域可以将聚类技术应用于分析数据,如生物学、信息检索、医学等。在商业和金融领域,可以使用聚类将客户划分为多个组,以进行额外的分析和营销活动。由于聚类通常用于数据汇总或压缩,与分类和关联分析相比,使用该技术的金融应用并不多。我们将在第III.D节中介绍一些方法。其他方法可应用于金融数据集的其他挖掘技术分为三类:优化、回归和模拟。例如,投资组合选择、风险管理和资产负债管理可以使用不同的优化技术,如遗传算法【12】、动态规划【13】、强化学习【14】等。此外,线性回归【2】和小波回归【15】是财务预测领域的常用方法,期权定价与股票预测。三、 聚类方法A。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

点击查看更多内容…
相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群