全部版块 我的主页
论坛 经济学人 二区 外文文献专区
467 13
2022-05-06
英文标题:
《Supervised classification-based stock prediction and portfolio
  optimization》
---
作者:
Sercan Arik, Sukru Burc Eryilmaz, Adam Goldberg
---
最新提交年份:
2014
---
英文摘要:
  As the number of publicly traded companies as well as the amount of their financial data grows rapidly, it is highly desired to have tracking, analysis, and eventually stock selections automated. There have been few works focusing on estimating the stock prices of individual companies. However, many of those have worked with very small number of financial parameters. In this work, we apply machine learning techniques to address automated stock picking, while using a larger number of financial parameters for individual companies than the previous studies. Our approaches are based on the supervision of prediction parameters using company fundamentals, time-series properties, and correlation information between different stocks. We examine a variety of supervised learning techniques and found that using stock fundamentals is a useful approach for the classification problem, when combined with the high dimensional data handling capabilities of support vector machine. The portfolio our system suggests by predicting the behavior of stocks results in a 3% larger growth on average than the overall market within a 3-month time period, as the out-of-sample test suggests.
---
中文摘要:
随着上市公司的数量及其财务数据量的快速增长,人们迫切希望跟踪、分析并最终实现股票选择的自动化。很少有研究专注于估算单个公司的股价。然而,其中许多人的财务参数非常少。在这项工作中,我们应用机器学习技术来解决自动选股问题,同时对单个公司使用了比之前研究更多的财务参数。我们的方法基于使用公司基本面、时间序列特性和不同股票之间的相关性信息对预测参数的监督。我们研究了各种监督学习技术,发现当与支持向量机的高维数据处理能力相结合时,使用股票基本面是解决分类问题的有用方法。正如样本外测试所显示的那样,我们的系统通过预测股票行为所显示的投资组合,在3个月内的平均增长率比整个市场高出3%。
---
分类信息:

一级分类:Quantitative Finance        数量金融学
二级分类:Statistical Finance        统计金融
分类描述:Statistical, econometric and econophysics analyses with applications to financial markets and economic data
统计、计量经济学和经济物理学分析及其在金融市场和经济数据中的应用
--
一级分类:Computer Science        计算机科学
二级分类:Computational Engineering, Finance, and Science        计算工程、金融和科学
分类描述:Covers applications of computer science to the mathematical modeling of complex systems in the fields of science, engineering, and finance. Papers here are interdisciplinary and applications-oriented, focusing on techniques and tools that enable challenging computational simulations to be performed, for which the use of supercomputers or distributed computing platforms is often required. Includes material in ACM Subject Classes J.2, J.3, and J.4 (economics).
涵盖了计算机科学在科学、工程和金融领域复杂系统的数学建模中的应用。这里的论文是跨学科和面向应用的,集中在技术和工具,使挑战性的计算模拟能够执行,其中往往需要使用超级计算机或分布式计算平台。包括ACM学科课程J.2、J.3和J.4(经济学)中的材料。
--
一级分类:Computer Science        计算机科学
二级分类:Machine Learning        机器学习
分类描述:Papers on all aspects of machine learning research (supervised, unsupervised, reinforcement learning, bandit problems, and so on) including also robustness, explanation, fairness, and methodology. cs.LG is also an appropriate primary category for applications of machine learning methods.
关于机器学习研究的所有方面的论文(有监督的,无监督的,强化学习,强盗问题,等等),包括健壮性,解释性,公平性和方法论。对于机器学习方法的应用,CS.LG也是一个合适的主要类别。
--
一级分类:Quantitative Finance        数量金融学
二级分类:Portfolio Management        项目组合管理
分类描述:Security selection and optimization, capital allocation, investment strategies and performance measurement
证券选择与优化、资本配置、投资策略与绩效评价
--
一级分类:Statistics        统计学
二级分类:Machine Learning        机器学习
分类描述:Covers machine learning papers (supervised, unsupervised, semi-supervised learning, graphical models, reinforcement learning, bandits, high dimensional inference, etc.) with a statistical or theoretical grounding
覆盖机器学习论文(监督,无监督,半监督学习,图形模型,强化学习,强盗,高维推理等)与统计或理论基础
--

---
PDF下载:
-->
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2022-5-6 07:04:25
2014年6月2日基于监督分类的股票预测和投资组合优化Sercan Arik*,1.布尔,塞里i勒马兹*,2.亚当·戈德伯格*,3soarik@stanford.edu,eryilmaz@stanford.edu, andagoldberg@cs.stanford.edu1,2斯坦福大学电气工程系,加利福尼亚州斯坦福94305,斯坦福大学计算机科学系,加利福尼亚州斯坦福943051。简介随着上市公司的数量及其财务数据量的快速增长,硬件基础设施和信息处理技术的改进使大量数据得以高速处理,人们迫切希望实现跟踪、分析和最终股票选择的自动化。机器学习已经在贸易和金融领域占据重要地位。目前的一个主要领域是高频交易。文献和应用中有许多技术可以基于不同的股票价格时间变化随机模型来预测短期波动【1】、【2】、【3】。这种方法通常依赖于将单个股票数据作为时间序列处理,而不分析不同公司之间的相关性和模式,这主要是因为以极高的速度处理非常大的数据集的局限性。另一个主要应用是基于经济参数[4]、[5]、[6]、[7]、[8]、[9]的市场估值。对于大多数这些应用程序,处理的数据量是有限的,大多数不会深入到单个公司的粒度[4]、[5]、[6]、[7]、[8]、[9]。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-5-6 07:04:28
很少有研究在单个公司层面上进行投资组合优化的工作专注于非常少量的财务参数[10]。金融业的很大一部分由中长期投资组合构成,主要由对冲基金经理和金融分析师根据使用公司基本原理的分析和决策过程进行。考虑到1993年至2013年间整个纽约证券交易所(NYSE)的股票市场,有超过27189只股票(随着新的首次公开发行,这个数字几乎每天都在增长)。由于这个数字远远超过了人工处理的能力,显然需要通过对公司基本面建模来进行自动财务分析和投资决策。在这个项目中,我们使用机器学习技术来解决投资组合优化问题。我们的方法基于使用公司基本面、时间序列属性和不同股票之间的相关性信息对预测参数的监督。相当地*平等贡献关注整体经济指标,关注培训阶段的个别公司数据。我们将问题简化为分类问题,因为这样更容易评估我们的方法。我们研究了各种监督学习技术,发现当与支持向量机的高维数据处理能力相结合时,使用股票基本面是解决分类问题的有用方法。我们的系统通过预测股票行为得出的投资组合结果是,在3个月的时间内,平均增长率比整体市场高出3%。2.
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-5-6 07:04:32
研究数据200420062008 2010202014-50050100150标准化IBC(a.u.)年份02040608100120标准化行为(a.u.)-10010203040标准化OIADP(a.u.)-100102030标准化RECCH(a.u.)GOOGKSUAXLLORBT0420062008 2010200122014Year200420062008 2010200122014YearGOOGKSUAXLLORBT0420062008 2010200122014Year(a)(b)(c)(d)图1。两支看涨股票(GOOG和KSU)和两支看跌股票(AXLL和ORBT)的财务参数值示例,分别用绿色圆圈和红色方块表示。财务参数表示(a)非常项目前的收入,(b)流动资产总额,(c)折旧后的营业收入(d)应收账款/减少额。在进行财务文献回顾和可用性搜索后,我们选择了69个基本财务参数,以有效地代表每个股票的业务基础,以及整个股票的总体情况十四:1406.0824v1[q-fin.ST]2014年6月3日资本市场和美国经济。所有财务参数均以年为周期,尽管其公布日期显示全年几乎均匀分布。作为代表性的例子,图1显示了2004年至2013年间四种股票(谷歌、KSU、Axland ORBT)的四个财务参数(特殊项目前的收入、流动资产总额、折旧后的营业收入和应收账款)。如第4节所述,我们的分类方法基于确定股票的年度表现与平均年度市场表现(相对于纽约证券交易所综合指数进行量化)的比较。我们将看涨定义为“相对于市场产生正收益”,看跌定义为“相对于市场产生负收益”,并将其作为我们的分类标签。图1给出了2013年2只看涨和2只看跌股票的例子。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-5-6 07:04:34
当单独考虑时,各种财务参数的个别影响可能不会有太大的差别,但是,正如将要显示的,当综合考虑,并结合支持向量机分类器的灵活性和数据处理能力时,财务参数数据变得非常重要。0 200 400 600 800100102104订购公司指数市场资本化(a.u.)图2。按排名顺序排列的数据集中公司的市值。pinkare中显示的公司被丢弃。我们最初认为所有可用的纽约证券交易所股票至少有50%的分析财务参数可用。在所有股票中,我们剔除了那些因破产或收购而目前未交易的股票。由于我们需要能够分析股票行为的时间特征,为了完整起见,我们丢弃了财务数据不足10年的股票。结合这些限制,我们收集了1012只股票的数据集。从图2中的市值值可以看出,大公司和小公司的财务差异超过四个数量级。非常小的公司的股票价格行为通常没有可以分析建模的模式。他们的股价走势往往被几乎不依赖金融基本面的投机行为所影响。因此,为了更有力地实施监督学习技术,我们进一步淘汰了市值最小的152家公司。3.数据预处理鉴于整套财务参数的规模很大(总共69·10·860=59.34万个数据点),预处理对于学习和预测技术的效率和准确性至关重要。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-5-6 07:04:39
在本节中,我们将介绍在应用监督分类之前使用的数据预处理方法。首先,860家公司的财务数据集包括一些财务参数的数据和错误值。我们分两步解决这个问题。首先,我们用大于某个阈值的缺失数据的一小部分来消除财务参数(请注意,这与消除研究数据部分中解释的某些股票不同,在研究数据部分中,我们消除了缺失数据超过阈值的股票)。保守地将2004年至2013年间的这一阈值设置为5%,我们从财务数据集中消除了69个特征中的17个,剩下52个财务参数。其次,我们通过将给定财务参数的平均值(给定年份内所有股票的平均值)分配给缺失的数据条目来进行插补,我们不认为缺失的数据条目会扭曲我们的特征分布,因为在上述公司和特征选择之后,缺失的值很少。由于财务参数的相对变化而非货币价值本身对业绩更为重要,我们在财务数据时间框架开始时将每个参数与其价值进行标准化(类似于图1)。然后,我们将给定特征的每个分布标准化为零均值和单位方差(在给定年份的所有股票中),因为我们使用的监督分类实现针对这种标准化进行了优化。200620070082009201020112013年指数特征值(a.u.)3 DCT系数5 DCT系数9 DCT系数7 DCT系数CTIDCTRECT。过滤器012005图。3.DCT系数不同值随时间变化的特征值。插图:过滤操作框图。为了分类的稳健性,我们考虑了两种平滑策略。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

点击查看更多内容…
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群