全部版块 我的主页
论坛 经济学人 二区 外文文献专区
554 10
2022-05-06
英文标题:
《A Bellman View of Jesse Livermore》
---
作者:
Nick Polson and Jan Hendrik Witte
---
最新提交年份:
2014
---
英文摘要:
  Richard Bellman\'s Principle of Optimality, formulated in 1957, is the heart of dynamic programming, the mathematical discipline which studies the optimal solution of multi-period decision problems. In this paper, we look at the main trading principles of Jesse Livermore, the legendary stock operator whose method was published in 1923, from a Bellman point of view.
---
中文摘要:
理查德·贝尔曼(Richard Bellman)于1957年提出的最优性原理是动态规划(dynamic programming)的核心。动态规划是一门研究多阶段决策问题最优解的数学学科。在本文中,我们从行李员的角度来看杰西·利弗莫尔(Jesse Livermore)的主要交易原则,这位传奇的股票运营商的方法发表于1923年。
---
分类信息:

一级分类:Quantitative Finance        数量金融学
二级分类:Trading and Market Microstructure        交易与市场微观结构
分类描述:Market microstructure, liquidity, exchange and auction design, automated trading, agent-based modeling and market-making
市场微观结构,流动性,交易和拍卖设计,自动化交易,基于代理的建模和做市
--
一级分类:Mathematics        数学
二级分类:Optimization and Control        优化与控制
分类描述:Operations research, linear programming, control theory, systems theory, optimal control, game theory
运筹学,线性规划,控制论,系统论,最优控制,博弈论
--

---
PDF下载:
-->
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2022-5-6 10:54:44
行李员对Jesselvermorenick Polsonand Jan HENDRIK WITTE1的看法。引言理查德·贝尔曼(Richard Bellman)于1957年提出的最优性原理是研究多阶段决策问题最优解的数学学科动态规划的核心。1923年,他在《证券交易方法》一书中提到了一个叫Jessedalevery的交易员。在这篇文章中,我们研究了利弗莫尔的一些交易规则,我们发现其中许多规则直接反映了贝尔曼的最优性原则。因此,在他们追求最佳状态的过程中,20世纪最伟大的两个国家可以被发现是最优秀的。理查德·贝尔曼(Richard Bellman)1957年的《动态规划》(Dynamic Programming)一书介绍了他解决多阶段决策过程的概念框架。尽管有多种不同的数学公式,贝尔曼研究的问题都有以下主要特点:有一个系统,每个阶段都有一组参数和状态变量在这两个过程的每个阶段,我们都有一系列的决定决策的效果是状态变量的转换过去的历史在决定未来的发展中并不重要目的是使状态变量的函数最大化。用贝尔曼的话来说,“政策”是做出决定的任何规则,它会产生一系列允许的决定;“最优策略”是指使最终状态变量的预先设定函数最大化的策略。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-5-6 10:54:47
对于上述问题,芝加哥大学博思商学院的尼克·波尔森,ngp@chicagobooth.edu.Jan亨德里克·维特,牛津大学数学研究所,witte@maths.ox.ac.uk.listed物业,行李员建立了以下规则。贝尔曼的最优性原则:“最优政策的性质是,无论初始状态和初始决策如何,剩余决策必须构成与第一个决策产生的状态相关的最优政策。”很明显,贝尔曼的最优标准让人想起交易过程,因此,最优原则也应该适用于交易。最优性原则建议我们研究Q值矩阵,该矩阵描述在当前状态s下执行动作a的价值,然后再进行优化。在这个框架中,让Q(s,a)表示通过动作a从当前状态可用的一组值;e、 例如,将s解释为代理人当前的财富,将a解释为他发起的长期或短期职位(或任何其他行动)的参数化。给出了当前最优策略和价值函数(s) :=arg maxaQ(s,a)和V(s):=maxaQ(s,a)=Q(s,a)(s) ),分别。让我们’表示系统的下一个状态,让r(a,s,s′)表示给定当前状态和动作a的下一个状态的奖励。我们想把刚才介绍的定义放在一个连续的上下文中。我们将考虑单一市场的情况,在这个市场中,交易在离散时间进行。时间t=0对应于当前时间。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-5-6 10:54:50
实现的当前状态用T表示,当前行动用at表示,未来不可观测状态用St+1表示,最优策略和价值函数用a定义(st)=arg maxaQt+1(st,a)和V(st)=Qt+1(st,a)(st)),分别。最优性原理现在提供了动态规划的关键序列恒等式,即qt+1(st,a)(1)=E[r(a,st,st+1)+V(st+1)|st,a]。用贝尔曼的话说:无论今天的状态是什么,无论今天的决定是什么,今天的值Qt+1(st,a)都是基于(预期的)关于下一个状态st+1的优化决策,而下一个状态st+1是由今天的国家立场决定a产生的。要找到今天的最佳行动,必须求解Q矩阵的平衡条件(1),然后读取最佳行动a(st)达到Sarg maxaQ(st,a)。为了简单起见,我们假设∈ A只接受一组有限的可能值。(等式(1)和(2)也允许包含贴现因子,如果需要,应将其纳入r(a,st,st+1)中。)然而,在现实中,有一个警告:为了评估(1)他的决策,因为真实世界的概率对他来说是未知的,交易者必须根据他的主观概率分布q(St | St,a)进行预期,该分布描述了他对状态变量的未来路径的信念,这取决于他当前的财富和他的行为a。因此,代替(1),交易者将尝试求解qqt+1(st,a)(2)=Eq[r(a,st,st+1)+Vq(st+1)| st,a],其中Eq[·]和Vq(·)表示根据交易者信念的分布q(st+1 | st,a)所采取的概率。在贝尔曼和利弗莫尔的最佳框架中,我们注意到了一些引人注目的特性,我们在下面的评论中对此进行了总结。备注1.1。令人惊讶的是,(1)和(2)之间的区别对实际交易过程的影响微乎其微。备注1.2。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-5-6 10:54:53
基于实际市场价格和交易者预期之间的偏差的规则在评估最佳行动时几乎没有地位:像“s e ll因为价格高于我的预期”这样的论点并没有进入画面,这是利弗莫尔(1923)格言“市场永远不会错”的一个版本。简单地说,我们应该只担心最佳的行李员行动,或者我们是如何做到的,而不是从现在开始采取最佳的行动。备注1.3。贝尔曼和利弗莫尔最优政策洞察的很大一部分是,必须根据观察到的市场价格有条件地更新贸易商的主观信念(2)。因为当价格上涨时,市场有一个优越的信息集,所以最佳的行动是什么都不做——用利弗莫尔(1923)的话来说,“一个人应该希望,而不是害怕”——当价格下跌时,一个人应该考虑出售——“一个人应该害怕,而不是希望”。我们将在下一节更详细地讨论备注1.1、1.2和1.3的重要性。2.交易原则我们讨论Jesse L ivermore的两个主要交易规则,希望对histrading原则提供一个适度的见解。2.1. 利益会照顾自己,损失永远不会。假设只有两种可能的市场头寸,多头和中性,分别用aLand和aN表示。短将是长的反映。假设一名交易员在一段时间内开始多头仓位,因为考虑到他当前的财富st,他观察到AL=a*(st)(3)=arg maxaqt+1(st,a)=arg maxaEqr(a,st,st+1)+Vq(st+1)| st,a.但是,假设在时间t+1时,他发现r(a,st,st+1)<0,并且他的新财富现在是t+1<st。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-5-6 10:54:58
然后交易者必须评估是结束他的仓位(即行动aN),还是继续持有他的仓位(即行动aL)。如果我们假设是否进入或退出市场的决定与当前财富水平St+1无关,则arg maxaqt+2(St+1,a)=arg maxaqt+2(St,a)。我们观察到,如果在主观概率q=q(St+1 | St,a)不变的情况下行事,那么交易者将继续进行aL,因为Qqt+2(St+1,aL)>Qqt+2(St+1,an)与之前一样。然而,如果我们定义qq,xt+1t+2(St+1,a):=Eqr(a,st,st+2)+Vq(st+2)| st,a,xt+1暂时∈ {aL,aN},然后交易者现在用最近的价格移动xt+1中包含的信息补充他的理性(即他的主观概率q)。如果我们用q表示交易者的更新视图∪{xt+1}然后,通过s对称性参数,我们得到了qq∪{xt+1}t+2(St+1,aL)<Qq∪{xt+1}t+2(St+1,aN),其中,根据假设,r(aL,St,St+1)<0=r(aN,St,St+1)。我们观察到,除了价格变动xt+1之外,在没有其他外部信息的情况下,并且与他自己以前的理由一致,贸易商应该采取中立的行动,退出他的立场。实际上,由于交易成本的原因,交易者不会立即做出反应。然而,最优性原则的含义是,唯一需要关注的是卖出失去的头寸。在r(aL,st,st+1)>0的情况下,对上述论点的反映表明,下一阶段的最佳活动与当前阶段相同:赢家自己照顾自己。用利弗莫尔(1923)的话来说:“利润总是会照顾好自己,但损失永远不会。投机者必须通过承担第一笔小损失来确保自己不会遭受重大损失。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

点击查看更多内容…
相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群