全部版块 我的主页
论坛 经济学人 二区 外文文献专区
1599 44
2022-05-26
英文标题:
《EM Algorithm and Stochastic Control in Economics》
---
作者:
Steven Kou, Xianhua Peng, Xingbo Xu
---
最新提交年份:
2016
---
英文摘要:
  Generalising the idea of the classical EM algorithm that is widely used for computing maximum likelihood estimates, we propose an EM-Control (EM-C) algorithm for solving multi-period finite time horizon stochastic control problems. The new algorithm sequentially updates the control policies in each time period using Monte Carlo simulation in a forward-backward manner; in other words, the algorithm goes forward in simulation and backward in optimization in each iteration. Similar to the EM algorithm, the EM-C algorithm has the monotonicity of performance improvement in each iteration, leading to good convergence properties. We demonstrate the effectiveness of the algorithm by solving stochastic control problems in the monopoly pricing of perishable assets and in the study of real business cycle.
---
中文摘要:
推广了广泛用于计算最大似然估计的经典EM算法的思想,我们提出了一种用于求解多周期有限时域随机控制问题的EM控制(EM-C)算法。新算法采用蒙特卡罗模拟,在每个时间段以前后向的方式依次更新控制策略;换句话说,在每次迭代中,算法在模拟中向前,在优化中向后。与EM算法类似,EM-C算法在每次迭代中都具有性能改进的单调性,因此具有良好的收敛性。通过求解易逝性资产垄断定价中的随机控制问题和实际经济周期的研究,证明了该算法的有效性。
---
分类信息:

一级分类:Quantitative Finance        数量金融学
二级分类:Economics        经济学
分类描述:q-fin.EC is an alias for econ.GN. Economics, including micro and macro economics, international economics, theory of the firm, labor economics, and other economic topics outside finance
q-fin.ec是econ.gn的别名。经济学,包括微观和宏观经济学、国际经济学、企业理论、劳动经济学和其他金融以外的经济专题
--
一级分类:Mathematics        数学
二级分类:Optimization and Control        优化与控制
分类描述:Operations research, linear programming, control theory, systems theory, optimal control, game theory
运筹学,线性规划,控制论,系统论,最优控制,博弈论
--
一级分类:Statistics        统计学
二级分类:Machine Learning        机器学习
分类描述:Covers machine learning papers (supervised, unsupervised, semi-supervised learning, graphical models, reinforcement learning, bandits, high dimensional inference, etc.) with a statistical or theoretical grounding
覆盖机器学习论文(监督,无监督,半监督学习,图形模型,强化学习,强盗,高维推理等)与统计或理论基础
--

---
PDF下载:
-->
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2022-5-26 22:43:33
EM算法与随机控制不经济性*彭显华+徐兴波2016年11月6日摘要概括了广泛用于计算最大似然估计的经典EM算法的思想,我们提出了一种用于解决多周期有限时间随机控制问题的EM控制(EM-C)算法。新算法在每个时间段内通过蒙特卡罗模拟以前后向的方式依次更新控制策略;换言之,该算法在每次迭代中向前模拟,向后优化。与EM算法类似,EM-C算法在每次迭代中都具有性能改善的单调性,因此具有良好的收敛性。我们通过解决易逝性资产垄断定价中的随机控制问题和实际经济周期的研究,证明了该算法的有效性。关键词:EM算法、随机控制、递归模型、动态规划、垄断定价、实际经济周期、数值方法、随机逼近JEL分类:C44、C61、C63、D4、E3*新加坡国立大学风险管理学院和数学系,新加坡恒梅坑台21号。电子邮件:matsteve@nus.edu.sg.+香港九龙清水湾香港科技大学数学系。电子邮件:maxhpeng@ust。香港美国纽约哥伦比亚大学工业工程与运营研究系,邮编:10027。电子邮件:xx2126@columbia.edu.1引言1.1动机和主要结果随机控制问题广泛应用于宏观经济学(例如,真实商业周期的研究)、微观经济学(例如,效用最大化问题)和市场营销(例如,易腐资产的垄断定价)。这些控制问题可能是有限的时间范围。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-5-26 22:43:37
然而,由于最优控制策略不一定是静态的,因此有限时间随机控制问题比相关的有限时间随机控制问题更困难。通常必须借助数值方法来找到此类有限时间随机控制问题的解。由于维数的原因,通常很难用数值方法解决此类问题,尤其是在高维和复杂的随机动力学中。为了克服这些困难,在本文中,我们试图通过蒙特卡罗模拟来解决实时ho-RizontoCastic控制问题。更准确地说,我们提出了一种新的算法,EM控制(EM-C)算法,该算法使用蒙特卡罗模拟以向前向后的方式在每个时间段内顺序更新控制策略;换言之,在每次迭代中,算法在模拟中向前,在优化中向后。我们通过解决易逝性资产垄断定价和实际经济周期研究中的随机控制问题,证明了该算法的有效性。我们的算法源自不同领域的一种算法,即经典的期望最大化(EM)算法(Dempster、Laird和Rubin(1977)),该算法广泛用于计算缺失数据或潜在变量的最大似然估计(MLE)。在每次迭代中,EM算法首先根据前一次迭代的参数计算缺失数据的条件分布,然后根据刚更新的条件分布最大化全似然函数的期望值,以获得更新的参数。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-5-26 22:43:40
有趣的是,EM算法可以看作是一种在每次迭代中交替最大化一个具有一个分布参数和一个序数参数的目标函数的算法:分布参数是丢失数据的条件分布,普通参数是原始MLE问题的参数;参见第2.1节。我们的EM-C算法推广了EM算法的思想,用于解决多周期有限时间范围的随机控制问题,其中每个时间段都有对应的控制策略。EM-C算法是一种迭代算法,它在每一步操作中更新对应于一个时间段的一个控制策略。EM-C算法继承了EM算法的精神,通过优化仅在该时间段内与控制策略相关的目标函数,在给定时间段内更新控制策略,并且在算法迭代过程中,所有其他时间段的控制策略都固定在最新状态。新的EM-C算法与现有算法的区别在于四个方面:(i)与EM算法类似,所提出的EM-C算法在每次迭代时都具有性能改进的单调性,这使得EM-C算法具有良好的收敛性。(ii)EM-C算法不假设状态演化的特定动力学(即不限于随机过程的特定设置),正如EM算法可以应用于广泛的概率分布一样。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-5-26 22:43:43
(iii)EM-C算法不使用Bellman方程;相反,文献中的许多数值算法依赖于Bellman方程或其近似。(iv)与许多现有算法不同,EM-C算法处理有限时间范围的随机控制问题,其中最优策略不一定是平稳的。1.2文献综述由于EM算法是统计学中被引用最多的算法之一,因此该算法有许多扩展;例如,参见Wei和Tanner(1990年)、Meng和Rubin(1993年)、Gu和Li(1998年)以及Lange(2010年,第13章)中的评论。EM算法允许一般分布假设,并具有单调收敛的优点(Wu(1983))。经济学中有大量关于随机控制的文献。Hansen和Sargent(2013)详细讨论了可以解析求解Bellman方程的随机控制问题。Ljungqvist和Sargent(2013)讨论了动态规划方法及其对经济学中各种问题的应用。Judd(1998)、Miranda和Fackler(2002)提供了解决经济学中随机控制问题的递归方法的综合处理。Stokey、Lucas和Prescott(1989)描述了许多建模理论的例子。这里有一些Bellman方程可能不适用的随机控制问题。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-5-26 22:43:46
例如,当一般控制问题(6)中的效用函数不可时间分离时,则此类问题可能没有Bellman方程。使用动态规划和其他递归方法的经济学问题,包括最优经济增长、资源提取、委托代理问题、公共财政、企业投资、资产定价、要素供应和产业组织。Flemming和Soner(2005)深入讨论了连续时间随机控制问题及其应用。Kushner和Dupuis(2001)对利用马尔可夫链解决连续时间随机控制问题的数值方法进行了极好的综述。对于数学金融中连续时间随机控制问题的数值解也有很多研究;参见,例如,Zhang(2004年)、Bouchard和Touzi(2004年)、Crisan、Manolarakis和Touzi(2010年)、Fahim、Touzi和Warin(2011年)、Kharro ubi、Langreneé和Pham(2013a)、Kharroubi、Langreneé和Pham(2013b)以及Guo、Zhang和Zhuo(2012年),等等。这些研究大多集中于特定的随机过程,例如离散化扩散过程或Lévy过程,但我们的EM-C算法可以应用于一般的随机过程。此外,我们的方法是一种基于仿真的方法,适用于高维问题。近似动态规划(ADP)已被开发用于处理三个维度诅咒的来源:高维状态空间、控制策略空间和随机冲击空间;参见鲍威尔(2011)和贝特塞卡斯(2012)的著作。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

点击查看更多内容…
相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群