全部版块 我的主页
论坛 经济学人 二区 外文文献专区
3033 142
2022-04-26
英文标题:
《Policy Transforms and Learning Optimal Policies》
---
作者:
Thomas M. Russell
---
最新提交年份:
2020
---
英文摘要:
  We study the problem of choosing optimal policy rules in uncertain environments using models that may be incomplete and/or partially identified. We consider a policymaker who wishes to choose a policy to maximize a particular counterfactual quantity called a policy transform. We characterize learnability of a set of policy options by the existence of a decision rule that closely approximates the maximin optimal value of the policy transform with high probability. Sufficient conditions are provided for the existence of such a rule. However, learnability of an optimal policy is an ex-ante notion (i.e. before observing a sample), and so ex-post (i.e. after observing a sample) theoretical guarantees for certain policy rules are also provided. Our entire approach is applicable when the distribution of unobservables is not parametrically specified, although we discuss how semiparametric restrictions can be used. Finally, we show possible applications of the procedure to a simultaneous discrete choice example and a program evaluation example.
---
中文摘要:
我们研究了在不确定环境下,使用不完全和/或部分识别的模型选择最优策略规则的问题。我们考虑一个政策制定者,他希望选择一个政策来最大化一个特定的反事实数量,称为政策转换。我们通过一个决策规则的存在来描述一组策略选项的可学习性,该决策规则以高概率逼近策略变换的最大最优值。为该规则的存在提供了充分条件。然而,最优策略的可学习性是一个事前概念(即观察样本之前),因此也为某些策略规则提供了事后(即观察样本之后)理论保证。虽然我们讨论了如何使用半参数限制,但当不可观测的分布不是参数化指定时,我们的整个方法是适用的。最后,我们展示了该方法在同时离散选择和程序评估中的可能应用。
---
分类信息:

一级分类:Economics        经济学
二级分类:Econometrics        计量经济学
分类描述:Econometric Theory, Micro-Econometrics, Macro-Econometrics, Empirical Content of Economic Relations discovered via New Methods, Methodological Aspects of the Application of Statistical Inference to Economic Data.
计量经济学理论,微观计量经济学,宏观计量经济学,通过新方法发现的经济关系的实证内容,统计推论应用于经济数据的方法论方面。
--

---
PDF下载:
-->
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2022-4-26 14:54:50
政策转变与学习最优政策托马斯·M·拉塞尔*Carleton University 2020年12月22日摘要我们研究在不确定环境中使用可能不完整和/或部分识别的模型选择最优政策规则的问题。我们考虑希望选择政策以最大化特定反事实数量的决策者,称为政策转换。我们通过一个决策规则的存在来描述一组策略选项的可学习性,该规则以高概率逼近策略转换的最大最优值。为此类规则的存在提供了充分的条件。然而,最优策略的可学习性是一个事前概念(即观察样本之前),因此事后(即观察样本之后)也为某些策略规则提供了理论保证。虽然我们讨论了如何使用半参数限制,但当不可观测的分布不是参数指定的时,我们的整个方法是适用的。最后,我们展示了该方法在同时离散选择和程序评估中的可能应用。关键词:部分识别、决策理论、统计学习理论感谢顾家英、伊斯梅尔·穆里、爱德华多·索扎·罗德里格斯、亚当·罗森、斯坦尼斯拉夫·沃古舍夫和万元元的反馈和鼓励,我特别感谢赵俊焕长时间的讨论,帮助改进了本文。这篇论文的前一个版本出现在我在多伦多大学的博士论文中。这项研究得到了加拿大社会科学和人文研究委员会的支持。所有的错误都是我自己的。*托马斯·M·拉塞尔,卡尔顿大学经济学系助理教授,加拿大安大略省渥太华市凯伦上校路1125号,K1S5B6。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-4-26 14:54:56
电子邮件:托马斯。russell3@carleton.ca.1引言计量经济学的基本目标之一是可靠地将基础经济机制的知识转化为模型,当与样本数据结合时,模型可用于理解反实际政策实验的影响,并有助于指导政策决策。在本文中,我们考虑在计量经济模型部分确定和/或不完整的情况下进行决策的问题。这篇论文的动机是,需要可信的模型来诚实地告知政策制定者反事实政策的影响,即使可信的模型提供了真实数据生成过程的不完整描述。我们的框架足够通用,可以容纳许多现有的结构经济计量模型。我们对环境的描述与约万诺维奇(1989年)和切希尔与罗森(2017a)中的描述相似,这反过来又是库普曼斯等人(1950年)和赫维茨(1950年)等人提出的经济计量模型经典基础的延伸。我们假设所考虑的经济系统表现为一组随机变量,这些随机变量可分为可观察变量,包括可观察的内生变量Y和外生变量Z的向量,以及由向量U表示的潜在或不可观察的变量。我们通俗地称Y和Z中包含的变量为“可观察变量”并将U中包含的变量称为“不可观测”与大多数现有文献不同,我们不把U的分布作为一个模型原语。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-4-26 14:55:02
这与潜在变量U代表理论模型可以解释的内容与必须解释的内容之间的差距的观点一致;也就是说,“方程中的错误”而不是“变量中的错误”正如我们将要展示的那样,在进行反事实分析时,这种区别变得尤为重要。假设决策者能够访问可观测数据,以及描述可观测数据与不可观测数据之间关系的计量经济学模型。该模型可能依赖于参数θ的向量∈ Θ; 这里只要求Θ是一个完整且可分离的度量空间,这允许在非参数分析中使用许多函数空间。然后,我们让Γ表示决策者正在考虑的所有可能政策集合的抽象,其中γ∈ Γ表示这样一种政策。每一项道德政策∈ Γ代表对潜在的现有经济系统的干预,其作用是从外生和未观察到的变量中产生内生变量。在经济系统被修改后,由此产生的系统现在可能会产生新的或反事实的内生变量分布。因此,通过改变基础经济系统,政策干预会导致内生结果变量的事实(或观察到的)和反事实(假设和未观察到的)分布发生变化。潜在变量不受政策的影响,而是遵循Morgan(1990)第6章中对误差项的两种解释。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-4-26 14:55:08
我们建议秦和吉尔伯特(2001)回顾一下人们对潜在变量的态度是如何随着时间的推移而演变的。作为事实和反事实领域之间的重要联系。然后,决策者的问题被表述为选择政策干预的问题,该政策干预会导致内部结果变量的反事实分布,根据某些标准,这些变量是有利的。我们将反事实的内生结果变量表示为Y?γ、 γ指数强调其分布将取决于反事实政策实验γ这一事实∈ Γ正在考虑中。在这种设置下,本文主要关注一类特殊的反事实量,其可以用以下形式书写:I[~n](γ):=Z~n(v)dPVγ。(1.1)这里φ是一些函数,Vγ:=(Y?γ,Y,Z,U)是描述事实域和反事实域的所有随机变量的向量,PVγ表示Vγ的分布,V表示Vγ的实现。特别是,运算符I[·](γ)取内生、外生、未观测和反事实变量的向量v的函数,并将其映射到策略参数γ的函数I[ν](γ)。因此,我们将I[·](γ)视为一种政策转变。正如我们将在同步离散选择和项目评估的示例中所示,可以写成策略转换的反事实对象包括反事实选择概率和反事实平均效果。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-4-26 14:55:14
如果政策制定者的反事实利益对象可以写成某个函数的政策转换,那么由此产生的政策转换提供了政策制定者比较各种政策和做出政策选择所需的所有信息。在整篇论文中,我们考虑了希望最大化政策转变价值的决策者,尽管我们的分析同样适用于决策者希望最小化政策转变价值的情况。决策者完全了解向量Vγ的分布,可以面对一个简单的决策问题,并且可以简单地选择策略γ,该策略γ可以获得最大的策略变换I[~n](γ)。然而,这种理想化的决策问题在实践中很少遇到,相反,决策者可能只能获得观察到的随机变量的有限样本。此外,即使有一个有限的样本,在任何可信的假设下,也可能无法确定政策转变。在整个讨论过程中,这一点尤其正确,因为我们不要求对不可观测U的分布进行参数化规定。为了取得进展,我们将政策决策问题建模为模糊决策,其中我们假设“世界的真实状态”属于状态空间S×PY,Z。这里PY,Zis是可观测空间Y×Z上所有可钻性测度的集合∈ S和一对条件分布(PU | Y,Z,PY?γ| Y,Z,U)有关。拿一双(s,PY,Z)∈ S×PY,zt要成为真实状态,政策制定者可以在对应于该状态的(1.1)中评估策略转换。将依赖项保持在PY,Zimplicit上,我们将状态(s,PY,Z)中的策略转换表示为I[~n](γ,s),并将其称为状态依赖策略转换。然后,我们考虑决策者在获得aFrom Pearl(2009)p时的决策问题。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

点击查看更多内容…
相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群