策略转换和学习最优策略

2022-4-26 14:54:50

政策转变与学习最优政策托马斯·M·拉塞尔*Carleton University 2020年12月22日摘要我们研究在不确定环境中使用可能不完整和/或部分识别的模型选择最优政策规则的问题。我们考虑希望选择政策以最大化特定反事实数量的决策者，称为政策转换。我们通过一个决策规则的存在来描述一组策略选项的可学习性，该规则以高概率逼近策略转换的最大最优值。为此类规则的存在提供了充分的条件。然而，最优策略的可学习性是一个事前概念（即观察样本之前），因此事后（即观察样本之后）也为某些策略规则提供了理论保证。虽然我们讨论了如何使用半参数限制，但当不可观测的分布不是参数指定的时，我们的整个方法是适用的。最后，我们展示了该方法在同时离散选择和程序评估中的可能应用。关键词：部分识别、决策理论、统计学习理论感谢顾家英、伊斯梅尔·穆里、爱德华多·索扎·罗德里格斯、亚当·罗森、斯坦尼斯拉夫·沃古舍夫和万元元的反馈和鼓励，我特别感谢赵俊焕长时间的讨论，帮助改进了本文。这篇论文的前一个版本出现在我在多伦多大学的博士论文中。这项研究得到了加拿大社会科学和人文研究委员会的支持。所有的错误都是我自己的。*托马斯·M·拉塞尔，卡尔顿大学经济学系助理教授，加拿大安大略省渥太华市凯伦上校路1125号，K1S5B6。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

2022-4-26 14:54:56

电子邮件：托马斯。russell3@carleton.ca.1引言计量经济学的基本目标之一是可靠地将基础经济机制的知识转化为模型，当与样本数据结合时，模型可用于理解反实际政策实验的影响，并有助于指导政策决策。在本文中，我们考虑在计量经济模型部分确定和/或不完整的情况下进行决策的问题。这篇论文的动机是，需要可信的模型来诚实地告知政策制定者反事实政策的影响，即使可信的模型提供了真实数据生成过程的不完整描述。我们的框架足够通用，可以容纳许多现有的结构经济计量模型。我们对环境的描述与约万诺维奇（1989年）和切希尔与罗森（2017a）中的描述相似，这反过来又是库普曼斯等人（1950年）和赫维茨（1950年）等人提出的经济计量模型经典基础的延伸。我们假设所考虑的经济系统表现为一组随机变量，这些随机变量可分为可观察变量，包括可观察的内生变量Y和外生变量Z的向量，以及由向量U表示的潜在或不可观察的变量。我们通俗地称Y和Z中包含的变量为“可观察变量”并将U中包含的变量称为“不可观测”与大多数现有文献不同，我们不把U的分布作为一个模型原语。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

2022-4-26 14:55:02

这与潜在变量U代表理论模型可以解释的内容与必须解释的内容之间的差距的观点一致；也就是说，“方程中的错误”而不是“变量中的错误”正如我们将要展示的那样，在进行反事实分析时，这种区别变得尤为重要。假设决策者能够访问可观测数据，以及描述可观测数据与不可观测数据之间关系的计量经济学模型。该模型可能依赖于参数θ的向量∈ Θ; 这里只要求Θ是一个完整且可分离的度量空间，这允许在非参数分析中使用许多函数空间。然后，我们让Γ表示决策者正在考虑的所有可能政策集合的抽象，其中γ∈ Γ表示这样一种政策。每一项道德政策∈ Γ代表对潜在的现有经济系统的干预，其作用是从外生和未观察到的变量中产生内生变量。在经济系统被修改后，由此产生的系统现在可能会产生新的或反事实的内生变量分布。因此，通过改变基础经济系统，政策干预会导致内生结果变量的事实（或观察到的）和反事实（假设和未观察到的）分布发生变化。潜在变量不受政策的影响，而是遵循Morgan（1990）第6章中对误差项的两种解释。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

2022-4-26 14:55:08

我们建议秦和吉尔伯特（2001）回顾一下人们对潜在变量的态度是如何随着时间的推移而演变的。作为事实和反事实领域之间的重要联系。然后，决策者的问题被表述为选择政策干预的问题，该政策干预会导致内部结果变量的反事实分布，根据某些标准，这些变量是有利的。我们将反事实的内生结果变量表示为Y？γ、 γ指数强调其分布将取决于反事实政策实验γ这一事实∈ Γ正在考虑中。在这种设置下，本文主要关注一类特殊的反事实量，其可以用以下形式书写：I[~n]（γ）：=Z~n（v）dPVγ。（1.1）这里φ是一些函数，Vγ：=（Y？γ，Y，Z，U）是描述事实域和反事实域的所有随机变量的向量，PVγ表示Vγ的分布，V表示Vγ的实现。特别是，运算符I[·]（γ）取内生、外生、未观测和反事实变量的向量v的函数，并将其映射到策略参数γ的函数I[ν]（γ）。因此，我们将I[·]（γ）视为一种政策转变。正如我们将在同步离散选择和项目评估的示例中所示，可以写成策略转换的反事实对象包括反事实选择概率和反事实平均效果。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

kedemingshi

2022-4-26 14:55:14

如果政策制定者的反事实利益对象可以写成某个函数的政策转换，那么由此产生的政策转换提供了政策制定者比较各种政策和做出政策选择所需的所有信息。在整篇论文中，我们考虑了希望最大化政策转变价值的决策者，尽管我们的分析同样适用于决策者希望最小化政策转变价值的情况。决策者完全了解向量Vγ的分布，可以面对一个简单的决策问题，并且可以简单地选择策略γ，该策略γ可以获得最大的策略变换I[~n]（γ）。然而，这种理想化的决策问题在实践中很少遇到，相反，决策者可能只能获得观察到的随机变量的有限样本。此外，即使有一个有限的样本，在任何可信的假设下，也可能无法确定政策转变。在整个讨论过程中，这一点尤其正确，因为我们不要求对不可观测U的分布进行参数化规定。为了取得进展，我们将政策决策问题建模为模糊决策，其中我们假设“世界的真实状态”属于状态空间S×PY，Z。这里PY，Zis是可观测空间Y×Z上所有可钻性测度的集合∈ S和一对条件分布（PU | Y，Z，PY？γ| Y，Z，U）有关。拿一双（s，PY，Z）∈ S×PY，zt要成为真实状态，政策制定者可以在对应于该状态的（1.1）中评估策略转换。将依赖项保持在PY，Zimplicit上，我们将状态（s，PY，Z）中的策略转换表示为I[~n]（γ，s），并将其称为状态依赖策略转换。然后，我们考虑决策者在获得aFrom Pearl（2009）p时的决策问题。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

点击查看更多内容…

2022-4-26 14:55:22

211：“背景变量是从现实世界到假想世界的主要信息载体；它们在将前者转化为后者的动态过程中充当“不变性”（或持久性）的守护者。”来自真实分布的有限样本。让ψn表示所有可能n的空间-样本{（yi，zi）}ni=1，且设d:ψn→ Γ表示从样本实现映射到策略的（可测量的）决策规则。在样本ψ之前∈ ψd（ψ）将是一个随机变量，然后决策者的问题转化为根据一些合理标准选择决策规则的问题。然而，在不了解真实情况的情况下，不清楚决策者应该如何（按照规定）在各种决策规则中进行选择或排序。对任何排名决策规则的方法来说，一个几乎不言而喻的要求是，排名应该尊重弱优势；也就是说，如果每个PY，Z∈ PY，Zwe有I[~n]（d（ψ），s）≤ 对于每一个s，I[~n]（d（ψ），s）a.s∈ S、然后d应该优先于d。然而，很明显，根据这种偏序，许多决策规则将不具有可比性。为了进一步研究，我们引入了一种偏好关系，它超越了所有决策规则的空间，这是由计算学习理论激发的。特别是，fix anyκ∈ （0,1）设cn（d，κ）为最小值：infPY，Z∈PY，ZP纽约，Zinfs∈SI[~n]（d（ψ），s）+cn（d，κ）≥ supγ∈Γinfs∈SI[~n]（γ，s）≥ κ. （1.2）然后在我们的框架下，一个决策规则d:ψn→ Γ弱于决策规则d:ψn→ Γ如果cn（d，κ），则κ水平和样本量n≤ cn（d，κ）。这种偏好关系似乎是新的，并且（在一定程度上）与现有的频繁决策理论文献不同。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

2022-4-26 14:55:35

然而，它与计算学习理论中的概率近似正确（PAC）学习框架有着密切的联系，这使得我们可以利用统计学习理论和经验过程理论的丰富结果来研究它的理论性质。此外，这种偏好关系导致总体排序，我们在第2节中的第一个结果表明，这种偏好关系至少尊重弱优势。鉴于这种偏好关系，在本文中，我们将使用值cn（d，κ）来衡量给定样本量n和置信水平κ下决策规则d的“性能”或“质量”。然后，我们为决策者的决策问题提供了两组理论结果。在第一组结果中，我们提供了决策问题的条件，以保证决策规则d的存在，使得cn（d，κ）随着样本量n变大而趋于零。这种决策规则的存在是政策空间可学习性概念的特征。政策空间学习能力的定义在经济学中似乎是新的，尽管它是根据Valiant（1984）提出的广受欢迎的计算机科学PAC学习框架改编的。我们的具体分析主要涉及Haussler（1992）提出的PAC学习模型的决策论推广，即认知PAC学习模型。我们表明，即使在简单的环境中，政策空间也可能无法学习。在这种情况下，政策制定者的决策问题仍然很明确，但即使在大样本情况下，任何给定政策的执行效果也会受到理论上的限制。然后，我们为可学习性提供了充分的条件，这与问题中函数类的某些复杂性度量有关；特别是第2.3节的定义。覆盖/包装数和度量熵的行为。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

2022-4-26 14:55:44

我们定义了一个“熵增长条件”，并证明如果我们环境中的某些关键函数类满足该条件，那么策略空间Γ是可学习的。我们的熵增长条件的原始条件可以在关于经验过程和统计学习的文献中找到。除了对可学习性有帮助外，我们还展示了如何使用该条件来确定收敛速度。然而，由于可学习性是一个事前概念（即在观察样本之前），验证可学习性可能对给定策略规则的事后表现（即在观察样本之后）没有信息。因此，我们的第二组结果为决策者提供了一种手段，可以对自己选择的政策规则进行事后分析。首先，我们研究称为ε的特定决策规则的有限样本性质-maximin经验（eME）规则，选择ε-最坏情况下的最大值（超过s）∈ S） I[~n]（γ，S）的经验衰减。利用集中不等式，我们给出了当d为eME规则时，数量cn（d，κ）的上界，并证明了上界是如何受到决策问题的各种特征的影响的。然而，eME规则只是一个特定规则，出于许多原因，它可能不是决策者选择的政策规则。因此，我们转向近似所有策略集γ的问题∈ Γ满意：γ7→ supγ∈Γinfs∈SI[~n]（γ，s）- infs∈SI[~n]（γ，s）≤ δ、（1.3）概率至少为κ；请注意，在这个集合中选择策略的任何决策规则都将因此具有cn（d，κ）≤ δ. 我们将这组策略称为“δ-水平集”，并展示了统计学习理论中关于超额风险界限的文献中的一个过程如何适应我们的环境，以近似δ-水平集。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

2022-4-26 14:55:52

最后，我们证明了eME决策规则在δ中选择策略-δ足够大的可能性很高，为其使用提供了进一步的合理性。与可学习性的第一次事前分析不同，包括事后分析在内的所有结果都不要求满足熵增长条件或任何其他可学习性的充分条件。因此，无论政策空间Γ是否可学习，它们都适用，尽管它们对收敛速度保持沉默。综上所述，我们相信我们的两组理论结果提供了一种制定和评估决策的综合手段。本文也从身份识别的角度做出了贡献。也许毫不奇怪，我们研究政策决策的一个重要理论对象是以下政策变换包络函数：I`b[~n]（γ）：=infs∈SI[~n]（γ，s），Iub[~n]（γ）：=sups∈SI[~n]（γ，s）。不管真实（子）状态是什么∈ S、在真实分布PY中，zt（1.1）中的策略转换可以“夹在”这些上下包络函数之间。这个想法如图1所示。因此，我们能够对这些包络函数进行易于处理的描述，这对我们的图1至关重要：该图说明了一些函数的策略转换，以及上下包络函数Iub[]（γ）和I`b[]（γ）（分别）。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

2022-4-26 14:55:58

极小极大（超（子）态∈ S）策略是使上包络最小化的策略，而最大化（在（子）状态下）的策略∈ S）政策选择是使低层发展最大化的政策。能够为政策的可学习性以及我们对eME规则和δ的事后分析提供充分的条件-水平集。包络函数本身可能不是策略变换，但在某些情况下，它们可以被解释为策略变换I[~n]（γ）上的尖锐边界，即变量γ中的逐点边界。正是在这里，我们在识别文献中做出了贡献，表明包络函数可以表示为由策略变量γ参数化的优化问题的值函数∈ Γ. 结果是在误差界理论和优化文献中精确罚函数的假设下得出的，由此产生的优化问题与平衡约束的数学程序或MPEC密切相关。我们的优化方法的一个显著好处是，我们可以在不需要首先估计模型参数向量θ的完整识别集的情况下构建策略转换的边界。这与限制反事实量的典型方法不同，反事实量首先估计已识别的结构参数集，然后对已识别集中参数向量的每个可能值进行计算。我们的结果的一个直接含义是，在任一点或部分识别的模型中，如果决策者的反事实利益量是某些函数的政策转换，那么在执行反事实和做出政策选择时，所有结构参数都可以被视为干扰参数。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

2022-4-26 14:56:04

这些识别结果可能具有实质性的单独利益。最后，在全文中，我们讨论了一个同时离散选择和一个程序评估示例，以说明该程序的可能应用。同时离散选择示例参见Dolgopolik（2016），了解精确惩罚函数及其与误差界的关系，参见Luo等人（1996），了解教科书中的MPECs处理方法。将经验入门游戏（如Tamer（2003））和社会互动的经验模型（如Brockand Durlauf（2001））作为特例，并已成为部分识别文献中不完整模型的典型例子。第二个项目评估示例遵循Heckman和Vytlacil（1999）以及Heckman和Vytlacil（2005）中的设置。这个例子最近引起了部分识别文献的关注（例如Mogstad等人（2018年）和Mouri fie and Wan（2020年））并被包括在内，以显示我们程序的广度。1.1相关文献本论文基于各种不同文献的结果，包括结构模型中的反事实、部分识别和随机集理论、决策理论和最优政策选择，以及计算和统计学习理论的最新研究成果。我们在部分识别模型中建模和反事实的方法扩展了计量经济学中使用随机集理论的文献，包括Beresteanu等人（2011）、Galichon和Henry（2011）、Beresteanu等人（2012）和Chesher和Rosen（2017a）。如引言中所述，我们的一般环境与约万诺维奇（1989年）以及最近的切希尔和罗森（2017a）中的描述相似，这反过来又是inKoopmans等人（1950年）和Hurwicz（1950年）等提出的经典计量经济建模基础的延伸。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

2022-4-26 14:56:10

随机集理论的使用很方便，以便将该方法应用于更广泛的模型。特别是，我们的框架适用于可能（或可能不）不完整的模型，这是部分识别文献中的一类重要模型。现在，不完整的模型数量众多，包括具有多重平衡的入门游戏（Bresnahan and Reiss（1990）、Bresnahan and Reiss（1991）、Tamer（2003）、Jia（2008）、Cilibertoet al.（2018））；英国拍卖（Haile and Tamer（2003）、Chesher and Rosen（2017b））；具有内生回归或社会互动的离散选择模型（Chesher and Rosen（2012）、Chesher et al.（2013）、Chesher and Rosen（2014））；匹配模型（Uetake和Watanabe（2019））；《友谊网络》（宫内（2016））；以及选择和治疗效果模型（Mouri Fie等人（2018年），Russell（2019年））。从政策选择的角度来看，我们对政策决策问题的总体态度是新的。然而，现在关于计量经济学中统计处理规则的文献越来越多，包括曼斯基（2004年）、平野和波特（2009年）、斯托耶（2009年）、斯托耶（2012年）、张伯伦（2011年）、泰特诺夫（2012年）、卡西（2016年）、北川和泰特诺夫（2018年）以及姆巴科普和塔博德·米汉（2019年）的论文。一般来说，这些论文可以根据（i）他们是否是常客/贝叶斯，（ii）他们是否采用单一样本或渐进方法，以及（iii）他们是否考虑不确定性或歧义（或“奈特不确定性”）下的决策问题进行分析。在目前的论文中，我们采取了一种频繁的、有限样本的方法来解决模糊性下的决策问题。然而，与以前属于同一类的论文不同，我们评估统计决策规则的方法不同于Wald（1950）提出的程序。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

2022-4-26 14:56:16

在不存在未知子状态引起的歧义的情况下∈ S、我们的过程与归纳推理的框架非常相似，归纳推理在计算机科学文献中非常流行。这种学习模式最初由Valiant（1984）在一篇开创性论文中提出，并因此获得了图灵奖。Angluin和Laird（1988）首次使用了“大概大致正确”这个名称，他们将模型扩展到了噪声数据的情况。PAC模型及其扩展现已成为机器学习理论基础中的主要学习模型；明确这种联系的有效教科书处理方法包括卡恩斯等人（1994年）、瓦普尼克（1995年）、瓦普尼克（1998年）、维迪亚萨加尔（2002年）、沙列夫·施瓦茨和本·戴维（2014年）以及莫赫里等人（2018年）。我们的具体分析与Haussler（1992）提出的PAClearning模型的决策论推广以及Vapnik（1995）考虑的一般学习环境密切相关。其他研究各种机器学习环境下可学习性的必要和有效条件的重要论文包括Blumer等人（1989年）、Kearns和Schapire（1994年）、Bartlett等人（1996年）、Alon等人（1997年）和Shalev Shwartz等人（2010年）等。我们在这里为可学习性提供充分条件的工作大量借鉴了这篇文献。然而，与政策转变的可能部分识别相关的额外模糊性使我们的设置与统计学习文献不同，我们将这种模糊性概念纳入PAC框架似乎是新的。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

2022-4-26 14:56:22

我们的许多结果适用于（随机）约束下的风险最小化问题，因此可能对机器学习的研究人员有不同的兴趣。令人惊讶的是，我们不知道有人试图将统计决策理论的文献与统计学习理论的文献正式联系起来。一方面，Wald styleanalysis的特性（在这一点上）得到了更好的理解；例如，参见Stoye（2011）对Wald的频率最大化过程的公理化。另一方面，我们发现PAC风格的标准更适合于特定决策规则的事后信息分析，主要是因为它与度量集中现象有关，因此更适合使用集中不等式进行分析。与统计学习文献的联系渗透到我们的理论结果中。我们的工作与比率型经验过程的研究（如金恩等人（2003年）、金恩等人（2006年））以及风险最小化问题中的定点方程和收敛速度的研究（如马萨特（2000年）、科尔钦斯基和潘琴科（2000年）、布斯凯等人（2002年）、巴特利特等人（2005年）和科尔钦斯基（2006年））有关。总体而言，我们的工作与科尔钦斯基（2006）的工作以及随后的教科书处理科尔钦斯基（2011）的工作关系最为密切。正如我们将在某些决策规则的事后分析一节中看到的，我们方法的一个关键组成部分是使用Rademacher过程来构造某些重要经验过程的数据相关边界。这样做的好处是，决策者可以避免依赖底层函数类的任何特定属性，这些属性通常很难验证，因此无论相关的策略空间是否可学习，都是适用的。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

2022-4-26 14:56:29

此外，使用依赖于数据的复杂性度量，如经验Rademacher复杂性，确保我们的有限样本Kitagawa和Tetenov（2018年）以及Mbakop和Tabord Meehan（2019年）与统计学习文献有一定的联系。然而，他们评估统计处理规则的方法不同于PAC模型所考虑的方法。豪斯勒（Haussler，1992）的一篇综述性论文中对与决策理论的联系进行了一些讨论，尽管讨论非常有限，与沃尔德式的频繁决策理论没有联系。据我们所知，这仍然是一个公开的问题。与其他方面相比，担保没有那么保守。这一想法似乎是由Bartlettet al.（2002）和Koltchinskii（2001）独立提出的，并在Koltchinskii（2006）中进一步发展。另见Koltchinski（2011）第4.2节。Boucheron等人（2005年）和Koltchinskii（2011年）对过度风险界限及其在分类问题中的应用进行了综述，并介绍了不稳定学习理论。Ekeland等人（2010年）、Schennach（2014年）、Torgovitsky（2019年）和Li（2019年）的工作与本文中研究政策转换包络函数的识别部分密切相关。Ekeland等人（2010）的论文侧重于模型规格测试，并允许预测模型仅对力矩条件下不可观测数据的分布具有半参数限制。Schennach（2014）为具有依赖于潜在变量的矩条件的模型提供了一个通用框架，并表明可以使用最不利的熵最大化分布，在不损失信息的情况下，将潜在变量从矩条件中整合出来。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

2022-4-26 14:56:35

Torgovitsky（2019）表明，当潜在变量分布的限制具有某种结构时，部分识别参数的函数的清晰识别集可以用优化问题来表征。最后，Li（2019）表明，结构参数和反事实参数的清晰识别集可以使用一种方法来构建，该方法基本上可以从力矩条件中提取潜在变量。在当前的论文中，我们使用了与Li（2019）相关的想法，以消除反事实边界问题中的不可观测项。然而，与李（2019）相比，我们对政策转变的关注意味着我们的公式不需要用连续的力矩条件替换有限数量的力矩条件。此外，我们的方法不要求决策者计算完整的结构参数集。我们针对两个参数优化问题对策略转换边界的具体描述，旨在符合策略空间可学习性的理论分析，以及eME规则和δ的分析-水平仪。因此，我们的特定边界方法是新的。最后，或许也是最重要的一点，我们的重点主要是利用边界来研究政策选择问题，Ekeland等人（2010年）、Schennach（2014年）、Torgovitsky（2019年）或Li（2019年）都没有考虑到这一点。在政策决策问题中，至少有一些结构参数可能被视为有害参数的想法至少可以追溯到Marshak（1953年）。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

2022-4-26 14:56:41

Heckman（2010）将这种想法称为“Marshak\'sMaxim”从高层次上讲，本文的识别部分让人想起Ichimura和Taber（2000），他们讨论了一种在治疗效果文献中进行事前政策实验的方法，无需估计结构参数，也无需指定误差分布。在Syrgkanis等人（2018年）、Tebaldi等人（2019年）和Kalouptsidi等人（2019年）中可以找到更多未首先估计（已识别的）结构参数的反事实分析示例。论文的其余部分将按以下步骤进行。第2节介绍了符号和主要定义Ekeland等人（2010）的论文与同一作者的一系列其他论文相关，即Galichon and Henry（2006）、Galichon and Henry（2009）和Galichon and Henry（2011）。和假设，除了描述决策环境和介绍激励示例。重要的是，第2节介绍了政策转换，并定义了政策空间的可学习性概念。如上所述，本文的理论结果在很大程度上取决于策略转换的上下包络函数的性质。因此，在第3节中，我们定义了策略变换的识别集，并给出了表征其上下包络的主要识别结果。根据这一结果，第4节考虑了政策选择问题，为可学习性提供了充分的条件，第5节对特定决策规则的表现进行了事后分析。第6节结束。所有证据都可以在附录中找到。注：给定一个波兰空间（一个完整的可分离度量空间）的子集X，我们使用B（X）来表示Borelσ-X上的代数（注意X上的拓扑是由度量导出的拓扑）。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

2022-4-26 14:56:47

我们通常要么隐式保留度量，要么用函数d:X×X表示通用度量→ R.对于两个可测空间（X，B（X））和（X，B（X）），乘积σ-用B（X）表示的X×Xis上的代数B（X）。如果X：(Ohm, （A）→ （X，B（X））是定义在概率空间上的随机变量(Ohm, A、 P），然后我们用PXtodenote表示由X诱导的概率测度；也就是说，对于任何一个∈ B（X），PX（A）：=P（X-1（A））。我们让σ（X） A表示最小次σ-使X成为可测函数的代数。此外，我们还解释了px | X（X∈ A | X=X）作为正则条件概率度量。在许多情况下，我们不会明确区分随机变量X（比如PX）的真实分布，或者随机变量X（比如PX）的其他分布，而是将区别留待上下文解决。为了保持旋转干净，我们在组合列向量时将省略转置；也就是说，如果vand vare使用两个列向量，而不是写v=（v>，v>）>我们改为写v=（v，v），在这里，除非另有规定，否则我们理解为是一个列向量。重要的是，在本文中，我们使用了 = -∞ 和inf = +∞. 最后，我们将在正文中基本上忽略可测量性问题，但我们注意到，这些问题在我们的框架中并非无关紧要，在附录B.2.1.2 Methodology2中进行了讨论和解决。1序言中提到，环境的描述与约万诺维奇（1989）和切希尔与罗森（2017a）的描述密切相关，这反过来又是库普曼斯等人（1950）和赫维茨（1950）等人提出的计量经济学模型的经典基础的延伸。然而，当它们发生时，会指出一些差异。本文还将大量使用随机集理论。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

2022-4-26 14:56:54

随机集理论在开发部分识别模型的方法方面发挥了重要作用，例如Beresteanu等人（2011）、Galichon和Henry（2011）、Beresteanu等人（2012）和Chesher和Rosen（2017a）等人的贡献。在本文中，我们还将使用随机集理论，因为它自然地将完整计量经济模型的许多特征推广到不完整模型（见Chesherand Rosen（2017a））。由于完整模型可以被视为不完整模型的特例，关注不完整模型将使我们能够构建一种适用于更广泛类别的计量经济学模型的方法。为简洁起见，随机集理论中的一些重要定义，包括效应可测性的概念、随机集的定义、随机集的分布以及从随机集中选择的概念，已移至附录a。本节将假定对这些概念有一些实用知识。我们首先指定对事实和反事实领域的限制。首先，我们将定义概率空间，并定义两个域共有的未观察到的随机变量和参数。假设2.1。存在固定概率空间(Ohm, A、 P）和一个随机元素U：(Ohm, （A）→（U，B（U））其中U是紧致的第二可数Hausdorff空间。此外，参数空间Θ是带有σ的非对称空间-代数B（Θ）。修正整个概率空间代表着与计量经济学中关于部分识别和随机集理论的一些现有文献（例如Galichon and Henry（2011），Chesher andRosen（2017a））不同。我们这样做的原因主要是概念性的。本文关注的是反事实，而反事实自然涉及事实和反事实状态之间的单位比较。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

2022-4-26 14:57:00

在任何概率框架中，潜在的概率空间自然地规定了基本的观察单位（例如个人、企业、类型等），因此在进行反事实分析时，观察单位必须与事实和反事实状态相同。这一点似乎是中观的，但它将对我们大多数结果的陈述和证明产生重大影响，同时也将解决一些解释上的困难。假设2.1中U是紧空间的限制似乎过于严格；例如，欧几里德空间Rd（d<∞) 通常的拓扑结构不是一个紧凑的空间。我们可以考虑放宽假设2.1，允许U是局部紧的第二可数Hausdorff空间，其中CHRD（具有通常的拓扑）就是一个例子。然而，任何局部紧Hausdorff空间都有一个单点紧空间；也就是说，假设U是局部紧的，并且hausdorff，存在一个紧空间eu和UeU使eU\\U由一个点组成。此外，eU在同胚上是唯一的。相关论点已在Schennach（2014）中提出。从这个角度来看，很难想象一个环境，在这个环境中，决策者应该有很强的先验理由，使用局部紧凑的Hausdorff空间U和它的一点紧凑空间U对不可观测的事物进行建模，尽管这是在实践中实现的。另一方面，从理论上讲，将U看作紧致（或某些局部紧致Hausdorff空间的一点紧致）的好处很多。我们将强调这些好处。见Munkres（2014）定理29.1。回想一下，同胚是一个具有连续逆的连续可逆函数。注意，我们不要求分布U属于参数类。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

2022-4-26 14:57:06

这与我们希望避免将U的分布视为模型原语的愿望是一致的。这一观点与以下观点一致：潜在变量代表未建模的基础经济系统的组成部分，这主要是因为决策者不知道决定U的过程，因此无法构建受调查经济系统的完整数学描述。鉴于潜在变量在决定反事实结果中所起的作用，这种解释变得特别有意义。相反，正如我们将看到的，U的分布可以隐式地受到模型的其余原语的约束。最后我们注意到，用Borelσ来装备参数空间-代数B（Θ）可能看起来很奇怪。然而，要在我们的框架内做出政策决定，需要在以后介绍某些功能的可测量性。所需可测量性的原始条件将利用测量空间（Θ，B（Θ））。我们在整篇文章中回到了类似的观点，并请读者参阅附录B.2.1，以了解我们关于可测量性的结果。现在我们将总结对事实域和反事实域的限制，从非事实域开始。假设2.2（事实领域）。事实域由随机向量Y表示：(Ohm, （A）→（Y，B（Y））和Z：(Ohm, （A）→ （Z，B（Z）），其中Y和Z是波兰空间。存在一个（可能是多值的）映射G-: Y×Z×Θ→ U是封闭的，效果是可测量的，并且满足：PU∈ G-（Y，Z，θ）|Y=Y，Z=Z= 1，（2.1）（y，z）-a、对于一些θ∈ Θ. 此外，EPU | Y，Z×PY，Z[mj（Y，Z，U，θ）]≤ 0，j=1，J、（2.2）对于一些可测函数mj:Y×Z×U×Θ→ R、对于j=1。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

2022-4-26 14:57:12

，J，每个θ的绝对值有界∈ Θ.假设的第一部分指出，未观测到的随机向量是从随机集G中选择的-（Y，Z，θ）（选择的定义见附录A）。注意，假设只需要G-（·，θ）在θ=θ时允许选择。因此，假设的第一部分可以解释为不可观测向量的支持限制，条件是观测数据。这些限制来自决策者的计量经济模型，我们将在前面的例子中看到。我们还注意到，随机集G-包含美国-Chesher和Rosen（2017a）提出的水平集是一个特例，因此我们的框架将适用于他们工作中考虑的广义工具变量（GIV）模型。Chesher和Rosen（2015）附录B中提出的类似论点可以用来表明，以（y，z）A.s.为条件的可选择性的这种表征相当于对（y，z，U）的联合分布使用类似的可选择性标准。稍后，当我们引入假设2.3时，类似的观点也将适用。在假设的第二部分中，我们假设事实域满足（2.2）中的矩不等式，这取决于未观测到的随机变量U。这与广义矩法（GMM）中的矩条件以及矩不等式的典型定义不同（c.f.Chernozhukov等人（2007））。这使得我们的论文在狭义文献中以部分识别的形式出现，从而允许时刻依赖于可能未知分布的未观测随机变量（c.f.Ekeland et al.（2010）、Schennach（2014）、Torgovitsky（2019）和Li（2019））。矩函数的边界假设似乎是有限制的。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

2022-4-26 14:57:19

这个假设可以用较弱的假设来代替，即矩函数对于概率测度集PU | Y，Z×PY，Z一致可积，Z满足假设2.2的其他部分。然而，不管它是如何被削弱的，我们认为矩函数的有界性仍然是最原始的假设。最后，力矩函数的数量有限这一事实也可能具有限制性；例如，当条件变量是连续的时，这禁止使用条件矩不等式。第3节中的识别结果可以在适当修改假设的情况下进行扩展，以处理有限数量的矩不等式。然而，第4节和第5节中关于政策决策的结果并非如此，它们更关键地依赖于时刻条件的数量是有限的这一事实。我们还注意到，G的可测量性-每个矩函数Mj相对于B（Y）的Borel可测性 B（Z）B（Θ）（而不仅仅是关于B（Y） B（Z））之后将被要求确保某些关键类函数的可测量性。与事实域类似，我们必须指定对反事实域的限制，在指定反事实域时，我们必须指定决策者正在考虑哪些反事实。我们通过抽象参数γ对各种反事实进行索引，其中γ的固定值代表单个反事实，不同的γ值对应不同的反事实。对贯穿始终的参数γ的解释是，它是决策者控制下的政策工具的抽象。参数γ将在本文后面介绍的政策决策过程中发挥重要作用。假设2.3（Γ-反事实域）。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

2022-4-26 14:57:25

Γ-反事实域由随机过程{Y？（ω，γ）：γ表示∈ Γ}其中（Γ，B（Γ））是一个可测空间，Γ是一个抛光空间，在哪里？γ：=Y？（·，γ）是这样的吗？：(Ohm ×Γ，A B（Γ）→ （Y？、B（Y？）是可测量的吗？抛光空间。此外，存在一个（可能是多值）映射G？：Y×Z×U×Θ×Γ→ Y这是封闭的、可测量的，并且令人满意：PYγ∈ G（Y，Z，U，θ，γ）|Y=Y，Z=Z，U=U= 1，（2.3）（y，z，u）-a、对于相同的θ∈ Θ根据假设2.2，对于所有γ∈ Γ .与现有文献相比，假设2.3似乎是新的。它限制了副手的设置，例如Ekeland et al.（2010）和Li（2019）中给出的替代假设。图2：上面显示的是假设2.1、2.2和2.3所暗示的设置说明。特别要注意的是，假设所有随机变量定义在同一概率空间上。此外，注意箭头的方向，从事实域Y×Z到潜在U，再到反事实域Y？，旨在说明事实领域的信息通知反事实领域的过程。本文中考虑的事实是那些可以写成支持修正的事实，比如对模型中随机变量的限制。我们认为，这一假设能够适应经济学中最感兴趣的计算事实，尽管它排除了，例如，考虑改变潜在变量分布的反事实。在这个假设下，我们有Y？γ：=Y？（·，γ）是集值过程G的选择过程吗？（Y，Z，U，θ，γ），其中G？要求对产品σ的影响是可测量的-代数同样，关于Θ和Γ的可测量性要求可能看起来很奇怪，但当我们考虑政策选择问题时，第4节和第5节将要求这样做。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

2022-4-26 14:57:31

注意，与假设2.1中的注释一致——假设2.2和2中的概率空间。假设3是相同的。备注2.1（“无回溯”原则）。从纯数学的角度来看，假设2.2中的矩函数不能也是Y？γ和/或γ∈ Γ. 然而，出于解释的原因，我们省略了这个扩展，并提醒对这种方法感兴趣的研究人员。特别是，如果研究人员在制定此类矩函数时不够明智，那么就有可能存在反事实γ的环境∈ 感兴趣的Γ对结构参数θ具有“识别能力”∈ Θ. 这种环境非常令人费解，因为直觉上，在这些情况下，反事实域是γ∈ 考虑中的Γ包含有关结构参数θ值的“信息”∈ Θ存在于事实领域。避免这种困难的环境将被称为满足“无回溯原则”我们将在同步离散choicemodels的示例中的某个时刻回到这个想法。假设2.1、2.2和2.3所暗示的设置如图2所示。在本文的剩余部分，我们让Vγ：=（Y？γ，Y，Z，U）表示一个随机向量，其实现为V∈ 五、其中V是乘积为σ的productspace-代数这一原则是为了纪念哲学家戴维·刘易斯（David Lewis）而命名的，他在刘易斯（1979）中反对类似的“反向追踪反事实”。2.2示例我们现在将通过两个示例来帮助说明刚才介绍的假设的性质。这些例子将在正文的其余部分重新讨论。这些例子的介绍很长，读者可以跳过第2.3小节而不失去连续性。我们考虑的第一个例子是同时离散选择模型。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

2022-4-26 14:57:38

同时离散选择模型有着广泛的应用，包括经验进入博弈（如Tamer（2003））和具有社会互动的离散选择模型（如Brock和Durlauf（2001））。从Chesher和Rosen（2020）的工作中已经知道，这个例子属于Chesher和Rosen（2017a）考虑的GIV模型类别。对于熟悉这些作品的读者来说，该模型将成为一个自然的比较点。第二个例子是一个项目评估例子，它与Eckman和Vytlacil（2005）中的环境密切相关。该示例显示了一个模型，其中结构参数是点识别的，但感兴趣的反事实对象是部分识别的。示例1（同时离散选择）。考虑一个同时离散选择问题。特别地，假设二进制结果向量Y:=（Y，…，YK）具有泛型元素YK∈ Y由方程确定：Yk={πk（Zk，Y-Kθ) ≥ 英国}。（2.4）这里ZK是协变量的向量，UK是未观测到的随机变量，θ是模型参数的向量。我们将定义向量Z:=（Z，…，ZK）和U:=（U，…，UK），其中每个变量Zkhas支持Z={Z，…，zL}，欧氏空间的有限子集，每个Ukhas支持U=[-1，1]杜。对于eachk，我们假设πkis是（Zk，Y）的已知可测函数-k、 θ），映射到[-1，1]在参数θ中是线性的，并且每个（z，y）都有一个远离零的梯度（相对于θ）-k）。我们还假设θ=（θ，…，θK），并且每个πkd仅在子向量θK上结束。为了简单起见，我们假设参数空间Θ是Rdθ的一个紧子集，并且U是连续分布的。为了避免使用半参数限制，我们还将假设向量ui的每个坐标（i）中值为零，且（ii）中值独立于（Zk，Y）-k）。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

2022-4-26 14:57:44

最后，我们假设所有随机变量都支持在同一概率空间上(Ohm, A、 P）。这些条件下假设2.1的验证见附录C.1.1。对于事实领域，我们有以下几个方面：-（Y，Z，θ）：=cl{u∈ U:Yk={πk（Zk，Y）-Kθ) ≥ k=1，K.}。（2.5）在我们的设置中，这是因为假设仪器具有有限的支持。注意，我们可以定义U:=Rdu，但是：{πk（Zk，Y-Kθ) ≥ Uk}={πk（Zk，Y）-Kθ) ≥~Uk}，其中~πk（Zk，Y）-Kθ） =tanh（πk（Zk，Y）-Kθ））和<<Uk=tanh（英国）。换句话说，U:=Rduis的情况与U:=Rduis的情况同胚[-1，1]杜。注：采取封闭措施以确保G-（·，θ）是每个θ的闭集。然而，这并没有引入额外的结构，只是一种技术简化，因为-上文定义的（·，θ）几乎肯定等于（2.5）的右侧，而不进行闭包，这是因为假设U是连续分布的。为了完成对事实域的描述，我们将向量U的每个坐标的中值零和中值独立假设作为力矩条件序列。特别是，对于k=1，K、我们将施加当前条件：E[（{Uk≥ 0}-{英国≤ 0}）{Zk=z，Y-k=y-k} ]≤ 0, Z∈ Z、 y-K∈ YK-1，（2.6）E[（{Uk≤ 0}-{英国≥ 0}）{Zk=z，Y-k=y-k} ]≤ 0, Z∈ Z、 y-K∈ YK-1.（2.7）综合起来，（2.6）和（2.7）意味着潜在变量Uk都是中位数零，中位数独立于协变量Zk和结果Y-k、附录C.1.1中提供了假设2.2的验证，包括多功能（2.5）的可测量性。关于反事实领域，有许多可能的反事实可能会引起人们的兴趣。为了便于说明，我们将考虑以下形式的反事实。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

2022-4-26 14:57:51

设γk:Z×YK-1.→Z×YK-1，γ=（γk）Kk=1，和Y？γ：=（Y？1，γ，…，Y？K，γ），典型元素为Y？k、 γ={πk（γ（Zk，Y？-k、 γ）；θ) ≥ 英国}。（2.8）例如，我们的兴趣可能是反事实随机变量Y的性质？k、 γ，例如它的平均值或它的条件平均值。反事实域的多功能性由以下公式给出：G？（Z，U，θ，γ）：=Y∈ Y:Y？k={πkγ（Zk，y？-k） )；θ≥ k=1，K. （2.9）注意这里我们用Y=Y.附录C.1.1中提供了假设2.3的验证，包括（2.9）中多功能的可测量性。例2（项目评估）。考虑一下项目评估的问题。在本例中，二进制变量D∈ {0,1}表示参与某个项目的治疗或对照组，观察到的实值结果由以下公式给出：Y=U（1-D） +UD，（2.10），其中UAR和UAR存在从未共同观察到的潜在结果。我们会一直假设∈ U=[Y，Y]，因此我们也假设结果Y取有界区间Y的值：=[Y，Y]。在没有确定D值的选择方程的情况下，潜在结果模型是不完整的。Russell（2019）考虑了这个案例，本文的框架也适用于这个案例。或者，我们将考虑Heckman和Vytlacil（1999）以及Heckman更流行的方法，并注意到这种限制意味着对向量（U，…，UK）的联合分布的限制。或者，我们可以只对UKZK施加中间独立性，这只限制了英国的边际分布。Vytlacil（2005），并将假设治疗由以下等式确定：D={g（Z）≥ U} ，（2.11），其中U是连续的，g（·）是可观测协变量Z的未知可测函数∈ ZRdz，其中dz是向量Z的维数。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝