全部版块 我的主页
论坛 经济学人 二区 外文文献专区
1104 22
2022-04-20
摘要翻译:
条件分布函数是分析计量经济学和统计学中一类广泛问题的重要统计对象。我们提出了条件分布函数的柔性高斯表示,并给出了其全局估计的凹似然公式。我们得到了满足条件分布函数单调性的解,包括在一般的非规范条件下和有限样本条件下。给出了相应的最大似然估计的一个Lasso型惩罚版本,将估计分析的范围扩展到稀疏模型。给出了条件分布、分位点和密度函数的推论和估计结果,并用一个经验例子和模拟加以说明。
---
英文标题:
《Gaussian Transforms Modeling and the Estimation of Distributional
  Regression Functions》
---
作者:
Richard Spady, Sami Stouli
---
最新提交年份:
2020
---
分类信息:

一级分类:Economics        经济学
二级分类:Econometrics        计量经济学
分类描述:Econometric Theory, Micro-Econometrics, Macro-Econometrics, Empirical Content of Economic Relations discovered via New Methods, Methodological Aspects of the Application of Statistical Inference to Economic Data.
计量经济学理论,微观计量经济学,宏观计量经济学,通过新方法发现的经济关系的实证内容,统计推论应用于经济数据的方法论方面。
--
一级分类:Statistics        统计学
二级分类:Methodology        方法论
分类描述:Design, Surveys, Model Selection, Multiple Testing, Multivariate Methods, Signal and Image Processing, Time Series, Smoothing, Spatial Statistics, Survival Analysis, Nonparametric and Semiparametric Methods
设计,调查,模型选择,多重检验,多元方法,信号和图像处理,时间序列,平滑,空间统计,生存分析,非参数和半参数方法
--

---
英文摘要:
  Conditional distribution functions are important statistical objects for the analysis of a wide class of problems in econometrics and statistics. We propose flexible Gaussian representations for conditional distribution functions and give a concave likelihood formulation for their global estimation. We obtain solutions that satisfy the monotonicity property of conditional distribution functions, including under general misspecification and in finite samples. A Lasso-type penalized version of the corresponding maximum likelihood estimator is given that expands the scope of our estimation analysis to models with sparsity. Inference and estimation results for conditional distribution, quantile and density functions implied by our representations are provided and illustrated with an empirical example and simulations.
---
PDF下载:
-->
English_Paper.pdf
大小:(1.8 MB)

 马上下载

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2022-4-20 21:42:38
分布回归函数的高斯变换建模和估计。条件分布函数是分析计量经济学和统计学中一系列问题的重要统计对象。本文给出了条件分布函数的合理的高斯表示,并给出了其全局估计的合理似然公式。我们得到了满足条件分布函数单调性的解,包括在一般错误情况下和在特定样本中。给出了相应的最大似然估计的一个Lasso型惩罚版本,将估计分析的范围扩展到稀疏模型。给出了条件分布、分位点和密度函数的推论和估计结果,并用一个经验例子和模拟加以说明。条件分布函数的建模和估计对于分析各种计量经济学和统计学问题是很重要的。条件分布函数是内生性非分离模型的识别和估计(例如,Imbens和Newey,2009;Chernozhukov,FernandezVal,Newey,Stouli和Vella,2020),反事实分布分析(例如,DiNardo,Fortin和Lemieux,1996;Chernozhukov,Fernandez-Val和Melly,2013)或平稳时间序列预测区间的构造(例如,Hall,Woll,Yao,1999;Chernozhukov,Wutrich和Zhu,2019)中的核心构件。条件分布函数也是为其他感兴趣的对象(Spady and Stouli,2018a)制定可替代估计方法的一个富有成效的起点,如conditionalquantile functions(CQF)。日期:2020年11月13日。{牛津大学努菲尔德学院和约翰·霍普金斯大学经济系,rspady@jhu.edu.§Bristol大学经济系,s.Stouli@Bristol.ac.uk。我们感谢Whitney Newey的鼓励和有益意见,并感谢布里斯托尔、加州大学圣地亚哥分校、牛津大学、利哈伊、伦敦经济学院、约翰·霍普金斯大学和2020年计量经济学会世界大会的与会者。对于一个连续的结果变量Y和一个协变量向量X,在建立一个合适的模型和选择一个损失函数来估计Y Givenx的条件分布和分位数函数时,出现了三个主要的困难。一个主要的缺陷是一个模型的特性,它允许Y分布的形状在X的值之间变化,同时用一个损失函数来表征,该函数在估计中潜在的大量解释变量X的每个值处保持Y的单调性。因为有效的最大似然(ML)特性需要保持这种单调性,第二个相关的结论是损失函数的公式,它描述了一个近似模型,在错误的情况下有明确的信息论解释。第三个结论是,非凹似然自然地出现在不可分离的模型中,一种方法是抛弃估计中的单调性要求,并使用逐点描述分位数或分布函数的损失函数,同时指定一种允许Y分布形状改变x的最大值的函数形式。分位数回归(Koenker and Basset,1978)将每个CQF指定为x的分量的线性组合。然后通过一系列线性规划问题在每个分位数处估计CQF。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-4-20 21:42:45
分布回归(Foresi andPerrachi,1995;Chernozhukov,Fernandez-Val和Melly,2013)将以X为条件的Y的累积分布函数(CDF)的每一个水平规定为X的分量的线性组合的已知CDF变换。然后,条件CDF通过一系列二元结果ML估计在每个Y值上估计。另一种方法是坚持单调性要求,并使用损失函数,这些损失函数在全局上描述分位数和分布函数,但没有ML解释。对偶回归(Spady and Stouli,2018a)将给定X的Y的单调表示定义为X的已知函数和未知元素的线性组合。然后根据随机元素估计样本值的经验分布全局估计条件CDF。本文对条件CDF采用高斯表示,而不是直接建模条件CDF或CQFs。这些表示都被定义为已知函数X和Y的线性组合,隐含的分布回归模型允许Y的分布形状在X的值之间变化。我们给出了一个凹似然刻画。Owen(2007)和Spady和Stouli(2018b)讨论了在线性回归模型中同时估计位置和尺度参数的情况。排除了非单调解。在一般错误的情况下,这个公式也通过构造刻画了满足条件CDFs单调性的准高斯表示。根据Kullback-Leibler信息准则(KLIC)(White,1982),相应的分布模型是真实数据概率分布的最优逼近。在估计方面,我们导出了相应的ML估计量的性质,并将其扩展到两步惩罚ML估计策略,其中,在保持目标函数凹性的情况下,将无惩罚的Destimator作为自适应Lasso(Zou,2006)ML估计量的第一步。我们得到了条件分布、分位数和密度函数的相应估计量的渐近性质。惩罚估计量是选择一致的渐近正态andoracle,其中选择是基于参数估计量的伪真值。在正确的规定下,估计器也是e-cient。我们还给出了用于实现的估计量的对偶公式。本文对现有文献做出了有益的贡献。首先,我们引入了一类新的线性高斯表示,用于分布回归模型的易用估计。其次,我们证明了我们的模型和相应的损失函数在一般错误情况下,无论是在概率接近1的样本中还是在总体中,都是全局单调条件CDFs和CQFs的刻画。分位点和分布回归可以得到不满足条件分位点和分布函数单调性的误码情况下的样本估计和总体逼近。第三,我们证明了所得到的逼近是KLIC最优的非广义误码。与对偶回归相比,我们发现单调性和KLIC最优性可以联合得到,并在一般错误情况下建立了解的存在唯一性。第四,我们利用对偶理论来说明我们的公式具有相当大的计算优势。与对偶回归相比,我们特别发现对偶ML问题具有一个具有线性约束的凸规划问题(Boyd andVandenberghe,2004)的重要优点。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-4-20 21:42:51
第五,我们的估计分析允许稀疏性,从而给出条件CDFs和CQFS.cf的稀疏、全单调和KLIC最优表示的渐近有效刻画。Chernozhukov,Fernandez-Val和Galichon(2010)在量子力学的背景下进行了讨论。在第2节中,我们介绍了高斯变换建模。在第3节中,我们给出了错误定义下的结果。第4节包含估计和推断结果,对偶理论在第5节导出。第6节说明我们的方法,第7节总结。附录中给出了所有结果的证明。在线附录Spady and Stouli(2020)包含补充材料,包括与经验说明校准的数值模拟结果。高斯变换模型让Y是一个连续的结果变量,X是一个解释变量的向量。通过应用高斯分位数函数Φ-1,(2.1)e=Φ1(fyx(yx))g(Y,X),得到的高斯变换(GT)e是一个零均值和单位变量的高斯随机变量,并通过构造与X无关。当y7→fy X(yX)严格增加时,对应的映射y7→g(y,X)也严格增加,且逆为e7→h(X,e),重要的统计对象如给定X的条件分布、分位数和密度函数可以表示为g(y,X)的已知泛函。给定X的条件CDF可以表示为asFY X(Y X)=Φ(g(Y,X)),给定X的CQF为asQY X(u X)=h(X,Φ-1(u)),u∈(0,1),给定X的条件概率密度函数(PDF)为yg(Y,X)=φ(g(Y,X)){yg(Y,X)},yg(Y,X)g(Y,X)Y,其中E7→φ(e)为高斯型PDF,偏导数为yg(Y,X)g(Y,X)/Y。GT g(Y,X)因此在FY X(Y,X)、QY X(uX)和FY X(Y,X)的分布回归模型中构成了一个自然的建模目标。Werefer将这些对象称为“分布回归函数”。本文考虑了具有线性形式的高斯表示e=g(Y,X)的条件CDFs类,其中g(Y,X)被定义为Y和X的已知变换的线性组合。分布回归函数的隐含模型是方便的、简洁的,并且能够捕捉Y和X之间整个统计关系的复杂特征。特别是,这些模型允许这种关系的非线性和不可分离性。线性形式的高斯表示。设W(X)是X的已知函数的K×1向量,S(Y)是Y的已知函数的J×1向量。假设W(X)包括一个截获,即,具有组件1,S(Y)有两个分量(1,Y)和导数dS(Y)/dy=s(Y),R上连续的函数向量我们用Y和X表示Y和X的边缘支持度,分别是和它们的联合支持。给定一个随机向量(Y,X)支持度为YX=Y×X,其中Y=R,对于RJKa,GT回归模型的形式为(2.2)e=bT(X,Y),e XéN(0,1),T(X,Y)W(X)S(Y),带有导数函数,(2.3)Y{bT(X,Y)}=bT(X,Y)>0,T(X,Y)W(X)S(Y),其中我们用Kronecker积将W(X)、S(Y)及其相互作用形成的字典定义为T(X,Y),相应的导数向量定义为T(X,Y)。在(2.1)中GT g(Y,X)被定义为已知函数T(X,Y)的线性组合,因此也是分量W(X)、S(Y)及其相互作用的线性组合。e的线性形式由导数函数bt(X,Y)保持,它同时被指定为已知函数t(X,Y)的线性组合。当指定的字典t(X,Y)不存在(2.2)-(2.3)成立的B∈RJKsuce时,这种线性指定可以看作是一般高斯变换(2.1)的近似。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-4-20 21:42:57
我们在第3节中分析了这种情况。将模型(2.2)-(2.3)解释为变Coe模型,这是由于将e及其导数函数分别指定为已知函数S(Y)和S(Y)的线性组合,(2.4)e=β(X)S(Y),Y{β(X)S(Y)}=β(X)S(Y)>0,变Coe模型的向量β(X)=(β(X),。..,βj(X))定义为(2.5)βj(X)=b0jW(X),j∈{1,...,j},其中b0j=(b0j1,...,b0jK),j∈{1,...,J}。一起(2.4)-(2.5)给出线性形式JxJ=1βJ(X)Sj(Y)=JxJ=1{b0jW(X)}Sj(Y)=B[W(X)S(Y)]=bT(X,Y),导数bT(X,Y)>0,其形式为(2.2)-(2.3)。由于导数函数要求β(X)s(Y)>0,所以有必要对β(X)和s(Y)进行公式化,这样至少是可能的。一个最基本的条件是两个向量都是非负的,概率为1。例如,如果W(X)和s(Y)的非常数分量被指定为非负样条函数,这个要求将用b>0来满足(Curry and Schoenberg,1966;Ramsay,1988)。在J=2的情况下,高斯位置尺度表示的重要特例可以用表示(2.4)ase=β(X)+β(X)Y,e X'AN(0,1),βJ(X)b0jW(X),J∈{1,2},导数函数β(X)>0,其形式为(2.2)-(2.3),其中S(Y)=(1,Y)。当β(X)=bW(X)和β(X)b∈R时,此特性特别适用于高斯位置表示e=bW(X)+bY,其中b>0。由(2.2)-(2.3)导出的给定X的条件CDF和PDF模型分别为(2.6)FY X(Y X)=Φ(bT(X,Y)),FY X(Y X)=φ(bT(X,Y)){bT(X,Y)},Y∈R,给定X的Y的CQF为(2.7)QY X(u X)=h(X,Φ-1(u)),u∈(0,1),其中E7→h(X,e)是Y7→Φ(bT(X,Y))的完备逆。当J=2时,由于雅可比项bt(X,Y)=W(X)bin(2.6)不依赖于Y,所以对于X的所有值,Y的条件分布被限制为高斯分布。定理1。对于模型(2.2)-(2.3),分布回归函数形式为(2.6)-(2.7),定理1证明了模型(2.2)-(2.3)对应于Y给定X的一个良好的概率分布,具有线性形式的高斯表示。因此,模型(2.2)-(2.3)给出了分布回归函数(2.6)-(2.7)的有效表示。当设定W(X)=1时,定理1暗示模型(2.2)-(2.3)允许Y的边缘分布、分位点和密度泛函的分布模型作为特例。我们注意到定理1还暗示了给定X的Y的条件密度函数为:log fY X(Y X)=-[log(2π)+{bT(X,Y)}]+log(bT(X,Y))。我们用这个公式给出了b的一个ML刻划,从而给出了bT(X,Y)和相应的分布回归函数。注1。我们的建模框架也适用于Y有界的情况,因为Y总是可以单调地转换成一个支持实线的随机变量,例如,对于GT回归模型e=Ebt(X,g(Y))eg(g(Y),X),eX,N(0,1),导数Y{eg(g(Y),X)}>0,给定X的Y的相应条件CDF为pr[Y≤yX]=pr[eg(g(Y),X)≤eg(g(Y),X)=Φ(eg(g(Y),X)),Y∈R.注2。具有多重结果(Y,...,YM)Y,M≥2,写YM(Y,...,Ym)的一个紧致推广是递归公式em=Tm(X,Ym)b0,m,em X,ym-1èN(0,1),m∈{2,...,M},e=T(X,Y)b0,1,e XéN(0,1),其中Tm(X,Ym)tm-1(X,ym-1)sm(Ym)和T(X,Y)W(X)s(Y),具有导数函数,Ym{Tm(X,Ym)b0,M}=Tm(X,Ym)b0,M>0,M∈{1,.M},其中tm(X,Ym)tm-1(X,ym-1)sm(Ym),M∈{2,...,M},和t(X,Y)w(X)s(Y)。通过构造,得到了高斯表示e,...
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-4-20 21:43:03
在方差-协方差条件下,单位矩阵为(e,.,eM)→qmm=1Φ(eM)。这是Rosenblatt(1952)\'多元概率变换的高斯版本。通过对定理1的递推应用,给出了给定X的Y的隐含条件CDF为fy X(Y,..,yM X)=y-∞。..ym-∞fy X(t,...,tM X)dt。..DTM,其中Y给定X的PDF取格式X(Y,...,yM X)=mym=1φ(Tm(X,yM)b0,m){Tm(X,yM)b0,m},yM(Y,...,yM),对所有Y,...,ym∈R。对于每个m∈{2,...,m},ym给定(X,ym-1)的隐含分布回归函数类似于(2.6)-(2.7)。2.2.特征和识别。对于满足导数条件(2.3)θ=b∈Rjk:Pr[bT(X,Y)>0]=1的参数值集合,我们构造出总体目标函数(2.8)Q(b)=e-log(2π)+{bT(X,Y)}+log(bT(X,Y)),b∈θ。该准则引入了一个自然对数屏障函数(如Boyd和Vandenberghe,2004),其形式为雅可比项Y{bT(X,Y)}的对数。这一点很重要,因为导数函数bt(X,Y)进入对数项,因此条件CDF和CQF的单调性要求是由目标直接强加于Q(b)的e-射域,即Q(b)>-∞的区域。利用(2.8)中高斯密度函数和对数势垒函数的存在性和性质,等价的解释是Q(b)的e-空间域包含了对严格正条件PDF的GT回归模型可容许的参数值集。我们在以下主要假设下刻画了Q(b)的形状和性质。假设1。E[T(X,Y)]<∞,E[T(X,Y)]<∞,E[T(X,Y)]<∞,且E[T(X,Y)T(X,Y)]的最小特征值离零有界。这些条件限制了我们所允许的字典集,以及以X为条件的Y的概率分布。特别地,由于T(X,Y)包括Y,假设1要求Y具有第二阶矩。假设1中的矩条件也证明了Q(b),(2.9)(b)E[γ(Y,X,b)],γ(Y,X,b)-T(X,Y)T(X,Y)-T(X,Y)T(X,Y)T(X,Y)T(X,Y){bt(X,Y)},b∈θ的二阶导数矩阵存在。E[T(X,Y)T(X,Y)]的非奇性保证了γ(b)是负的,从而保证了Q(b)是严格凹的并且允许唯一的极大值。因此,E[T(X,Y)T(X,Y)]的非奇性是b的证明,GTg(Y,X)被证明为已知函数T(X,Y)的已知线性组合,从而也证明了分布回归函数。定理2。对于模型(2.2)-(2.3),如果假设1成立,则Q(b)在b处存在一个唯一的maximum。通过定理2,得到了b、GT g(Y,X)和分布回归函数的唯一解(2.10)E[ψ(Y,X,b)]=0,ψ(Y,X,b)t(X,Y)(bT(X,Y))+t(X,Y)bT(X,Y),b∈θ。对于Y具有零均值和单位方差高斯分布且与X无关的基线情况,我们得到了bT(X,Y)=Y和bT(X,Y)=1满足模型(2.2)-(2.3)的条件。然后定理2暗示条件(2.10)是由b=(0,1,0 jk-2)唯一满足的。这一事实可以直接证明:E[ρ(Y,X,b)]=E[-t(X,Y)Y+t(X,Y)]=E[W(X){-s(Y)Y+s(Y)}]=E[W(X)]E[-s(Y)Y+s(Y)]=0,因为E[-s(Y)Y+s(Y)]=0具有标准高斯随机变量的Stein方程的形式(例如Chen,Goldstein,和Shao,2010中的引理2.1),因此对于连续可扩展函数s(Y)的任意向量在[sj(Y)]<∞,j∈1,..,j}成立。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

点击查看更多内容…
相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群