全部版块 我的主页
论坛 计量经济学与统计论坛 五区 计量经济学与统计软件 EViews专版
4586 2
2014-03-15
删截回归模型  CENSORED---Consored or Truncated Data
    在某些情况下,被解释变量的某些取值是无法观测到的。这时候即使被解释变量是连续的,但是受到某种限制,也就是说所得到的被解释变量变量的观测值来源于总体的一个受限制的子集,并不能完全反映总体的实际特征,那么通过这样的样本观测值来推断总体的特征就需要建立受限因变量模型(limited dependent variable models)。受限因变量模型主要包括两类:删截回归模型(censored regression models)和截断回归模型(truncated regression models)。
1、一般删截回归模型
    为了更好地理解删截回归模型,这里也引入隐变量。一般的删截回归模型数据具有以下特征:
yi*=xi*βi+δ*ei*         δ为尺度参数,这也是该模型与二元选择模型的不同之处。这一参数连同其他参数一起进行估计,并在回归估计的输出结果中给出。
  • 当yi*<=ci时,yi=ci;
  • 当ci<yi*<di时,yi=yi*;
  • 当yi*>=di时,yi=di

     ci、di就是所谓的删截点,分别成为左侧删截点和右侧删截点。它需要在Eviews中的left、right输入栏中给出。某一输入栏空白表示不存在这一删截点。
     Eviews还允许针对不同的个体设定不同的删截点,这时候就需要在输入栏中输入表示删截点的序列,这一序列随不同个体而变动。例如失业时间序列,有些观测样本在分析时仍然处于失业状态,这时候就可以把这个序列输入右删截点的输入栏中。
     另外,还存在这样一种情况,即知道被解释变量的哪些观测值需要删截,但是无法确定或者不容易确定具体的删截点。这时就需要创建与被解释变量观测值对应的取值为0和1的序列,即所谓的指示变量。此时,在Eviews中选定Field is zero/one indicator of censoring(Eviews默认设置是另一个选项,即默认删截点已知时),并在输入栏中输入指示变量。指示变量是针对哪侧删截的则输入哪个输入栏,当然如果两端都需要进行这种设置则两栏都可以输入各自的指示变量。
2、删截回归模型的典型代表:Tobit模型
    Tobit模型较之一般模型的特殊之处在于它的左侧删截点ci=0,而且不存在右删截点。其公式如下所示:
  • 当yi*<=0时,yi=0;
  • 当yi*>0时,yi=yi*

    其他的内容与一般模型类似,Tobit模型是Eviews的默认设置。
3、截断回归模型
    这一模型主要用于解决截断问题。截断问题,形象地说就是掐头或者去尾。即在很多实际问题中,不能从全部个体中抽取因变量的样本观测值,而只能从大于或小于某个数的范围内抽取样本的观测值,此时需要建立截断因变量模型。例如,在研究与收入有关的问题时,收入作为被解释变量。从理论上讲,收入应该是从零到正无穷,但实际中由于各种客观条件的限制,只能获得处在某个范围内的样本观测值。这就是一个截断问题。
    该模型的其他设置于删截回归模型完全相同,不同之处在于它将超出删截点的观测值从样本中剔除掉,而不是用删截点的数值来替代。
    在EVIEWS中进行操作时,只需要选定Truncated sample(即截断样本)即可。
    需要注意的是,该模型的删截点必须已知,即不能使用序列或者指示变量。

计数模型  COUNT---Integer Count Data
    计数模型应用于被解释变量仅取非负整数数值的情况,一般是指在一定时间段内某种事件发生的次数或者形成的数量。更确切地说,当被解释变量表示事件发生的数目,是离散的整数,即为计数变量,并且数值较小,取零的个数多,而解释变量多为定性变量时,应该考虑应用计数模型。计数模型提供了泊松分布、正态分布、负二项式分布和指数分布,并提供了极大似然估计法和拟极大似然估计法进行估计。
1、Poisson(ML and QML)
    这一设定是适用性最强的,也是Eviews的默认设置。倘若条件均值函数被正确的指定且的条件分布为泊松分布,则极大似然估计量是一致的、有效的、且服从渐近正态分布。但是,泊松分布有一个非常明显的特征,即其均值恰好等于方差,这就构成了一项极强的约束条件,而实际情况不一定能够满足这一条件。如果这一条件被拒绝,模型就被错误设定。这里要注意泊松估计量也可以被解释成准极大似然估计量。为解决这一问题,可以考虑使用其他的估计方法。
2、Negative Binomial(ML)
    即负二项式分布的极大似然估计,它是泊松模型的常用替代。当数据的离散程度过大从而使得泊松分布的假设条件不在成立,方差大于均值时,采取这一方法更为合适。与泊松模型不同的是,它除了原有的解释变量系数外还包含了一个参数η。通过该模型的均值函数和方差函数可知,其方差大于均值,而η^2恰好可以度量条件方差大于条件均值的程度。Eviews在回归估计的输出结果中也给出了η^2的对数值估计。
3、拟极大似然估计(Quasi-maximum likelihood(QML))
    如果被解释变量的分布不能被假定为泊松分布和负二项式分布,那么就要在其他分布(当然也包括前面两种分布)假定之下执行拟-极大似然估计(quasi-maximum likelihood, QML)。即使分布被错误假定,这些拟-极大似然估计量也能产生一个条件均值被正确设定的参数的一致估计,即对于这些QML模型,对一致性的要求是条件均值被正确设定。这一点与OLS的分析是一样的,即参数估计的一致性仅要求均值的设定是正确的,而并不需要满足其他的苛刻条件。Eviews提供了泊松、正态、负二项式以及指数分布的拟极大似然估计。

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2014-3-16 19:37:30
总结不错。谢谢
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2018-3-18 21:52:40
谢谢 楼主的总结
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群