10、 计量模型中,回归分析是重中之重。那么我们做了一份回归分析后,要报告哪些结果呢?请简要做一个案例,将您认为需要报告的东西列举出来,并做简单的解释吧。
同时,请考虑下R^2是不是在所有模型中都很重要(如多元线性回归的R^2和Logistic回归的伪R^2,它们是一样的么?)。同时,请再考虑有没有截距项对模型有什么样的影响呢?都是些有挑战的题目哦,请举例说明,有高奖励哦。
答:以logistics回归为例!举中外两篇文章介绍结果报告的内容。1)《Beyond case studies: Barriers to energy efficiency in commerce and the services sector》这篇文章的结果主要报告,伪R^2,参数值及p值。
2)《农民工定居地选择意愿及其影响因素分析——基于温州的调查》
这篇文章的结果主要报告,伪R^2、参数值、p值、模型χ 2检验及Hosmer and Lemeshow检验值。
以上文章都是以因变量为二分类、自变量包含连续及分类变量的例子。总结在模型估计后,需要考虑模型的适当性,主要需要检验的指标包括:模型的拟合优度,预测准确性和模型的χ2检验。
模型的准确性:伪R^2属于预测准确性的检验指标,其中类(伪)R2(Analogous R2)与线性回归中的R2相似,值域为0至1,当自变量与因变量完全不相关类R2(Analogous R2)趋近于0,当自变量可解释变异中的比例越高时类R2(Analogous R2)趋近于1。
模型的拟合优度:当自变量为分类变量时,用皮尔逊χ2检验拟合优度。如果皮尔逊χ2很小就说明了模型的预测值与观测值之间无显著性差异,证明该模型拟合数据。与此相反,如果皮尔逊χ2统计很大,统计检验显著,并提供证据证明拟合效果差。当增加自变量的数目,特别是在连续自变量纳入模型中,协变量的数量就会有巨大变化,所以许多协变量只有少数的观察案例。使得皮尔逊χ2和偏差统计量不再适用于评价拟合优度。采用Hosmer and Lemeshow检验值检验,同皮尔逊χ2检验,检验不显著,模型拟合数据,相反显著拟合不好。
模型的χ2检验:在多元线性回归及ANOVA模型中,常用自由度分别为K和n-K-1的F检验(其中K是自变量的个数,n为样本规模)来检验“除常数项外的全部系数都等于0”的无关假设。而在logistic回归中服务于同一目的的检验是似然比检验,它可以用来检测logistic回归模型是否统计性显著,似然统计量近似服从于χ2分布。
按照理想情况,最好是模型χ2统计性显著而拟合优度统计不显著。
关于是不是在所有模型中R^2都很重要(如多元线性回归的R^2和Logistic回归的伪R^2,它们是一样的么?):个人认为在线性模型中的R^2更为重要,而在Logistic回归的伪R^2值通常会很小,很少能超过0.5,在进行变量的剔除或添加中用于比较模型的变化。
而关于有没有截距项对模型有什么样的影响,不知如何回答,请各位朋友给予帮助,上述回答请多多赐教。