全部版块 我的主页
论坛 计量经济学与统计论坛 五区 计量经济学与统计软件 经管代码库
2015-8-22 17:54:26
      4、 一份数据资料(尤其是微观实证资料),一些指标经常会出现极端异常值,请问您注意到它了吗?有哪些手段和方法可以帮助我们去发现极端异常值呢?


      请举例说明;如果发现有极端异常值,而我们没处理,那会对模型结果产生什么样的影响呢?请举例说明;如果不小心和它偶遇了,我们怎么解决它呢?如果变量中不小心有大量的0,且成正偏态分布,这种情况我们又怎么解决呢?这个问题理清楚了,对实证分析很有帮助哦,快来解决吧。
       毕业论文就是做的孤立点(离群点)检测,与一般想办法排除异常值的做法相反,我们认为这些异常值可能不是随机偏差,而是产生于完全不同的机制。一般的检测方法有基于统计、基于距离、基于密度、基于偏离、基于聚类五种。
       在时间序列分析中用信息异常值IO模型、附加异常值AO模型处理异常值个数已知的情况,用迭代检验法处理个数未知的情况。
       异常值的通常做法有直接剔除、用邻近值替代、插值替代等方法。不处理通常会直接导致模型结果不好甚至不通过总体检验。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2015-8-22 17:55:20
   6、 变量的独立同分布,同方差,且服从正态分布,是很多模型的假定基础,假定是很多模型的基础,那么您知道有哪些方法可以判定一个变量是否服从正态分布呢?


       请举例说明吧(欢迎图文并茂哦)。
一、图示法
1、P-P图
2、Q-Q图
3、直方图
4、箱式图
5、茎叶图
二、计算法
1、偏度系数(Skewness)和峰度系数(Kurtosis)
2、非参数检验方法
非参数检验方法包括Kolmogorov-Smirnov检验(D检验)和Shapiro- Wilk(W 检验)。
SAS中规定:当样本含量n ≤2000时,结果以Shapiro – Wilk(W 检验)为准,当样本含量n >2000 时,结果以Kolmogorov – Smirnov(D 检验)为准。
SPSS中则这样规定:(1)如果指定的是非整数权重,则在加权样本大小位于3和50之间时,计算 Shapiro-Wilk 统计量。对于无权重或整数权重,在加权样本大小位于3 和 5000 之间时,计算该统计量。(2)单样本 Kolmogorov-Smirnov 检验可用于检验变量(例如income)是否为正态分布。
对于此两种检验,如果P值大于0.05,表明服从正态分布。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2015-8-22 17:56:42
  7、 高级点的问题来了:您是否听说过异方差呢?如果模型一不小心出现了异方差怎么办,会对模型结果产生什么样的影响呢?


      我们有哪些手段可以去判定一个模型是否存在异方差呢?如果发现模型确实存在异方差了,我们有哪些办法可以去解决它呢?请举例说明,欢迎图文并茂(这个题比前面的一些题奖励的要多些哦)。
     
     忽视异方差的存在会导致残差的方差会被严重低估,继而参数显著性检验容易犯纳伪错误,这使得参数的显著性检验失去意义,最终导致模型的拟合精度受影响。
     更多异方差的相关知识请参见这个网页http://classroom.dufe.edu.cn/spsk/c102/wlkj/CourseContents/Chapter05/
异方差表现与来源
异方差的后果
判别异方差
异方差检验
克服异方差的方法(广义最小二乘法)
案例分析

     我来说下时间序列分析中的异方差,在对序列建模后,计算残差,画残差平方图,观察图像。假如已知异方差函数具体形式,进行方差齐性变化。假如不知异方差函数的具体形式,拟合条件异方差模型。

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2015-8-22 18:53:01
  https://bbs.pinggu.org/thread-3641714-36-1.html
  看帖忍不住回复一下,很多问题前面有很多大牛回复了,翻页起来也特别的累,我就说说自己学习计量的一些感想吧。
  ## 私心想着版主是不是能够给我多点论坛币。
  楼主的问题其实特别好,问题很多但是是逐渐深入的。我前两个学期在没有任何计量基础的情况下一上来就学中级计量确实有点懵,但好在对这门课程比较重视,且网上的资源特别多。学习过程中其实发现现在网上关于计量的问题,实用性的特别多,理论性的少。大概体现在很多时候想弄明白一个检验,搜出来的结果都是用R啊Stata啊Eviews啊这些计量软件怎么去进行检验并查看结果,但很少提及这些检验在理论上的模型是怎么样的,它的结果说明了什么问题以及为什么。
  上学期看了陈强老师的《Stata及其运用》后感觉收获特别大,主要脉络清晰,我觉得学习就必须注重学习的逻辑深化。
  简单来讲,接触计量都是从线性回归开始,那么线性回归有它的几个假设即高斯-马尔科夫假设,这是很重要的,因为后面的各种内容都是一步一步放松假设。
  假设大概如下:
  1.自变量X是非随机的 2.E(e|X) = 0 Var(e|X)=sigma^2 3.残差服从正态分布。
  对线性回归可以做OLS估计,也可以做极大似然估计。在估计出系数之后,我们还要关注系数的显著性、假设检验、有效性、无偏性等。
  好,以上关注之后我们再一步一步放松假定。自变量的非随机性只是为了我们的估计提供便利,而第二个假设放松就更复杂一些。而第三个假设是方便我们对回归系数做假设检验。
  具体来讲,如果E(e|X)不等于0,将会出现残差项受自变量影响,即内生性。因此我们要关注引起内生性的原因、后果、解决方法等。用工具变量IV法、2SLS等。
  如果Var(e|X)不等于sigma^2,那么将会出现两种情况。第一种是方差非对角线上的值为0,而对角线上的值不相同,此时情况称为异方差,即样本明显地来源于不同类别。第二种是非对角线上的值不为0,这里我们称残差之间出现显著的相关性,即自相关。上述两种情况我们可以用广义最小二乘法GLS求解,当然GMM也是一种途径。
  学习到这里之后,还有一些其他的情况。如自变量之间存在的多重共线性,回归因变量是二元变量,自变量引入虚拟变量,数据的面板数据等等,这些就都是后续的学习了。有了前面的基础,后面的学习起来就快一些。
  
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2015-8-22 18:54:50
为啥我回复不了。。。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2015-8-22 20:14:36
亚米UM 发表于 2015-8-22 18:54
为啥我回复不了。。。
你已经能回复啦~
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2015-8-22 21:37:01
xddlovejiao1314 发表于 2015-8-22 20:14
你已经能回复啦~
版主 我刚刚写了好长好长一段 然后发上来结果说要审核。。。不知道你看到没。。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2015-8-22 21:51:16
亚米UM 发表于 2015-8-22 21:37
版主 我刚刚写了好长好长一段 然后发上来结果说要审核。。。不知道你看到没。。
呵呵,刚去审核通过了哈。欢迎来继续回帖额。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2015-8-23 08:43:46
xddlovejiao1314 发表于 2015-8-22 21:51
呵呵,刚去审核通过了哈。欢迎来继续回帖额。
发现我发了两次 - - 斑竹可以把重复的楼删掉嘛(~把这楼也删掉留点干货就行嘻嘻) 另外没有论坛币了求斑竹给奖励点儿
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2015-8-23 09:38:29
亚米UM 发表于 2015-8-22 18:53
https://bbs.pinggu.org/thread-3641714-36-1.html
  看帖忍不住回复一下,很多问题前面有很多大牛回复了 ...
鼓励积极发帖讨论,给了你我能给的最高奖励。欢迎再次来解答。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2015-8-23 09:50:06
shaode01 发表于 2015-8-22 17:53
2、 数据类型和变量类型明确后,接下来是方法的选择洛。

      请举例说明不同数据类型、不同因变 ...
好贴,谢谢来分享经验,欢迎再来分享。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2015-8-23 09:51:06
shaode01 发表于 2015-8-22 17:54
3、 在做计量分析前,一般要做描述性统计分析(报告均值,标准差,最大值和最小值),做这个分析的目的是 ...
好贴,谢谢来分享经验,欢迎再来分享。PS:谢谢@我的帖子。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2015-8-23 09:52:16
shaode01 发表于 2015-8-22 17:54
4、 一份数据资料(尤其是微观实证资料),一些指标经常会出现极端异常值,请问您注意到它了吗?有哪 ...
好贴,谢谢来分享经验,欢迎再来分享。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2015-8-23 09:52:58
shaode01 发表于 2015-8-22 17:55
6、 变量的独立同分布,同方差,且服从正态分布,是很多模型的假定基础,假定是很多模型的基础,那么您知 ...
好贴,谢谢来分享经验,欢迎再来分享。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2015-8-23 09:53:41
shaode01 发表于 2015-8-22 17:56
7、 高级点的问题来了:您是否听说过异方差呢?如果模型一不小心出现了异方差怎么办,会对模型结果产生什 ...
好贴,谢谢来分享经验,欢迎再来分享。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2015-8-25 08:26:11
xddlovejiao1314 发表于 2015-7-11 07:50
学习计量并非一两天就能有所成就,只怕有心人。加油,共勉!
师兄说的太好了,高投入、高产出。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2015-8-25 08:40:32
niuniuyiwan 发表于 2015-8-25 08:26
师兄说的太好了,高投入、高产出。
呵呵,贵在坚持。加油,共勉啊~
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2015-8-26 12:35:36
我来答题了,描述性统计分析是目的是对数据做一整体的认识,认识总体的内在数量规律,可用来判断分布进一步选择推断的方法。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2015-8-28 10:24:24
八九十支 发表于 2015-8-26 12:35
我来答题了,描述性统计分析是目的是对数据做一整体的认识,认识总体的内在数量规律,可用来判断分布进一步 ...
呵呵,谢谢来答疑。欢迎继续来答疑。加油,共勉~
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2015-9-3 18:17:13
很好地
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2015-9-7 21:59:09
瞬间解决了我好多疑惑
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2015-9-7 22:27:20
记忆是搁浅 发表于 2015-9-3 18:17
很好地
加油,共勉。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2015-9-7 22:28:28
moretc 发表于 2015-9-7 21:59
瞬间解决了我好多疑惑
呵呵,加油。共勉~
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2015-9-13 10:41:58
有些困难是必须要克服的,即使你不会在学术的路上一直走下去,搁置了很久的学习和文章不得不重拾。
昨天偶然的机会看到楼主的帖子就给收藏起来了,今天上午从第一页翻到了最后一页,有种众人拾柴火焰高的感觉,自己也希望有一份力发一份光。自己学计量也好,学统计也罢,完全是不得门道,正如版主所说为了模型而模型,迫于数据寻找处理分析方法。就像是只学了九阴真经的武功招式而没有学习内功心法一般,知其然不知其所以然。结合自己经历的一些内容试着和大家进行分享。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2015-9-13 11:21:59
pat乐 发表于 2015-9-13 10:41
有些困难是必须要克服的,即使你不会在学术的路上一直走下去,搁置了很久的学习和文章不得不重拾。
昨天偶 ...
呵呵,所以交流的作用就在这里。对外行而言,找准努力的方向很重重要。加油,共勉~越努力,越幸运~
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2015-9-13 11:51:46
10、 计量模型中,回归分析是重中之重。那么我们做了一份回归分析后,要报告哪些结果呢?请简要做一个案例,将您认为需要报告的东西列举出来,并做简单的解释吧。
同时,请考虑下R^2是不是在所有模型中都很重要(如多元线性回归的R^2和Logistic回归的伪R^2,它们是一样的么?)。同时,请再考虑有没有截距项对模型有什么样的影响呢?都是些有挑战的题目哦,请举例说明,有高奖励哦。
答:以logistics回归为例!举中外两篇文章介绍结果报告的内容。
1)《Beyond case studies: Barriers to energy efficiency in commerce and the services sector》这篇文章的结果主要报告,伪R^2,参数值及p值。

2)《农民工定居地选择意愿及其影响因素分析——基于温州的调查》
这篇文章的结果主要报告,伪R^2、参数值、p值、模型χ 2检验及Hosmer and Lemeshow检验值。
以上文章都是以因变量为二分类、自变量包含连续及分类变量的例子。总结在模型估计后,需要考虑模型的适当性,主要需要检验的指标包括:模型的拟合优度,预测准确性和模型的χ2检验。
模型的准确性:伪R^2属于预测准确性的检验指标,其中类(伪)R2(Analogous R2)与线性回归中的R2相似,值域为0至1,当自变量与因变量完全不相关类R2(Analogous R2)趋近于0,当自变量可解释变异中的比例越高时类R2(Analogous R2)趋近于1。
模型的拟合优度:当自变量为分类变量时,用皮尔逊χ2检验拟合优度。如果皮尔逊χ2很小就说明了模型的预测值与观测值之间无显著性差异,证明该模型拟合数据。与此相反,如果皮尔逊χ2统计很大,统计检验显著,并提供证据证明拟合效果差。当增加自变量的数目,特别是在连续自变量纳入模型中,协变量的数量就会有巨大变化,所以许多协变量只有少数的观察案例。使得皮尔逊χ2和偏差统计量不再适用于评价拟合优度。采用Hosmer and Lemeshow检验值检验,同皮尔逊χ2检验,检验不显著,模型拟合数据,相反显著拟合不好。
模型的χ2检验:在多元线性回归及ANOVA模型中,常用自由度分别为K和n-K-1的F检验(其中K是自变量的个数,n为样本规模)来检验“除常数项外的全部系数都等于0”的无关假设。而在logistic回归中服务于同一目的的检验是似然比检验,它可以用来检测logistic回归模型是否统计性显著,似然统计量近似服从于χ2分布。
按照理想情况,最好是模型χ2统计性显著而拟合优度统计不显著。
关于是不是在所有模型中R^2都很重要(如多元线性回归的R^2和Logistic回归的伪R^2,它们是一样的么?):个人认为在线性模型中的R^2更为重要,而在Logistic回归的伪R^2值通常会很小,很少能超过0.5,在进行变量的剔除或添加中用于比较模型的变化。
而关于有没有截距项对模型有什么样的影响,不知如何回答,请各位朋友给予帮助,上述回答请多多赐教。
附件列表
QQ图片20150913111248.png

原图尺寸 63.05 KB

QQ图片20150913111248.png

QQ图片20150913111248.png

原图尺寸 63.05 KB

QQ图片20150913111248.png

QQ图片20150913110236.jpg

原图尺寸 82.78 KB

QQ图片20150913110236.jpg

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2015-9-14 17:05:19
很好,学习了
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2015-9-14 17:10:10
pat乐 发表于 2015-9-13 11:51
10、 计量模型中,回归分析是重中之重。那么我们做了一份回归分析后,要报告哪些结果呢?请简要做一个案例 ...
谢谢来分享心得和答问,欢迎继续来答疑。加油,共勉。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2015-9-14 17:10:47
rachelee 发表于 2015-9-14 17:05
很好,学习了
加油,共勉。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2015-9-16 23:25:14
xddlovejiao1314 发表于 2015-4-5 12:17
谢谢鼓励。其实我本身也非学计量出身,只是现在博士阶段写论文做研究要用到这块的东西,所以在以前 ...
楼主你好!我自己现在学了李子奈的计量经济学(包括经典回归,时间序列模型)和面板数据模型(混合模型、固定效应模型、随机模型的选择、估计、检验),现在适合看哪些计量经济方面的书,您能推荐下吗?谢谢
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群