全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 Excel
6804 11
2009-02-25

在做练习的过程中,遇到这样一个问题,比如一个数据集,假如其中存在三个离估计的回归线很远的值,如果我们从样本中去掉这三个值会得到更好的估计的回归方程吗?为什么?谢谢!

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2009-2-25 17:15:00
会。但是你就操纵数据了,所以不可取。R方高到一定程度就可以了。再不你换一下估计方程的形式。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2009-2-25 20:13:00

这是存在异常值的情况。建议看看计量经济学相关的书籍,文章。有很多种情形,简单举个例子,引入虚拟变量,考察出现异常点的原因,如果是一次性的突发事件,比如911,非典,禽流感等影响,导致考察的变量突然减少或增大,这种情况就可引入虚拟变量拟合方程模型。

以上文献可供参考。

297453.pdf
大小:(123.42 KB)

 马上下载


297454.pdf
大小:(89.58 KB)

 马上下载


297455.pdf
大小:(256.78 KB)

 马上下载


297456.pdf
大小:(164.09 KB)

 马上下载


297459.pdf
大小:(143.63 KB)

 马上下载


[此贴子已经被作者于2009-2-25 20:27:52编辑过]

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2009-2-26 19:41:00

好的,谢谢~虽然二楼讲得我听得有点复杂,可能我层次还比较低,还是谢谢你提供的资料,这里真是一个交流的好地方。

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2009-2-26 19:46:00

假设这三个值并不是远离得非常离谱,不像非典这些突发事件,而只是其中相对其他值离得较远的值,如果把把他们去掉来估计会出现什么结果?

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2009-2-26 19:47:00
coral033,非常谢谢您的资料,look了一下感觉又有进一步的了解了。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

点击查看更多内容…
相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群