全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 SAS专版
1827 5
2017-06-26
悬赏 10 个论坛币 已解决
完成模型在做测试的时候,发现有多重共线问题,但是去掉一个variable以后,本来没有自相关问题却出现了自相关问题,应该怎么去解决阿,求各位大神.....

最佳答案

每一天都是晴。 查看完整内容

我建议你用不带log的模型,不过考虑换一种模型,比如mix model,这样或许可以解决多重共线性问题。另外,不知道你的trend是什么,这个可能会对自相关产生影响。对于解决自相关,是不是应该先做平稳检验呀,然后再用差分的方法去解决试试....统计学的知识好多还给老师了,暂时只能给出这些建议,不好意思....
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2017-6-26 23:43:33
我建议你用不带log的模型,不过考虑换一种模型,比如mix model,这样或许可以解决多重共线性问题。另外,不知道你的trend是什么,这个可能会对自相关产生影响。对于解决自相关,是不是应该先做平稳检验呀,然后再用差分的方法去解决试试....统计学的知识好多还给老师了,暂时只能给出这些建议,不好意思....
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2017-6-27 07:45:11
分层分析,看相互影响啊!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2017-6-27 11:22:00
发数据和代码出来,这个要具体情况具体分析
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2017-6-28 11:16:19
啊好的,其实回归方程就是下面这个:
model log_Recreation_Visits= trend d1 d2 d3 d4 d5 d6 d7 d8 d9 d10 d11 lag UR Gasrate cci/vif tol dwprob;
回归方程的左边,是各个公园的访问量也就是客流,一共58个公园,数据是月度数据,时间跨度是25年,所以整套数据有上万个。
我所有等号右边的量都算出来了,d1~d11是月份的dummy, 就是当月份是1月份的时候的d1=1其余等于0,当月份是2月份的时候d2=1其余等于0,lag是每个公园月度访问量的滞后项,UR是每个月的失业率,gasrate是每个月的汽油费,CCI是消费者信心指数。

现在问题是这样,这个回归方程我有带log就是同上式和不带log的如下:
model Recreation_Visits= trend d1 d2 d3 d4 d5 d6 d7 d8 d9 d10 d11 lag UR Gasrate cci/vif tol dwprob;

带log的自相关做出来好高,不带log好非常多,但是存在共线问题,vif的值是d8和lag,比较高,最高的48,然后不是所有的,大概24个公园这两个量出现了高的共线,如果移除lag或者d8这个问题可以被解决,但是呢自相关问题会变得严重....

我应该怎么办,我试了好多好多...都不行
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2017-6-28 11:16:44
每一天都是晴。 发表于 2017-6-27 11:22
发数据和代码出来,这个要具体情况具体分析
我发出来了哦,不知道是不是够详细...
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群