全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 SPSS论坛
5862 13
2015-08-28
因变量:Y
自变量:费率,本身是连续变量,人为分为低、中、高组。
然后低费率组对应Y的均值>中费率组,但是不显著。
       中费率组对应Y的均值<高费率组,显著。即是说费率和Y正相关?
       即均值图曲线是V字形的……

回归以后,费率和Y 显著负相关。

这种情况该怎么解释或者调整?头疼死了,感谢各位!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2015-8-29 09:06:58
athas_pro 发表于 2015-8-28 22:53
因变量:Y
自变量:费率,本身是连续变量,人为分为低、中、高组。
然后低费率组对应Y的均值&gt;中费率组,但 ...
低等和中等差异不显著,却和高等差异显著。试试中等和高等显著与否呢。若显著,尝试将低等和中等合并呢。ps:你分低,中和高三组是否有依据呢?如果没有依据,为什么连续变量要分组呢,直接以连续变量纳入模型就好啊。祝好运~
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2015-8-29 09:25:53
xddlovejiao1314 发表于 2015-8-29 09:06
低等和中等差异不显著,却和高等差异显著。试试中等和高等显著与否呢。若显著,尝试将低等和中等合并呢。 ...
感谢回复。
分组是按另一篇文献,按20%和80%分位数划分的,做均值比较,然后再回归……我算是依葫芦画瓢,虽然现在还不是很明白为什么。
中低等合并的思路倒是很有启发~我先尝试按照这个思路改成划分两组(只分低、高)而不是三组,再做均值比较,结果显著了。不过,我仍然头疼的一个问题就是,均值比较里低费率组的Y是低于高费率组的Y,即是说费率和Y是正向关系;可是回归里费率的系数是负的,说明费率跟Y反向关系。这时候我该怎么办呢?

还是说,其实均值比较这步可以假装没做,就忽略过去呢?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2015-8-29 09:40:48
athas_pro 发表于 2015-8-29 09:25
感谢回复。
分组是按另一篇文献,按20%和80%分位数划分的,做均值比较,然后再回归……我算是依葫芦画瓢 ...
是不是你没有在构建模型前对Y数据做预处理,使得Y存在极端异常值,改变了回归系数的方向。按道理来说,如果你对数据进行了预处理,你的结果会与描述性统计分析结果类似的。同时,也请检验下模型中的自变量是否存在多重共线性,这也可能导致模型系数方向发生改变。祝好运~
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2015-8-29 09:41:27
athas_pro 发表于 2015-8-29 09:25
感谢回复。
分组是按另一篇文献,按20%和80%分位数划分的,做均值比较,然后再回归……我算是依葫芦画瓢 ...
是不是你没有在构建模型前对Y数据做预处理,使得Y存在极端异常值,改变了回归系数的方向。按道理来说,如果你对数据进行了预处理,你的结果会与描述性统计分析结果类似的。同时,也请检验下模型中的自变量是否存在多重共线性,这也可能导致模型系数方向发生改变。祝好运~
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2015-8-29 10:10:28
ok,学习了!!!!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

点击查看更多内容…
相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群