全部版块 我的主页
论坛 提问 悬赏 求职 新闻 读书 功能一区 经管百科 爱问频道
4340 1
2017-09-16
普通回归的结果显著,当控制了行业效应时,结果不再显著,为什么呢?求大神解惑
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2017-9-16 09:22:02
对回归模型而言,如果不控制自变量的规模和回归的复杂度,无论多奇怪的Y,你都可以获得相应的回归模型,但是,这种回归往往是无意义的,因为往往这种回归是data mining。
一般而言回归模型是Y=h(X,W,V)+err,发生data mining时,模型看起来很美丽,但是实际上失去了可预测性,因为err也被当作有效数据加进了回归模型中,回归出来的比较像这样Y=g(X,W,V,Z,T,...)+o(h),其中o(h)趋近于0,这个模型和我们期望的h(X)实际上是不同的。
另外一个问题则是多重共线性的问题,即在回归模型中有两个或以上的自变量是相关的。举个例子,我们回归一个模型
体重=a年龄+b收入+c纬度
我们知道收入和年龄是正相关的,那么,我们在回归上面这个模型的时候,实际上增加了年龄这个变量的权重,那么我们跑出来的实验就很容易在年龄收入上表现出显著,因为它们是互相促进的。实际上我们想跑这个模型,那么就要把收入做一个投影,使之与年龄不相关,才能让他们彼此不再干扰。
回答楼主的问题,控制了行业效益结果就变得不显著,那么明显,实际上这个模型就应该是不显著的,也就是说,控制行业效益相当于剔除了数据中的多重共线性的数据,同样的,减少了对数据的过度挖掘。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群