想做多元线性回归,由于我的样本数较少(100个),而想关注的自变量很多(可能有二三十个),这样是否导致自由度低?如果想要排除其中不显著的变量,仍然需要做一次回归,那么还是会碰上自由度低的问题。
所以我在想是否能分别建立几个模型,假设将这些变量分为ABC三类,A与B不相关,但A与C,B与C都相关。一个模型加入A,C做回归,另一个加入B,C做回归。这样的做法是否有问题?两个模型中都存在的B组变量是否会得到不同的估计结果?
如果我的想法有问题,又应该如何应对这种变量较多的情况呢?
小白求指点,谢谢!
请注明:姓名-公司-职位
以便审核进群资格,未注明则拒绝
胖胖小龟宝 发表于 2017-10-20 11:28 从理论上来说你的数据量和自变量还是可以做回归分析的 当然自变量多出现严重共线性的概率会比较高