R语言线性回归函数lm()中关于缺失值的处理方式有一个参数:na.action,经查阅文献,得知其默认值与R自己的options()中的na.action一致,正常是na.omit,我理解就是忽略了数据中有缺失值的case。但是当我手动把没有NA值的cases筛出来做回归的时候,却发现跟用全部数据得到的回归方程不一样,请各位点拨一下是什么原因,回头给大家发奖励,谢谢先!
得到的结果如下:
然后先用complete.cases()筛出来没有数据缺失情况的cases,然后再用没有缺失的数据做线性回归,代码和结果分别如下:
比较两个回归的结果,很容易发现两者并不一致,那也就是说na.omit并不是把所有的含NA值的case都剔除掉了,那na.omit到底是对NA值做了什么处理呢?请论坛里的各位小伙伴多指教!