线性回归后职级4级的数据为7163元,大于调查的原始数据6600、6334元,请问如何取舍?大于原始数据应该就不合理了,得到的结果是偏高的。r方0.8以上,线性回归的模型应该是没问题的。请指教!
原始的调查数据如下
| 职级 | 薪酬数据 |
| 1 | 3500 |
| 1 | 3655 |
| 1 | 4977 |
| 2 | 6429 |
| 2 | 6562 |
| 2 | 6115 |
| 3 | 7880 |
| 3 | 6744 |
| 4 | 6600 |
| 4 | 6334 |
| 5 | 7250 |
| 6 | 10105 |
| 6 | 10120 |
| 7 | 10055 |
| 7 | 12355 |
| 8 | 11120 |
| 8 | 12329 |
| 8 | 12295 |
模拟的数据如下: