文献中关于加权最小二乘法的描述:
对于残差变异(通过方差体现)大的数据,通过加权(原始残差*权重, 权重 = 1 / 残差的方差),使得原始残差变小,从而减小了这些变异大的残差对数据的影响。
文献认为变异较大的数据可信度低,所以通过加权来减小其水平,并认为这样做就减小了可信度低数据的影响。
我的问题是:
为什么会认为“减小可信度低的数据的效应”就等价于“减小其数据大小”呢?
换句话说,为什么会认为“降低效应”就等价于“降低数值”呢?
这二者其实没有任何关系啊?
我觉得对于可信度低的数据应该通过校正,接近其真实水平。
但真实水平是未知的(与实际水平相比,可能是> = < 其中的任何一种)。
但是根据加权最小二乘法的描述,通过加权,对于变异大的残差(即可信度低)仅仅是起了一个减小的作用,但实际水平未必就一定是小。
不知道大家如何理解。
多谢!