楼主的东西有许多真知灼见。只是几点需要商榷:
1. MLS(maximum likelihood estimation) .通常的叫法是MLE;
2. 第5部分:“.。。于Y是什么分布无关。可以通过LSE或者MLS来估计Y的值”
MLE根据分布而来。如果Y的分布无知,如何写出MLE呢?
3. X 和Y有函数关系。如果不结合exponential family的概念,这种说法有些模糊;
4. 共性导致误差的膨胀;有时候也可能缩小。其实是导致标准差的不准确性;
另外,从我个人的学习过程来看,把logistic model和least squared method 结合起来讲,弊大于利。说实在的,到我毕业之前,我还误以为logistic model 是用weighted least square 估计的。
5.‘。。。WALD有一个很不好的性质,就是当回归系数很大时,SE就会相应的膨胀,这样导致整个W统计量变小,从而P-VALUE变大。’
有些不解。举一个例子,年龄和年龄/10 分别作为自变量,回归系数不同,SE也不同,其实p是一样的。我认为,回归系数很大往往是模型估计算法不准确造成的,比如说, separation, 太多的自变量, 太少的数据,因此失控的SE也难免。Wald 是从大样本得的渐进性得到的。27个数据不足为例。