请注明:姓名-公司-职位
以便审核进群资格,未注明则拒绝
因为n-1是无偏估计,n是有偏估计
自由度也可以解释,不是有n个与均值偏差的平方和吗?正好这n个表达式之和等于0,也就是说本来n维自由度的,受限于一个条件。所以变成了n-1维了。另外楼上说的无偏性最为根本,才是修正的根本原因。
还有一点,正是因为无偏的缘故,大样本情况下,除以n-1和n结果偏差不大,所以要追求性质更好的那个估计了。
自由度也可以解释,不是有n个与均值偏差的平方和吗?正好这n个表达式之和等于0
???虽然受限,但跟var的计算有什么关系?
这样看,x1,x2,...xn是n个可以自由变化的样本,互不影响。
而x1-xbar, x2-xbar,...xn-xbar是否也是n个自由变化的呢?不是……因为这n个统计量受到一个约束条件的影响就是之和等于0。如果我们记 yi=xi-xbar,也就是说y1+y2+...yn=0,
这样我们可以任意变动其中n-1值,比如取定了y1,y2,...y(n-1),那么yn就不能任意变化,
yn=-(y1+y2+y(n-1))。
这个只是从自由变化的角度直观解释,实际上证明分布比较烦琐……
样本方差与样本均值,都是随机变量,都有自己的分布,也都可能有自己的期望与方差(由此进一步讨论估计量的无偏性与有效性)。
取分母n-1,可使样本方差的期望等于总体方差,即这种定义的样本方差是总体方差的无偏估计。
举个例子
比如说让十跟人任意取十个数,很容易理解可以随便取.十个都是自由的.
如果我加一个条件,十个人取十个数,但是这是个书加起来必须得零.
第一个人可以随便取,第二个人也可以,第九个也可以,都是自由的,
但是第十个人不能随便自由取,只能取特定的数,才能保证这十个数的
和是零.所以加了一个条件就丢了一个自由度
谢谢各位!
由于有一个约束条件,所以最后一个变量不能随便取。为了满足这个约束条件,第n个变量不能随机取值,它的值由前n-1个变量确定了。
问题是:虽然第n个变量不能随机取,假设取10以满足约束条件,但10与均值的离差仍然存在。分子中,包括了这个离差平方,但分母却不考虑它。
是不是可以这样理解:按照方差的“定义”,分母仍应取n。只是为了保证无偏性,对样本方差进行调整。通过计算,分母应当取n-1。这时的方差实际是“调整后的样本方差”,只不过我们仍将它叫做“样本方差”。
不知这样理解对不对?
伍德里奇的书中,样本方差的分母是n-(k+1),即在一元回归中的,样本方差的分母应是n-2。
倒底用n-1,还是n-2呀?
你能说一下k的含义吗?
从你的说法上看,好像在说拟合优度。
他/她上面说的K是指线性模型中所要估计的变量(如果公式是N-(K+1),我
想这不包括intercept?)
比如说一元回归,当你做最小二乘法的时候,只要你
用这个方法估计,你实际上给error term 限定了两个
条件 sum(e-hat)=0 and sum(e-hat*x)=0,所以自由度
就只有n-2
对于t检验而言,在一元回归中,刚才我们说了对于一个变量而言损失了一维自由度,
对因变量同样也损失了一维自由度,因此一元的情况就是n-2的自由度。
顺水又顺风 发表于 2010-4-1 19:30 17# zhang3333 谢谢高手,终于见到这么清晰的解释
bingobingo 发表于 2007-1-8 15:00 这样看,x1,x2,...xn是n个可以自由变化的样本,互不影响。 而x1-xbar, x2-xbar,...xn-xbar是否也是n个自由 ...