一直对卡方检验不是很理解,假设两个分布完全一致,那么其卡方值Sum(observed value—expected value)^2/expected value=0,如果两个分布不完全一致,则和observed value和expected value的差越大,卡方也越大,当卡方值大到超过统计显著性所规定的临界值时,则证明这个两个分布在统计上具有显著性。
在两个分布基本一致的理想情况下,其卡方值会很小,接近为0,换句话说,在接近100%的significance level极端情况下也是显著的,发生一类错误的概率接近100%,即原假设正确情况下拒绝原假设的概率会很高,这样不就与两个分布完全一致相冲突吗?
同样在两个分布相差很大,卡方值很大极端情况下,也有同样的冲突,其中本人理解错误与不准确的地方,请各位老师指教,谢谢!