这个问题其实很好回答,当你研究投一枚硬币的时候,正反概率各为二分之一,这只是你的假设而已,assumption!不过,在统计学里,这类假设有一个名称,叫做prior。
你可以给任何随机事件定义一个prior,也就是说,你可以给任何随机事件定义一个不需要预先证明的分布,特别是在作bayes分析的时候,这种现象特别普遍。
prior有对的,也有错的。bayes分析中,往往要对实际的样本分析来修正你的prior。比如,你可以一个随机事件是正态分布的,这样,可以从样本中得到正态分布的参数估计值----期望值和方差的估计值。但是经过对样本进一步的检验,发现skewness和kurtosis都不对,那么正态的hypothesis(注意,当对一开始的prior进行检验的时候,这个prior被称为一个hypothesis)就会被拒绝。拒绝hypothesis的意思,其实就是说:从样本上来看,这个分布是正态的可能性相当低,没理由相信他。
然后我们回到你的投硬币问题上去,prior肯定是二项分布,这个不需要证明了,问题是p=? 一般大家都设0.5。说白了,这是一种公认的习惯而已。其实,统计学家也认为这不科学,一枚硬币的p,完全可以不是0.5,(质地,重心,风力,投掷角度等等因素会左右结果)。统计学家们会先设p=0.5。如果在整个实验中,没有去检验这个p,而是默默的接受他,这个假设就是prior。如果检验了,也就是说,抛了好多次来检验,那么,这个时候p=0.5这个prior就成了hypothesis。根据中央极限定理。从同一试验中取得的多次相互独立的样本之和是渐进正态的,然后就可以计算p=0.5的p值,最后得到拒绝,或者是接受p=0.5这个hypothesis的结论。
这才是真正的统计学!