猫爪 发表于 2009-7-30 16:37 
zhoujin6108 发表于 2009-7-30 14:11 
猫爪 发表于 2009-7-30 12:18 
sungmoo 发表于 2009-7-30 12:10 
如果不介绍“试验”,我只给你一串数1,2,3,4,5,让你猜下一个数是几,你觉得要怎么猜呢?
我估计这位楼主的意思,是要用已有的数据的“频率”,估计出“概率”,然后推测未来的实验结果。
你说的没错..........
呵呵,要是这样,本帖可以转爱问版了。
请注意频率的定义:
在相同的条件下,进行了n次试验,在这n次试验中,事件A发生的次数na称为事件A发生的频数。
比值na/n称为事件A发生的频率,并记为fn(A)。
用文字表示定义为:每个对象出现的次数与总次数的比值是频率。
既然提到了“推测”,这就说明,你给出的这组数据,仅仅是一个样本,而非整个空间。
从概率论角度看,概率是频率的极限(概率的统计定义)。从统计学的角度看:
频率是基于一组实际观测数据的相对次数,一如以上定义。其特点是随各次试验和试验次数n的不同而改变,是随机变量的一个观测或随机样本的一次实现。具体试验之前肯定不能确定其确切值,但试验后只有唯一值。
概率是基于随机变量概率分布的理论相对次数。如果知道了该变量的概率分布类型及其参数就肯定知道了它取各种值的概率,变量值和概率一一对应或唯一确定。问题的困难在于我们不知一个实际问题(变量)理论上究竟应该服从什么分布。
简单而言,概率是随机变量所有可能值的相对次数,可称为总体分布或理论分布,由于(可重复试验无限)总体所有可能值不可观察,概率就不能用求相对频数的方法计算。可以(1)依据数学法则用概率分布模型计算,(2)获得一组实际数据的相对次数(频率),它们是一个样本的分布或经验分布,用来推断未知总体分布。