扑克,概率,蒙特卡洛和R
我很早就记得这项练习,当时我使用基本的组合计数技术计算概率课程的所有相关概率。不过,我的女儿,是一个商业本科生,对数学的兴趣不如对统计/计算感兴趣,她认为那是她赚钱的地方。
很难说出逻辑,尽管我认为这可能是她将概率数学与统计联系起来的一个分析“啊哈”的时刻。5张抽奖牌总数由52个选择5或2598960个元素组成,在数学和统计学上都非常简单。
因此,当然,无论极客,我只需要尝试向她展示概率和统计量如何融合。除了解释计数和概率的“组合”之外,我还进行了两次计算练习。首先是从52张卡片组中划出5张抽奖的所有可能组合,计算相关组合的出现次数,例如2对,顺子或在单元格循环中不存在。
第二种统计方法是基于“重复随机抽样以获得数值结果。”的基本思想是蒙特卡洛模拟。他们的基本思想是使用随机性来解决原则上可以确定的问题。因此,通过生成可观数量的随机采样的手,可以使用与上述相似的逻辑来计算相关组合的计数。该大数定律表明,随着样本规模变大,统计数应该看起来很像那些概率计算。
以数学/概率为基础的方法1会给出确切的答案,而以采样为基础的方法2是近似的且可变的,通常,样本量越大,准确性越高。
为什么近似于精确?在这种情况下,概率分布很简单,但是在更复杂的情况下,数学可能太复杂了。蒙特卡洛统计估计要好于难解的数学。
本笔记本的其余部分着眼于概率计算,然后是相应的基于采样的近似值。该技术是具有Microsoft Open R 3.4.4的Jupyter Notebook。
对于概率计算,我大量借鉴了R的选择和合并组合函数。基本样本函数馈入统计估计单元的主循环。从数据表包中计算出的按手号和等级计算的单个手的简单频率是练习的中心。毫不奇怪,笔记本电脑的计算量非常大,从头到尾消耗了将近2.5个小时。
1