全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 数据分析与数据挖掘
1302 0
2020-09-04
似然原则,MVUE,鬼魂,蛋糕和精灵
在我以前的博客文章中,我写了一个聪明的小精灵,它可以在大约90%的时间内预测数学上公平的过程的结果。实际上,这是百分之九十三的时间,为什么它是百分之九十三而不是百分之九十三也很重要。
前一篇博文的目的是说明在应用金融中使用最小方差无偏估计量(MVUE)的缺点。但是,这引出了一个更普遍的问题,即何时以及为什么应使用它,或者应该使用基于贝叶斯或基于可能性的方法。幸运的是,以前的博客文章提供了一种解决问题的方法。
Fisher的似然法,Pearson和Neyman的频数法以及Laplace的逆概率方法确实彼此矛盾。确实,二十世纪中叶的许多文献对此都有争论。不幸的是,最终出现的是工具的混合,因此要了解不同属性的重要性可能是具有挑战性的。
实际上,每种工具都是为解决不同类型的问题而创建的。毫不奇怪,它们在某些地方会表现出色,甚至在某些情况下可能会出现问题。
在先前的博客文章中,聪明的精灵能够在80%的案例中对数学公平过程的结果拥有完备的知识,而在其余20%的案例中,有13个优于精灵,因为MVUE违反了似然原理。当然,这是设计使然。应该违反似然性原则。如果它试图遵循它就无法显示其美德。但是,它一方面迫使皮尔逊和内曼分裂,另一方面使费舍尔和拉普拉斯分裂。
在大多数统计分歧中,分裂是围绕原假设方法和贝叶斯方法建立的。在这种情况下,费舍尔的方法将放在栅栏的拉普拉斯一侧,而不是皮尔森和内曼的那一侧。这篇文章的目的既不是捍卫也不是攻击可能性原则。其他人则具有很高的技术水平。
这篇文章的目的是为您提供问题的背景和技术性介绍。尽管此职位可能会在度量理论上产生混乱,但目标是扩展蛋糕的示例,以便可以使差异变得明显。碰巧的是,两种方法之间使用的信息之间存在清晰明确的区别。
似然原理在概率和统计领域存在分歧。该原理的一些拥护者认为,它完全排除了皮尔逊和内曼的方法论。反对者要么说它的结构存在某种缺陷,要么简单地说,对于大多数实际问题,没有人需要关心这种差异,因为正统程序在实际情况下经常足够有效。但是这些立场说明了为什么不了解核心论点可能会导致数据科学家或主题专家选择错误的方法。
似然性原则源自两个单独的原则,它们没有分别引起争议或至少没有引起很大争议。已经有工作来探索它,例如Berger和Wolpert。也有反驳和反驳的工作。例如,请参见Deborah Mayo的作品。到目前为止,还没有人提出这样的论据,以至于使对立双方相信讨论甚至接近结束。它仍然是研究生进行研究和发展的沃土。
似然性原则的第一个要素是充分性原则。没有人倾向于对此提出异议。第二是条件原则。它往往是任何争论的源头。我们在这里仅考虑离散情况,但是对于连续情况的讨论,请参见下面列出的Berger和Wolpert的工作。
非正式地,弱条件性原则假定关于参数可以进行两个可能的实验。在伯恩鲍姆(Birnbaum)的原始公式中,他考虑了可以选择的两个可能的实验,每个实验的概率为一半。条件性原则指出,有关参数的所有证据仅来自实际执行的实验。没有发生的实验没有作用。最后一句话是争议的根源。
想象一下,从总体中选择一个代表性样本来测量成员的身高。两个研究小组将针对许多不相关的主题进行许多不同的研究,以进行多个实验。
实验室有两种可以使用的设备。第一个是一个木匠的磁带精确到1/8 个一英寸(3.125毫米)的,而另一个是一个木匠的磁带精确到1毫米。投掷硬币以确定哪个团队得到哪个木匠的胶带。
条件性原则指出,实验结果仅取决于所用仪器和样品成员的准确性,必须忽略使用其他设备或其他样品收集的信息。对于大多数人来说,这是显而易见的,但这是有争议的部分。
Pearson和Neyman的方法会在查看任何数据之前选择最佳解决方案。任何影响过程的随机性都必须考虑在内,因此本来可以获取但不会影响解决方案形式的结果。
Pearson和Neyman的算法是最佳算法,它从未看到过数据,但是在看到数据后可能不是最优的。样本空间中可能存在一个元素,这将导致Pearson和Neyman的方法产生较差的结果。保证是在整个样本空间上重复获得良好的平均结果,而不是在任何一个实验中均获得良好的结果。
文献中有一些病理结果的例子,其中频发者和贝叶斯统计学家可以用相同的数据得出根本不同的解决方案。要了解可能发生违反似然性原则的另一个地方,请考虑使用低t检验。
想象一个更简单的案例,其中实验室只有一件设备,精确到1毫米。如果结果很重要,则样本统计量与null为真时的预期值一样极端或极端。它将结果与如果null为true的所有可能采样的集合进行比较。
当然,样本均值未观察到更多的极值。如果发现了更极端的结果,那将是结果,而不是实际观察到的结果。如果结果是任何人所见过的最极端的结果,那有人真的可以说尾巴概率是充分的吗?
条件性原则说,如果您没有看到它,那么您将没有关于它的信息。您不能使用未执行推断的样本。这不包括所有的t检验,F检验,z检验和大多数Frequentist检验,因为它们以假设某些事物是真实的,从未被观察到的模型为条件。
一方面,拉普拉斯和费舍尔,另一方面是皮尔森和内曼,两者之间的一个大区别是,是否具有参数相关的所有证据都在样本中,或者是否还必须包括看不见的样本。
似然性原则的无争议部分是充分性原则。充分性原则是所有方法的核心要素。它说的东西很明显。
假设您正在执行一组实验以收集有关某个参数的证据,并且将要使用statistic

关注 CDA人工智能学院 ,回复“录播”获取更多人工智能精选直播视频!


二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群