在贝叶斯统计中,参数被分配一个概率,而在频率论方法中,参数是固定的。因此,在频率统计中,我们从总体中随机抽取样本,旨在找到一组与生成数据的潜在分布相对应的固定参数。与贝叶斯统计相比,我们采用整个数据并旨在找到生成数据的分布参数,但我们将这些参数视为概率,即不固定。
那么问题是
这个讨论(贝叶斯与常客)如何扩展到参数和非参数模型?
回顾一下:在参数模型中,我们有有限数量的参数。相反,对于非参数模型,参数的数量(可能)是无限的,更具体地说,参数的数量和模型的复杂性随着数据的增加而增长。
术语参数和非参数也适用于基础分布。直观地说,您可以说参数模型遵循指定的分布——这是由参数定义的。非参数模型并不意味着潜在的分布。
解决该问题的另一种方法是考虑学习函数的算法。
您可以将机器学习视为学习将输入 X 映射到输出 Y 的未知函数。该函数的一般格式为 Y = f(x)。该算法从训练数据中学习函数的形式。不同的算法对函数的形式以及如何学习它做出不同的假设或偏差。通过这种方法,参数机器学习算法是将函数简化为已知形式的算法。这种方法有好处,因为参数
机器学习算法更简单、更快并且需要更少的数据。然而,并不是所有的未知函数都能以线性函数等相对简单的函数形式简洁地表达出来。因此,参数模型更适合更简单的问题。
相反,非参数模型不对底层函数进行字符串假设。非参数模型具有灵活性、强大和更好的性能等优势。但是,它们也需要更多数据,速度较慢且容易过度拟合。
回顾一下,我们之前说过,因为术语参数和非参数也适用于基础分布,你可以说参数模型遵循指定的分布——这是由参数定义的。非参数模型并不意味着潜在的分布。
因此,我们可以得出结论,虽然这些概念是切线相关的,但它们并不意味着连接。
具体来说
参数模型意味着数据来自已知分布,并且模型可以推断出该分布的参数
但是,这并不意味着参数模型是贝叶斯模型(因为贝叶斯模型假设参数的分布)
需要强调的是,贝叶斯模型与先验信息有关。
正如我们越来越多地看到的那样,贝叶斯与频率论的问题更多是统计学家关心的问题,对于机器学习,我们经常在更高的抽象层次上工作——其他考虑因素也适用
编辑推荐
1、
2022年300个以上最佳免费数据科学课程
2、
大厂数据分析面试指南!来自亚马逊、谷歌、微软、头条、美团的面试问题!
3、
机器学习模型方法总结
4、
历史最全机器学习/深度学习/人工智能专业术语表中英对照表
5、
机器学习如何应用于商业场景?三个真实的商业项目
6、
数据工作者的自我修养 | 哪些技能是必不可少的?
7、
《汗牛充栋:数据分析书籍分享》CDA网校新课上线
8、
文本挖掘常用的107个语料库
9、
一图读懂“东数西算”工程
10、
零基础转行数据分析,看这篇文章就够了
DA内容精选