全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 数据分析与数据挖掘
726 0
2020-08-14
泛化能力-一种智力测度?
知识获取与构建泛化能力有关。在机器学习世界中,泛化是指模型根据从未见过的数据做出准确预测的能力。良好通用的模型具有处理新场景数据的智能。对于人类智力也是如此。孩子们从榜样开始学习,最初他们无法对意外情况做出正确反应。他们逐渐掌握了概括技巧,以应对所有情况。泛化在人类和机器获取情报方面起着重要作用。具有快速概括能力的机器或人员被认为是更智能的。简而言之,据信概括能力可被视为智力的量度。在此博客中,让我们详细研究这种信念。
过度拟合模型就像一个孩子,在没有从理论中学到任何概括的情况下弄乱了结果。这些模型在训练过程中损失很小,但是在预测新数据方面做得不好。如果模型能够很好地拟合当前样本,我们如何相信它会对新数据做出良好的预测?过度拟合是由于使模型变得比必要的复杂而引起的。机器学习的基本规则是尽可能简单地拟合数据。
如果向孩子们展示了猫的照片,他们可以轻松地将猫这个词与猫的形状联系起来。如果照片颠倒显示,则某些孩子可能会难以识别。老师需要告诉孩子这也代表一只猫。现在,孩子意识到物体的形状与方向无关。在使用神经网络和深度学习时,一种称为数据增强的技术可用于提供方向独立性。数据扩充意味着从给定数据中生成相同数据的新化身。通常,这是通过使用随机翻转和移动来修改数据集中的图像来以编程方式完成的。这使训练数据集更大,并有助于模型概括图像中表示的对象的形状,并告诉模型该形状与图像中表示的对象的位置和方向无关。正是这正是幼儿园老师对孩子所做的。因此,数据扩充可帮助孩子和模型轻松地概括并快速学习。
大多数机器学习库都提供图像增强API,可用于在训练数据集中即时创建图像的修改版本。过度拟合是普遍化的敌人,因为它会使学习者在不了解的情况下变得笨拙。数据扩充通过将对象的所有特征暴露给学习者(无论是儿童还是深度学习模型)来帮助避免过拟合。当模型试图非常紧密地拟合训练数据以致不能很好地推广到新数据时,就会发生过度拟合。总而言之,如果您不能一概而论,则您的智力水平很低。对于人类和机器学习模型都是如此。
随着年龄的增长,您将掌握泛化技术,并且您的智能也随之增长。随意概括和快速学习。下次见........

关注 CDA人工智能学院 ,回复“录播”获取更多人工智能精选直播视频!


二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群