全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 数据分析与数据挖掘
939 0
2020-08-05
请没有ML算法备忘单
什么是备忘单?
维基百科将备忘单定义为一组简明的注释,用于 快速参考。  现在,此处需要强调的单词是“快速参考”。
在编程中,备忘单是可以的,因为没有人可以记住编程语言的所有语法。特别是如果编程语言不断发展(例如Python),或者程序员发现自己正在过渡到不同的编程语言中或从中过渡出来。
快速参考(如备忘单)可帮助程序员节省时间并专注于更大的问题。
数据科学家,您急着要干什么?
机器学习算法的学习和实现绝不应是100 M破折号。每个机器学习实现都应该经过仔细考虑,仔细考虑然后再实施。数据科学解决方案需要时间,这是一项探索性和实验性的工作。
遵循一些备忘单会使您减少实验性,并且无法探索所有选项。在“潜水直入问题”的态度可能会帮助你赢得一些比赛Kaggle但它不会带你在现实生活中学习机使用情况。  
好吧,现在让我们开始讨论问题的关键...
为什么ML算法备忘单是个坏主意?
数据与假设
即使在公司内部,一个部门的业务问题也有所不同。在逐案的基础上,数据的多样性和复杂性太大,以至于无法规定任何一种方法。但是ML备忘单正是这样做的。
例如,如果数据<1k,则选择算法X:否则如果数据> 1k,则选择算法Y
得出这些假设,每种机器学习算法都考虑了许多假设。从有关数据生成过程的假设到有关模型的假设开始。这些假设根本没有被详细研究或评估。
备忘单让您走上一条没有掉头或走弯的道路
就像编程中的硬编码一样,ML算法的备忘单会限制您的选择。他们让您走上一条快乐的道路,一旦您意识到自己所走的道路是错误的,那就太晚了!
没有创新的机会
如果您使用备忘单,那么您走的路并不少。不用说,创新是通过走更少的路来实现的。备忘单不会告诉您将学习从一个领域应用于另一个领域。转移学习在这里没有发生。它既没有告诉您尝试一些集成技术,也没有尝试将不同的算法技术进行合并。一个或多或少就像一匹马与眨眼。
我们(数据科学家)站在巨人的肩膀上。无论是Legendre的OLS还是Geoffrey Hinton的各种深度学习技术,都不是通过遵循速查表而发明的。
备忘单使您的决策“像机器一样”
好吧,对机器学习算法进行编码并不意味着您会成为机器本身!备忘单通常会使您在每个阶段的决策都是二进制的。
例如
瞧,您有集群吗?还是?
天真的数据科学家或有抱负的数据科学家只会对他/她获得的集群感到满意,然后继续前进。
但是这里有个陷阱...
k意味着算法存在的陷阱之一是它将对几乎所有事物进行聚类。因为我们现在有了集群,所以这并不意味着我们已经完成了任何事情!这只是一个痛苦的胜利。
因此,可以清楚地看到,虽然备忘单将数据科学家引向了K means算法的道路,但是当需要进一步探测时,它给人一种错误的任务完成感。
没有免费的午餐理论-棺材里的最后钉子
也许“没有免费的午餐理论”是ML速查表棺材中的最后钉子。没有免费的午餐理论指出
“没有一种模型能最好地解决每个问题。对于一个问题建立好的模型的假设可能对另一个问题不成立。
如果没有一种模型或算法对每个问题都最有效,那么拥有ML算法备忘单真的有意义吗?
因此,请避免使用ML算法备忘单。尝试有机地解决。让您的头脑直觉并连接点!

关注 CDA人工智能学院 ,回复“录播”获取更多人工智能精选直播视频!


二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群