全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 数据分析与数据挖掘
1541 0
2022-05-09
伟大的数据科学家的技能、能力或经验涵盖不同的类别。我根据这些类别分解我的列表。有些与 Cassie 的列表重叠。

优化你的时间
优化您的时间以更快地创造价值。这听起来本身就是一个机器学习问题。但是有一些经验法则。

了解 80/20 法则:不追求完美,追求“足够好”的模型。无论如何,您的数据并不完美。通过遵循此规则,您可以更快地处理多个项目。
自动化数据探索性分析。在这个阶段花很少的时间在编码和数据清理上。相反,这应该是一个简化的过程,大多数时候只需单击一下即可开始和完成。
不要重新发明轮子。编写可重用的代码,并尽可能使用 Python 或其他库。正确记录您的代码。使用具有实际意义的变量名,即使它们很长。在云上的文件夹中组织您的材料(这样它就可以在笔记本电脑崩溃时幸免于难)。增加花在记录上的时间。一些高薪、高价值的谷歌工程师甚至将印度的员工外包并支付报酬,以完成他的部分工作。我强烈建议不要这样做,因为您的公司数据和技术是私有的。
不要低估 Excel。一些分析,甚至是高级分析,都可以在 Excel 中完成。此外,非技术人员熟悉 Excel。因此,您可以与各个团队(例如销售、产品或营销)分享您的完整分析。确保您的电子表格中有一个摘要选项卡,名为(例如)“仪表板”。这样,非技术人员就不会在您的电子表格上浪费太多时间。当您在 6 个月后查看电子表格时,它也会对您有所帮助。
优化别人的时间
如果您遵守这些规则,管理层将不胜感激。回报比使用恒星算法更大。请记住,时间就是金钱。

了解管理层真正想要解决的问题。这将减少解决问题所需的会议和迭代次数。并且在一个项目上无处可去的机会更小。
发现增加价值的机会。管理层可能没有意识到公司数据的潜力。通过建议低垂的果实来积极主动,而不是被动反应。
拥抱简单,用简单的话解释事情。尽可能使用简单的模型:它们更容易解释,更有说服力。如今,管理人员更喜欢可解释的人工智能,而不是晦涩难懂的黑盒系统。它对降低风险也有积极的影响。
设计强大的图表和可视化。一张好图胜过千言万语。一个好的短数据动画(视频甚至 Gif 图像)值得很多图像。如今,它们很容易生产,无需任何编码。请参见图 1 中的示例。
数据和模型敏锐度
您可以获得这些技能,就像我列表中的任何其他技能一样。有些人似乎与生俱来。他们被称为天才。如果你在你的工作中存活足够长的时间,你最终会自动获得它们。但最好早点开始,以便更快的职业发展。你可以称他们为分析敏锐。

评估模型或预测的真实预期潜力和可变性。承诺不足,但交付过多。不要犹豫提及潜在的缺陷或弱点。但是,要取得适当的平衡:除非有正当理由,否则不要要求太多时间来完善您的分析,从而吓倒利益相关者。在某些情况下,从头开始重新开始分析比尝试修复它更有效。
寻找缺失的数据或外部数据源。在 Covid 的早期,大多数人都没有接受过测试。许多人自行康复。“康复”的人数被大大低估了。常识比最复杂的分析更能做出预测。而且它需要更少的时间和资源。这些天来,有问题的未观察到的数据是通过废水中的病毒测量来捕获的。
混合多种算法,而不是将它们相互对立以找到赢家。某些算法在某些观察结果上效果更好,而在其他观察结果上效果不佳。分配给观察的决定可以是多个竞争算法之间投票的结果。这种混合称为集成方法。
对您的数据集执行敏感性分析:为数据添加噪声、处理合成数据、执行模拟。了解您的预测对噪声或错误数据的敏感程度。掌握特征选择和交叉验证技术。
不要忘记模型维护。一些表、参数或规则会随着时间而改变。因为数据会随着时间而变化。当心混合数据。来自不同供应商(或过去)的数据可能具有相似的字段。但它们的测量方式可能不同。
特定于代码的建议
查找代码中的瓶颈。想想如何让你的代码运行得更快。
让您的代码生成通过电子邮件发送给正确人员的警告和错误消息(例如:“空数据集”或“接近零的矩阵行列式”)。
让您的代码生成实时更新的活动日志和汇总表。这样,如果程序或服务器崩溃,您的程序可以从它停止的地方恢复,而不会丢失数据。您的算法可以在设计时考虑到该功能。
获得社区反馈
我在这里包括了两个有时被忽视的项目。

发布并与社区分享您能做的事情。GitHub 和一些社交团体是获得反馈和建议的绝佳平台。例如,您的供应商社区博客、reddit.com/r/MachineLearning 或 Quora,具体取决于主题。
学习,学习,学习。在线课程是一种选择。如果您是自学者,请花时间阅读其他人在做什么。为此,您需要出色的搜索技能,并使用正确的搜索引擎。就我而言,StackExchange 比 Google 更重要。在设计我的形状分类器时,谷歌搜索“形状分类”是没有用的。但是“形状分类机器学习”带来了有趣的结果。
例子

      相关帖子DA内容精选
  • 大厂数据分析面试指南!来自亚马逊、谷歌、微软、头条、美团的面试问题!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群