应如何看待数据科学世界
MBA学生:我对我的数据科学技能有很多疑问。我不明白我的需要。我将永远不会像花了数年时间掌握这项技术的数据科学家那样出色。我的才智来自于我的批判性思维和综合分析结果的能力;不算数字。
我:同意! 技术最终将取代许多数据科学家和数据工程任务。 考虑一下AutoML [1]发生了什么。 最终,价值不在构建模型中,价值在于知道如何从模型结果中获利!
MBA学生:数据科学将在10年后淘汰。今天我们几乎有自动驾驶汽车…
我: 虽然这可能有点夸大其词,但这也是为什么我们强调明天的商业领袖必须了解经济学以及数据科学如何成为创造财富或价值的基础的原因。 对于MBA学生来说,经济学是比数据科学更好的学科,尽管每个商科学生都应该理解如何“像数据科学家一样思考”。 您对组织的价值是不会发现数据中隐藏的见解。 您的价值是知道一旦数据科学家找到这些见解该怎么做。 例如,在体育科学中,这将是关于利用玩家的表现和健康/恢复见解来优化玩家的开发计划和游戏中的决策。
MBA学生: 您不会通过知道如何制作剑来赢得战斗。您会通过使用剑来赢得战斗。 这就是为什么武士不是剑匠的原因。
正如我之前写的,我认为培养同时也是数据科学家的MBA学生是错误的重点;众所周知的“数据科学独角兽”,他同样精通软件开发,数据科学和业务。这就像在寻找既是出色的内野手又是出色的投手的美国职棒大联盟潜在球员一样。 尽管可能会有罕见的鸟能够同时投球和命中(纽约洋基队贝贝·鲁斯,加利福尼亚天使安吉·大谷),但成功的美国职棒大联盟球队更容易选拔最佳内野手和最佳投手,让他们完成不同的任务在团队中的角色。
因此,这是我们向MBA学生(以及未来的商业和社会领袖)教给他们关于数据科学需要了解的知识:
1) 数据科学是一项团队运动
数据科学是一项由数据工程师,数据科学家和业务利益相关者组成的团队运动。 就像棒球队一样,仅游击手和接球手就无法有效发挥作用。一个人的数据科学计划必须清楚地阐明数据工程师,数据科学家和业务涉众的角色,职责和期望(见图1)。
图 1: 数据科学团队的角色
如果您的组织的目标是变得更加有效地利用数据和分析来支持您的业务模型并推动数字化转型,那么拥有一支充满投手的团队将无法赢得这场比赛。
有关创建一支成功的数据科学团队的更多详细信息,请参见博客“构建数据科学团队的获奖游戏计划”。
2) 拥抱“像数据科学家一样思考”
业务利益相关者不仅要了解业务,而且要知道如何“像数据科学家一样思考”,这对数据科学战略的有效性至关重要。 也就是说,业务利益相关者必须理解数据科学过程,以便不仅进行协作,而且最终要领导数据科学工作,以确保将宝贵的数据科学资源集中在最重要的业务机会上(参见图2)。
图 2: “像数据科学家一样思考”的过程
有关“像数据科学家一样思考”(TLADS)流程中每个步骤的更多详细信息,请参见博客“像数据科学家一样精炼思维”系列。
注意:从图2与博客中列出的流程的区别可以看出,我们将继续基于客户参与和班级工作来完善和更新TLADS流程。 改进工作导致了以下发展–假设发展画布。
3) 假设发展画布是您的获利指南
假设发展画布是我们最近为“像数据科学家一样思考”过程奠定基础的发展。假设开发画布使用一种通用的设计思维技术在一个文档上总结了TLADS流程的所有关键方面(参见图3)。
图 3:假设开发画布与数据科学执行联系在一起的业务策略
虽然我们仍处于测试和完善画布的早期阶段,但早期的反馈和结果令人鼓舞。 有关假设开发画布,业务模型画布和经过修改的
机器学习画布的更多详细信息,请参见博客“带有假设开发的数据科学'按数字绘画'... ”。
4) 深入了解高级分析
尽管我们不希望商科学生精通数据科学,但让他们了解数据科学(和高级分析)可以为组织的业务模型提供动力是非常重要的。 让我们以过于简化的
人工智能或AI定义开始高级分析对话:
人工智能是关于将客户,产品,运营或市场模式和关系进行整理,以便学习,行动和/或自动化。
然后,可以将支持的高级分析分类或划分为3个级别的高级分析(请参见图4)。
图 4: 高级分析的三个层次
Advanced Analytics的组件包括:
级别1:统计和预测分析可量化因果关系(相关系数)和拟合优度(卡方检验)
级别2:深度学习(
神经网络)从训练数据集中学习,然后将这些学习应用于新数据集(照片,图像,音频,手写体)
级别2:有监督的机器学习可识别驱动“标记”或已知结果的已知未知关系(例如,欺诈,损耗,产品故障,垃圾邮件)
级别2:无监督机器学习可识别未知的未知关系-簇,段,关联-隐藏在数据中
第3级:强化学习和人工智能学习(主要是通过反复试验)并进行适应,以便在不断变化的环境(机器人,自动驾驶汽车)中运行
有关高级分析的三个级别的更多详细信息,请参见博客“人工智能不是伪造的情报”。
概要
综上所述,这是我认为MBA学生(和商业领袖)需要了解的有关数据科学不断发展的功能和力量的内容:
数据科学是一项团队运动,同样包括数据工程师(他们收集并准备和丰富数据以进行高级分析),数据科学家(他们建立分析模型以对因果关系进行编码并衡量拟合优度”)和业务利益相关者。
拥抱“像数据科学家一样思考”的方法,以便确定数据科学要解决的问题以及如何应用产生的客户,产品和运营洞察力来推导和推动业务价值。
了解如何与假设发展画布上的数据科学团队合作,以巩固组织的业务战略与特定的AI和机器学习工作之间的关系。
对“什么”高级分析功能(例如深度学习,机器学习和强化学习)有较高的了解,可以发现组织数据中埋藏的客户,产品和运营洞察力(而不必担心它们的“方式”如何)做到这一点-这就是为什么我们有那些头脑敏捷的数据科学家!)。
1