为什么数据科学领域的领导者要退出市场?
最近,我与我在数据科学领域认识的人进行了几次对话,这些对话总是从业务开始,然后逐渐发展到整个数据科学的状态。这些对话中不断出现一个主题:当前有很多人在大型组织中运行数据科学团队,其中绝大多数人(我相信我们谈论的是80%到90%)都想辞职。这是为什么?在较小的组织中,这个数字并不那么大。那么,导致如此大规模外流的大型组织正在发生什么呢? 我曾与许多大型组织合作并以数据科学领导力工作过,因此我有一些理论。
学术界无法牟利
许多大公司陷入陷阱,以为您需要 博士学位才??能进行数据科学。你不知道 在我曾经合作过的前五名数据科学家中,只有一名拥有博士学位,甚至没有统计或数据科学专业,而是生物物理学专业。我称之为“学术障碍陷阱”。有些聪明的人对非常狭窄的领域了解很多,但是数据科学是一门非常广泛的学科。当这些博士掌管时,他们常常发现他们超出了他们的深度。他们从未被教导过如何经营损益表,管理团队或与人打交道,竞争情报,市场评估,建立业务案例等。
除此之外,他们还来自这个世界:学术界中许多真正经过同行评审的优秀论文都没有日渐成熟。为什么?审稿人可能有相互竞争的理论,不希望他们的想法被取代。在数据科学领域这种情况发生的频率令人震惊。我一直发现学术界比企业界更具政治性。当您的驱动力是利润和客户满意度时,学术思维可能更多是负债而不是资产。我还没有看到我个人认可的数据科学程序。我认为,大多数是由从未在实验室外完成数据科学工作的人员运营的。那不是您公司想要的。
如果您不愿意为数据科学经理提供所需的培训和支持,或者不愿创建将具有业务背景的人员纳入数据科学战略的组织结构, 那么预算将会增加,而结果却会下降。我见过领导团队每年花一千万美元,而回报却很少。我从未花过那种钱,但我已经建立了数十亿美元的数据产品。我也不是博士学位。所不同的是,我知道生意。博士做的很棒,但是他们擅长的工作类型并不是大多数公司要求他们在企业数据科学的新时代从事的工作。不要犯这个错误。
错误的期望
做数据科学和管理数据科学是不一样的,就像工程师和产品经理一样。有很多重叠,但是重叠并不等于相同。有时,我羡慕数据科学家-他们的大部分时间都花在清理数据集,测试算法和研究新方法上。与需要进行练习的人员的工作相比,数据科学家的工作相当出色。
“做数据科学和管理数据科学是不一样的。”
数据科学实践的负责人需要关注 数据治理,MDM,合规性,算法使用方面的法律问题以及文档,以防万一有人提起诉讼以防不当使用。存在招聘问题和人员配置问题,需要获得预算和资金,要运行P&L,要建立业务案例,要进行市场研究,要举行供应商会议,技术生命周期管理,对项目进行宣传(包括内部和外部)。外部),然后将其转化为可以销售的数据产品,而所有这些都试图确保公司的利润。巨大差距。
大多数数据科学家还不准备领导团队。这就是为什么数据科学团队现在的失败率如此之高的原因。通常,公司在真正需要强大的业务主管时会任命强大的技术主管。我称这个人为数据策略师。在该数据战略家的带领下,是强大的技术人员;两者之间必须有非常牢固和牢固的人际关系。如果他们竞争,将导致摩擦和不良结果。
错误的方法
敏捷已经席卷了科技界。它非常适合软件开发,因此,许多公司在数据科学上强制执行它。但是数据科学不是软件开发,它实际上是一个发现领域,而软件开发则是关于汇编的。我曾与需要 敏捷和敏捷 的数据科学公司合作,然后看到他们的一半团队在不到一年的时间内走了进来。您不能告诉团队在两次冲刺中解决问题。如果他们没有数据或工具,就不会发生。
“你不能告诉一个团队在两次冲刺中解决问题。如果他们没有数据或工具,就不会发生。”
数据科学是一门需要其自身方法的学科。此外,大多数公司仍然像对待物理产品一样对待数据产品,但经济情况并不相同。当我构建 推荐引擎时,我的单位成本几乎为零,这与物理产品肯定具有单位成本不同。我可以使用该引擎或一个引擎提出一百万种产品推荐,除电力外,我的每条推荐成本是相同的。如果我想将实物产品的价格从一增加到一百万,那么实物产品的成本将更高,并且涉及许多不同的变量。
我们必须了解,数据产品的经济性是不同的。许多大公司甚至没有进行这种交谈,这可能会使负责数据产品的人员感到沮丧。本质上,他们的一只手绑在背后。
题库