全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 数据分析与数据挖掘
846 0
2020-09-07
适应还是死:为什么您的业务策略使数据策略失败
几年前,我接到一个对冲基金分析师的电话,他正在寻找用他的话说可以提供“ alpha”的外部数据。我解释说,我们公司已与数千个数据源和数十万个公共数据集建立了连接。我告诉他,我们将不断从70个国家/地区提取开放数据,通过针对全球最大的公共数据目录进行了培训的提取管道将其标准化,并通过可直接插入任何生态系统的API套件对其进行服务。
象棋比赛
短暂停顿了一下,分析师说:“我拥有所有这些。你有我不想要的东西吗?”
这让我感到惊讶。“您是在告诉我您已经在提取和处理来自美国每个公共机构和市政当局的数据吗?”
“不,但是我可以。买东西很容易。我想要别人没有的东西。”
这不是我最后一次听到有人提出这一要求。人们误以为公共数据易于访问,这定义了开放数据运动的头十年,这极大地损害了实际上试图使用它来做出明智业务决策的人们。在实践中,公共数据不容易访问,也不容易使用。我们将其称为可用与可访问性之间的差异,这是采用的重大障碍。
对于现代企业来说,有效地访问和使用数据至关重要。无论是在组织的四面墙中生成的数据,政府公开数据,甚至是其他企业发布的数据,通过将这些信息流整合到分析模型或应用程序中,都可以释放很多价值。有了这么多资源,高管们争先恐后地获取新数据,因为知道创新最快的人可以从适应不充分的人那里抢走市场份额。
对创新的关注导致组织聘请了许多数据科学家和分析师,他们的任务是创建可用于推动商业智能的新产品,服务和应用程序。
所以有什么问题?
问题在于业务部门基于结果的思维与数据科学家的现实之间的脱节。当您雇用了一批数据科学家时,就可以期待“创新”,但是从地面上看,他们所做的工作中只有一小部分可以被认为是开创性的。在大多数时候,数据科学家都在为我对冲基金的量化朋友认为很简单的所有事情苦苦挣扎:采购数据,完善数据并将其插入应用程序。
由于处理数据的困难,我们对数据项目越来越感到不满。他们在那里炒作,人才在那里,但结果却没有。由于有效使用数据所涉及的运营障碍,数月甚至数年的工作未能付诸实践。对于数据科学家而言,这是令人沮丧的,对于高管而言,这是紧迫的商业问题。
事情看起来很严峻。Gartner在2016年估计有  60%的大数据项目失败了,一年后Gartner的分析师Nick Heudecker表示  这一数字可能接近85%。无论您的口袋有多深,任何理智的生意都不会继续向每五次失败四次的东西扔钱。
现实是,为了创新,所有企业都必须优化其数据策略。
从管理的角度来看,优化始于沟通。最高管理层和数据科学部门之间必须有更好的对话渠道。运营目标应该明确,并且必须为数据科学家提供有效开展工作所需的资源。制定数据策略是朝正确方向迈出的一步,但是它已经实施了吗?仅仅依靠数据驱动是不够的,您还需要了解其中的含义,并为您的团队提供使他们能够将想法付诸实践的工具和支持。
优化数据基础结构的第二种方法是加快耗时的数据管理任务,这些任务困扰着各地的数据部门。
在理想情况下,数据科学家有权进行实验和尝试想法,但是在操作上这通常是不可能的。采购,抓取,标准化,完善和集成数据只需要太长时间。此操作陷阱的结果是以下两种情况之一:
想法来自高层,高层管理人员决定关键目标并将数据划分交给目标;要么
数据科学家在受控环境中工作,使用合成的小型数据来测试模型。
在第一种情况下,数据科学家缺乏所有权,并被束缚于可能不可行的项目。在第二种情况下,好的想法和体面的模型通常会在投入现实环境后立即失效。
通过采用DataOps框架并找到使收集数据的准备阶段和过程阶段自动化的方法,数据科学家将能够更快地测试和评估想法,并确保其模型可用于生产。这将导致产量增加,从而带来更好的业务成果。优化将导致创新。
最近,我正在与一个想开始使用公共数据的人开会。我向他介绍了该平台,并解释了采购和集成数据所涉及的步骤。
他耸了耸肩。“我的数据团队可以做所有这一切。”
这次我准备好了。“ 那么为什么不呢?”

关注 CDA人工智能学院 ,回复“录播”获取更多人工智能精选直播视频!


二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群