Gartner 估计,60% 的大数据项目未能实现其预期目标。一年后,他们将这一数字修正为 85%,承认他们对最初的估计“过于保守”。
那么,回到最初的问题——这么多大数据项目不成功的原因是什么?
嗯,有多种原因。大多数时候,技术甚至不是罪魁祸首。
让我解释。
可能使大数据失败的错误
不是陈词滥调,而是大数据正在重塑现代世界。它的指纹在每个部门,从零售医疗保健及其他领域。
当应用于大数据时,“太大而不能倒”一词具有全新的含义。
此类项目的规模常常使组织不堪重负,以至于他们完全避免这些举措。失去对数据科学项目的投资可能会对企业造成重大打击。
但并非所有的大数据项目都是平等的,并且注定要失败。事实上,如果你避免以下错误——大数据可以成为你最大的资产。
1.关注短期收益
我们的时代无缘无故被称为信息时代。每一个重要的决定,无论是来自政府机构还是企业实体,都必须有相关和真实的数据支持。直觉和个人经验推动决策的日子已经一去不复返了。
公司现在认识到从客户那里收集的数据具有巨大的价值。这是一项需要有效管理的资产。这可以通过使用技术来简化数据收集、自动扩展以管理可变数据量以及启用
人工智能,同时保留一些定制空间。
大多数公司倾向于做的是专注于这些工具的短期价值,而忽略从长远来看他们会获得的一切。这导致他们错过了未来的一些主要好处。
2. 缺乏对可视化的关注
有时,数据科学家不会花太多时间通过各种可视化技术. 这些工具可以在帮助企业快速提供洞察力方面发挥重要作用。
适当的可视化对于探索性
数据分析建模、监控分析和说明结果非常重要。
没有这个,即使是最好的
机器学习模型也无法挽救您的大数据项目。
大多数数据科学家更喜欢类似图表的视觉效果,因为它们具有美学吸引力,而不是考虑其数据集的特征并做出相应决定。
公司应该聘请能够实现可视化目标及其基本原则的数据科学家。
3. 没有中央机关
数据的准确性和质量是许多公司经常遇到的问题。无论数据多么“大”,当充满不一致和重复时,它都毫无用处。
保持高标准数据收集的一种方法是为此目的建立中央监督。这样,可以完全避免任何重复、错误输入和不正确的列使用。
所以要么成立一个委员会,要么把这个角色交给经验丰富的专业人士。在任何情况下,该机构都应该有一项任务是保持数据清洁并培训将使用它的员工。
数据卫生值得特别关注,组织不应该回避对这样一个关键功能进行额外投资。
4. 太“大”
这似乎有点讽刺,但这是必须要说的;大数据并不总是很大。是的,重点是检查大量数据集以揭示模式,获得洞察力,并以此为基础做出未来的决策。
但是,收集所有可以收集的东西可以复杂的业务功能. 当不相关的数据被保留时,它会产生所谓的数据饱和——一种存储大量数据的情况,几乎不可能对其进行组织并获得有意义的见解。
因此,从一开始就制定一个精心设计的计划很重要。您的数据策略应与您公司的整体业务目标保持一致。收集有目的和战略性的信息,这将导致一些有用的发现。
同样,中央权威机构应负责确保数据收集的冗余并帮助确定主要目标和相关数据集。
5. 毫无疑问地寻求答案
引用大卫科波菲尔的话,“我们生活在我们的问题创造的世界里。” 了解您需要回答的问题是数据科学的重要组成部分。这是收集适当数据集然后收集结果的第一步。
毫无疑问地跳入数据为几乎没有价值的分析结果让路。更好的方法是有明确的目标和问题,以及实现这些目标的少量假设。
如果你不知道自己想要什么,那就准备好什么都得不到。大数据使您能够为新旧问题寻求新答案。所有这些答案都是通过合并以前从未合并的数据集来接收的。好奇心是整个过程的主要驱动力。
6. 在同一基础设施中安装大数据
与传统的组织功能相比,大数据有自己的一组要求,其中包括不同的身份验证、数据隔离、访问和环境管理机制。
简而言之,为了让大数据发挥作用,组织程序需要改变。在现有环境中添加它只是令人失望的秘诀。
需要调整操作流程才能使大数据发挥作用。否则,您的公司将以极其复杂和低效的架构告终。
当您全面了解您的组织的需求、让整个公司参与进来并分阶段执行计划时,您就会取得成功。
当您转向参考基础设施时,所有这些都需要发生,这是在初始战略中构建的。
虽然改变确实很困难,但在进行大数据实施时却是必要的。
结论
不同的技术是帮助企业省钱并打开新的收入大门。与人工智能 (AI)、物联网 (IoT) 和虚拟现实 (VR) 一起,数据科学已成为一项彻底改变企业运营方式的技术。
大数据正在帮助决策者了解过去的趋势,并使他们能够在未来做出更好的决策。然而,这并不是什么可以解决所有决策问题的魔术。
为了使其成为您组织的资产,大数据应被视为一种工具,以及适当的上下文和相关的业务案例。
由于数据可以帮助您了解过去的趋势以备将来使用,因此您最好在继续项目之前了解常见的大数据实施错误。