全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 数据分析与数据挖掘
518 0
2022-06-28
高绩效企业和低绩效企业的区别在于前者最大化他们的数据,而后者没有。但大多数企业可能仍然生活在这两个世界之间。

这意味着许多公司仍在努力将 IT 支持的业务计划提升到一个新的水平,包括提高运营和/或劳动力效率、改善客户体验、降低成本以及改善对数据的访问以进行决策。

有什么方法可以帮助他们到达那里?迄今为止,提供商业利益的前两项技术是基础设施现代化和云/混合计算,Harald Smith 说,产品管理总监同步排序,在最近的一次 DATAVERSITY® 采访中。

想了解情况吗?
在您的收件箱中获取我们的每周通讯,其中包含最新的数据管理文章、网络研讨会、活动、在线课程等。

订阅
例如,Syncsort 最近的一项调查发现,48% 的受访者表示,他们的组织在从数据中获取价值方面仅在一定程度上有效。认为他们的公司有效地为用户提供数据洞察力的受访者比例存在分歧,50% 的受访者认为他们的公司有效或在某种程度上有效。但 35% 的人对此事仍持中立态度,15% 的人仍在苦苦挣扎。

高级/预测分析和数据治理,每一个都在 30% 附近徘徊,排在第二位。这两种技术都可以对公司改善客户体验的愿望产生重大影响,帮助他们全面了解如何发现客户的偏好、购买习惯和其他数据点并将其用于销售、营销和其他任务。

保持迄今为止赋予他们价值的过程,受访者表示,他们在未来 12 个月内的首要任务是云/混合计算、基础设施现代化和数据治理。

下一代分析的新基础设施

尽管有很多好处,但在将数据从遗留平台迁移到大数据平台和云以降低成本和实现更高的处理性能时,可能存在需要解决的问题,这是可以理解的。

“人们希望将基础设施现代化为大数据平台或云,”史密斯评论道。Syncsort 为数据基础架构优化、云、数据可用性、安全性、数据整合, 和数据质量。随着企业构建数据湖以集中数据以进行高级分析,他们还需要为 Hadoop 和 Spark 等大数据平台摄取大型机数据。

根据 Smith 的说法,驱动数据湖和企业数据中心的顶级分析用例是高级/预测分析、实时分析、运营分析、数据发现和可视化,以及机器学习和人工智能。填充数据湖的主要遗留数据源是企业数据仓库、RDBMS 和大型机/IBM I 系统。

“遗留基础设施非常重要,”史密斯评论道。“这些系统不会消失。” 据该公司称,大型机和 IMB 我仍然运行大多数企业的核心事务应用程序。“非常传统的环境对于您如何订购和交付货物或如何保持业务运行至关重要,”他说。因此,随着遗留流程进入大数据或云平台,立即进行故障转移同样重要。

数据从主机移到数据湖– 并与其他数据合并 – 现在能够以更低的成本和更大的规模进行分析。但是,跨环境适当地洗牌数据并不是一次性的过程,因为大型机应用程序会继续更新其数据,并且数据湖中的数据必须不断保持同步。使数据保持最新和同步是 Syncsort 确定的最大 IT 挑战之一,用户访问数据也是如此。

为了帮助解决这个问题,Syncsort 的连接疾控中心当事务通过直接读取大型机数据库日志完成时,产品会实时捕获大型机上的更改。除了更新数据外,它还使用数据位置更新 Hive 元数据,以保持分析查询快速运行。“不需要专业的编码,”Smith 说——工作流程是在直观的 GUI 中定义的。

Smith 指出,Syncsort 的 Change Data Capture 已被大量采用,用于保持数据湖中的数据最新。“确保您获得和访问的信息不会过时是关键,”他说。

以治理治国

尽管数据治理是为提供商业利益而挑选出来的因素之一,Smith 提到。“数据集成以及数据质量和安全性都与数据治理集成在一起,”他说,无论是为了合规性、风险缓解、业务价值还是成本。

为了从中央数据湖向数据科学家和商业智能分析师提供良好的信息,企业本身需要克服许多传统的数据质量挑战。但是,在处理第三方数据时,这些数据质量问题(例如了解来自多个来源的信息的沿袭、完整性和准确性)变得更加重要。

“我可能对我如何从操作系统收集数据以及如何引入这些数据很有信心,但我们怎么知道第三方如何收集数据呢?” 史密斯问道。他们是否按照 GDPR 要求收集数据?数据中是否存在可能影响通过分析提供有价值见解的能力的固有偏差?如果您要求供应商记录和分析数据,您能否相信他们以一种易于理解、可重复和可访问的方式完成了这项工作?

此外,一些组织尚未确定如何操作和管理仍处于研究初期的技术,例如区块链、物联网和人工智能。这是公司评估的三大顶级技术。如果没有管理良好的数据,利用机器学习和人工智能的能力就会面临风险。

Syncsort 解决与数据治理和集成相关的数据质量问题的努力反映在其用于大数据的 Trillium DQ解决方案以及与企业信息管理和 IT 系统管理供应商的合作伙伴关系ASG. 据该公司称,可以为客户提供业务规则的数据分析和验证(由用户创建以执行数据质量和策略的技术实施),以便业务部门的分析师可以立即识别问题和异常情况。

具有 ASG 企业数据智能的 Trillium 数据发现和质量软件可以通过管理和定义业务级别策略、使业务条款和质量结果与关键数据保持一致以及深入了解数据的来源,从而跟踪数据的来源以及数据在系统中的移动方式从原始来源到最终目的地存在质量差距,例如 BI 报告。“你可以追溯到数据,”史密斯说。“这在数据湖中至关重要。”

      相关帖子DA内容精选
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群