全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 数据分析与数据挖掘
3769 0
2022-04-01
每次我们认为我们已经掌握了一项新技术及其用途。有时,这种转变是技术本身的增加,似乎强化了原始版本。有时会发生一些事情,导致技术性质发生重大转变。随着人们对这项技术的重要性越来越了解,该名称已更改以更好地反映其主要价值。


在大数据出现之前,企业认识到需要使数据更易于访问,并且可以更快地集中定义、分类和描述。然而,当时还没有实现数据编目自动化所需的技术,因此数据编目需要大量人工来维护。然后,目录中的数据是静态的,反映了过去的一个时间点。数据目录是所有数据集的库。一个地方,您的所有数据都被整齐地索引、组织并随时可用。


为什么需要扩充数据目录?


增强数据目录最突出的价值在于它提高了数据团队的生产力并实现了协作。因为在大多数组织中,数据和技术存在于孤岛中,数据团队经常盲目地工作,无法看到现有的数据集。他们花费太多时间来识别和理解数据,不断地重新创建已经存在的数据集。
为您的所有数据创建档案,包括数据的结构、质量、定义和统计数据
允许用户访问元数据。
查看和了解数据的沿袭,包括应用的转换、来源和使用者。
通过自动更新自身来确保数据的准确性和一致性,同时允许人们进行编辑并仍然在系统中
通过提供数据资产沿袭其生命周期的图形表示来简化合规性和数据治理。
增强数据目录在数据治理中的重要性




效率: 增强的数据目录是公司高效流程的基础。作为“效率催化剂”,数据目录还可以减少数据管理员的工作量,并为其他任务创造空闲容量。根据 Forrester-Forbes 报告,数据科学家将 75% 的时间用于查找和理解数据。
性能: 增强的数据目录可用于加速整个公司的流程、降低成本并确定新的业务领域。结构化数据的使用可以显着提高公司所有领域的绩效。
降低成本: 由于效率的显着提高和数据冗余的消除,可以显着降低公司的成本。除了可衡量的成本外,数据目录还会对公司的其他领域产生影响。此外,员工之间的沟通得到优化,错误减少,数据更容易获得。
数据安全: 在日益严格的数据保护标准和安全要求的背景下,数据目录能够遵守公司内部合规性和法律法规。特别是,数据目录还有助于消除影子 IT 并防止不必要的数据复制。
数据访问和敏捷性: 通过数据目录,公司可以在整个企业范围内访问他们的数据,为团队开辟全新的可能性。由于消除了数据孤岛,可以开发新的用例,从而开辟新的销售市场。与此同时,敏捷项目正在数据计划方面得到推广。由于缺乏数据文化,该公司目前约有 60% 的敏捷项目失败。
决策: 数据驱动的决策在公司中变得越来越重要。数据使基于可信数据的透明、可追溯和客观的决策成为可能。
数据质量: 那些建立增强数据目录的人通常会自动关注现有数据的质量并识别缺失或不正确的数据。通过建立增强的数据目录,可以总体上优化数据质量并识别与数据相关的问题。更高的数据质量还增加了员工对数据的信心:增强的数据目录成为“真实的中心点”并支持自助分析。
‍ 平衡: 通过扩充的数据目录,定义和管理职责。通过这种方式,可以确保敏捷性和治理之间的可持续平衡,并使公司的数据管理适应监管准则和市场要求。
结论


随着我们越来越接近数据驱动的世界,查找和清点驻留在任何特定组织内部和外部不同位置的数据资产日益重要。这是有效分析的必要第一步。这也是当今数据管理团队面临的最大挑战之一。这也是对增强数据目录的需求持续增长的根本原因之一。


[编辑推荐
1、2022年300个以上最佳免费数据科学课程
2、大厂数据分析面试指南!来自亚马逊、谷歌、微软、头条、美团的面试问题!
3、机器学习模型方法总结
4、历史最全机器学习/深度学习/人工智能专业术语表中英对照表
5、机器学习如何应用于商业场景?三个真实的商业项目
6、数据工作者的自我修养 | 哪些技能是必不可少的?
7、《汗牛充栋:数据分析书籍分享》CDA网校新课上线
8、文本挖掘常用的107个语料库
9、一图读懂“东数西算”工程
10、零基础转行数据分析,看这篇文章就够了

DA内容精选

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群