明天的数据库:自动驾驶的自主数据库
未来几年,到2025年,我们在全球范围内创建的数据量将增长到每年175 ZB,高于2018年的33 ZB。其中一半以上的数据将由物联网设备创建,其中60%以上这将是企业数据。到2025年,所有创建的数据中有30%将是实时的,这为组织提供了不断优化业务的巨大机会。
显然,明天的组织是一个数据组织。但是,仅收集大量数据是不够的。您还需要分析数据以获取见解,并更改组织文化以从中受益。据麦肯锡,数据驱动的组织更可能是23倍来获取客户,6X可能会更容易留住客户和19X是有利可图的。数据驱动对企业有利。
数据治理的重要性
当收集PB级数据时,此数据的高质量至关重要。专注于高质量数据的组织能够更好地应对不断变化的业务环境并实现战略目标。因此,在当今数据驱动的世界中,数据治理已成为组织的必需品,并且它们再也无法用最小的努力脱身。
相反,组织需要重新考虑如何创建,审核和管理信息,如何定义所有权以及如何保持数据的私密性和安全性。企业需要一个结合了业务和技术观点的数据治理框架,以应对数据所涉及的战略和运营挑战。这样的框架由五个领域组成,包括数据原理,数据质量,元数据,数据访问和数据生命周期。
数据原理定义了业务用户如何管理和处理可用数据。数据质量是指数据的准确性,及时性,可信性和完整性。元数据被定义为“关于数据的数据”,提供数据描述并促进对数据的理解。数据访问权决定谁有权访问组织内的哪些数据以及数据生命周期中有关如何使用,存储和组织数据的时间。
管理数据生命周期
数据生命周期是数据从收集到删除所经过的步骤序列。它包括数据捕获(例如,使用IoT设备),维护(在使用之前进行数据处理),积极使用(数据用于支持组织的活动,例如个性化营销),发布(将数据发送到组织外部,例如,使用区块链解决方案与行业合作伙伴共享它),存档(不再需要数据时,将其存档而不是删除,以备将来使用),最后清除(不再需要GDPR兼容的数据)。
在整个生命周期中优化数据对于未来的组织至关重要。只有符合数据治理框架并在其整个生命周期中受到监视的高质量数据才对组织有用。早期的数据库系统仅照顾生命周期的某些步骤(例如数据捕获和维护),而现代系统则照顾整个数据生命周期。
随着数据量的增长,数据库系统变得越来越重要。无论您是将数据存储在云中,本地还是使用混合云,都只是故事的一部分。随着数据的增长,如何管理数据和数据库变得越来越重要和困难。
自治数据库
幸运的是,现代数据库系统所做的不只是允许您存储和维护数据。我们现在已经进入了自治数据库的时代,在这个时代,人工智能取代了数据库工程师的角色。自主数据库使用
机器学习和自动化来完成艰苦的工作,而工程师则可以专注于更重要的工作。结果,您的数据将得到更好的管理,并且变得更加有用。
自主数据库使用机器学习来在运行时自动升级,修补和调整自身。安全更新是自动化的,无需停机。机器学习用于确保由于自动压缩数据而减少数据库的计算和存储。结果是比传统数据库更快,更可靠和更便宜。
Oracle是此开发领域中最前沿的组织之一。在甲骨文自治数据库,在云计算的世界上第一个独立的数据管理,提供了一个基于机器学习和消除人类劳动,人为错误和手动调整-包括执行在系统所有日常数据库维护任务运行,无需人工干预全自动化。这个新的自主数据库是自动驾驶的
借助自动化和机器学习,自主数据库是自动驾驶的,从而使IT人员得以腾出时间来支持业务。它具有自我保护功能,因为它可以自动保护数据库免受攻击和自我修复,从而使您的业务持续正常运行。
因此,它最大化了您可以从数据中检索的价值。它使您可以创建新的数据模型,获得新的见解并比以往任何时候都快。因此,智能自动化可以使组织更好地利用手头的数据获利。一个增加了10%,在数据的可获得性可能导致一个典型的财富1000强公司$ 65万的额外收入。
明天的数据库
今天的组织已经可以从明天的数据库中受益。自治数据库是从传统的辛苦数据库中向前迈出的一大步,在传统的辛苦数据库中,需要一批工程师来保持其正常运行和安全。尤其是随着数据成为保持竞争力的关键因素,组织对于确保数据的最大输出至关重要。只有在可以使用数据,黑客没有机会并且您的数据库一直处于运行状态时,才有可能。
随着自动化和机器学习进入组织,只有在数据库中使用AI才有意义。毕竟,在数据管理方面,
人工智能在消除复杂性,人为错误和确保安全性方面比人类更好。

关注 CDA人工智能学院 ,回复“录播”获取更多人工智能精选直播视频!