全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 数据分析与数据挖掘
444 0
2022-06-21
在云中实现高可用性 (HA) 的挑战是高成本。HA 需要提供冗余资源,以确保能够在任何故障期间保持所需的性能水平。备用实例中的资源通常配置为与活动实例的峰值负载相匹配。这种 1:1 配置始终能够满足严格的恢复时间和恢复点目标(RTO 和 RPO),但对于除最关键任务应用程序之外的所有应用程序,它们可能难以证明其成本合理性。

根据云服务提供商 (CSP)、使用的服务和合同条款,以这种方式实施 HA 可以使在云中运行应用程序的成本翻倍。为了保持云计算的巨大规模经济所提供的成本节约潜力,组织可能会倾向于实施不充分的 HA 规定。毕竟,为什么要为一年只能使用几个小时的东西支付这么多钱呢?

所有 CSP 都提供动态供应资源的能力,但这些功能并非为 HA 目的而设计。这种动态配置可能不可靠或采用耗时(且容易出错)的手动流程,迫使云客户在需求高峰期花费超过必要的费用或达不到服务水平。

出于这些原因,IT 部门正在寻找 CSP 来帮助他们通过机器学习 (ML) 和人工智能 (AI) 技术更高效地运营,这些技术能够提供更有效和全自动的动态资源管理。实现这一点需要系统了解何时需要更多资源,然后自动扩展这些资源以满足增加的需求。相反,系统将需要了解何时不再需要某些资源并安全地减少其分配以最小化成本。

ML 和 AI 是使 HA 配置更具成本效益的理想技术。该方法需要 24×365 全天候监控每个应用程序,以了解一年中一天、几周和几个月的不同时间的使用模式。随着对这些模式的了解,系统将不断提高其调整备用资源分配的能力,以在不影响保护的情况下最大限度地节省成本。

为了满足苛刻的 RTO,备用实例中分配的 CPU 和内存资源需要不断调整,以匹配当前在活动实例中消耗的资源。这些是最昂贵的资源,并尽可能将它们最小化,这有望比目前的做法节省大约 50% 的潜在成本。为了满足苛刻的 RPO,仍需要不断复制数据,但云中的数据存储相对便宜。

基于 ML/AI 的动态 HA 供应系统将通过已发布的 API 与 CSP 的普通供应能力接口,使其能够自动运行。由于自动化并不意味着放弃控制,这些系统将提供图形用户界面 (GUI) 来监控正在采取的行动,并使操作员能够为不同的应用程序指定各种选项。GUI 还应该清楚地显示当前正在实现的成本节约,并可能提供执行“假设”分析以优化设置的能力。

      相关帖子DA内容精选
  • 大厂数据分析面试指南!来自亚马逊、谷歌、微软、头条、美团的面试问题!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群