全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 数据分析与数据挖掘
392 0
2022-06-13
当前的全球危机助长了跨组织削减成本的呼声。从本地环境到公共云平台的数据湖不断发展,经常努力保持较低的基础设施和运营成本,同时提供业务敏捷性。

在许多大型组织中,传统的数据湖是在本地建立的,具有跨不同业务部门的复杂工作流。这些环境中的本地基础设施经常受到压力,导致基础设施的总成本增加。与此同时,这些数据驱动的组织正在迅速加入新的和意料之外的工作负载。

由于配置新的基础设施需要时间以及维护所购买的每一件硬件和软件的高昂运营成本,一个完全本地的基础设施将无法跟上。尽管拥有托管弹性基础设施的公有云供应商的承诺听起来不错,但随着我们在这种情况下扩大规模,成本很快就会开始增加。

随着数据量的不断增长,控制成本的关键是保持灵活性。通过为跨本地数据湖和公共云分布的基础设施做好准备,您将能够两全其美。但说起来容易做起来难。以下是关于如何利用混合云的五项建议。

增量迁移
完全提升本地环境并迁移到公共云可能听起来很可怕。而且,弹性计算基础架构的优势常常被昂贵的存储、网络和运营成本所抵消。通过将您的一些工作负载从繁忙的本地数据湖迁移到利用云中的计算,在这两个世界中立足。准备好将数据和计算基础架构分布在本地环境和公共云中。

保持与基础架构无关
以幼稚的方式采用云原生计算可能需要重写应用程序、将数据复制到云存储以及重新定义结构化数据目录。如此复杂的迁移既费力又昂贵。抽象是在技术堆栈的所有层保持对基础设施提供商不可知的关键。容器编排使应用层面向未来,以便在需要时可以跨基础设施提供商迁移工作负载。但是数据具有引力,移动数据也不能免受网络和存储成本的影响。类似地,数据编排层将应用程序与数据的物理位置分离,以优化哪些数据驻留在何处以及驻留多长时间。

不要忘记数据局部性
初始数据分析生态系统的一个关键前提是数据局部性为您带来性能。在计算工作负载迁移到云并与存储分离的场景中,没有局部性。公共云环境中的性能提升转化为通过在不需要时弹性缩减计算来实现成本节约。高度分布式的缓存功能会自动编排热数据,使其更接近计算性能,同时将冷数据保存在更便宜的存储中。缓存还消除了重复的网络传输和相关的云运营成本。

对所有事情都使用策略(尽可能多)
每个工作负载都是独一无二的,具有不同的资源使用模式。云中的弹性需要针对这些特定工​​作负载的策略,包括计算和存储。使用自动扩展策略来控制保持计算资源的时间和时间。同样,雇用数据管理确定何时何地迁移哪些数据以真正启用混合云环境的策略。

制定安全解决方案战略
虽然开源软件和抽象很重要,可以帮助避免潜在的供应商锁定,但在您的环境中提供必要的安全功能以保护组织中的数据也很重要。使用广域网上的安全访问方法规划动态和静态数据的安全性。与本地和云组件集成,以防止在最后的障碍上绊倒。

您的组织是否正在计划未来的发展?混合云即将出现吗?混合云是否有意义,但您仍然持怀疑态度吗?为您的工作负载选择合适的工具并重新构想您的云战略。

      相关帖子DA内容精选
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群