对今天的企业来说,数据分析已经成为生死攸关的选择。我们分析一些著名的供应商,从Hadoop创业者到传统的数据库市场参与者。
Amazon将所有服务都放在云端
分析数据库管理系统:AmazonRedshift服务(基于ParAccel引擎);Amazon关系数据库服务
内存数据库管理系统:无。AmazonWeb服务的第三方选择包括Altibase、SAPHana和ScaleOut
Hadoop分布式系统:Amazon灵活数据处理系统(ElasticMapReduce),第三方选择包括Cloudera和MapR
流处理技术:AmazonKinesis.
硬件/软件系统:不适用
AmazonWeb服务从第三方(包括Cloudera、微软、Oracle、SAP及很多其它市场参与者)那儿获得数据管理服务的重要客户名单, 但这个云服务的巨头对大数据分析长久以来有着自己的野心。在灵活计算云(ElasticComputeCloud,EC2)和简易存储服务 (SimpleStorageService,S3)的存储基础设施基础上,Amazon早在2009年就推出基于Hadoop的灵活数据处理 (ElasticMapReduce)服务。2013年,AmazonWeb服务增加了基于ParAccel数据库管理系统的"红移" (Redshift)数据仓库服务,该服务由另一个独立数据集成系统、商业智能和分析供应商的重要客户名单来提供支持。为AmazonWeb服务实现大数 据能力的是DynamoDBNoSQL数据库管理服务和Kinesis流处理服务。
Amazon对各类企业/机构最大的吸引力在于:在它的"云"上面运行数据密集型应用。领先的Hadoop分发商Cloudera最近与 AmazonWeb服务(AWS)结成合作伙伴,此事可以明显地推断很多企业正在选择融合战略,将选定的大数据工作量移向云端,同时将敏感数据和关键任务 工作保留在内部。通过增加更多选择来连接企业数据中心,AmazonWeb服务(AWS)正在开拓这样的机会。
Cloudera着眼于"数据轴"角色
分析数据库管理系统:Hbase,以及ClouderaImpala,虽然不是一个数据库管理系统,仍然支持SQL在Hadoop顶层的查询。
内存数据库管理系统:虽然不是数据库管理系统,ApacheSpark仍然支持在Hadoop顶层的内存分析
Hadoop分布式系统:CDH开源分布式系统、Cloudera标准版(Standard)、Cloudera企业版(Enterprise)
流处理技术:包括Storm(风暴)的Hadoop上开源流处理
硬件/软件系统:合作伙伴工具和预设硬件,两者也可来自Cisco、Dell、HP、IBM、NetApp和Oracle等系统。
作为Hadoop软件分发市场的领导者,Cloudera致力于将数据处理架构扩展入一个综合的"企业数据轴",它可以作为企业内部所有数据的首要目的地和管理中心点。
Cloudera郑重声明支持开源的Hadoop,但为了确保企业级的业绩、可靠性、数据接入控制和安全性,Cloudera还提供专有的软件,包 括Cloudera管理器(ClouderaManager)、Cloudera导航器(ClouderaNavigator),以及供应商独有的用于备 份和恢复的特定组件。更进一步,通过Cloudera管理器来准备、管理并监控工作量,以及通过Cloudera导航器来提供接入控制和账户查询,包括 ClouderaImpala和Cloudera搜索(ClouderaSearch)在内的开源组件均得到了规模化管理。
Cloudera认为它的平台正在稳定地走向成熟,逐渐成为数据管理的"地心引力中心",它还相信关系数据库最终将预留给合适的应用来处理小规模的 连续、结构化数据。不管是否符合您的认知,我们还是期望Cloudera一如既往地致力于提供成熟而拥有广泛能力的Hadoop平台。