全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 数据分析与数据挖掘
884 0
2020-11-16
受到大数据迷因的诱惑:Hadoop与公共云
技术原因很容易解释。简而言之,大数据技术对于特定类型的问题很有用,但已应用于许多其他类型的企业问题。去年,在Cloudera – Hortonworks合并之后,新的Cloudera被称为下一个“ Oracle”。这是一个奇怪的选择,因为从技术上讲,这确实是在企业中采用大数据的最大差距。像Oracle这样的供应商不厌其烦地指出Hadoop不是数据库-但通常将其作为试图解决关系数据库可以为企业解决的问题进行销售的产品。
本质上,Hadoop是开源软件产品的集合,该产品提供了分布式存储框架(通过HDFS)来管理非常大的数据集。它的主要目的是使用提供并行化的MapReduce范式为大多数分析应用程序存储,管理和传递数据。因此,HDFS是文件系统,而不是数据库,因此不适合需要ACID合规性的事务性应用程序。诸如Cloudera Impala,Apache Hive和Spark SQL之类的计划试图将类似SQL的功能添加到Hadoop中-但是这些仍然面向最终用户分析应用程序,而不是面向事务性应用程序。因此,基本问题仍然存在,即在企业中使用Hadoop派生工具不适用于OLTP系统。
商业原因:忽略公共云
商业原因也很容易发现。对于Hadoop供应商而言,众所周知的大象是“云”,特别是三个PAAS供应商-AWS,Azure和GCP。与内部部署相比,云提供了许多选择,并且价格更低。云策略不仅仅提供Hadoop作为平台。尽管Hadoop供应商已经整合了许多新计划,例如容器,kubernetes等,但云计算发展迅速,更重要的是,这三个公司(亚马逊,微软和谷歌)都有一个强大的开发人员生态系统,可以更快地进行创新。
心理原因:被模因诱惑
但是还有第三个非常重要的原因。这是心理原因。
这是因为大数据是一个模因-由西海岸会议组织者创建
大数据出现之前-出现了“ Web 2.0”
与Web 2.0(这是一个概念)不同,大数据基于开放源代码软件
因此,随着公司加入大数据模因而创建了一个整体潮流-但忘记了一个关键事实,即云改变了开放源代码的性质。从某种意义上说,开源(或无关紧要)在云中无关紧要
这就是为什么Hadoop供应商将Hadoop本身视作终极目标的原因-同时围绕它们开发整个替代生态系统
结论
话虽如此,前途一片光明
今天,Tableau被salesforce.com收购。salesforce还收购了mulesoft。Pivotal还可以帮助公司部署到多个云中。所有这一切都表明,通过一些大型的Cloud播放器,企业已经从内部部署过渡到了简化。对于生态系统而言,这是一个很好的发展。这与十年前的移动应用行业相似,较小的参与者失败了,实际上存在两个生态系统(Android和iPhone)。到那时,应用程序有可能成为主流。如今,即将到来的大型生态系统是人工智能和物联网/边缘计算,我们将在...  
我看到由Azure,AWS和GCP驱动的AI和IoT生态系统的增长
Canalsys表示,云基础设施支出在2018年第四季度和2018年第四季度达到800亿美元,其中AWS,Azure和GCP的市场份额分别为32.3%,16.5%和9.55-Azure占75.9%,GCP占81.7%
因此,我相信AI和IoT生态系统蓬勃发展的时机已经到来-但是这是由三个PAAS供应商推动的。
题库
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群