经管之家App
让优质教育人人可得
立即打开
全部版块
我的主页
›
论坛
›
数据科学与人工智能
›
大数据分析
›
Hadoop论坛
大数据处理一定需要Hadoop吗?
楼主
daazx
2102
3
收藏
2015-04-03
来源:
中国大数据
Google强大的搜寻引擎每天处理庞大的搜寻数据,靠的是数十万的伺服器同时作工。然而一般企业并无法使用Google所用的内部搜寻引擎工具,所以,拥有处理大数据工具的分散式运算平台Hadoop应运而生。
但问题是Hadoop使用上有难度,数据处理公司Cloudera决心要解决这个问题。
过去的公司企业仰赖传统的关联式资料库和数据仓储就可应付所需,然而,今日电子商务、社交媒体和行动运算不断成长使得资料量暴增,许多企业便开始使用Hadoop等的工具处理数据。现在,Cloudera现在更针对Hadoop平台推出类Google的搜寻引擎:Cloudera Search。
搜寻引擎让Hadoop更平易近人
Cloudera希望客户能在Hadoop壮大之前就将资料储存进去,并将之整合入平台。但使用Hadoop平台与资料互动必须要懂得MapReduce运算技术,也就是说你得会写Java语言,这对许多使用者来说并不方便。
虽然Hadoop已经推出许多工具让使用上更便利,但Cloudera希望更进一步建立一个Hadoop的搜寻引擎。产品经理泽德勒维斯基(Charles Zedlewski)说:「数万开发者可能知道怎么用MapReduce,执行SQL指令,但会使用搜寻引擎的人有数十亿人。」
Cloudera Search能够与Hadoop分散式档案系统(HDFS)或资料库系统Hbase整合,使用者可以输入搜寻字串后就找到一串搜寻结果。这项搜寻工具是以Apache Solr搜寻器为基础。
市场研究公司RedMonk分析师欧葛瑞迪(Stephen O’Grady)表示:「每多一项数据处理工具对Hadoop都有好处……从写MapReduce程式到支援SQL语法的Hive或Pig等套件,每项工具都让数据处理更有效率。」
所有大数据都该放入Hadoop吗?
这对改善Hadoop可用性的确帮助不少,但问题是:客户是否真的有需要将它们所有的数据都放入Hadoop?微软今年稍早发表一份报告,主张大多数的公司只需要增加丛集伺服器的使用数量,不须尝试用单台伺服器处理数据,报告指出,甚至雅虎和脸书两家最需要数据处理效能的公司,也是透过增加伺服器丛集解决效能问题。
但许多公司正面临数据不断增长的问题,一开始就加入Hadoop是不错的选择,RedMonk过去也是Hadoop的使用者,但最近转用BigQuery等其他的Google资料库工具,原因是他们的数据在量上本质就比较小,而且成长的速度也没有分析师原本预测得快。
但欧葛瑞迪说:「如果我们能够更快速地获得数据,就一定会使用Hadoop!」
扫码加我 拉你入群
请注明:姓名-公司-职位
以便审核进群资格,未注明则拒绝
全部回复
沙发
daazx
2015-4-3 14:35:58
“微软今年稍早发表一份报告,主张大多数的公司只需要增加丛集伺服器的使用数量,不须尝试用单台伺服器处理数据,报告指出,甚至雅虎和脸书两家最需要数据处理效能的公司,也是透过增加伺服器丛集解决效能问题。”
扫码加我 拉你入群
请注明:姓名-公司-职位
以便审核进群资格,未注明则拒绝
藤椅
olympic
2015-4-11 10:48:40
> 说:「数万开发者可能知道怎么用MapReduce,执行SQL指令,但会使用搜寻引擎的人有数十亿人。」
要普及使用的话搜索接口也许是个瓶颈。
扫码加我 拉你入群
请注明:姓名-公司-职位
以便审核进群资格,未注明则拒绝
板凳
soccy
2015-6-15 00:13:32
Hadoop设置太麻烦了
扫码加我 拉你入群
请注明:姓名-公司-职位
以便审核进群资格,未注明则拒绝
相关推荐
淘宝Hadoop应用--分布式数据处理实践
用 Hadoop 进行分布式数据处理(入门)
用 Hadoop 进行分布式数据处理(进阶)
批Hadoop之父与吴甘沙有关大数据的对话
大数据处理的两种方式,数据两种处理方式
“Hadoop论坛”正式升级为“Hadoop与大数据论坛”
【转干货】Hadoop和大数据:60款顶级大数据开源工具
分享:如何利用 Hadoop 挖掘大数据价值
入门大数据,两天能搞定Hadoop搭建
受到大数据迷因的诱惑:Hadoop与公共云
栏目导航
Hadoop论坛
经济金融数学专区
金融类
经管高考
经管文库(原现金交易版)
微观经济学
热门文章
CDA考试模拟题库:新增章节练习题(更新于1 ...
文本分析:从经管顶刊“加分项”到学术发表 ...
【AI Agent可靠性】 智能体Agent记忆系统: ...
CDA 认证考试大纲 2025 重磅更新:一二级考 ...
股市操练大全PDF版
25秋投资学回忆
PromptCoT-2.0-SFT-4.8M 监督微调提示 SFT ...
货币--是如何产生成长发展的和人类的四大工 ...
哈耶克作品集 6本 含通往奴役之路、自由宪章 ...
博观研究院2025年中国跨境进口保健品市场分 ...
推荐文章
AI狂潮席卷学术圈,不会编程也能打造专属智 ...
10月重磅来袭|《打造Coze/Dify专属学术智能 ...
最快1年拿证,学费不足5W!热门美国人工智能 ...
关于如何利用文献的若干建议
关于学术研究和论文发表的一些建议
关于科研中如何学习基础知识的一些建议 (一 ...
一个自编的经济学建模小案例 --写给授课本科 ...
AI智能体赋能教学改革: 全国AI教育教学应用 ...
2025中国AIoT产业全景图谱报告-406页
关于文献求助的一些建议
说点什么
分享
微信
QQ空间
QQ
微博
扫码加好友,拉您进群
各岗位、行业、专业交流群