有四本不错的书,在这里抛砖引玉,大家继续推荐哈。原地址在这儿
http://www.china-pub.com/itbook/article4977.shtml
MapReduce是一种编程模型,用于大规模数据集(大于1TB)的并行运算。MapReduce极大地方便了编程人员在不会分布式并行编程的情况下,将自己的程序运行在分布式系统上。一起来看看今天荐给大家的几本好书吧!
mapreduce编程书籍推荐一:《MapReduce设计模式》
MapReduce设计模式(china-pub首发)
将各种有价值的MapReduce设计模式汇集在一起,形成一本独特的合集,可以帮读者节省大量的时间和精力,无论读者身处哪个领域,使用哪种编程语言,使用什么开发框架。
书中对每一种模式都会详细解释其使用的上下文、可能存在的陷阱及使用的注意事项,以帮助读者在对大数据问题架构建模时避免常见的设计错误。本书还提供了MapReduce的一个完整综述,解释其起源和实现,并说明设计模式如此重要的原因。书中的所有示例代码都是基于Hadoop平台编写的。
mapreduce编程书籍推荐二:《Hadoop MapReduce实战手册》
Hadoop MapReduce实战手册
本书是使用Hadoop生态系统处理大规模复杂数据集的一站式指南。本书先为读者介绍了简单的示例,然后深入到解决深度大数据问题的用例。
本书将教会读者如何驾驭Hadoop生态系统中的各组件,包括HBase、Hadoop、Pig以及Mahout,然后让读者学会如何安装云环境来完成Hadoop MapReduce计算。本书还将用最真实的示例教会读者如何处理大规模复杂数据集。
本书将教会读者:
如何安装Hadoop MapReduce和HDFS,开始运行示例程序;
如何安全地配置和管理Hadoop和HDFS;
理解Hadoop内部实现,以及如何扩展Hadoop来满足用户需求;
如何使用HBase、Hive、Pig、Mahout和Nutch简单且有效地完成一些事情;
如何使用MapReduce解决各种分析问题;
解决复杂问题,如聚类、寻找关联、在线营销及推荐;
如何使用云环境完成Hadoop计算。
mapreduce编程书籍推荐三:《MapReduce 2.0源码分析与编程实战》
MapReduce 2.0源码分析与编程实战
资深云计算技术讲师潜心力作;
CSDN Hadoop版主鼎力推荐;
深入浅出、结合实例,帮你在实战中掌握MapReduce 2.0编程的精髓。
mapreduce编程书籍推荐四:《Hadoop MapReduce性能优化》
Hadoop MapReduce性能优化
《Hadoop MapReduce性能优化》详细描述了Hadoop MapReduce作业性能的优化过程。书中通过大量清晰而实用的步骤,帮助读者充分利用集群的节点资源。
《Hadoop MapReduce性能优化》从MapReduce工作原理以及影响MapReduce性能的因素出发,让读者对Hadoop性能指标以及几个性能工具有大致的了解。接下来,本书探索了性能计数器,帮读者判断资源瓶颈、检查集群的健康状况、量化Hadoop集群并学习常用的性能调优手段。读者还会学到通过对map和reduce任务进行性能分析并使用Combiner和压缩技术对map和reduce任务进行性能优化。
以Hadoop集群的最佳实践和建议结尾,讲述如何最优地使用Hadoop集群。