全部版块 我的主页
论坛 数据科学与人工智能 大数据分析 Hadoop论坛
4756 0
2015-04-28

Apache Hadoop 2.7.0 发布,包括大量显著改进,值得关注的改进如下:

  • 重大改进


    • 此版本不再支持 JDK 6 运行时,仅支持 JDK 7+

    • 此版本不适用于生产环境!还有一些重要的问题需要通过测试,用于生产环境的用户请等待 2.7.1/2.7.2


  • Hadoop Common


    • 支持 Windows Azure 存储 —— Blob


  • Hadoop HDFS


    • 支持文件截断

    • 支持每个存储类型配额

    • 支持可变长度的文件块


  • Hadoop YARN


    • YARN 认证可插拔

    • 自动分享,全局缓存 YARN 本地化资源(测试阶段)


  • Hadoop MapReduce


    • 限制一个作业运行的 Map/Reduce 任务

    • 加快大量输出文件时大型作业的 FileOutputCommitter 速度


完整改进请看发行说明

Hadoop 是一个分布式系统基础架构,由Apache基金会开发。用户可以在不了解分布式底层细节的情况下,开发分布式程序。充分利用集群的威力高速运算和存储。 Hadoop实现了一个分布式文件系统(Hadoop Distributed File System),简称HDFS。HDFS有 着高容错性的特点,并且设计用来部署在低廉的(low-cost)硬件上。而且它提供高传输率(high throughput)来访问应用程序的数据,适合那些有着超大数据集(large data set)的应用程序。HDFS放宽了(relax)POSIX的要求(requirements)这样可以流的形式访问(streaming access)文件系统中的数据。

下图是Hadoop的体系结构:


来源:开源中国


二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群