全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 数据分析师(CDA)专版
1958 2
2016-03-22

       CDA数据分析师学习之路出系列了,每篇都有数据分析、大数据相关文章和视频,各大名师主讲,每周一、二、四、五更新!CDA数据分析师学习之路已经更新到CDA数据分析师学习之路(29)了,欢迎观看学习!
       另外欢迎各位坛友投稿数据分析相关视频和文章,一经选用将赠送100论坛币和现金奖励、并有机会获赠一套数据分析相关视频(SAS、SPSS、Java、统计理论等等)!(PS:相关文章和视频得原创!联系方式见下方,欢迎投稿!)


CDA数据分析师学习之路(29)


附赠《Python通过hive来处理json数据》干货视频


Hadoop资源调度器的比较


       Hadoop资源调度器,也就是YarnResourceManager的调度器有FIFO、Fair Scheduler和Capacity Scheduler,在共享环境下进行多用户多队列/分组管理的就是后两者,这样就保障一个企业内各个部门共享一个Hadoop集群。


       如何在两者之间选择呢?Fair Scheduler是Facebook开发的,Capacity Scheduler是Yahoo开发的,背景都比较硬,共同点很多,比如每个队列可以配置资源量,也可限制每个用户和每个队列的并发运行作业数量;每个用户的作业有优先级,前者按照优先级分配资源,优先级越高分配的资源越多,而后者先按照优先级,优先级相同的再按照作业提交时间先来先服务进行调度。同时,两者都支持延迟调度和资源抢占。


       对两者的比较应该侧重不同点的比较,首先比较它们的设计目的,Capacity Scheduler多用户的情况下,强调最大化集群的吞吐和利用率;而Fair Scheduler在此情况下,强调在用户间公平的分配资源。这样的设计明显表现在队列排序算法上的不同,前者按照队列的资源使用量最小的优先,然后考虑FIFO和内存限制因素;而后者根据公平排序算法排序,公平是通过作业缺额体现的,调度器每次选择缺额最大的job。同时,两者都通过树状结构组织队列,前者父子队列存在资源参数限制,子队列基于父队列计算资源,而后者父子队列没有参数继承关系。

感谢宋广磊老师提供视频资料!


附赠《Python通过hive来处理json数据》干货视频

【CDA数据分析师学习之路】Python通过hive来处理json数据

感谢宋广磊老师提供视频资料!


***************************************************************************
投稿流程:投稿前请加我QQ联系我,或者直接将文章或视频发送到我的邮箱,但一定要备注好您的姓名、电话、邮箱,以方便我联系您们赠送现金和视频教程的事宜!欢迎投稿!

投稿联系方式:

小段老师QQ:28819897132881989713
邮箱:duanliangbin@pinggu.org
***************************************************************************

相关链接:

CDA数据分析师就业班第四期4月10号开课啦!https://bbs.pinggu.org/thread-4160404-1-1.html


CDA大数据分析师就业班第二期4月17号开课啦!https://bbs.pinggu.org/thread-4160397-1-1.html


上一篇:


CDA数据分析师学习之路(28)https://bbs.pinggu.org/thread-4492918-1-1.html


下一篇:


CDA数据分析师学习之路(30)https://bbs.pinggu.org/thread-4498458-1-1.html
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2016-3-24 14:33:24
欢迎积极投稿,论坛币、现金、整套数据分析视频教程等你来拿哦!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2017-6-13 23:00:13
最近几章不适合新手。。。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群