全部版块 我的主页
论坛 提问 悬赏 求职 新闻 读书 功能一区 经管文库(原现金交易版)
212 0
2023-11-27
互联网大厂大数据面试题合集百度阿里腾讯BAT校招优酷东方国信大数据技术研发算法结构

关于Java的面试题:关于虚拟机的面试题:

1.hashmap底层?

2.Java进程中断怎么处理?

3.介绍下面向对象?

4.介绍下多态?

5.方法重载和重写?

6.这俩哪个属于多态?

7.说下多线程?

8.实现方式有哪些,区别?

9.同步锁  互斥,为什么常量不能做锁?

10.说下反射,都是做什么的?

11.反射机制怎么实现的?

......

关于设计模式的面试题:

1. 设计模式?

2.说说常用的设计模式,我说了个单例,他好像觉得太简单了,我又说了个策略模式?

关于数据结构和算法的面试题:

1.再一次提起数据结构和算法

.....

关于MapReduce的面试题:----(ok)

1.mapreduce的原理和架构?

2.hadoop的全排序和局部排序和二次排序?----需要注意

3.Mapreduce 过程?

4.Mapreduce 优化?

5.通过mapreduce 实现两个表的join?

6.MR的原理拿wordcount来讲,以及优化(全面些)?

7.Mr中啥时只有map,啥时要有map和reduce?

......

53:关于集群数据量,运行时间的参考

刚才面试面试官问了你们每天有多少数据,

用了多少台机器,

一般根据你写的项目,每天产生的数据量规划,假如一天数据量100g

一般集群规划是年数据的3倍,还有 hadoop集群3倍冗余

假如一台服务器磁盘6T

100G*365*3*3/6*1024g=53.4 这样的集群(一般在60台左右的服务器)

机器的配置,


(100多MB压缩包的网盘链接)
3e12dddbe4fb6f141b8be852a1a6442.png

5e1aa571760927a24dfe13f5b7ea304.png e92a69f693f6b5981663e1eb3cae1f6.png

1dcfa3dfdc493c9a190052f92344316.png 550eea358c3f68939727f30cbd7f418.png



二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群