互联网大厂大数据面试题合集百度阿里腾讯BAT校招优酷东方国信大数据技术研发算法结构
关于Java的面试题:关于虚拟机的面试题:
1.hashmap底层?
2.Java进程中断怎么处理?
3.介绍下面向对象?
4.介绍下多态?
5.方法重载和重写?
6.这俩哪个属于多态?
7.说下多线程?
8.实现方式有哪些,区别?
9.同步锁 互斥,为什么常量不能做锁?
10.说下反射,都是做什么的?
11.反射机制怎么实现的?
......
关于设计模式的面试题:
1. 设计模式?
2.说说常用的设计模式,我说了个单例,他好像觉得太简单了,我又说了个策略模式?
关于数据结构和算法的面试题:
1.再一次提起数据结构和算法
.....
关于MapReduce的面试题:----(ok)
1.mapreduce的原理和架构?
2.hadoop的全排序和局部排序和二次排序?----需要注意
3.Mapreduce 过程?
4.Mapreduce 优化?
5.通过mapreduce 实现两个表的join?
6.MR的原理拿wordcount来讲,以及优化(全面些)?
7.Mr中啥时只有map,啥时要有map和reduce?
......
53:关于集群数据量,运行时间的参考
刚才面试面试官问了你们每天有多少数据,
用了多少台机器,
一般根据你写的项目,每天产生的数据量规划,假如一天数据量100g
一般集群规划是年数据的3倍,还有 hadoop集群3倍冗余
假如一台服务器磁盘6T
100G*365*3*3/6*1024g=53.4 这样的集群(一般在60台左右的服务器)
机器的配置,
(100多MB压缩包的网盘链接)