金山云面试题
学长1
1)基本介绍金山云2.21日下午4点:电话面试
部门主要做数据平台,通过二次开发修改源代码
面试时间: 1小时
2 )技术部分:
)1) HashMap、HashTable、ConcurrentHashMap的区别、HashMap的扩展; 注释的使用和内部原理
)2) Spark任务分类、作业提交流程;
(3)根据进程名显示进程的端口号使用情况;
4 )防止Flume丢失数据的方法TailDir如何保证数据的完整性; 我不太记得了,是读取位置
5 ) Flink如何保证exactly-once语义; Flink和Spark的区别;
6 ) Kylin和Druid的使用场景和原理; CDH集群监控相关问题
(7)介绍Kafka速度调节和背压释放的机理; 广播变量原理; 项目的性能调谐(调参一直被人怼); 指引入集群
)8) JVM的参数调整GC的种类和算法(讲述标记-清除的原理);
(9)打印两个数组找到中位数的两个线程交替增加的自然数;
3 )金山云2.25日上午11点:电话面试
1 )介绍最擅长的项目,使用什么样的大数据组件
)2)如何使用Azkaban和其他调度工具的优劣,在某个job挂起后确保断点继续执行任务?
)3) Spark的使用过的操作员
4 )你知道Presto吗?
)5) HashMap和HashTable的区别? ConcurrentHashMap知道什么? 被问一面又一面
)6)网络编程、NIO、BIO等同时执行的相关理解。
7 )找出8枚硬币中最重的(分成两组分成2份找) )。
)在n级台阶上,可以以1/2的刻度走路。 有什么样的走路方式? (斐波那契数列) )