The first round interview experience of hikvision 2019 campus recruitment for Big data algorithm-海康威视2019校园招聘提前批大数据岗一面面经,2018-08-08

8月8日晚上,海康威视电话面试,30分钟左右。大数据岗。
1.问简历上的项目和科研内容的核心,每个都问。。。。。心累
2.数据怎么存储的?我说科研内容的数据是不变的,就用HDFS分布式处理;对于一些有更新变化的就用hbase了。
你的数据是怎么用HBase存储的?就是怎么设计ROWKEY的?一列作为ROWKEY还是多列作为ROWKEY?
3.图模型你了解多少?属性图模型,RDF模型,超图
4.具体的来了。。。慌得一批;
问:你对HBase熟悉吗?说一下它的写流程?
先是根据rowkey进行定位,二层架构的定位;
然后是HBase的PUT写流程:WAL–>MemStore–>HFile
然后是HFile文件数量超过一定阈值触发compact合并操作;
问:为什么要合并文件?
不知道。不过,那个哥给我说了答案:为了优化读过程,注意不是读写,与写没关系,写只是一味的刷盘flush,因为小文件较多,合并成一个文件,方便更快的读。
问:怎么合并?
选择部分小文件进行合并。不是全部小文件。
问:你对spark上的组件用过哪个?
我只用过基本的spark core。
问:然后又问你了解流处理吗?有什么流处理框架?
spark streaming,storm,Flink等。
问:然后是他们是怎么处理的?
不会。不过说了传统的流处理方案,逻辑上的流处理,实际上的批处理,时间块划分的数据进行静态处理
问:讲一下spark streaming流处理大致过程?
我简历根本就没写流处理啊,硬是瞎扯了一会,后悔。不懂就说不会,不然模棱两可的会被误认为略懂一点,然后就遭殃了一直被追问下去。。。cry。。。
问:熟悉shell脚本吗?怎么查看系统定时任务?
不会,我就说这个我没有接触过。
查了查,是这个命令 crontab
又问,怎么修改主机名?
/etc/hostname
5.你在项目中遇到的比较深刻的问题?
我说的是科研方向的方案,对于一个新的科研问题怎么着手,以调研最新论文为主,然后查博客。
经常看什么博客?是百度搜的吗?我说是CSDN之类的。
然后又莫名问了一个经常翻墙吗?我什么意思?
6.你对我们公司职位啊什么的有什么问题没有?
我问了技术方面的。对于HIVE和HBase,公司有没有结合的研究?巴拉巴拉。。。
对于HBase的文件合并怎么优化的?基本没有改,只是预分配和配置上的优化。
7. 如果你到我们这边来,你会做哪方面的工作?偏应用还是底层开发之类的?
我说喜欢科研类的偏应用之类。
8.要求现场面试。等通知,说是10月之前
终!

From:Nowcoder