暂无图片
暂无图片
暂无图片
暂无图片
暂无图片
一个月面试近20家大中小厂,在互联网寒冬突破重围,成功上岸的知识点总结和建议 !.pdf
225
9页
1次
2023-05-15
50墨值下载
前⾔
我努⼒了这⼀年,不仅仅是为了逼岁⽉回头。
我是年前离职的,没想到这个突如其来的疫情,完全将⾯试升级为地狱难度,焦虑、烦躁、失眠,是过
去⼀个⽉的主旋律。
⾃四⽉上旬投第⼀封简历开始,前⼀周完全是在欸打,最⽓的⾯试的⼩公司,还没到技术⾯,HR对我
说了⼀句:“ 18届,我们最⾼只能给11K我:????
说实话,我不⽢⼼,真的。毕竟在过去⼀年,我很少有早于凌晨睡的,每天坚持对技术进⾏复盘,然后
不断的学习新东⻄,我的预期⾃然也远远不⽌于此。
从⼀开始的焦虑、迷茫,到对⾃⼰的技术产⽣的深深的怀疑。
幸亏,身边⼀帮⼩伙伴互相打⽓,然后还有像敖丙(为何丙丙和我⼀样⼤,能这么优秀|O| )他
的⼀些⼯作和⽣活经历给了我很多共鸣以及给了我⼀个努⼒的⽅向吧。
接下来,陆陆续续⾯试了中软国际、翼海云峰、华讯⽅⾈、明略科技、赛意信息、浙江⼤华、中新赛
克、华为OD、焦点科技、浩鲸、阿⾥云...20家南京/杭州的⼤中⼩⼚,最终成功上岸,我就⼤数据部
分的⾯试题做⼀个总结,希望能对⼤家有所帮助。
⼀、⾯试准备
⾯试前,我花了很多时间,对项⽬进⾏了梳理,尤其在业务数仓的分层和多维数据模型设计这块。整个
项⽬的业务流程、数据流向我⽤⼀张⽩纸进⾏了梳理,数据收集 + 数仓建设+数据建模+数据清洗 +
据转换+ 特征提取+算法建模+数据展示,我觉得对⾃⼰做过或者参与的项⽬,在准备⾯试前,做⼀次系
统的复盘,是必不可少的。
⼤数据技术栈这⼀块,可以按照B站某⾕的⼀些视频进⾏复习,毕竟⼀些理论和架构的东⻄,有时是需
要花时间记忆和理解的,我放⼀张图,⼤家看看⾃⼰能了解多少:
⼆、Hadoop
1、介绍 MapReduce 的运⾏过程 Suffer 过程
如果在现场,我可以⼿绘 MapReduce InputFormat OutputFormat 的流程,⼀边画图⼀
边说。如果讲到环形缓冲区那⾥,是不是有很多调优的⽅式、combiner 也可以考虑讲⼀下。
2Hadoop 集群的搭建过程
⾄少⾃⼰集群的配置、框架的技术选型是不是都要清楚的明明⽩⽩。
3Hadoop 优化
1HDFS ⼩⽂件的影响 、输⼊输⼊时的⼩⽂件的处理 2Map 阶段 Reudce 阶段的调优
3、数据压缩(LZO \Snappy 存储优化(Orcfile) 关于压缩怎么配的,⼏种存储格式有什么
区别是不是都要搞清楚
4Hadoop集群HA实现
5Hadoop 调度器
FIFO Capacity Scheduler(容量调度器)和 Fair Sceduler(公平调度器)三种需要区分清
楚,还有在实际开发环境中,⼀般不⽤FIFO哦。
6Hadoop 解决数据倾斜⽅法
of 9
50墨值下载
【版权声明】本文为墨天轮用户原创内容,转载时必须标注文档的来源(墨天轮),文档链接,文档作者等基本信息,否则作者和墨天轮有权追究责任。如果您发现墨天轮中有涉嫌抄袭或者侵权的内容,欢迎发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。

评论

关注
最新上传
暂无内容,敬请期待...
下载排行榜
Top250 周榜 月榜