暂无图片
暂无图片
暂无图片
暂无图片
暂无图片

数仓实习面试题

会飞的一十六 2025-09-08
36
1.数仓的概念
2.业务域怎么分的?
猪小明vs飞猪数据团队:数仓中既然有了主题域,为什么还要划分数据域?
数仓建模:如何设计数据域?
3.关于主题的说法,如何划分?
潘子vs小红书数仓团队:数仓分主题预计算的好处和坏处是什么?
4.ADS的表如何分类,提交什么需求就叫什么表?
关注“数仓哲与思”专栏,答案会详细放到该专栏解释
5. 数仓分层建设中,DWD、DWS、ADS哪一层最难?
经典问题争议:数仓分层建设中,DWD、DWS、ADS哪一层最难?
6.各层有多少张表,数据量?
7. 刚提到的数据资产建设,数据资产主要是放在那一层产出的?这块是怎么做的?
球球 vs 懂车帝数仓岗位:数据资产沉淀主要是指DWS和ADS层的表吗?
8.数仓跑了多久
9.hadoop的基本原理。hadoop3跑的啥,tez还是spark?
10.RDD的基本原理,弹性怎么理解
11.宽依赖和窄依赖
12.spark数据倾斜的问题
13.结果表: 客服名称,客户数 ,未完成对话数, 平均响应时间
msg_tab: from_id, to_id, msg_time, msg
server_tab server_id,server_name
消息表:发送消息的ID,接收消息的ID,消息的时间,消息内容
客服 和 客户都可以发送消息,接收消息
客服表:客服ID,客服名称
统计指标:统计每一个客服:客户数:服务的客户数
未完成对话数:客户发送消息,客服没有回复的
平均响应时间:客户发送消息,客服多久回复 的平均值
参考以下解法:
SQL进阶技巧:如何分析互逆记录?| 相互关注为例分析
详细答案放在SQL面试精要专栏里面
14. 2-8定律,20%的人手里掌握着80%的财富
场景:一张表有两个字段,user_Id,money ,统计掌握80%财富的 那20%的人,如何统计?
详细答案放在SQL面试精要专栏里面
往期精彩
面试提问: 数仓底座健康度衡量标准是什么?都有哪些指标?
字节数据开发一面(校招)
SQL面试题:供应链库存周转率计算与缺货预测
数仓建模中,如果遇到跨业务过程的分析,这时候dwd层表模型如何设计?整体的设计思路是什么?|支付宝
面试官问:数仓DWM层与DWS层有什么区别?什么时候需要建设DWM层?
懂车帝面试提问:什么是指标口径收敛?应如何落地?
SQL中的短路规则:三值逻辑下的执行优化
读者提问:缓慢变化维能进行维度退化吗?答案可能和你想的不一样
大厂数据仓库数仓建模面试题及参考答案
数仓实习生面试(一面)
SQL面试题:如何拆分多值字段并优化性能?
企业级指标体系设计与应用 | 一文讲完
快手大数据开发一面面试题(社招)

文章转载自会飞的一十六,如果涉嫌侵权,请发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。

评论