点击上方蓝色【数据有道DataHayWay】关注+星标~
第一时间获取最新内容

阿里巴巴作为BBAT的巨厂之一,
是很多求职者心中的 “白月光” 与 “朱砂痣”。
如何应对阿里的面试?
常见的考点又有哪些?
有没有题库可以进行针对性训练?
...
和淘系BU朋友(面试官)交流探讨后
针对考点部分的真题讲解,来了!
本篇,对手淘等电商类面试题进行拆解(含解题思路)
文末 附 PDF版 人工整理 100道SQL题库
温馨提示:重在思路理解,学会举一反三 ------正文手动分割线------
一、SQL类题
SQL类题
user_id,用户注册时生成的ID
page_name,页面名称
viewtime,访问时间
page_view_duration, 访问时长
▼ 问题描述:统计用户最后访问的页面信息,提取每日最后停留次数最多TOP10页面
① 根据窗口函数计算每个用户最后访问的页面信息

▼ 解题思路:

user_id,用户注册时生成的ID
orderid, 订单ID
goodsid,商品ID
paystatus,支付状态,退款,未支付,已支付
paytime,支付时间
order_amount,支付金额
goods_num, 购买的商品件数
注意:一个订单可能包含多个商品ID,该表的主键为:orderid+goodsid
▼ 问题描述:
▼ 解题思路:

机器学习&概率论
面试真题1
举个简单的例子,如果把人和生物界其他动物放在一起比较,可以通过四肢、五官、肤色、毛发等特征,将人归为一类,鱼归于一类、鸟归为一类,这就是聚类。
② 常用的聚类算法有K-means,层次聚类,SOM聚类,FCM聚类
③ 下面重点描述一下层次聚类的原理和步骤
将每个样本都视为一个聚类;
计算各个聚类之间的相似度;
寻找最近的两个聚类,将他们归为一类;
重复步骤二,步骤三;直到所有样本归为一类。

面试真题2
开放性问题
面试真题1
一般来说,A商品在刷单之前搜索排名会比较靠后,刷单用户在购买A商品时,只点击查看该商品,甚至存在秒拍的情况。
用户下单前没有对比同个同款商品。
流量访问的转化率异常,因为刷单比例较高,故访问了该商品且转换的订单数占比会很高,在数据上的表现即为转化率异常高。
商品成交量异常,刷单商品普遍在刷单之前成交量较低。故刷单后,商品成交量可能会出现暴增。
一般来说,电商内部的物流订单号是唯一的,即不会重复,刷单商家为了节约成本,可能会重复利用同一个快递订单号。
同时如若刷单,商家所发快递物品可能非真实原物,且会虚假发货。可从商品重量、件数预估物流运费,物流轨迹+时间等方面进行甄别。
建立黑名单库,识别刷单账号
同一个手机设备,不同账号,购买同一商品。
对于同一个账号重复购买同一件商品。
同一个IP网络地址,不同的手机设备,购买同一个商品。
面试真题2
大促分析也可以从这三个角度进行结构化的分析:
① 人(用户)
活跃度:活跃的用户数
转换率:下单的用户数、转换率
成交额:成交总额,人均购买金额,人均购买件数
留存率:大促结束后的留存情况以及后续的成交情况
② 货(商品)
曝光的商品数,如果存在大促商品池,那么可看看曝光的商品数占比
成交的商品数,统计有成交记录的商品数,及成交商品数占比
商品丰富度,从商品的结构、种类进行分析,不同种类的商品成交曝光情况
商品供应量,分析大促的供需关系,是否存在商品库存情况
商品价格,大促期间商品价格的优惠情况
③ 场(大促活动)
用户大促活动参与度,比如大促是否设置小游戏,如天猫盖楼游戏,可以分析游戏的参与度和完成度
漏斗转换,大促活动每一步的漏斗流失和转换情况,指导后续大促活动的设计优化
大促页面的活跃情况
面试真题3
① 背景确认:20%提升是指AB实验结果还是日常数据监控类。如果是AB实验,确认实验设计的方案。如果是日常数据监控类,确认数据计算的业务场景。
② 口径确认:确认数据计算的逻辑。20%中涉及到的指标分别是什么。
③ 数据分析:确认绝对提升是多少,比如GMV提升20%,可能绝对提升量为2千。业务场景较小,波动较大。
④ 问题分类:确认该问题属于正常波动还是异常类数据问题。如果是异常类数据问题,请参考往期文章中关于异常问题分析方法。
以上,即为淘宝数分岗的面试真题+思路参考。
若本篇对你有帮助,欢迎 转发,点亮在看
你的鼓励,是对创造者最大的支持~







