暂无图片
暂无图片
暂无图片
暂无图片
暂无图片

数据分享|数据探索电商平台用户行为流失可视化分析

拓端数据部落 2022-06-30
770

原文链接:http://tecdat.cn/?p=27482

随着互联网和电子商务的发展,人们已经习惯了网上购物。在中国,电子商务平台非常受欢迎。在每年的618、双11、双12活动中,大量用户在如淘宝等电商平台浏览商品,或收藏、加入购物车或直接购买。通过用SQL对用户行为的分析,我们可以挖掘用户的购买规律,了解产品的热度,并结合门店的营销策略,实现更精细、更精准的运营,让业务获得更好的增长。

数据集查看文末了解数据获取方式包含用户行为,由用户ID、产品ID、产品类别ID、行为类型和时间戳组成。本次分析共导入数据约383万条。在导入过程中,与主键联合设置了5个字段,在导入过程中消除了重复值。

用户行为间的转化情况

用户行为转化漏洞分析


从上面的漏斗图分析可以看出,从用户进入APP浏览页面开始,购买环节的最终转化率为2%。用户点击页面后,用户流失巨大。从浏览到购买的转化率是多少?


点击标题查阅往期内容


PYTHON用户流失数据挖掘:建立逻辑回归、XGBOOST、随机森林、决策树、支持向量机、朴素贝叶斯和KMEANS聚类用户画像


左右滑动查看更多


01

02

03

04



用户购买的路径分析

点击-收藏-购买的转化路径分析:用户浏览商品后,约有1/5的用户进行收藏,然后收藏中约13.26%的用户进行购买。


转化路径分析:从上图可以看出,用户浏览商品后,约有41.13%的用户会加入购物车,远高于进行收藏的用户,但加入购物车后,只有 17% 左右的用户最终进行了购买,超过 80% 的用户没有进行购买。我们需要分析这个环节。推测的原因可能是:

1、加入购物车是在不同店铺比较同种产品的价格;

2、为了凑单,全减;

3、先放在一边,过几天再买;

4、等其他活动折扣

用户点击的商品和下单之间的关系

这里我们重点关注用户点击的产品与用户订购的产品之间的关系,是否支持我们的假设:平台推送的产品不符合用户的需求。

产品点击量排名前九的产品类别:


对点击进行排序后,分析最畅销的商品,找出点击与购买之间的关系。从上图我们可以看出,点击率最高的产品的购买率只有0.56%,而点击率第6的产品的购买率已经达到了5.8%。

结论:假设成立

通过以上分析可以得出结论,电商平台的推送机制不合理,推送的商品无法匹配用户的需求,导致用户在浏览过程中没有找到想要的商品,因此转化率:用户实际购买的比例非常低,即用户流失严重。

本文章中的所有信息(包括但不限于分析、预测、建议、数据、图表等内容)仅供参考,__拓端数据(__tecdat__)__不因文章的全部或部分内容产生的或因本文章而引致的任何损失承担任何责任。



数据获取


在下面公众号后台回复“电商数”,可获取完整数据。




点击文末“阅读原文”

获取全文完整资料


本文选自《数据探索电商平台用户行为流失可视化分析》。


点击标题查阅往期内容

PYTHON用户流失数据挖掘:建立逻辑回归、XGBOOST、随机森林、决策树、支持向量机、朴素贝叶斯和KMEANS聚类用户画像
Python对商店数据进行lstm和xgboost销售量时间序列建模预测分析
PYTHON集成机器学习:用ADABOOST、决策树、逻辑回归集成模型分类和回归和网格搜索超参数优化
R语言集成模型:提升树boosting、随机森林、约束最小二乘法加权平均模型融合分析时间序列数据
Python对商店数据进行lstm和xgboost销售量时间序列建模预测分析
R语言用主成分PCA、 逻辑回归、决策树、随机森林分析心脏病数据并高维可视化
R语言基于树的方法:决策树,随机森林,Bagging,增强树
R语言用逻辑回归、决策树和随机森林对信贷数据集进行分类预测
spss modeler用决策树神经网络预测ST的股票
R语言中使用线性模型、回归决策树自动组合特征因子水平
R语言中自编基尼系数的CART回归决策树的实现
R语言用rle,svm和rpart决策树进行时间序列预测
python在Scikit-learn中用决策树和随机森林预测NBA获胜者
python中使用scikit-learn和pandas决策树进行iris鸢尾花数据分类建模和交叉验证
R语言里的非线性模型:多项式回归、局部样条、平滑样条、 广义相加模型GAM分析
R语言用标准最小二乘OLS,广义相加模型GAM ,样条函数进行逻辑回归LOGISTIC分类
R语言ISLR工资数据进行多项式回归和样条回归分析
R语言中的多项式回归、局部回归、核平滑和平滑样条回归模型
R语言用泊松Poisson回归、GAM样条曲线模型预测骑自行车者的数量
R语言分位数回归、GAM样条曲线、指数平滑和SARIMA对电力负荷时间序列预测
R语言样条曲线、决策树、Adaboost、梯度提升(GBM)算法进行回归、分类和动态可视化
如何用R语言在机器学习中建立集成模型?
R语言ARMA-EGARCH模型、集成预测算法对SPX实际波动率进行预测
在python 深度学习Keras中计算神经网络集成模型
R语言ARIMA集成模型预测时间序列分析
R语言基于Bagging分类的逻辑回归(Logistic Regression)、决策树、森林分析心脏病患者
R语言基于树的方法:决策树,随机森林,Bagging,增强树
R语言基于Bootstrap的线性回归预测置信区间估计方法
R语言使用bootstrap和增量法计算广义线性模型(GLM)预测置信区间
R语言样条曲线、决策树、Adaboost、梯度提升(GBM)算法进行回归、分类和动态可视化
Python对商店数据进行lstm和xgboost销售量时间序列建模预测分析
R语言随机森林RandomForest、逻辑回归Logisitc预测心脏病数据和可视化分析
R语言用主成分PCA、 逻辑回归、决策树、随机森林分析心脏病数据并高维可视化
Matlab建立SVM,KNN和朴素贝叶斯模型分类绘制ROC曲线
matlab使用分位数随机森林(QRF)回归树检测异常值



文章转载自拓端数据部落,如果涉嫌侵权,请发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。

评论