作者简介
K.Y.Xing,携程高级开发经理,对高并发数据处理,流式数据处理,风控大数据处理,用户行为分析有浓厚兴趣。
一、引言
二、实践篇


2.1 如何搭建ODS层





三、工具篇


对无序数据均匀采样并排序,反应原始数据分布;





组件现已应用在风控数仓PSI 计算中
运行简单,最少只需2个参数、1个配置文件即可运行
配置方式多样,提供全局模式、one-stage模式、排除模式、结果文件配置等配置方式
计算速度快
表3-3 psi计算性能

a node in graph = a record in table
a edge in graph = 2 records with same column value




图3-9 Streaming回溯的时间窗口






四、未来规划
五、总结
参考文献

●Spark训练营(一)-- 开发环境搭建及wordCount实战
文章都看完了
不点个
吗
欢迎 点赞、在看、分享 三连哦~~
文章转载自DLab数据实验室,如果涉嫌侵权,请发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。





