

1. 埋点体系建设
1.1 埋点分类
前端埋点 将采集的 SDK 集成在终端上,主要分三种:代码埋点、可视化埋点、无埋点。 优点:较方便、灵活,能方便手机到用户在界面上的行为数据,比如用户点击了哪些资源位。 缺点:依赖客户端环境,一般对采集的数据压缩、暂存,为减少移动端的数据流量,除一些需要实时上报的重要事件不限制网络环境,其它事件一般只在wifi情况下上报,因此数据会有延迟,丢数据等弊端。 代码埋点 可视化埋点 概念 需要埋点开发同学侵入埋点代码。 和无埋点原理差不多,产品或者运营同学可以在管理平台配置需要的埋点,然后SDK定时检测识别埋点的的控件,获取埋点数据,无需埋点开发同学介入。 优点 高度定制、控制精准、采集的数据丰富准确 实施成本低 缺点 实施成本大 场景局限于交互,覆盖面小
后端埋点
将采集的 SDK 集成在服务端,就是我们常说的后端日志,比如登录日志。
优点:由于数据是在内网传输,数据传输的即时性强,丢失数据的风险小
缺点:采集数据少,无法获取用户界面行为数据,爬虫数据较多
SPM语义化 页面位置信息采取统一的英文定义+后置的埋点关联来实现 英文名 中文名 所属页面 关联的埋点 indexsign 首页签到入口 首页(index) click_index_signin
show_index_signinkingkong 金刚区 首页(index) click_index_kingkong
show_index_kingkongbanner 首焦 首页(index) click_index_banner
show_index_bannersearchrank 热搜榜 搜索关键词列表页(searchkw) click_searchkw_searchrank
show_searchkw_searchrankSCM统一化 后端统一透传json化业务参数 {"extra": {"k1": v1,"k2": v2,"k3": v3}}ACTION标准化 事件 描述 click 点击事件,通用用户点击行为 add 加购,商品加购行为 collect 收藏,商品收藏行为 view 访问,页面特有,页面请求一次加载一次记录一次 show 曝光,页面模块坑位展示,页面不带曝光属性 special 自定义事情,例如:用户行为的风控行为记录

2. 数仓建设



3. uuid和归因建设


末次单点归因 末次多点归因


初期的导购方案需要很大的人工介入,每新增一个页面,都需要人为定义页面层级,维护成本高,行为链路依赖时间序列,准确性完全依赖客户端的时间; 中期的方案解决了初期的遗留问题,依赖客户端埋点的上一步的sequence,但是这种方案只能应用在离线数据; 现阶段的方案能够应用到实时数据中,单个埋点会透传前10步的行为链路,在获取链路的时候就无须通过关联。
4. 数据应用
5. 未来展望
数仓的自动化构建正在进行中:目前已完成的是ods层会代替原有的mid层,ods只需要在平台进行简单的算子配置即可完成自动化落仓。集市层的自动构建还在进行中; dws的建设还不够丰富,目前集市层会有一些重复加工的指标逻辑存在,目前正在逐步步下沉到dws; 集市层模型的升级更多的依赖olap引擎的计算能力,后续会引入doris,借助其物化视图的能力 ,减少集市层的模型数量。


文章转载自严选技术产品团队,如果涉嫌侵权,请发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。




