

导读 指标体系在数据分析、数据应用中有着重要的价值。本文从数仓开发的角度,分享在懂车帝业务中,指标体系建设工作如何开展落地,如何在数仓模型层面实现指标体系建设。
1. 如何建立指标体系规范
2. 指标模型建设在数仓工作中的收敛
3. 指标体系质量监控策略
4. 构建全方位的指标应用场景
5. 未来展望
6. 问答环节
分享嘉宾|肖继哲 字节跳动 懂车帝资深数仓研发工程师
编辑整理|许通
内容校对|李瑶
出品社区|DataFun
如何建立指标体系规范
1. 懂车帝业务介绍


2. 为什么要做指标体系规范

3. DataLeap 指标管理平台

4. 指标体系建设框架

指标元信息规范建设,比如指标的命名规范、业务定义、元信息管理,解决指标是什么的问题; 指标模型挂载建设,包括模型粒度的选择、多模型如何挂载等,关乎如何保证数据查询的准确性和效率,解决指标怎么开发的问题; 指标血缘管理建设,明确上游生产链路以及下游应用场景,解决指标用在哪的问题; 指标服务质量保障建设,保证指标一致性和整个系统的稳定性,解决指标数据准不准的问题。
5. 指标元数据管理规范
一级指标:衡量业务结果的北极星指标,OKR 指标; 二级指标:业务重点关注的指标,能够反映当前业务效果的指标; 三级指标:衡量过程效率,辅助推动结果达成的指标; 四级指标:临时性指标,适用于小范围的指标。


分析业务过程,对应词根为“成交”; 分析度量,对应词根为“量”; 分析业务描述,对应词根为:“CPS”; 分析时间周期,对应词根为:“双月”;

需求方提出需求 数据产品团队确定业务指标集合 数仓指标审核组进行指标评审 确定业务指标口径 给出初版指标中文名称 在观星台拆解工具中进行中文名词根拆解 词根工具根据词根中文名自动进行英文名称翻译 明确指标中英文名称后,数据产品团队补齐其他基础元数据 录入 DataLeap 指标平台

维度表建设不足:缺少一致性维度层,维度表和事实表没有严格区分,有些维表也放在了 DWD 层。 汇总层严重缺失:未沉淀通用的指标逻辑,复用性差,存在同名不同义和同义不同名的问题,血缘链路也不清晰,加大了维护和问题排查成本。 明细层建设混乱:直接使用明细数据进行简单加工,没有进行过程抽象,造成大量耦合信息,数据产出的质量和时效越来越没有保障。 应用层重复建设:随着需求的增加,应用层快速膨胀,通用逻辑未下沉,造成大量重复建设,导致了资源的浪费。

明细层(DWD 层)基于业务过程抽象,沉淀通用逻辑,达到规范统一、稳定易用。 轻度汇总层(DWA 层)遵循数据域--业务过程--原子指标--衍生指标--复合指标的建设规范,拆解指标体系,建设数据域+粒度视角的数据模型。 数据集市层(DM 层)处理跨数据域交叉场景,进行指标大宽表模型建设、支持复合指标建设。


模型重复建设 模型建设层级不合理 模型数据结果产出不一致。


指标体系质量监控策略




多模型绑定查询一致性监控:支持多模型的指标体系,最担心的就是指标不一致。我们通过定时巡检指标查询服务,发现指标结果不一致,发送报警消息到指标模型 Owner。此类问题需要在开发阶段就将问题处理。 指标慢查询/异常查询监控:对慢查询同样采取定时巡检,事前处理。对于查询异常,通过服务接口的查询日志、用户访问平台的埋点日志,实时监控线上指标服务请求异常信息。发现异常时,按照指标服务登记场景的重要程度,分级发送报警消息。 指标 SLA 监控:对每个指标登记 SLA 信息,进行基线预警监控,还要根据需要进行专项优化治理。 指标数据波动监控:数据波动不一定是存在问题,但需要去分析其原因。

构建全方位的指标应用场景


未来展望
问答环节


分享嘉宾
INTRODUCTION

肖继哲

字节跳动

懂车帝资深数仓研发工程师

2017 年加入抖音集团旗下懂车帝数仓 团队,一直从事业务数仓模型开发和数据服务建设的相关工作。先后负责离线/实时数仓模型开发、数仓开发规范制定、数据治理项目、数据工程服务应用等工作,目前主要聚焦于业务数据指标体系的建设工作。
课程推荐

往期推荐


点个在看你最好看

文章转载自锋哥聊DORIS数仓,如果涉嫌侵权,请发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。




