


/ 标签是什么
/ 标签体系是什么
2. 结构化
● 在分类下,整体根据一定的逻辑进行结构化拆分,形成金字塔/树状结构,更好的对标签进行管理。
● 层级也不宜过多,一般5层内即可,便于快速查找和使用。
3. 复用性和可扩展性
● 搭建最初的结构时,需要考虑到后续的复用和继续扩展,设计和放置要合理。举例:如果一个标签是原子性的,不可再向下拆分,那就不应该和大的分类放在一个层级。


/ 按标签性质分类
/ 按创建方式分类

/ 按标签数据源分类
2. 计算类标签
比如人工外呼后,对用户的状态进行重新标记。或者对视频素材进行标记时,由人工标注团队根据建立好的标签规则对视频内容进行打标。
值得一提的是,虽然各种图像识别、音频识别算法,自然语言处理等人工智能算法日渐强大,但当前在视频打标领域,仍然普遍依赖人工来对内容进行识别标记,以获取更准确的内容特征。
/ 按更新类型分类
一些短期行为相关的标签:活跃状态、下单状态、累计付款金额、一般要天级别进行更新,以保证数据的新鲜度。
一些基于长期行为、多源数据整合的标签:通过模型进行预测的购买概率标签,也需要进行动态更新。


/ 确定目标, 明确标签需求
● 明确标签与主体:针对这个目标,目前需要哪些主体的哪些标签
● 确定标签更新机制:标签是静态还是动态更新?更新的频率?
● 确定标签预期使用的时间
● 标签需求方
● 标签数据团队(生产方)
3. 产出物:
● 标签需求文档
/ 确定标签的数据源 /
● 如果缺少必要的数据源,是否需要新建埋点进行收集?
● 已有的数据源要不要再次清洗、加工、融合?
● 确定是否需要建立模型进行输出?
● 讨论是否需要人工标记进行数据补充?
● 标签的可用数据源
/ 确定数据方案
2. 参与角色
● 标签数据团队
● 其他支持团队(数仓/算法/人工标记等)
3. 产出物
● 标签数据方案
● 详细的执行计划
/ 构建标签体系
我们已经知道构建标签体系的重要性,尤其是0-1阶段,需要构建一个合理的标签体系,可以是mvp的方案,但需要打好基础,因为后续的扩展都要基于这个原始的结构进行,再次注意下满足以下关键点:
● 分类合理:根据标签的主题、目的、属性、类型等建立合理的分类,便于查找使用
● 结构化:建立标签的层级关系,便于标签维护,补充添加
● 可扩展性:基础结构保持后期扩展的可能,减少修改成本
2. 参与角色:
3. 产出物:
/ 注册标签
2. 参与角色:
3. 产出物:
/ 标签体系的维护与更新 /
2. 参与人:
3. 产出物:

产品介绍





文章转载自字节跳动数据平台,如果涉嫌侵权,请发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。




