暂无图片
暂无图片
暂无图片
暂无图片
暂无图片

如何构建符合业务目标的用户标签体系

胖风烟静 2020-05-31
747


01

为什么需要用户标签


1、什么是用户标签

大数据时代,面对海量用户,我们无法像过去一样,可以通过和这个人的面对面接触来了解他。或者是仅通过简单的数据分析,就能对用户进行有效的理解和管理。而且用户表现出来的特征相较于之前也已经变得更加多元化、非标准化。

例如,一个人的资产情况可以通过他住哪个小区推断,可以通过她开的车推断,也可以通过他所供职的公司和工作年限来推断。

因此,我们需要对大量用户进行批量的特征数据化、标签化,才可以实现通过IT技术对海量用户进行理解、分析和管理。

用户标签,就是用户特征信息的数据化、标签化实现。例如,用户性别、用户学历、工作单位、近30日购物金额、是否是李惠利的微博粉丝等等,一切可以描述用户某一特征的数据结果,都可以作为用户的标签。


2、用户标签可以用来做什么

数据化、标签化的用户信息,可以支持大批量的对用户的计算,这可以帮助我们实现:

1)用户快速统计

有了用户标签,可以支持我们对不同类型、群体用户的快速统计,例如统计客户等级为VIP和普通客户的用户占比;

2)用户多维分析与构建用户画像

通过用户标签,我们可以在更多维度、不同方面,对用户进行分析、统计和了解;例如我们可以在地域、年龄、学历几个维度上对用户进行分析统计,来分析用户消费能力的差异;也可以通过标签绘制用户画像,快速的了解用户的特征。

3)个性化推荐

针对不同特点、类型的用户,可以通过标签快速的区分他们,并对他们采取不同的措施;例如现在常见的个性化营销、资讯和音乐视频内容的个性化推荐等;

4)数据挖掘

有了信息化标签,我们就能利用机器学习、数据挖掘算法,对用户进行数据建模,挖掘更多信息;


可见,无论在数据统计、数据分析、客户理解、个性化用户服务还是更多的挖掘数据价值上,用户标签都有重要的作用,是任何现代公司都不可或缺的。



02 

什么是符合业务目标的标签体系


不同的业务目标需要不同维度的标签,例如针对防止羊毛党薅羊毛这件事,我们在用户身上会关注用户的:

  • 注册行为:是否是在活动上线后才注册的?注册的终端和网络是否有相应特征;

  • 登录行为:是否是僵尸用户,在活动举办后才再次启动的?

  • 事件序列与时间间隔:在账号中的操作行为序列、时间间隔是否有特定特征,如不同操作事件之间间隔时间是否非常短,短到超过人手动操作的范畴;

由此我们会需要标签:注册时间、注册设备、注册使用网络、注册网络是否使用代理、启动设备、启动使用网络、启动网络是否使用代理、最近一次登录时间、最近30/60/90/365日启动次数、是否僵尸用户、操作时间间隔是否异常等标签,来帮助我们识别羊毛党。

但是当我们想要促进商品销售、提高商品购买率的时候,我们就会关注用户的其他一些方面:

  • 所处生命周期

  • 消费能力

  • 消费偏好

  • 兴趣爱好

由此我们需要的标签会有:用户年龄、性别、所处地区、最近30/60/90/365日消费次数、最近30/60/90/365日消费金额、以及用户兴趣和购买品类相关兴趣、偏好标签。


可见,不同的业务目标,我们所需要的用户标签完全不同,因此只有符合业务场景的标签,才能为业务目标的实现提供帮助。

符合业务目标的标签体系,就是基于业务目标,寻找能帮助、支撑业务目标达成的数据标签。并且为了方便标签的管理,对标签进行适当的分类,形成一个符合和贴近业务需求,又方便进行管理的标签体系。



03 

如何构建符合业务目标的标签体系


1、明确业务目标寻找数据支撑

第一步需要分析业务需求,明确业务目标。

这一步类似于产品经理通常的业务需求分析,只不过在这里,当我们得出真正的业务需求,明确业务目标后,我们需要考虑的是:

  • 哪些数据可以衡量业务目标的实现程度;

  • 哪些因素会影响用户的行为决策;

  • 影响用户行为决策的这些因素又是通过哪些数据来衡量;

例如要考察用户对App的认可程度,活跃用户就是一个可衡量的指标,我们可以将活跃用户作为一个标签;又如对于提高裙子购买率来说,用户的性别会很大程度上决定她是否会买裙子,因此性别就是提高用户买裙子几率的一个重要数据,我们这时就需要性别这个标签。

找到这些数据和因素,是建立符合业务目标标签体系的第一步。


2、建立标签体系

在圈定业务目标的衡量指标与影响用户行为决策的因素的数据后,我们需要基于这些数据提炼出原子的明确代表唯一含义的标签;但是由于标签可能会有很多,为了方便管理和理解,我们需要通过一个特定的体系架构,来涵盖和分类管理所有的标签。

一般来说,我们会根据业务目标的衡量指标,以及影响用户行为决策的因素来对标签进行分类。

例如,当我们考虑用户的购买行为时候,影响用户购买行为的因素会取决于,用户的购买力,购买习惯,以及用户的人口统计学特征如性别、年龄、民族、地域等,因此我们在构建标签体系的时候,也会大致将标签分为人口统计学特征、消费能力、消费偏好几个大类,当然还有很多其他的潜在影响原因,例如用户是某某明星的粉丝,这可以通过社交属性来发现,以及用户在生活中对什么感兴趣,如军事?历史?或者二次元等等。这时候我们还可以在前面三类标签的基础上加上用户的社交属性与兴趣偏好标签。


神策标签分类


3、基于基础数据获得用户标签

标签需要在基础数据上提炼获得,他需要是原子的明确代表唯一含义的。

3.1 确定唯一标识

用户标签数据来源多样,有些来自于App行为数据采集、有些来自于不同的业务数据库,有些甚至来自于第三方的数据交换。不同的数据来源,不同的数据标准,但只有大家的数据能基于统一的用户标识进行分析才有意义。否则来自于不同源头的数据只能认为是不同用户的,即使实际上他们是同一个客户的数据。这样的分析是完全不准确且也无法发挥数据协同的效果,所以在进行用户标签构建之前,需要先定义好用户的唯一标识和标识对应方式,确保一个用户的数据都能对应到该用户的身份标识上面。


3.2 获取标签的方式

标签可以通过统计、规则和数据挖掘的方式获得。

1)事实标签

事实标签是一种统计类标签,是通过数据统计得到的标签。例如用户的性别、年龄、App使用时长、月均消费金额等。

2)模型标签

模型标签是基于一定的规则或模型,在统计类标签的基础上生成的标签。例如,7日活跃用户标签的规则为最近7天内,曾经启动过App的用户。又如,常旅客标签的规则为连续12个月内定级行程达到4万公里或者定级航段达到25个。

模型标签由于涉及到具体的规则,一般是需要业务运营人员来给出定义的,但是对于一些约定俗成的通用规则,产品人员也可以预定义一些,方便大家使用。

3)预测标签

预测标签是通过数据挖掘得到的,需要在现有数据上进行进一步的数据挖掘,才能得到标签。由于数据挖掘得出的标签具有不确定性,不能保证完全正确,因此这类标签是预测类的,还需要验证准确性。

最常见的预测标签是性别,有些情况我们不知道全部用户的性别,所以需要通过已知用户性别的行为习惯,来预测整体用户的性别分布。

还有就是流失用户的预测,我们可以通过用户行为习惯,来预测哪些用户可能将会流失,从而对这类用户进行行为干预。


3.3 标签的定义

标签应当具有意义的唯一性原子性,这样在分析用户的时候,我们既可以基于最基本的维度进行多维分析,也可以通过原子性标签的组合,进行复杂维度的分析。

一个标签在定义时应该明确以下方面:

1)标签名称

2)业务含义

即该标签在业务上的含义,用图;

3)标签类型

即事实标签、模型标签和预测标签;

4)取值规则

枚举型、连续型还是区间分桶型;取值的单位和精度;

5)计算规则

对于事实标签需要写明标签的统计方式;对于模型标签需要写明标签的规则逻辑;

6)计算周期

标签计算的周期,每周、每月、每日,还是实时计算、单次计算;

7)权限归属

用户使用权限,不是所有数据都适合给所有人看到;


某证劵公司标签示例


4、标签的维护

标签的计算是非常消耗资源的,对标签的实时性要求越高,计算消耗就越大。而且我们对于标签的需求也是会不断变化的。因此对于标签,需要我们不断的维护,我们会停止对不再使用的标签的计算,更新标签的计算周期,以及添加新的需要的标签等等。

标签的维护需要一套标签系统的支撑,后续会在单独的一篇文章来介绍。




END






文章转载自胖风烟静,如果涉嫌侵权,请发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。

评论