一、什么是用户画像?
用户画像是根据用户在互联网留下的种种数据,主动或被动地收集,最后加工成一系列的标签,简而言之,上部分所言的用户行为分析可以形成用户画像。用户画像本质是对任何一个用户都能用简化的标签数据描述。
二、用户画像的目的
精准营销:这是运营最熟悉的玩法,从粗放式到精细化,将用户群体切割成更细的粒度,辅以短信、推送、邮件、活动等手段,驱以关怀、挽回、激励等策略。
数据应用:用户画像是很多数据产品的基础,诸如耳熟能详的推荐系统。一般ad投放基于一系列人口统计相关的标签,性别、年龄、学历、兴趣偏好、手机等等。
用户分析:产品早期,PM们通过用户调研和访谈的形式了解用户。在产品用户量扩大后,调研的效用降低,这时候会辅以用户画像配合研究。新增的用户有什么特征,核心用户的属性是否变化等等。
数据分析:用户画像可以理解为业务层面的数据仓库,各类标签是多维分析的天然要素。数据查询平台会和这些数据打通。
三、如何正确建立用户画像
用户画像首先是基于业务模型的。业务部门连业务模型都没有想好,数据部门只能巧妇难为无米之炊。理解消费者的决策,考虑业务场景,考虑业务形态,考虑业务部门的需求,一个好的用户画像都离不开它们。本文没有说数据、模型和算法,但是我认为,它们比技术层面更重要。
四、用户画像的构建
不同业务的画像标签体系并不一致,这需要数据和运营目的性的提炼。
1.用户标签的结构
用户画像一般按业务属性划分多个类别模块。除了常见的人口统计,社会属性外。还有用户消费画像,用户行为画像,用户兴趣画像等。具体的画像得看产品形态,像金融领域,还会有风险画像,包括征信、违约、洗钱、还款能力、保险黑名单等。电商领域会有商品的类目偏好、品类偏好、品牌偏好等。

另外,用户画像包含上下级递进关系。以流失系数举例,它通过建模,其依赖于用户早期的历史行为。而用户早期的历史行为,即10天内的消费金额、消费次数、登录次数等,本身也是一个标签,它们是通过原始的明细数据获得。
2.标签的加工过程
上图列举了标签加工和计算的过程,很好理解,通过原始数据不断加工处理,得出最后的预测标签,运营人员通过多个标签的组合形成一个用户群组,方便执行。公司越大,用户画像越复杂。
五、用户画像的技术路径
- 用户画像准备阶段——数据的挖掘和收集
(1)对网站、活动页面进行SDK埋点。
即预先设定好想要获取的“事件”,让程序员在前/后端模块使用 Java/Python/PHP/Ruby 语言开发,撰写代码把“事件”埋到相应的页面上,用于追踪和记录的用户的行为,并把实时数据传送到后台数据库或者客户端。
所谓「事件」,就是指用户作用于产品、网站页面的一系列行为,由数据收集方(产品经理、运营人员)加以描述,使之成为一个个特定的字段标签。
我们以“网站购物”为例,为了抓取用户的人口属性和行为轨迹,做SDK埋点之前,先预设用户购物时的可能行为,包括:访问首页、注册登录、搜索商品、浏览商品、价格对比、加入购物车、收藏商品、提交订单、支付订单、使用优惠券、查看订单详情、取消订单、商品评价等。
把这些行为用程序语言进行描述,嵌入网页或者商品页的相应位置,形成触点,让用户在上网时直接产生网络行为数据(登陆次数、访问时长、激活率、外部触点、社交数据)以及服务内行为数据(浏览路径、页面停留时间、访问深度、唯一页面浏览次数等等)。
数据反馈到服务器,被存放于后台或者客户端,就是我们所要获取到的用户基础数据。
(2)A/B test
A/B test就是指把两个或者多个不同的产品/活动/奖品等推送给同一个/批人,然后根据用户作出的选择,获取到进一步的信息数据。
为了知道男性用户是哪个年龄层,借助A/B test,我们利用抽奖活动,在奖品页面进行SDK埋点后,分别选了20~30岁和30~40岁两种不同年龄段使用的礼品,最后用户选择了前者,于是我们能够得出:这是一位年龄在20~30岁的男性用户。
以上就是数据的获取方法。有了相关的用户数据,我们下一步就是做数据分析处理——数据建模。
- 用户画像成型阶段——数据建模
(1)定性与定量相结合的研究方法
定性化研究方法就是确定事物的性质, 是描述性的;定量化研究方法就是确定对象数量特征、数量关系和数量变化,是可量化的。
定性的方法,表现为对产品、行为、用户个体的性质和特征作出概括,形成对应的产品标签、行为标签、用户标签。
定量的方法,则是在定性的基础上,给每一个标签打上特定的权重,最后通过数学公式计算得出总的标签权重,从而形成完整的用户模型。
(2)数据建模——给标签加上权重
用户的行为,我们可以用4w表示:WHO(谁);WHEN(什么时候);WHERE(在哪里);WHAT(做了什么),具体分析如下:
WHO(谁):定义用户,明确我们的研究对象。主要是用来用户分类,划分用户群体。网络上的用户识别,包括但不仅限于用户注册的ID、昵称、手机号、邮箱、身份证、微信微博号等等。
WHEN(时间):这里的时间包含了时间跨度和时间长度两个方面。“时间跨度”是以天为单位计算的时长,指某行为发生到现在间隔了多长时间;“时间长度”则为了标识用户在某一页面的停留时间长短。越早发生的行为标签权重越小,越近期权重越大,这就是所谓的“时间衰减因子”。
WHERE(在哪里):就是指用户发生行为的接触点,里面包含有内容+网站。内容是指用户作用于的对象标签,比如小米手机;网站则指出用户行为发生的具体地点,比如小米官方网站。权重是加在网站标签上的,比如买小米手机,在小米官网买权重计为1,,在京东买计为0.8,在淘宝买计为0.7。
WHAT(做了什么):就是指的用户发生了怎样的行为,根据行为的深入程度添加权重。比如,用户购买了权重计为1,用户收藏了计为0.85,用户仅仅是浏览了计为0.7。
当上面的单个标签权重确定下来后,就可以利用标签权重公式计算总的用户标签权重:
标签权重=时间衰减因子×行为权重×网站权重
比如:A用户今天在小米官网购买了小米手机;B用户七天前在京东浏览了小米手机,由此得出单个用户的标签权重,打上“是否忠诚”的标签。
通过这种方式对多个用户进行数据建模, 就能够更广的覆盖目标用户群,为他们都打上标签,然后按照标签分类:比如,总权重达到0.9以上的被归为忠实用户,这样的一来,企业和商家就能够根据相关信息进行更加精准的营销推广、个性化推荐。
六、总结
1.用户画像并不只是代表一个具体的用户,而是代表具有相同特点的一类用户。
2.用户画像的目的是为了让团队中其他成员更明确用户特点以及行为习惯,为产品设计、研发提供辅助参考。
3.对于以用户研究为目的的用户画像构建,在构建前期要明确目的,根据目的收集相关的用户信息。在用户画像构建完成后,要根据用户画像去发现这一类用户群体,并提出具体方案为这一类群体进行服务。




