暂无图片
暂无图片
暂无图片
暂无图片
暂无图片

因果推断之Uplift Model|入门篇

Alina的小岛 2022-06-17
6292

Hi  👋

祝你有美好的一天




导读


终于对超火的因果推断下手了!工作需要,先从它在智能营销的应用Uplift Model开始学起。本文对想了解因果推断和营销增益模型的人来说将是一篇不错的入门读物,涉及了因果推断学科的介绍智能营销的新挑战增益模型的核心思路常用的建模方式模型评估方式未来应用的思主要参考了论文<Causal Inference and Uplift Modeling A review of the literature>、阿里文娱博客和B站<因果推断入门>课程。感恩前辈们的宝贵研究成果,本篇是在学习提炼后,加入自己的理解,整理而成。


欢迎探讨指正~




01

从因果推断说起


因果推断学科是一门年轻的学科,近30年才开始被研究,近几年随着机器学习发展成熟,工业界的关注从“模式识别”到“因果推断”,成为新的研究热点,被称为“AI的未来”。它不是一种方法,而是一套统计框架,可以和各种模型衔接,例如心理学、经济学、机器学习模型等等。


因果推荐之所以被赋予这么高的头衔,是因为它打破了传统统计学的局限——传统统计学只能反映相关性,而很难排除干扰项来解释因果性(最典型的例子是辛普森悖论)。同时,它也打破了传统因果分析方法的局限——通过做实验来验证因果性,然而现实中由于实验成本巨大往往并不可行。


因果推断学科,正是研究如何通过观测数据(无实验干预情况下)科学地识别因果性,有突破性意义。


当前,因果推断有两个分支:因果图:讨论几个变量之间构成的图状的关系结构(定性);因果效应:讨论因变量的变化对于结果到底有多少影响(定量)。


工业界的实际落地以因果效应为主,我们需要知道一个或多个变量的干预对于客户行为的影响程度,从而决定针对客户的策略,Uplift Moel就是一个预测因果效应的模型,也是本文的讨论重点后续会针对因果图分支再写文章介绍。(给自己挖个坑...)




02

应对智能营销新挑战


长期以来,智能营销的模型以响应模型(repsonse model)为主,即直接预测客户是否响应,从而给预测响应率高的客户推送广告、优惠券等。


但营销的目标是在成本有限的情况下最大化营销的投资回报率(ROI),我们并不需要去营销本身就会转化的用户,而应找到真正能被营销打动的用户,我们称之为“营销敏感人群”


结合上图解释更加直观,根据用户对营销的反应,可以将其分为以下四类:


(1)营销敏感:不营销不购买、营销则购买

(2)自然转化:无论是否营销都会购买

(3)无动于衷:无论是否营销都不会购买

(4)反作用:对营销活动比较反感,不营销时购买,但营销后不会再购买


显然,我们只需要营销第一类用户。这就是为什么我们需要Uplift模型——预测营销对于用户响应率的增益,识别“营销敏感人群”





03

Uplift Model 概述


1

预测目标

Uplift Model,即增益预测模型,用于估算干预动作(treatment)对用户响应行为(outcome)产生的效果,即预测个体因果效应ITE(The Individual Treatment Effect)。


ITE = 一个客户在营销时响应的概率 - 该客户在不营销时响应的概率


Y为响应结果,X为客户特征,T为营销的变量 

( 1代表有干预,0代表无干预 )


2

技术难点

营销与不营销互为反事实观测结果,总有一个无法被观测。直接识别ITE是无法做到的。


3

解决思路

将求解ITE转化为求解条件平均因果效应CATE(Conditional Averaged Treatment Effect)的问题,即给定一系列特征组合来表示每个个体, 以这个特征组合下的整体的条件期望来作为个体的ITE。


CATE = 整体中营销用户的响应率 - 整体中未被营销客户的响应率


4

前提假设

CATE的前提是CIA(Conditional Independence Assumption)条件独立假设,要求客户特征X与营销变量T是相互独立的


因此,Uplift模型对于样本的要求是很高的,样本需要服从CIA假设,样本中的营销组/不营销组必须是随机分配。例如,通过A/B Test拆分流量得到的这两组样本在特征的分布上面是一致的,也就是X和T是相互独立的,可以作为Uplift模型的样本数据提供无偏样本。





04

建模方法


1

差分响应模型

不直接对Uplift建模,而用响应模型预测客户在营销/不营销下的响应率,相减得到uplift score。具体有两种做法,核心思路是一致的:


(1) 两段式(Two-model):分别对营销组和不营销组数据独立建响应模型,预测时用两个模型预测用户的分数就得到了uplift score;


(2)一段式(One-model):在营销组和不营销组的用户特征中,加入与T(营销)有关的特征,合并数据,只训练一个响应模型;对同一客户通过将T=1和T=0时的分数相减得到了uplift score;


这种方式原理好理解,可直接套用响应模型,很好上手;但缺点也很明显:未直接对uplift建模,当营销/不营销组数据差异过大时,累计误差较大。


2

类别变换模型(Class Transformation Model)

构造响应变量Z,对“营销购买客户”和“未营销未购买客户”使得Z=1,否则Z=0;基于一些假设可以推导uplift与P(Z=1|X)的关系如下图,则只需对P(Z=1|X)建模即可

直接对uplift建模,但需要满足两个假设前提:(1)treatment和outcome必须是二分类变量;(2)数据在实验/对照组的分布平衡 。


3

直接对Uplift模型建模(以树模型为例)

通过对现有机器学习算法的改造直接对增益效果建模最流行的是树模型,本文以树模型为例来介绍。


在CIA假设下,即P(X=Xi) = 1/2情况下,对每个叶子节点预测值的估计,为其中营销组的响应率减去非营销组的响应率。


一种简单的分裂标准是衡量两个叶子结点间uplift的差值,另一种是通过比较分裂前后的信息差异,同理传统树模型,不再赘述。


这种方式目前最为主流,好理解且直接对uplift建模,效果较好。





05

评估指标


整体上,增益模型和响应模型的评估体系非常相似,可参考下图的对应关系:

Response Model

Uplift Model

分组成功率

增益柱状图

累积成功率

累积增益图

累积成功人数

累积收益

AUUC

AUC


1

增益柱状图

用模型对所有样本预测uplift值,按照uplift值倒序排序,分别计算每个十/百分位里的整体uplift(营销组响应率 - 非营销组的响应率),看是否有排序能力以及前几组是否有较高的uplift



2

累积增益图

基于上述计算的每个十分位的uplift值,可以计算出累积增益,第一个bar代表前10%的uplift,第二个bar代表前20%的uplift。一个表现好的模型在前半段会有比较大的值,后半段下降可用于跨模型比较



3

累积收益

计算前t组uplift值乘以总人数,表示如果在前t个样本实施营销,获得的预期总收益(因果效应)


4

AUUC & GINI

我们可以通过上述累计收益公式计算每一个 t 的增益效果,绘成曲线如下,可以得到 uplift model 最常用的评估指标AUUC(Area Under Uplift Curve),即曲线下的面积。



当营销组和不营销组样本不平衡时,上述Uplift Curve,AUUC表达的增益效果存在偏差。可以对累积收益公式做一个缩放修改,相当于以Treatment组的样本量为准,对Control组做一个缩放,累积绘制的曲线称为Qini 曲线,取Qini曲线下面积为Qini系数。





Uplift Model的应用建议


Uplift Model预测营销对于用户响应的增益,识别营销敏感人群,从而最大化营销投资回报率。这一点上,Uplift Model优于常规的响应模型


但是,Uplift Model对于应用场景更为苛刻


首先,需要有稳定的客群、渠道、营销目标,例如“针对手机APP用户促下单”;不适用于渠道用户不稳定、临时性或一次性营销的场景,例如“针对银行未开借记卡的客户促开卡”。


其次,需要通过随机分桶获取无偏数据,用于训练模型,即样本数据中用户是否被营销应该是随机的,独立于用户特征。


Uplift Model的实现和评估可以使用python包PyliftPylift在sklearn的基础上针对uplift modeling对各模型做了一些优化,同时集成了一套uplift评价指标体系。所以Pylift内核还是sklearn,在sklearn外面封装了一套API,可以通过Pylift实现直接的uplift modeling。


另外,阿里文娱博客中提到Uplift Model在智能营销应用的两个后续思考方向:


(1)增加Treatment维度:实际制定营销策略时,除了考虑是否营销,还要考虑优惠券类型、优惠券金额等,多维度建模对样本的量级要求越来越高,样本的稀疏性问题会更加严重


(2)度量客户长期uplift:目前uplift model建模更多考虑的是单次或者短期用户行为的增益,但实际上的营销往往是常态化或持续化的;如何去建模长期的uplift也值得进一步去探讨。




Reference

1. Causal Inference and Uplift Modeling: A review of the literature

2. 阿里文娱智能营销增益模型 ( Uplift Model ) 技术实践

3. B站饺子博士and饭老师因果推断入门课程




文章转载自Alina的小岛,如果涉嫌侵权,请发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。

评论