在线AB实验成为当今互联网公司中必不可少的数据驱动的工具,很多公司把自己的应用来做一次AB实验作为数据驱动的试金石。

文 | 松宝 来自 字节跳动数据平台团队增长平台
本系列连载会从数据驱动、AB实验基本架构、指标选取与数据分析等角度切入,第一篇着重介绍AB实验与数据驱动的条件和AB实验的基本架构。
A/B Test
AB实验与数据驱动

1、设计执行分析阶段
2、标准化指标阶段
3、大面积实验AB实验阶段
4、绝大多数改动需要AB验证阶段
A/B Test
数据驱动的条件
1、实验标准化

2、实验结果可信性
举个例子:如果我抛起三枚硬币,落地分别是正正反,那么我可以说抛硬币正面朝上的概率是三分之二吗?

3、如何衡量好的想法
举个例子:一家超市突然提高价格,可能会在短期带来更高利润。但长远看,如果更多的顾客改从竞争对手那里购买商品,那么这家店的收入就会减少。
A/B Test
AB实验基本架构
01 - 流量分割

目的:为了获取纯净的分区,不会互相影响。
缺点:浪费流量,导致流量不够。
目的:同一个用户在不同的实验组,相互不会影响。
缺点:不同层之间的hash值尽量不要重合。
02 - 如何看待随机单元?
举个例子:我们选择页面级别的随机单元,AB实验针对某一个页面,用户每一次打开页面的时候决定把该用户导向某一个实验组。
03 - 随机算法
伪随机 (PRNG) 密码学安全的伪随机 (CSPRNG) 真随机 (TRNG)

特征(1):用户必须等可能看到一个实验的每个variant,对于任意的variant必须是无偏的。 特征(2):同一个实验中,对于单个user重复分配必须是一致的,对于该用户每次后续访问中,该user必须被分配到相同的variant上。 特征(3):当多个实验同时并行运行的时候,实验之间必须没有关联关系。也就是在一个实验中,一个user被分配到一个variant,对于被分配给其他任意实验的一个variant,在概率上没有影响。 特征(4):算法必须支持单调递增的,也就是说,如果没有对那些已经被分配给实验组的用户分配进行变更,用户看到一个实验组的百分比可能会缓慢增加的。
04 - 实验灰度发布
实验发布之后,还可以预留一些流量来衡量实验的长期效果。
还可以重复发布某一个实验,看实验的结果是否可以保持。
点击阅读原文了解火山引擎A/B测试
产品介绍
火山引擎A/B测试
A/B测试,摆脱猜测,用科学的实验衡量决策收益,打造更好的产品,让业务的每一步都通往增长。后台回复数字“8”了解产品
- End -
文章转载自字节跳动数据平台,如果涉嫌侵权,请发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。




