统计学(5)|AB测试—方差分析与卡方检验

我是ZZ,点击上方“关注”,每天为你分享数据分析干货;私信我回复数字“01”,送你一份新手入门数据分析大礼包。#互联网##数据分析##统计学##

我是ZZ,点击上方“关注”,每天为你分享数据分析干货;私信我回复数字“01”,送你一份新手入门数据分析大礼包。

#互联网##数据分析##统计学##统计##概率#

在工作中,除了同时进行AB两组实验之外,也会存在多组实验同时进行的情况。这种情况下就不能使用之前的实验结果分析方法了,而需要采用方差分析与 检验。

1.方差分析

方差分析用于主要用于检验多个总体均值是否相等,故适用于均值类指标,比如DAU,人均使用时长等。

多个总体情况下,要比较均值是否相等,两两之间的z 检验或t 检验需要进行多次,十分繁琐,而且会增加犯第一类错误的概率。而方差分析提高了检验的效率,也增加了分析的可靠性。由于进行AB测试,通常遵循单一变量原则,所以相对应我们只介绍单因素方差分析

1.1 基本思想和原理

方差分析的基本原理是误差分解:

总误差就是数据的全部误差;组内误差就是每个样本内部的数据误差;组间误差就是不同样本之间的误差,组间误差包括随机误差和系统误差。

在方差分析中,数据的误差使用平方和来表示的:

统计学(5)|AB测试—方差分析与卡方检验

误差分析:如果不同总体之间没有差别,那么组间误差中只包含随机误差,而没有系统误差,则组间误差与组内误差经过平均后的数据就会很接近,他们的比值就会接近1,反之比值就会大于1。当比值达到一定程度,我们就认为不同样本之间存在显著差异。

1.2 方差分析步骤

1.2.1 提出假设

如果拒绝原假设,则认为不同样本之间是存在显著差异的。

1.2.2 计算各平方和

(1)总平方和,是全部观测值与总体均值的误差平方和。

(2)组间平方和,是各组均值与总体均值的误差平方和。

(3)组内平方和,是每组的各个数据与该组均值的误差平方和。

其中,为总均值,为第个总体的样本均值, 是第i 个样本的样本量, 是第 i 个总体的第 j 个观测值。

1.2.3 构造统计量

由于各误差平方和的大小与样本量的多少有关,所以需要将其平均,也就是用平方和除以对应的自由度,这一结果称为方差。自由度分别为:

SST :,n 为全部样本个数

SSA : ,k 总体的个数

SSE :

故统计量为,当为真时,服从分子自由度,分母自由度 分布。

1.2.4 显著性检验

根据给定的显著性水平,在F 分布表中查找与分子自由度,分母自由度的对应的临界值

,不拒绝原假设,即各个总体之间没有显著性差异。

2.检验

2.1 基本原理

检验通过观测频数与期望频数的差异程度来判断,各总体之间的比例是否相等。

对于比例类指标的AB 实验(比如次日留存率),其显著性检验可以等价为2*2双向列联表独立性检验。即一个维度为实验方案(分别为A、B),另一个为维度为次日是否访问。在这种情况下,检验与检验在数学上是等价的。

因此计算多个样本的比例类指标显著性时我们可以使用卡方检验。

2.1 提出假设

假设我们的样本数据如下所示:

次日是否访问

方案1

方案2

方案3

合计

69

120

123

312

56

80

52

188

合计

125

200

175

500

当原假设为真时,我们可以通过样本数据确定期望频数,然后就可以利用检验统计量

来确定观测频数与期望频数之前是否存在显著差异。如果差异显著,则将被拒绝,就可以得到总体比例不全相等的证据。

2.2 计算期望值频数

通过观察上面观测频数的样本数据,我们可以看到,全部500个用户中,有312个用户次日会访问客户端,因此是次日可能访问客户端的用户的总样本比例。如果我们假定原假设为真,即所有总体的比例相等 ,那么0.624就是每一组用户次日可能访问客户端比例的最佳估计值。因此如果为真,我们将期望方案1的125个用户会有 个用户次日会访问客户端,78则是策略1的期望频数。

同理,我们可计算出各组的期望频数如下:

统计学(5)|AB测试—方差分析与卡方检验

2.3 计算 统计量

式中,表示第i 行第j 列单元格的观测频数,表示第行第列单元格的期望频数。在涉及个总体比例相等性的 检验中,检验统计量服从自由度为 分布,其中每个单元格的期望频数都

根据以上公式,计算 的值如下:

统计学(5)|AB测试—方差分析与卡方检验

最终统计量值为7.89,

根据给定的显著性水平,在 分布表中查找对应自由度的临界值的自由度为 ,R 和C 分别为行和列变量的个数,本例中分别为2和3,故自由度为2。

,不拒绝原假设,即各个总体之间没有显著性差异。

至此,AB测试所有相关的知识都已经全部介绍完毕了,如果觉得有帮助的,可以帮忙点赞-分享-转发一条龙支持一下作者。

同系列文章:

统计学(1)|白话统计学发展(含统计学必知必会)

统计学(2)|AB测试—理论基础

统计学(3)|AB测试—实验结果分析

统计学(4)|AB测试—实验流程

统计学(5)|AB测试—方差分析与卡方检验

统计学(5)|AB测试—方差分析与卡方检验

作者:ZZ数据分析,网易资深数据分析师,专注数据分析、数据科学知识分享。关注之后私信我,回复数字“01”,送你一份数据分析师大礼包。

免责声明:本站所有文章内容,图片,视频等均是来源于用户投稿和互联网及文摘转载整编而成,不代表本站观点,不承担相关法律责任。其著作权各归其原作者或其出版社所有。如发现本站有涉嫌抄袭侵权/违法违规的内容,侵犯到您的权益,请在线联系站长,一经查实,本站将立刻删除。 本文来自网络,若有侵权,请联系删除,如若转载,请注明出处:https://yundeesoft.com/84728.html

(0)

相关推荐

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注微信