导语:在实验数据收集完成之后,通常需要进行合适的假设检验来推断策略带来的影响是否是显著变化,常用的假设检验方法有Z test、T test、卡方检验等,但最常用的就是T test了,如何针对不同的指标采用科学的T test方(zi)案(shi),是数据分析师的必备技能。
先学会T test 的步骤
概念:T检验,亦称student t检验(Student’s t test),主要用于样本含量较小(例如n < 30),总体标准差σ未知的正态分布。T检验是用T分布理论来推断差异发生的概率,从而比较两个平均数的差异是否显著。
在实验中往往是只有实验组和对照组两组数据,且假设它们的方差是相等的,需要检验两组的均值是否有显著差异(双边检验),此时需要采用两独立样本均值检验的方式。
Step 1:首先提出原假设和备择假设
Step 2:构造统计量
Step 3:显著性计算
我们通常是根据计算p value来判定显著性的。双边T test的P值公式为:
一般来说,p小于0.05时认为是显著变化。
常用的三种姿势
所谓三种姿势,是根据指标的分布进行区分的,业务中常见的指标可以分为三种:均值指标、率指标、比例指标,这三类指标的方差计算方式不一样,导致了在实际计算t统计量时的公式也会发生变化,下面将一一介绍。
01 均值指标
均值指标是最常见的,比如人均消费金额、人均消费时长等,均值类指标的样本方差公式为:
02 率指标
率指标在业务中也较为常见,尤其是在漏斗分析的过程中,比如XX转化率,由于率指标复合二项分布,其方差公式等于p*(1-p),p为均值。
03 比例指标
比例指标由于它和率指标较为相似,在业务中也经常被忽略,比如成交率(分母为用户需求量,分子为成交需求量)这个指标,在以订单为实验单元时,就是率指标,在以用户为实验单元时,就是比例指标,比例指标的分子和分母分别服从一个分布,计算方差的公式为:
私信博主,获取T test python代码。
免责声明:本站所有文章内容,图片,视频等均是来源于用户投稿和互联网及文摘转载整编而成,不代表本站观点,不承担相关法律责任。其著作权各归其原作者或其出版社所有。如发现本站有涉嫌抄袭侵权/违法违规的内容,侵犯到您的权益,请在线联系站长,一经查实,本站将立刻删除。 本文来自网络,若有侵权,请联系删除,如若转载,请注明出处:https://yundeesoft.com/83453.html