一、转化率指标
1.1 理论公式
1.2 EXCEL公式
对照组样本量和转化:N1,P1
实验组样本量和转化:N2,P2
z_score= (P1 - P2) / SQRT( P1*(1-P1)/N1 + P2*(1-P2)/N2 )
p_value = NORMDIST(z_score,0,1,TRUE)
95%置信 = IF(OR(p_value<0.05,p_value>0.95),"YES","NO")
二、数值型指标
2.1 理论公式
2.2 EXCEL公式
p=normdist(z,0,1,true)
z=(u1-u2)/sqrt(delta1^2/n1 + delta2^2/n2)
2.3 实例参考
应用到互联网产品AB实验中,重点在于分别计算实验组和对照组指标的均值和标准差。
数值型指标的标准差可以根据每个样本的数值计算出来。
hive标准差函数:stddev(col_name) 、stddev_pop(col_name)
hive方差函数:var_pop(col_name)
三、探讨
疑问:
0-1分布方差pq
二项分布方差npq
转化率指标Z公式中的方差为啥是用pq呢?
方差公式:
根据方差公式,可以推导出比率型指标的方差为pq,其中q=1-p
假设p=k/n,n为样本量,k为结果为1的样本个数
则 x拔 = k/n = p; xi=0或1
方差=(sum(xi-x拔)^2) / n
=sum(xi^2 - 2xi*x拔 + x拔^2) / n
=(sum(xi^2) - 2*x拔 * sum(xi) + n*x拔^2)/n
=(k - 2p*k + np^2) / n
=(np - 2np^2 + np^2) / n
=(np - np^2) /n
=p(1-p)
参考:
方差公式方差公式_百度百科
做AB实验,怎么做数据分析呢?做AB实验,怎么做数据分析呢? - 知乎
04 T检验和Z检验04 T检验和Z检验 - 知乎