Underpowered studies (below 50%) suffer from the winner's curse: a statistically significant result must exaggerate the true treatment effect to meet the significance threshold. A study by Dipayan Biswas, Annika Abell, and Roger Chacko published in the Journal of Consumer Research (2023) reported that in an A/B test simply rounding the corners of square buttons increased the online click-through rate by 55% (p-value 0.037)$\unicode{x2014}$a striking finding with potentially wide-ranging implications for the digital industry that is seeking to enhance consumer engagement. Drawing on our experience with tens of thousands of A/B tests, many involving similar user interface modifications, we found this dramatic claim implausibly large. To evaluate the claim, we conducted three high-powered A/B tests, each involving over two thousand times more users than the original study. All three experiments yielded effect size estimates that were approximately two orders of magnitude smaller than initially reported, with 95% confidence intervals that include zero, that is, not statistically significant at the 0.05 level. Two additional independent replications by Evidoo found similarly small effects. These findings underscore the critical importance of power analysis and experimental design to increase trust and reproducibility of results.


翻译:功效不足(低于50%)的研究会受到“赢者诅咒”的影响:一个具有统计显著性的结果必须夸大真实的处理效应才能达到显著性阈值。Dipayan Biswas、Annika Abell 和 Roger Chacko 在《消费者研究杂志》(2023年)上发表的一项研究报告称,在一项A/B测试中,仅仅将方形按钮的边角变圆就能使在线点击率提高55%(p值0.037)——这一惊人发现对寻求提升消费者参与度的数字产业可能具有广泛影响。基于我们对数万次A/B测试(其中许多涉及类似的用户界面修改)的经验,我们发现这一戏剧性的主张大得令人难以置信。为了评估这一主张,我们进行了三项高功效的A/B测试,每项测试涉及的用户数量都是原始研究的2000多倍。所有三个实验得出的效应量估计值都比最初报告的小大约两个数量级,其95%置信区间包含零,即在0.05水平上不具有统计显著性。Evidoo进行的另外两项独立重复研究也发现了类似微小的效应。这些发现强调了功效分析和实验设计对于提高结果可信度和可重复性的至关重要性。

0
下载
关闭预览

相关内容

图机器学习 2.2-2.4 Properties of Networks, Random Graph
图与推荐
10+阅读 · 2020年3月28日
PSPNet ——语义分割及场景分析
AI科技评论
20+阅读 · 2019年8月20日
Focal Loss for Dense Object Detection
统计学习与视觉计算组
12+阅读 · 2018年3月15日
国家自然科学基金
13+阅读 · 2017年12月31日
国家自然科学基金
46+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
国家自然科学基金
6+阅读 · 2014年12月31日
Arxiv
1+阅读 · 2025年12月31日
VIP会员
相关资讯
图机器学习 2.2-2.4 Properties of Networks, Random Graph
图与推荐
10+阅读 · 2020年3月28日
PSPNet ——语义分割及场景分析
AI科技评论
20+阅读 · 2019年8月20日
Focal Loss for Dense Object Detection
统计学习与视觉计算组
12+阅读 · 2018年3月15日
相关基金
国家自然科学基金
13+阅读 · 2017年12月31日
国家自然科学基金
46+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
国家自然科学基金
6+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员