Small area estimation (SAE) improves estimates for local communities or groups, such as counties, neighborhoods, or demographic subgroups, when data are insufficient for each area. This is important for targeting local resources and policies, especially when national-level or large-area data mask variation at a more granular level. Researchers often fit hierarchical Bayesian models to stabilize SAE when data are sparse. Ideally, Bayesian procedures also exhibit good frequentist properties, as demonstrated by calibrated Bayes metrics. However, hierarchical Bayesian models tend to shrink domain estimates toward the overall mean and may produce credible intervals that do not maintain nominal coverage. Hoff et al. developed the Frequentist, but Assisted by Bayes (FAB) intervals for subgroup estimates with normally distributed outcomes. However, non-normally distributed data present new challenges, and multiple types of intervals have been proposed for estimating proportions. We examine domain inference with binary outcomes and extend FAB intervals to improve nominal coverage. We describe how to numerically compute FAB intervals for a proportion and evaluate their performance through repeated simulation studies. Leveraging multilevel regression and poststratification (MRP), we further refine SAE to correct for sample selection bias, construct the FAB intervals for MRP estimates and assess their repeated sampling properties. Finally, we apply the proposed inference methods to estimate COVID-19 infection rates across geographic and demographic subgroups. We find that the FAB intervals improve nominal coverage, at the cost of wider intervals.


翻译:小区域估计(SAE)可在每个区域数据不足时,改进对地方社区或群体(如县、街区或人口亚组)的估计。这对于针对地方资源和政策制定尤为重要,因为国家级或大区域数据往往会掩盖更细粒度层面的变异。当数据稀疏时,研究者常采用分层贝叶斯模型来稳定SAE。理想情况下,贝叶斯程序还应具备良好的频率性质,正如校准贝叶斯度量所展示的那样。然而,分层贝叶斯模型倾向于将域估计值向整体均值收缩,并可能产生无法维持名义覆盖率的可信区间。Hoff等人针对正态分布结果的亚组估计开发了“频率主义但由贝叶斯辅助”(FAB)区间。然而,非正态分布数据带来了新的挑战,且已有多种区间被提出用于比例估计。本文研究了二元结果下的域推断,并扩展了FAB区间以提高名义覆盖率。我们描述了如何数值计算比例估计的FAB区间,并通过重复模拟研究评估其性能。利用多级回归与事后分层(MRP),我们进一步优化SAE以校正样本选择偏差,构建MRP估计的FAB区间并评估其重复抽样性质。最后,我们将所提出的推断方法应用于估计跨地理和人口亚组的COVID-19感染率。研究发现,FAB区间以更宽的区间为代价,提高了名义覆盖率。

0
下载
关闭预览

相关内容

【ICML2022】Sharp-MAML:锐度感知的模型无关元学习
专知会员服务
17+阅读 · 2022年6月10日
专知会员服务
25+阅读 · 2021年7月31日
专知会员服务
44+阅读 · 2021年7月1日
【ICML2021】因果匹配领域泛化
专知
12+阅读 · 2021年8月12日
现代情感分析方法
算法与数学之美
14+阅读 · 2018年1月12日
CNN 反向传播算法推导
统计学习与视觉计算组
30+阅读 · 2017年12月29日
EKF常用于目标跟踪系统的扩展卡尔曼滤波器
无人机
10+阅读 · 2017年7月25日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
4+阅读 · 2014年12月31日
VIP会员
相关VIP内容
【ICML2022】Sharp-MAML:锐度感知的模型无关元学习
专知会员服务
17+阅读 · 2022年6月10日
专知会员服务
25+阅读 · 2021年7月31日
专知会员服务
44+阅读 · 2021年7月1日
相关资讯
【ICML2021】因果匹配领域泛化
专知
12+阅读 · 2021年8月12日
现代情感分析方法
算法与数学之美
14+阅读 · 2018年1月12日
CNN 反向传播算法推导
统计学习与视觉计算组
30+阅读 · 2017年12月29日
EKF常用于目标跟踪系统的扩展卡尔曼滤波器
无人机
10+阅读 · 2017年7月25日
相关基金
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
4+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员