We study the estimation problem for concurrent programs: given a bounded program $P$, estimate the number of Mazurkiewicz trace-equivalence classes induced by its interleavings. This quantity informs two practical questions for enumeration-based model checking: how long a model checking run is likely to take, and what fraction of the search space has been covered so far. We first show the counting problem is #P-hard even for restricted programs and, unless $P=NP$, inapproximable within any subexponential factor, ruling out efficient exact or randomized approximation algorithms. We give a Monte Carlo approach to obtain a poly-time unbiased estimator: we convert a stateless optimal DPOR algorithm into an unbiased estimator by viewing its exploration as a bounded-depth, bounded-width tree whose leaves are the maximal Mazurkiewicz traces. A classical estimator by Knuth, when run on this tree, yields an unbiased estimate. To control the variance, we apply stochastic enumeration by maintaining a small population of partial paths per depth whose evolution is coupled. We have implemented our estimator in the JMC model checker and evaluated it on shared-memory benchmarks. With modest budgets, our estimator yields stable estimates, typically within a 20% band, within a few hundred trials, even when the state space has $10^5$--$10^6$ classes. We also show how the same machinery estimates model-checking cost by weighting all explored graphs, not only complete traces. Our algorithms provide the first provable poly-time unbiased estimators for counting traces, a problem of considerable importance when allocating model checking resources.


翻译:我们研究并发程序的估计问题:给定一个有界程序$P$,估计其交错执行所诱导的Mazurkiewicz迹等价类的数量。这一数量为基于枚举的模型检测提供了两个实际问题的信息:模型检测运行可能持续多长时间,以及搜索空间目前已被覆盖的比例。我们首先证明,即使对于受限程序,该计数问题也是#P-难的,并且除非$P=NP$,否则无法在任意次指数因子内近似,从而排除了高效精确或随机近似算法的可能性。我们提出一种蒙特卡洛方法来获得多项式时间的无偏估计器:通过将一种无状态最优DPOR算法的探索过程视为一棵有界深度、有界宽度的树(其叶子节点为最大Mazurkiewicz迹),将其转换为无偏估计器。在此树上运行Knuth提出的经典估计器,可得到一个无偏估计。为控制方差,我们应用随机枚举技术,通过维护每个深度上一小部分具有耦合演化关系的部分路径集合来实现。我们已在JMC模型检测器中实现了该估计器,并在共享内存基准测试上进行了评估。在适中的计算预算下,即使状态空间包含$10^5$--$10^6$个等价类,我们的估计器也能在数百次试验内产生稳定的估计结果,通常误差范围在20%以内。我们还展示了如何通过加权所有已探索的图(而不仅仅是完整迹)来使用同一机制估计模型检测成本。我们的算法为迹计数问题提供了首个可证明的多项式时间无偏估计器,该问题在分配模型检测资源时具有相当的重要性。

0
下载
关闭预览

相关内容

UnHiPPO:面向不确定性的状态空间模型初始化方法
专知会员服务
11+阅读 · 2025年6月6日
【ICML2024】基于正则化的持续学习的统计理论
专知会员服务
21+阅读 · 2024年6月11日
【ICLR2022】GNN-LM基于全局信息的图神经网络语义理解模型
NeurIPS 2021 | 寻找用于变分布泛化的隐式因果因子
专知会员服务
17+阅读 · 2021年12月7日
【CVPR2021】跨模态检索的概率嵌入
专知
17+阅读 · 2021年3月2日
图节点嵌入(Node Embeddings)概述,9页pdf
专知
15+阅读 · 2020年8月22日
【NeurIPS2019】图变换网络:Graph Transformer Network
国家自然科学基金
0+阅读 · 2017年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
Arxiv
0+阅读 · 2025年12月29日
VIP会员
相关VIP内容
相关基金
国家自然科学基金
0+阅读 · 2017年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员