Static Code Analysis (SCA) tools, while invaluable for identifying potential coding problems, functional bugs, or vulnerabilities, often generate an overwhelming number of warnings, many of which are non-actionable. This overload of alerts leads to ``alert fatigue'', a phenomenon where developers become desensitized to warnings, potentially overlooking critical issues and ultimately hindering productivity and code quality. Analyzing these warnings and training machine learning models to identify and filter them requires substantial datasets, which are currently scarce, particularly for Java. This scarcity impedes efforts to improve the accuracy and usability of SCA tools and mitigate the effects of alert fatigue. In this paper, we address this gap by introducing a novel methodology for collecting and categorizing SCA warnings, effectively distinguishing actionable from non-actionable ones. We further leverage this methodology to generate a large-scale dataset of over 1 million entries of Java source code warnings, named NASCAR: (Non-)Actionable Static Code Analysis Reports. To facilitate follow-up research in this domain, we make both the dataset and the tools used to generate it publicly available.


翻译:静态代码分析(SCA)工具在识别潜在编码问题、功能缺陷或安全漏洞方面具有重要价值,但通常会产生数量庞大的警告信息,其中许多属于非可操作警告。这种警报过载现象会导致‘警报疲劳’,即开发人员对警告逐渐麻木,可能忽略关键问题,最终影响开发效率和代码质量。分析这些警告并训练机器学习模型以识别和筛选它们需要大规模数据集,而当前此类数据尤为稀缺,特别是在Java领域。这种稀缺性阻碍了提升SCA工具准确性与可用性、缓解警报疲劳影响的努力。本文通过引入一种新颖的SCA警告收集与分类方法来解决这一缺口,该方法能有效区分可操作与非可操作警告。我们进一步运用该方法构建了包含超过100万条Java源代码警告的大规模数据集,命名为NASCAR:(非)可操作静态代码分析报告。为促进该领域的后续研究,我们将数据集及其生成工具均公开提供。

0
下载
关闭预览

相关内容

专知会员服务
30+阅读 · 2020年9月18日
Python图像处理,366页pdf,Image Operators Image Processing in Python
NAACL 2019 | 一种考虑缓和KL消失的简单VAE训练方法
PaperWeekly
20+阅读 · 2019年4月24日
LibRec 每周算法:LDA主题模型
LibRec智能推荐
29+阅读 · 2017年12月4日
国家自然科学基金
17+阅读 · 2017年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2014年12月31日
国家自然科学基金
10+阅读 · 2014年12月31日
VIP会员
相关基金
国家自然科学基金
17+阅读 · 2017年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2014年12月31日
国家自然科学基金
10+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员