Document forgery poses a growing threat to legal, economic, and governmental processes, requiring increasingly sophisticated verification mechanisms. One approach involves the use of plausibility checks, rule-based procedures that assess the correctness and internal consistency of data, to detect anomalies or signs of manipulation. Although these verification procedures are essential for ensuring data integrity, existing plausibility checks are manually implemented by software engineers, which is time-consuming. Recent advances in code generation with large language models (LLMs) offer new potential for automating and scaling the generation of these checks. However, adapting LLMs to the specific requirements of an unknown domain remains a significant challenge. This work investigates the extent to which LLMs, adapted on domain-specific code and data through different fine-tuning strategies, can generate rule-based plausibility checks for forgery detection on constrained hardware resources. We fine-tune open-source LLMs, Llama 3.1 8B and OpenCoder 8B, on structured datasets derived from real-world application scenarios and evaluate the generated plausibility checks on previously unseen forgery patterns. The results demonstrate that the models are capable of generating executable and effective verification procedures. This also highlights the potential of LLMs as scalable tools to support human decision-making in security-sensitive contexts where comprehensibility is required.


翻译:文档伪造对法律、经济和政府流程构成日益严重的威胁,需要日益复杂的验证机制。一种方法涉及使用合理性检查——一种基于规则的、评估数据正确性和内部一致性的程序——来检测异常或篡改迹象。尽管这些验证程序对于确保数据完整性至关重要,但现有的合理性检查由软件工程师手动实现,耗时费力。近期利用大型语言模型(LLMs)进行代码生成的技术进展,为自动化生成和扩展这些检查提供了新的潜力。然而,使LLMs适应未知领域的具体要求仍然是一个重大挑战。本研究探讨了通过不同微调策略在领域特定代码和数据上适配的LLMs,能在多大程度上为受限硬件资源生成用于伪造检测的基于规则的合理性检查。我们在源自真实应用场景的结构化数据集上对开源LLMs(Llama 3.1 8B和OpenCoder 8B)进行微调,并在先前未见过的伪造模式上评估生成的合理性检查。结果表明,这些模型能够生成可执行且有效的验证程序。这同时凸显了LLMs作为可扩展工具的潜力,可在需要可理解性的安全敏感场景中支持人类决策。

0
下载
关闭预览

相关内容

Python图像处理,366页pdf,Image Operators Image Processing in Python
国家自然科学基金
17+阅读 · 2017年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
VIP会员
相关基金
国家自然科学基金
17+阅读 · 2017年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
Top
微信扫码咨询专知VIP会员