The rapid development of Artificial Intelligence Generated Content (AIGC) techniques has enabled the creation of high-quality synthetic content, but it also raises significant security concerns. Current detection methods face two major limitations: (1) the lack of multidimensional explainable datasets for generated images and videos. Existing open-source datasets (e.g., WildFake, GenVideo) rely on oversimplified binary annotations, which restrict the explainability and trustworthiness of trained detectors. (2) Prior MLLM-based forgery detectors (e.g., FakeVLM) exhibit insufficiently fine-grained interpretability in their step-by-step reasoning, which hinders reliable localization and explanation. To address these challenges, we introduce Ivy-Fake, the first large-scale multimodal benchmark for explainable AIGC detection. It consists of over 106K richly annotated training samples (images and videos) and 5,000 manually verified evaluation examples, sourced from multiple generative models and real world datasets through a carefully designed pipeline to ensure both diversity and quality. Furthermore, we propose Ivy-xDetector, a reinforcement learning model based on Group Relative Policy Optimization (GRPO), capable of producing explainable reasoning chains and achieving robust performance across multiple synthetic content detection benchmarks. Extensive experiments demonstrate the superiority of our dataset and confirm the effectiveness of our approach. Notably, our method improves performance on GenImage from 86.88% to 96.32%, surpassing prior state-of-the-art methods by a clear margin.


翻译:人工智能生成内容(AIGC)技术的快速发展使得高质量合成内容的创建成为可能,但也引发了重大的安全担忧。当前检测方法面临两大局限:(1)缺乏针对生成图像和视频的多维可解释数据集。现有开源数据集(如WildFake、GenVideo)依赖于过度简化的二元标注,这限制了训练检测器的可解释性与可信度。(2)先前基于MLLM的伪造检测器(如FakeVLM)在其逐步推理中表现出不够细粒度的可解释性,这阻碍了可靠的定位与解释。为应对这些挑战,我们提出了Ivy-Fake,这是首个用于可解释AIGC检测的大规模多模态基准。它包含超过106K个丰富标注的训练样本(图像和视频)以及5,000个手动验证的评估示例,这些数据通过精心设计的流程从多个生成模型和真实世界数据集中获取,以确保多样性与质量。此外,我们提出了Ivy-xDetector,这是一个基于组相对策略优化(GRPO)的强化学习模型,能够生成可解释的推理链,并在多个合成内容检测基准上实现鲁棒性能。大量实验证明了我们数据集的优越性,并证实了我们方法的有效性。值得注意的是,我们的方法将GenImage上的性能从86.88%提升至96.32%,以明显优势超越了先前的最先进方法。

0
下载
关闭预览

相关内容

【CVPR2024】VidLA: 大规模视频-语言对齐
专知会员服务
20+阅读 · 2024年3月31日
使用 Keras Tuner 调节超参数
TensorFlow
15+阅读 · 2020年2月6日
iOS如何区分App和SDK内部crash
CocoaChina
11+阅读 · 2019年4月17日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
VIP会员
相关基金
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员