Modern image editors can produce identity-preserving AIGC (IP-AIGC), where the same person appears with new attire, background, or lighting. The robustness and fairness of current detectors in this regime remain unclear, especially for under-represented populations. We present what we believe is the first systematic study of IP-AIGC detection for Indian and South-Asian faces, quantifying cross-generator generalization and intra-population performance. We assemble Indian-focused training splits from FairFD and HAV-DF, and construct two held-out IP-AIGC test sets (HIDF-img-ip-genai and HIDF-vid-ip-genai) using commercial web-UI generators (Gemini and ChatGPT) with identity-preserving prompts. We evaluate two state-of-the-art detectors (AIDE and Effort) under pretrained (PT) and fine-tuned (FT) regimes and report AUC, AP, EER, and accuracy. Fine-tuning yields strong in-domain gains (for example, Effort AUC 0.739 to 0.944 on HAV-DF-test; AIDE EER 0.484 to 0.259), but consistently degrades performance on held-out IP-AIGC for Indian cohorts (for example, AIDE AUC 0.923 to 0.563 on HIDF-img-ip-genai; Effort 0.740 to 0.533), which indicates overfitting to training-generator cues. On non-IP HIDF images, PT performance remains high, which suggests a specific brittleness to identity-preserving edits rather than a generic distribution shift. Our study establishes IP-AIGC-Indian as a challenging and practically relevant scenario and motivates representation-preserving adaptation and India-aware benchmark curation to close generalization gaps in AIGC detection.


翻译:现代图像编辑器能够生成身份保持型AI生成内容(IP-AIGC),即同一人物以新着装、背景或光照条件出现。当前检测器在此类场景下的鲁棒性与公平性尚不明确,尤其对于代表性不足的人群。我们开展了据信首个针对印度及南亚面孔的IP-AIGC检测系统性研究,量化跨生成器泛化能力与群体内性能。我们从FairFD和HAV-DF数据集中构建以印度面孔为主的训练集,并利用商用网页界面生成器(Gemini和ChatGPT)配合身份保持提示,构建了两个保留IP-AIGC测试集(HIDF-img-ip-genai和HIDF-vid-ip-genai)。我们在预训练(PT)与微调(FT)两种模式下评估了两种先进检测器(AIDE和Effort),并报告了AUC、AP、EER及准确率指标。微调虽带来显著的域内性能提升(例如Effort在HAV-DF-test上的AUC从0.739升至0.944;AIDE的EER从0.484降至0.259),但对印度群体的保留IP-AIGC测试集性能持续下降(例如AIDE在HIDF-img-ip-genai上的AUC从0.923降至0.563;Effort从0.740降至0.533),这表明模型过度拟合了训练生成器的特征线索。在非IP的HIDF图像上,预训练模型仍保持较高性能,说明这种脆弱性特指对身份保持编辑的敏感性,而非通用的分布偏移。本研究确立了IP-AIGC-印度场景作为具有挑战性且具实际意义的检测情境,并呼吁通过保持表征适应性的算法改进及纳入印度特征的基准数据集构建,以弥合AIGC检测领域的泛化差距。

0
下载
关闭预览

相关内容

图机器学习 2.2-2.4 Properties of Networks, Random Graph
图与推荐
10+阅读 · 2020年3月28日
iOS如何区分App和SDK内部crash
CocoaChina
11+阅读 · 2019年4月17日
国家自然科学基金
4+阅读 · 2017年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
46+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
VIP会员
相关基金
国家自然科学基金
4+阅读 · 2017年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
46+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员