In this paper, we introduce MotivNet, a generalizable facial emotion recognition model for robust real-world application. Current state-of-the-art FER models tend to have weak generalization when tested on diverse data, leading to deteriorated performance in the real world and hindering FER as a research domain. Though researchers have proposed complex architectures to address this generalization issue, they require training cross-domain to obtain generalizable results, which is inherently contradictory for real-world application. Our model, MotivNet, achieves competitive performance across datasets without cross-domain training by using Meta-Sapiens as a backbone. Sapiens is a human vision foundational model with state-of-the-art generalization in the real world through large-scale pretraining of a Masked Autoencoder. We propose MotivNet as an additional downstream task for Sapiens and define three criteria to evaluate MotivNet's viability as a Sapiens task: benchmark performance, model similarity, and data similarity. Throughout this paper, we describe the components of MotivNet, our training approach, and our results showing MotivNet is generalizable across domains. We demonstrate that MotivNet can be benchmarked against existing SOTA models and meets the listed criteria, validating MotivNet as a Sapiens downstream task, and making FER more incentivizing for in-the-wild application. The code is available at https://github.com/OSUPCVLab/EmotionFromFaceImages.


翻译:本文提出MotivNet,一种适用于鲁棒现实世界应用的通用化面部情感识别模型。当前最先进的面部情感识别模型在多样化数据测试中往往泛化能力较弱,导致其在真实场景中性能下降,并阻碍了该领域的研究进展。尽管研究者已提出复杂架构以应对此泛化问题,但这些方法需通过跨域训练来获得泛化结果,这与现实应用存在内在矛盾。我们的模型MotivNet以Meta-Sapiens为骨干网络,无需跨域训练即可在多个数据集上取得具有竞争力的性能。Sapiens是一种人类视觉基础模型,通过掩码自编码器的大规模预训练,在现实世界中实现了最先进的泛化能力。我们将MotivNet构建为Sapiens的附加下游任务,并定义三项标准来评估其作为Sapiens任务的可行性:基准性能、模型相似性与数据相似性。本文详细阐述了MotivNet的组成模块、训练方法以及证明其具备跨域泛化能力的实验结果。我们证明MotivNet在基准测试中可与现有最先进模型媲美,且满足所列标准,从而验证了其作为Sapiens下游任务的合理性,并为面部情感识别在开放场景的应用提供了更强驱动力。代码已开源:https://github.com/OSUPCVLab/EmotionFromFaceImages。

0
下载
关闭预览

相关内容

AAAI 2022 | ProtGNN:自解释图神经网络
专知
10+阅读 · 2022年2月28日
【NeurIPS2019】图变换网络:Graph Transformer Network
读论文Discriminative Deep Metric Learning for Face and KV
统计学习与视觉计算组
12+阅读 · 2018年4月6日
国家自然科学基金
17+阅读 · 2017年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
46+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
VIP会员
相关资讯
相关基金
国家自然科学基金
17+阅读 · 2017年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
46+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
Top
微信扫码咨询专知VIP会员