基于BAVED数据集的阿拉伯言语情感认同雇用Wav2vec2.0和HuBERT (Arabic Speech Emotion Recognition Employing Wav2vec2.0 and HuBERT Based on BAVED Dataset)

Recently, there have been tremendous research outcomes in the fields of speech recognition and natural language processing. This is due to the well-developed multi-layers deep learning paradigms such as wav2vec2.0, Wav2vecU, WavBERT, and HuBERT that provide better representation learning and high information capturing. Such paradigms run on hundreds of unlabeled data, then fine-tuned on a small dataset for specific tasks. This paper introduces a deep learning constructed emotional recognition model for Arabic speech dialogues. The developed model employs the state of the art audio representations include wav2vec2.0 and HuBERT. The experiment and performance results of our model overcome the previous known outcomes.

翻译：最近,在语音识别和自然语言处理领域取得了巨大的研究成果,这归功于发展完善的多层深层学习模式,如wav2vec2.0、Wav2vecU、WavBERT和HuBERT,这些模式提供了更好的代表性学习和高信息捕捉。这些模式以数百个未贴标签的数据运行,然后为具体任务对一个小数据集进行微调。本文为阿拉伯语语音对话引入了一种深层学习构建的情感识别模式。所开发的模式采用了最新的声音表达方式,包括 wav2vec2.0和HuBERT。我们模型的实验和绩效结果克服了先前已知的结果。

相关内容

MoDELS

关注 43

ACM/IEEE第23届模型驱动工程语言和系统国际会议，是模型驱动软件和系统工程的首要会议系列，由ACM-SIGSOFT和IEEE-TCSE支持组织。自1998年以来，模型涵盖了建模的各个方面，从语言和方法到工具和应用程序。模特的参加者来自不同的背景，包括研究人员、学者、工程师和工业专业人士。MODELS 2019是一个论坛，参与者可以围绕建模和模型驱动的软件和系统交流前沿研究成果和创新实践经验。今年的版本将为建模社区提供进一步推进建模基础的机会，并在网络物理系统、嵌入式系统、社会技术系统、云计算、大数据、机器学习、安全、开源等新兴领域提出建模的创新应用以及可持续性。官网链接：http://www.modelsconference.org/