专利内容由知识产权出版社提供
专利名称:一种基于对抗学习的端到端的跨语言语音情感识别
方法
专利类型:发明专利发明人:吴志勇,代东洋申请号:CN201910731716.1申请日:20190808公开号:CN1103186A公开日:20191022
摘要:本发明提供一种基于对抗学习的端到端的跨语言语音情感识别方法,包括:构建包括特征提取器、情感分类器和语言分类器的情感识别模型;接收原始数据对所述情感识别模型进行训练并在训练过程中使用梯度翻转层;利用训练好的所述情感识别模型预测源语言语音或目标语言语音的情感。通过构建包括特征提取器、情感分类器和语言分类器的情感识别模型,直接接受语音波形或者语谱图作为输入,不再需要其他数据预处理工作,免除了特征工程的工作;模型训练时采用梯度反转层以促进特征提取器提取语言无关的信息,适用于模型训练时一种语言的语音数据有大量的情感标签而其他语言的语音数据没有足够情感标签甚至没有情感标签的情况。
申请人:清华大学深圳研究生院
地址:518055 广东省深圳市南山区西丽大学城清华校区
国籍:CN
代理机构:深圳新创友知识产权代理有限公司
代理人:江耀纯
更多信息请下载全文后查看