广州大有网络科技有限公司;西安电子科技大学广州研究院;西安电子科技大学梁雪峰获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉广州大有网络科技有限公司;西安电子科技大学广州研究院;西安电子科技大学申请的专利一种混合模态专家情感识别方法和系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119089259B 。
龙图腾网通过国家知识产权局官网在2025-09-26发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411051787.4,技术领域涉及:G06F18/241;该发明授权一种混合模态专家情感识别方法和系统是由梁雪峰;许文鑫;江河欣;刘习高设计研发完成,并于2024-08-01向国家知识产权局提交的专利申请。
本一种混合模态专家情感识别方法和系统在说明书摘要公布了:本发明公开了一种混合模态专家情感识别方法和系统,涉及情感识别技术领域,该方法包括:利用不同模态数据对应的预训练模型对待识别模态数据进行特征提取,得到待识别模态数据中模态数据对应的模态特征;其中,待识别模态数据包括音频模态数据、文本模态数据和视觉模态数据中的至少一种;利用训练完成的混合模态专家模型对模态特征进行情感识别,得到待识别模态数据的情感识别结果;其中,混合模态专家模型用于提取模态特征的单模态表征和联合表征,将单模态表征和联合表征动态融合后进行情感识别得到情感识别结果。本发明方法克服了只有一个模态数据可用时提取的表征的判别力不足的问题,提高了在多个模态缺失场景下的识别性能。
本发明授权一种混合模态专家情感识别方法和系统在权利要求书中公布了:1.一种混合模态专家情感识别方法,其特征在于,包括: 利用不同模态数据对应的预训练模型对待识别模态数据进行特征提取,得到所述待识别模态数据中模态数据对应的模态特征;其中,所述待识别模态数据包括音频模态数据、文本模态数据和视觉模态数据中的至少一种; 利用训练完成的混合模态专家模型对所述模态特征进行情感识别,得到所述待识别模态数据的情感识别结果;其中,所述混合模态专家模型用于提取所述模态特征的单模态表征和联合表征,将所述单模态表征和所述联合表征动态融合后进行情感识别得到所述情感识别结果; 所述混合模态专家模型包括单模态专家、软路由、拼接单元和分类器,其中, 所述单模态专家用于提取输入的所述模态特征的单模态表征和联合表征; 所述软路由用于根据所述模态特征的单模态表征和联合表征对应的权重进行动态融合,得到所述模态特征的融合模态表征; 所述拼接单元用于将所述模态特征的融合模态表征进行拼接; 所述分类器用于根据拼接后的融合模态表征进行情感识别得到所述情感识别结果; 所述单模态专家包括音频专家、文本专家和视觉专家,其中, 所述音频专家用于提取音频特征的音频单模态表征,提取文本特征的文本-音频联合表征,提取视觉特征的视觉-音频联合表征; 所述文本专家用于提取所述文本特征的文本单模态表征,提取所述音频特征的音频-文本联合表征,提取所述视觉特征的视觉-文本联合表征; 所述视觉专家用于提取所述视觉特征的视觉单模态表征,提取所述音频特征的音频-视觉联合表征,提取所述文本特征的文本-视觉联合表征; 当存在模态缺失场景时,在将所述模态特征的融合模态表征进行拼接之前,所述方法还包括: 对存在模态缺失的融合模态表征用0补位; 对于所述音频特征,其单模态表征和联合表征的权重由所述音频模态数据的模态得分集和经过归一化运算确定;所述模态得分集和由基于MLP的软路由使用所述音频特征计算得到;所述模态得分集和包括音频模态得分、音频-文本模态得分和音频-视觉模态得分。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人广州大有网络科技有限公司;西安电子科技大学广州研究院;西安电子科技大学,其通讯地址为:510610 广东省广州市天河区林和西路9号1917房;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励