东南大学郑文明获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉东南大学申请的专利基于深度直推式迁移网络的跨库语音情感识别方法及装置获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN114898777B 。
龙图腾网通过国家知识产权局官网在2025-10-28发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202210513096.6,技术领域涉及:G10L25/63;该发明授权基于深度直推式迁移网络的跨库语音情感识别方法及装置是由郑文明;赵焱;宗源;赵力;路成;连海伦设计研发完成,并于2022-05-12向国家知识产权局提交的专利申请。
本基于深度直推式迁移网络的跨库语音情感识别方法及装置在说明书摘要公布了:本发明公开了一种基于深度直推式迁移网络的跨库语音情感识别方法及装置,方法包括:1获取源语音情感数据库和目标语音情感数据库2将源数据库和目标数据库的情感音频处理成语谱图3建立深度回归神经网络4将源数据库和目标数据库的语谱图输入深度回归神经网络进行训练,将从网络得到的特征来计算源数据和目标数据的、不同尺度的最大均值差异,对神经网络进行微调5将待识别语音作为目标数据库中的语音数据,输入训练好的深度卷积神经网络,得到语音情感类型。本发明识别准确率更高。
本发明授权基于深度直推式迁移网络的跨库语音情感识别方法及装置在权利要求书中公布了:1.一种基于深度直推式迁移网络的跨库语音情感识别方法,其特征在于该方法包括: 1获取两个不同的语音情感数据库,分别为源数据库和目标数据库,源数据库中存储有情感语音音频和对应的情感类型标签,目标数据库中仅存储情感语音音频; 2将源数据库和目标数据库的情感语音音频处理成语谱图; 3建立深度回归神经网络; 4将源数据库的语谱图和对应的标签,目标数据库的语谱图和随机初始化的伪标签,作为样本同时输入深度回归神经网络,进行预训练;之后将获得的深度特征,再作为样本输入深度回归神经网络进行微调,完成训练; 5将待识别语音情感音频预处理成语谱图,并作为目标数据库中的样本输入训练好的深度回归神经网络,得到语音的情感类型; 步骤4包括: 4-1将源数据库的语谱图和对应的标签,目标数据库的语谱图和随机初始化的伪标签,作为样本同时输入深度回归神经网络,训练时采用的损失函数L为: 其中,n为源数据库样本编号,N为源数据库样本数目,m为目标数据库样本编号,M为目标数据库样本数目,j为语音情感类别编号,J为语音情感类别数目,为源数据库第n个样本的实际输出情感特征被划分为j的概率,为源数据库第n个样本的输出情感特征被划分为j的期望概率,为目标数据库第m个样本的实际输出情感特征被划分为j的概率,为目标数据库第m个样本在上一轮训练中的实际输出情感特征被划分为j的概率; 4-2将源数据库和目标数据库经过深度回归神经网络得到的深度特征作为样本输入与训练好的深度回归神经网络,进行微调整训练,训练时采用的损失函数Ltotal为: Ltotal=αLmmd+βL 其中,MMDXs,Yt代表源数据库和目标数据库样本在深度回归神经网络上输出的情感特征的最大均值差异MMD,Xs表示源数据库样本在深度回归神经网络输出的情感特征,Yt表示目标数据库样本在深度回归神经网络输出的情感特征,代表源数据库和目标数据库样本在深度回归神经网络上输出的、类别j的情感特征的最大均值差异MMD,表示源数据库样本在深度回归神经网络输出的、类别j的情感特征分布,表示目标数据库样本在深度回归神经网络输出的、类别j的情感特征,代表源数据库和目标数据库样本在深度回归神经网络输出的、正负性情感的情感特征的最大均值差异MMD,表示源数据库样本在深度回归神经网络输出的、正负性情感的情感特征,表示目标数据库样本在深度回归神经网络输出的、正负性情感的情感特征,MMD是在再生希尔伯特空间中两组数据的均值距离,α和β是通过训练得到的结合强度系数。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人东南大学,其通讯地址为:211102 江苏省南京市江宁区东南大学路2号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励