平安科技(深圳)有限公司亢祖衡获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉平安科技(深圳)有限公司申请的专利语音情绪识别模型训练方法、装置、计算机设备及介质获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115101055B 。
龙图腾网通过国家知识产权局官网在2026-04-03发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202210897694.8,技术领域涉及:G10L15/02;该发明授权语音情绪识别模型训练方法、装置、计算机设备及介质是由亢祖衡;彭俊清;王健宗;肖京设计研发完成,并于2022-07-28向国家知识产权局提交的专利申请。
本语音情绪识别模型训练方法、装置、计算机设备及介质在说明书摘要公布了:本发明公开了一种语音情绪识别模型训练方法,获取音素语音特征、性别语音特征和情绪语音特征;音素语音特征关联音素语音标签,性别语音特征关联性别语音标签,情绪语音特征关联情绪坐标标签;输入至包含初始参数的预设识别模型中;获取预设识别模型的输出特征向量;基于第一特征向量,获取预测音素标签;基于输出特征向量,获取预测性别标签和预测情绪标签;根据预测音素标签、预测性别标签、预测情绪标签、音素语音标签、性别语音标签和情绪坐标标签,确定预测损失值;在预测损失值未达到预设收敛条件时,迭代更新预设识别模型中的初始参数,直至预测损失值达到收敛条件时,记录为语音情绪识别模型。本发明提高了语音情绪识别的准确率。
本发明授权语音情绪识别模型训练方法、装置、计算机设备及介质在权利要求书中公布了:1.一种语音情绪识别模型训练方法,其特征在于,包括: 获取音素语音特征、性别语音特征和情绪语音特征;所述音素语音特征关联音素语音标签,所述性别语音特征关联性别语音标签,所述情绪语音特征关联情绪坐标标签; 将所述音素语音特征、性别语音特征和情绪语音特征输入至包含初始参数的预设识别模型中;所述预设识别模型中包括卷积池化层和多个残差网络层;其中,卷积池化层包括第二卷积层和注意力池化层;残差网络层为Res2Net、双向RNN和SE-Block进行结合得到的; 获取所述预设识别模型的输出特征向量;所述输出特征向量是通过所述卷积池化层对语音特征向量进行向量处理得到;所述语音特征向量中包括第一个残差网络层输出的第一特征向量; 基于第一个残差网络层输出第一特征向量,获取预测音素标签;基于所述输出特征向量,获取预测性别标签和预测情绪标签; 根据所述预测音素标签、预测性别标签、预测情绪标签、音素语音标签、性别语音标签和情绪坐标标签,确定所述预设识别模型的预测损失值; 在所述预测损失值未达到预设的收敛条件时,迭代更新所述预设识别模型中的初始参数,直至所述预测损失值达到所述收敛条件时,将收敛之后的所述预设识别模型记录为语音情绪识别模型; 所述获取所述预设识别模型的输出特征向量,包括: 通过第一卷积层对所述音素语音特征、性别语音特征和情绪语音特征进行卷积处理,得到卷积特征向量; 将所述卷积特征向量输入至所述残差网络层中,并获取每一个所述残差网络层输出的残差特征向量;其中,将卷积特征向量通过1*1的卷积矩阵进行压缩处理,并通过3*3的卷积矩阵对各通道的权重值进行计算,以及通过1*1的卷积矩阵恢复到原来的维度,通过SE-Block层对卷积特征向量和各通道的权重值进行计算,得到残差特征向量; 通过第二卷积层对所有残差网络层输出的所述残差特征向量进行卷积处理,得到语音特征向量; 通过注意力池化层对所述语音特征向量进行向量处理,得到所述输出特征向量。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人平安科技(深圳)有限公司,其通讯地址为:518000 广东省深圳市福田区福田街道福安社区益田路5033号平安金融中心23楼;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励