Document
拖动滑块完成拼图
个人中心

预订订单
服务订单
发布专利 发布成果 人才入驻 发布商标 发布需求

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 天津中德应用技术大学;天津城建大学;天津滨海迅腾科技集团有限公司王新强获国家专利权

天津中德应用技术大学;天津城建大学;天津滨海迅腾科技集团有限公司王新强获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉天津中德应用技术大学;天津城建大学;天津滨海迅腾科技集团有限公司申请的专利一种基于多维信息感知策略的语音情感识别方法和系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120279950B

龙图腾网通过国家知识产权局官网在2025-09-05发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510741490.9,技术领域涉及:G10L25/63;该发明授权一种基于多维信息感知策略的语音情感识别方法和系统是由王新强;张龙超;沈燕宁;陈刚;徐均笑;李国燕设计研发完成,并于2025-06-05向国家知识产权局提交的专利申请。

一种基于多维信息感知策略的语音情感识别方法和系统在说明书摘要公布了:本发明提供了一种基于多维信息感知策略的语音情感识别方法和系统,涉及语音情感识别技术领域,包括:提取WavLM特征和MFCC特征;通过Transformer层、MDIP层、CDI层和卷积层构建出多维信息感知和跨维度交织模块;通过该多维信息感知和跨维度交织模块分别处理处理WavLM特征和MFCC特征获得第一特征图和第二特征图;将第一特征图和第二特征图输入至SENet中进行特征融合,通过全连接操作和批归一化操作输出融合特征;通过分类器对融合特征进行分类,以预测待识别语音的情感。本发明提出的多维信息感知和跨维度交织模块能够有效提升情感识别模型在多数据集、多情境下的准确性、鲁棒性与通用性。

本发明授权一种基于多维信息感知策略的语音情感识别方法和系统在权利要求书中公布了:1.一种基于多维信息感知策略的语音情感识别方法,其特征在于,包括: 提取WavLM特征:通过WavLM-Large模型对待识别语音进行特征提取,获得WavLM特征; 提取MFCC特征:通过音频特征提取工具对所述待识别语音进行梅尔频率倒谱系数提取,获得MFCC特征; 构建多维信息感知和跨维度交织模块:所述多维信息感知和跨维度交织模块包括依次连接的Transformer层、MDIP层、CDI层和卷积层;其中,所述Transformer层对所述WavLM特征或所述MFCC特征进行处理,以生成频率特征图和时间特征图;所述MDIP层通过频率多维信息感知操作获取频率特征并通过时间多维信息感知操作获取时间特征;所述CDI层以来自所述MDIP层的时间特征和频率特征作为输入,以特征交织的方式增强时间特征和频率特征的表示能力; 所述频率多维信息感知操作的计算过程具体包括: 在每个时间帧的频率维度上应用滑动窗口提取局部频域特征,从而选择特定的频率点,以捕捉频域中不同频带之间的情感相关性,其中,所述特定的频率点是指滑动窗口内所选频率点; 所述时间多维信息感知操作的计算过程具体包括: 在每个频率点上沿时间维度应用滑动窗口提取局部时间特征,以捕捉时间域中情感的瞬时变化以及情感变化间的依赖趋势; 处理WavLM特征:依次通过多层所述多维信息感知和跨维度交织模块处理所述WavLM特征,获得第一特征图; 处理MFCC特征:依次通过多层所述多维信息感知和跨维度交织模块处理所述MFCC特征,获得第二特征图; 特征融合:将所述第一特征图和所述第二特征图输入至SENet中进行特征融合,通过全连接操作和批归一化操作输出融合特征; 情感分类:通过分类器对所述融合特征进行分类,以预测所述待识别语音的情感。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人天津中德应用技术大学;天津城建大学;天津滨海迅腾科技集团有限公司,其通讯地址为:300000 天津市津南区天津海河教育园区雅深路2号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。