烟台大学郑阳获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉烟台大学申请的专利一种基于梯度智调子网池的人机交互语音感知方法及系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN121148370B 。
龙图腾网通过国家知识产权局官网在2026-02-24发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202511687467.2,技术领域涉及:G10L15/02;该发明授权一种基于梯度智调子网池的人机交互语音感知方法及系统是由郑阳;刘兆伟设计研发完成,并于2025-11-18向国家知识产权局提交的专利申请。
本一种基于梯度智调子网池的人机交互语音感知方法及系统在说明书摘要公布了:本发明涉及语音情感识别技术领域,尤其是涉及一种基于梯度智调子网池的人机交互语音感知方法及系统。方法包括:获取情感数据集;构建基于梯度智调子网池的人机交互语音感知模型,其中包括声学线索感知净化模块、分层式声学本质编码模块、梯度和谐化子网池模块、任务特异性特征萃取模块、焦点与置信度联合标定模块、自适应优化策略模块及实时推理与决策融合模块;利用构建的人机交互语音感知模型进行情感决策;输出决策结果。本发明通过声学线索感知净化模块与分层式声学本质编码,从根本上解决了真实环境噪声导致的情感信息失真与身份特征混淆的难题。
本发明授权一种基于梯度智调子网池的人机交互语音感知方法及系统在权利要求书中公布了:1.一种基于梯度智调子网池的人机交互语音感知方法,其特征在于,包括: 获取情感数据集; 构建基于梯度智调子网池的人机交互语音感知模型,其中包括: 声学线索感知净化模块,用于滤除干扰噪声;分层式声学本质编码模块,利用多尺度卷积前端和Transformer编码器提取声学与语义特征;梯度和谐化子网池模块,所述梯度和谐化子网池模块,包括引入梯度和谐化子网池,首先设定分层式声学本质编码模块的输出特征序列为:,其中为第帧的特征向量;为时间帧数;为特征维度,梯度和谐化子网池模块由个并行的、参数独立的子网和包含个任务,包括:情感识别SER、说话人识别SR、说话人性别识别GR以及语音识别ASR的专属门控网络构成;然后对于个任务中的任一任务及其门控,对中的每一帧单独计算其路由至个子网的偏好对数值:,其中是门控的可训练线性层;接着采用Top-k门控机制,选择中值最大的个索引,将个值进行Softmax计算得到稀疏路由权重,最后通过每个任务对应的稀疏权重,对所有K个子网的输出结果做加权求和,动态合成每个任务的输出特征;获取SER、SR、GR、ASR的辅助损失,并根据所述SER、SR、GR、ASR的辅助损失计算得到负载均衡损失值; 任务特异性特征萃取模块,计算任务SER、SR、GR以及ASR各自特征预测值; 焦点与置信度联合标定模块,利用SER、SR、GR预测值计算对应的焦点损失值;利用ASR预测值计算对应ASR的损失值;加权SER、SR、GR的焦点损失值、ASR损失值以及负载均衡损失值,得到基础联合损失值; 自适应优化策略模块,动态更新模型参数; 实时推理与多流决策融合模块,用于输出情感决策结果; 利用构建的人机交互语音感知模型进行情感决策; 输出决策结果。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人烟台大学,其通讯地址为:264003 山东省烟台市莱山区清泉路30号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励