武汉轻工大学王恒获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉武汉轻工大学申请的专利基于注意力的复数卷积神经网络语音增强方法及系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115938377B 。
龙图腾网通过国家知识产权局官网在2026-01-02发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202211448140.6,技术领域涉及:G10L21/0208;该发明授权基于注意力的复数卷积神经网络语音增强方法及系统是由王恒;尤昕源;张普;郝森;汪骁虎设计研发完成,并于2022-11-18向国家知识产权局提交的专利申请。
本基于注意力的复数卷积神经网络语音增强方法及系统在说明书摘要公布了:本发明提供一种基于注意力的复数卷积神经网络语音增强方法及系统,其特征在于:针对带有背景噪音的语音进行降噪从而实现对语音的增强,包括使用通道时频注意力机制捕捉时频域的语音分布;使用门控时间卷积网络GTCN进行时间建模,从而减少网络的参数、提高网络的训练速度;使用亚像素卷积对实现对纯净语音的重构,避免反卷积时造成的棋盘伪影。本发明有效的提升了网络降噪效果,降低语音信号中的噪声影响,从而提高了语音的可懂度和质量。
本发明授权基于注意力的复数卷积神经网络语音增强方法及系统在权利要求书中公布了:1.一种基于注意力的复数卷积神经网络语音增强方法,其特征在于:针对带有背景噪音的语音进行降噪从而实现对语音的增强,包括使用通道时频注意力机制捕捉时频域的语音分布;使用门控时间卷积网络GTCN进行时间建模,从而减少网络的参数、提高网络的训练速度;使用亚像素卷积对实现对纯净语音的重构,避免反卷积时造成的棋盘伪影; 实现过程包括以下处理, 步骤1,对带噪语音与对应的纯净语音进行处理,获得带噪语音的实部和虚部,以及带噪语音对应纯净语音的实部和虚部; 步骤2,将带噪语音的实部和虚部输入基于通道时频注意力的复数卷积神经网络,对复数卷积神经网络进行训练,用复数卷积神经网络的输出与纯净语音的实部和虚部计算损失来更新网络的参数;所述基于通道时频注意力的复数卷积神经网络包括复数编码器模块、时间建模模块和复数解码器模块,复数编码器模块中设置通道时频注意力机制,实现结合通道、时间和频率的注意力机制; 所述复数编码器模块优选包括五层依次连接的复数卷积层,所述复数卷积层依次由门控线性单元、通道时频注意力机制、层归一化和ELU激活构成; 所述时间建模模块由门控时间卷积网络GTCN构成,其中包括二维卷积、Sigmoid激活和时间卷积网络TCN,从复数编码器模块输出的特征中提取语音信号的时序特征,通过门控时间卷积网络GTCN,从所述特征构建时间序列模型,保留更多的长期时频特征,减少网络的参数,提高网络的训练速度,支持在困难的嘈杂条件下跟踪说话人依赖的信息;所述门控时间卷积网络GTCN通过门控机制传递有用信息并遗忘无关信息,从而提高对时序信息的建模能力,使用时间卷积网络TCN保留更多的语音长期时频特征; 所述复数解码器模块由两个结构一样的子解码器模块组成,分别估计语音的实部和虚部频谱;所述子解码器模块分别包括五层依次连接的复数反卷积层,每个复数反卷积层依次由亚像素卷积、层归一化和ELU激活构成; 步骤3,重复步骤2,不断优化复数卷积神经网络,直到获得增强效果满足预设要求的复数卷积网络; 步骤4,将未训练的带噪语音进行处理获得实部和虚部,输入进训练后的复数卷积网络进行增强;将增强后的实部和虚部恢复成纯净语音。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人武汉轻工大学,其通讯地址为:430023 湖北省武汉市东西湖区常青花园学府南路68号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励