西华大学卿朝进获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉西华大学申请的专利一种幅度相位混合特征交叉的语音增强方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN114530162B 。
龙图腾网通过国家知识产权局官网在2025-12-12发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202210071449.1,技术领域涉及:G10L21/0364;该发明授权一种幅度相位混合特征交叉的语音增强方法是由卿朝进;付小伟;唐书海;叶青;刘文慧;杨娜设计研发完成,并于2022-01-21向国家知识产权局提交的专利申请。
本一种幅度相位混合特征交叉的语音增强方法在说明书摘要公布了:本发明公开了一种基于幅度相位混合特征交叉的深度学习语音增强方法;根据收集到的含噪语音信号,得到增强型混合交叉特征;根据收集到的干净语音信号和与之对应的含噪语音信号,计算幅度相位降噪网络APNSN训练所用标签交叉压缩复数掩模;将增强型混合交叉特征输入到已训练的APNSN网络得到估计交叉压缩复数掩模;根据估计交叉压缩复数掩模和含噪语音信号的频谱,得到时域重构信号;本发明所采用方法,与单一特征方法相比,如幅度谱映射和基于幅度谱特征的时频掩蔽,本方法在相同模型大小的条件下能进一步提高语音质量和可懂度;在相对较小模型下能获得与单一特征方法相当的语音质量和可懂度。
本发明授权一种幅度相位混合特征交叉的语音增强方法在权利要求书中公布了:1.一种基于幅度相位混合特征交叉的深度学习语音增强方法,其特征在于,包括以下步骤: a根据长度为N的离散时域含噪语音信号y,得到增强型混合交叉特征O;包括: a1.将长度为N的离散时域含噪语音信号y变换到时频域后,得到含噪信号频谱 所述含噪信号频谱Y中,T=floorNN+1表示变换到时频域后的帧数,其中N为短时傅里叶变换STFT的帧移长度,floor·表示对元素向下取整; 所述含噪信号频谱Y中,F=NSTFT2+1表示含噪语音信号变换到时频域后的频点数,其中NSTFT为STFT变换的长度; a2.利用下式,根据含噪信号频谱Y,得到离散时域含噪语音信号y的对数功率谱和相位 其中,A[i,j]表示矩阵A第i行第j列的元素;Re·和Im·分别表示复数的实部和虚部;θ[i,j]表示矩阵θ第i行第j列的元素; a3.将A和θ的每列依次交叉排列得到混合交叉特征 其中,可表示为 其中,符号·T表示矩阵或矢量的取转置操作; a4.利用下式,根据混合交叉特征H,得到增强型混合交叉特征即 其中,T′=T-m+1,F′=2*m*F,m为特征扩张系数,表示为 其中,表示为, 其中,H[x,:]表示第x行所有列的元素; b根据长度为N的离散时域干净语音信号s和与之对应的离散时域含噪语音信号y,得到幅度相位降噪网络APNSN训练所用标签交叉压缩复数掩模L; c将增强型混合交叉特征O输入到已训练的幅度相位降噪网络APNSN得到估计交叉压缩复数掩模 d根据估计交叉压缩复数掩模得到时域重构信号
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人西华大学,其通讯地址为:611743 四川省成都市郫都区红光大道9999号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励