南京邮电大学邓立新获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉南京邮电大学申请的专利基于改进相位谱补偿和全卷积神经网络的语音增强算法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN114242099B 。
龙图腾网通过国家知识产权局官网在2025-07-22发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202111534489.7,技术领域涉及:G10L21/0208;该发明授权基于改进相位谱补偿和全卷积神经网络的语音增强算法是由邓立新;徐琦设计研发完成,并于2021-12-15向国家知识产权局提交的专利申请。
本基于改进相位谱补偿和全卷积神经网络的语音增强算法在说明书摘要公布了:本发明提出了一种基于改进相位谱补偿和全卷积神经网络的语音增强算法,对训练集语音数据进行预处理获取带噪语音和纯净语音的特征数据;结合带噪语音和纯净语音的特征数据引入帧信噪比优化相位补偿算法的补偿因子计算公式,再利用改进公式进行相位补偿因子的计算;搭建全卷积神经网络模型,相位补偿因子联合纯净语音的对数功率谱作为全卷积神经网络的训练目标,进行网络模型训练;将测试语音输入训练好的模型得到对数功率谱的估计值和相位补偿函数;利用对数功率谱的估计值和相位补偿函数分别进行语音信号的幅度谱和相位谱重建得到最终的增强语音。本发明在提高算法消噪能力的同时,更好地保证了语音可懂度,从而提升了语音增强的整体效果。
本发明授权基于改进相位谱补偿和全卷积神经网络的语音增强算法在权利要求书中公布了:1.一种基于改进相位谱补偿和全卷积神经网络的语音增强算法,其特征在于,包括以下步骤: 步骤1、对训练集语音数据进行预处理,获取带噪语音和纯净语音的特征数据; 对带噪语音和纯净语音进行预处理并提取带噪语音和纯净语音的特征参数,具体操作如下: 步骤1-1、用yn来表示带噪语音信号且yn=dn+xn,其中,dn为噪声信号,xn为纯净信号;通过对yn的M个样本加窗wn,并进行M点的FFT,将带噪语音变换到频域,得到带噪语音的频谱Yl,k,其中l为帧数标记,k表示频率分量且k=0,1,2,…,M-1;同样的可得到纯净语音xn的频谱Xl,k和噪声信号dn的频谱Dl,k; 步骤1-2、将带噪语音的频谱Yl,k表示在极坐标上,分为幅度谱和相位谱,即 Yl,k=|Yl,k|ej∠Yl,k 其中,|Yl,k|为带噪语音yn的短时幅度谱,∠Yl,k为相位谱;同样的可以得到纯净语音xn的短时幅度谱|Xl,k|和噪声信号dn的短时幅度谱|Dl,k|; 步骤1-3、利用下式计算带噪语音的对数功率谱Sn和纯净语音的对数功率谱Tn, Sn=[loge|Yn,1|2,loge|Yn,2|2,…,loge|Yn,k|2,…,loge|Yn,M-1|2] Tn=[loge|Xn,1|2,loge|Xn,2|2,…,loge|Xn,k|2,…,loge|Xn,M-1|2] 其中,|Yn,1|2为带噪语音通过短时傅里叶变换得到的第n帧第1个频带的功率,|Yn,2|2为带噪语音通过短时傅里叶变换得到的第n帧第2个频带的功率,|Yn,k|2为带噪语音通过短时傅里叶变换得到的第n帧第k个频带的功率,|Yn,M-1|2为带噪语音通过短时傅里叶变换得到的第n帧第M-1个频带的功率;|Xn,1|2为纯净语音通过短时傅里叶变换得到的第n帧第1个频带的功率,|Xn,2|2为纯净语音通过短时傅里叶变换得到的第n帧第2个频带的功率,|Xn,k|2为纯净语音通过短时傅里叶变换得到的第n帧第k个频带的功率,|Xn,M-1|2为纯净语音通过短时傅里叶变换得到的第n帧第M-1个频带的功率; 步骤2、结合带噪语音和纯净语音的特征数据,引入帧信噪比优化相位补偿算法的补偿因子计算公式,再利用改进后的公式进行相位补偿因子的计算; 优化相位补偿函数,具体操作如下: 步骤2-1、传统的相位补偿函数表示为 其中,Λl,k为相位补偿函数,λ为相位补偿因子,为噪声的估计值,一般可用带噪语音的幅度谱|Yl,k|代替,λ为经验值,Ψk为反对称函数,用于对相位的修正,记为 Λl,k的作用如下式所示, YΛl,k=Yl,k+Λl,k 其中,YΛl,k是补偿后的频谱,通过对补偿后的频谱进行相位的提取得到下式所示的相位谱∠YΛl,k, ∠YΛl,k=argYΛl,k 将∠YΛl,k与带噪语音的幅度谱|Yl,k|相结合,得到增强语音的频谱,其表达式为 步骤2-2、引入帧信噪比对相位补偿函数进行优化,获得优化后的相位补偿函数,即 其中,c为经验值,SNRl为第l帧信噪比; 步骤2-3、为了简化后续神经网络的训练目标,将优化后的相位补偿函数简写为如下公式, Λl,k=Ψk×Ql,k 其中,Ql,k的计算公式表示为, 步骤3、搭建全卷积神经网络模型,相位补偿因子联合纯净语音的对数功率谱作为全卷积神经网络的训练目标,进行全卷积神经网络模型的训练; 步骤4、将测试语音输入训练好的模型,得到对数功率谱的估计值和相位补偿函数; 步骤5、利用对数功率谱的估计值和相位补偿函数分别进行语音信号的幅度谱和相位谱重建,得到最终的增强语音。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人南京邮电大学,其通讯地址为:210003 江苏省南京市栖霞区文苑路9号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。