三峡大学张萌萌获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉三峡大学申请的专利一种融合OMLSA和TQWT的光纤麦克风单通道语音增强方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119785808B 。
龙图腾网通过国家知识产权局官网在2025-09-16发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411871991.0,技术领域涉及:G10L21/0208;该发明授权一种融合OMLSA和TQWT的光纤麦克风单通道语音增强方法是由张萌萌;冉昌艳;罗志会;刘冰倩;周琦;杜勇;张君强设计研发完成,并于2024-12-18向国家知识产权局提交的专利申请。
本一种融合OMLSA和TQWT的光纤麦克风单通道语音增强方法在说明书摘要公布了:一种融合OMLSA和TQWT的光纤麦克风单通道语音增强方法,对采集的语音信号首先进行分帧处理,对每一帧进行OMLSA语音增强,并使用分段信噪比为判决条件,决定是否需要进行TQWT去除残留噪声。利用重建误差选择TQWT分解所需参数Q因子和冗余量r的最佳值,保证对语音信号分解得到最适合的一组小波系数,并根据每个小波系数自适应选择阈值,使用基追踪对小波系数进行稀疏化,通过稀疏化的小波系数重构得到最终增强的语音信号。相较于只使用OMLSA进行去噪,本发明方法可在此基础上进一步有效抑制残余噪声,提升了语音增强效果。
本发明授权一种融合OMLSA和TQWT的光纤麦克风单通道语音增强方法在权利要求书中公布了:1.一种融合OMLSA和TQWT的光纤麦克风单通道语音增强方法,其特征在于包括以下步骤: 步骤1:设光纤麦克风检测的语音信号为yn,其中,n为采样点索引,,N为总采样点数; 步骤2:选择汉宁窗对语音信号yn分帧,得到时域信号yn,l,其中,l为帧索引,,L为总帧数; 步骤3:利用离散傅里叶变换,将时域信号yn,l转换为频域信号Yk,l,其中,k为频率索引,k=0,1,2,…,N-1; 步骤4:基于OMLSA算法对语音增强,增强后的频谱幅值由以下公式计算: ; 其中:G min为语音不存在时的增益函数;pk,l为频率k下第l帧语音存在的后验概率;G H1k,l为频率k下第l帧语音存在时的增益函数;表示频率k下第l帧语音不存在时,对|Yk,l|施加增益G min来抑制噪声,表示频率k下第l帧语音存在时,对|Yk,l|施加增益G H1k,l强调语音成分,符号|•|表示取绝对值; 步骤5:对所有帧的增强信号频谱幅值进行傅里叶反变换,并根据汉宁窗函数恢复得到经OMLSA算法增强后的语音信号x 1n; 步骤6:判断语音信号x 1n的分段信噪比segSNR是否满足如下条件: segSNR≥5dB; 若满足,则跳过步骤7、步骤8、步骤9,此时x 1n为最终的增强语音信号xn,否则,进行步骤7; 步骤7:对x 1n进行TQWT分解得到J+1个小波系数w{j},其中,J为最佳总分解层数,j为层数索引,1≤j≤J+1; 步骤8:采用基追踪对小波系数w{j}进行稀疏化,得到稀疏化的小波系数w 1{j}; 步骤9:对稀疏化的小波系数w 1{j}进行逆TQWT,得到最终的增强语音信号xn; 所述步骤5中,对所有帧的增强信号频谱幅值进行傅里叶反变换,其计算公式为: ; 其中:为第l帧语音的时域信号,n 1第l帧时域信号的采样点索引,,e为自然对数的底数,i 1为虚数单位; 并根据汉宁窗函数恢复得到经OMLSA算法增强后的语音信号x 1n,其具体步骤为: 对应用汉宁窗得到第l帧语音加窗后的时域信号: ; 其中:为汉宁窗公式,,cos为余弦三角函数;对按帧重叠相加得到x 1n,其计算公式为: ; 其中:汉宁窗重叠帧权重,其计算公式为: ; 所述步骤7中,对x 1nTQWT分解得到J+1个小波系数w{j},包括以下步骤: 步骤7.1:利用重建误差E求品质因子Q的最佳值Q opt和冗余度r的最佳值r opt; 步骤7.2:对x 1n进行酉离散傅里叶变换,得到X 1k,其公式为: ; 其中:X_1k为x 1n的离散傅里叶变换,初始化j=1; 步骤7.3:计算第j层的低通子带长度和高通子带长度: ; ; 其中:“round”表示四舍五入取整操作,,; 步骤7.4:计算第j层低通的通带长度、高通的通带长度、过渡带的长度: ; ; ; 步骤7.5:获取第j层低通子带序列和高通子带序列; 步骤7.6:对进行酉离散傅里叶反变换,得到TQWT分解的第j个小波系数w{j}: ; 其中:uDFTinv表示酉离散傅里叶反变换,其与离散傅里叶反变换的关系为: ; 其中:w_inv{j}为的离散傅里叶反变换; 步骤7.7:判断是否满足如下循环进行条件: jJ; 若满足,则j的值加1且重复步骤7.3~步骤7.6,否则进行步骤7.8; 步骤7.8:计算TQWT分解的第J+1个小波系数,表示第J层低通子带序列;至此分解的J+1个小波系数已全部求出; 所述步骤9中,对w 1{j}进行逆TQWT,包括以下步骤: 步骤9.1:求第J+1个稀疏化小波系数w 1{J+1}的酉离散傅里叶变换为,其中,k_2为其频率索引,0≤k_2≤,表示的长度;初始化j=J; 步骤9.2:计算稀疏化后第j层低通的通带长度、高通的通带长度、过渡带的长度分别为: ; ; ; 其中:为第j个稀疏化小波系数w 1{j}酉离散傅里叶变换的长度,为第j+1个稀疏化小波系数w 1{j+1}酉离散傅里叶变换的长度; 步骤9.3:计算第j层重构信号,0≤k 1≤,k 1表示第j层重构信号的频率索引;包括以下步骤: S9.3.1:对第j个稀疏化小波系数w 1{j}进行酉离散傅里叶变换为,k_1为其频率索引,0≤k_1≤; S9.3.2:由第j+1层重构的信号求第j层稀疏化的低通子带序列; ; 式中:表示第j层稀疏化的低通子带序列的初始值,表示第j+1层重构信号的初始值; ; 式中:表示第j层稀疏化的低通子带序列从频率1到频率的值,表示从频率1到频率的值; ; 式中:表示第j层稀疏化的低通子带序列从频率到频率的值;表示从频率+1到频率+的值;表示依次对取值1到执行θ运算; ; 式中:表示第j层稀疏化的低通子带序列从频率到频率的值; ; 式中:表示第j层稀疏化的低通子带序列在频率处的取值; ; 式中:表示表示第j层稀疏化的低通子带序列从频率到频率的值; ; 式中:表示第j层稀疏化的低通子带序列从频率到频率的值;表示从频率到频率的值, ; 式中:表示第j层稀疏化的低通子带序列从频率到频率的值;表示从频率到频率的值; S9.3.3:求第j层稀疏化的高通子带序列: ; 式中:表示第j层稀疏化的高通子带序列的初始值; ; 式中:表示第j层稀疏化的高通子带序列从频率1到频率的值; ; 式中:表示第j层稀疏化的高通子带序列从频率到频率的值;表示对w 1{j}进行酉离散傅里叶变换为从频率1到频率的值;表示依次对取值到1执行θ运算; ; 式中:表示第j层稀疏化的高通子带序列从频率到频率的值;表示从频率到频率的值; ; 式中:表示第j层稀疏化的高通子带序列在频率处的值;表示在处的值; ; 式中:表示第j层稀疏化的高通子带序列从频率到频率的值;表示从频率到频率的值; ; 式中:表示第j层稀疏化的高通子带序列从频率到频率的值;表示从频率到频率的值; ; 式中:表示第j层稀疏化的高通子带序列从频率到频率的值; S9.3.4:此时第j层重构信号; 步骤9.4:判断是否满足如下循环进行条件: j1; 若满足,则j的值减1且重复步骤9.2~步骤9.3,否则进行步骤9.5; 步骤9.5:对步骤9.4判断循环结束后最终的重构信号进行酉离散傅里叶反变换,得到最终的增强语言信号xn,xn=uDFTinvY 1k。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人三峡大学,其通讯地址为:443002 湖北省宜昌市大学路8号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。