当前位置 : 首页 > 专利喜报 > 苏州奇梦者科技有限公司李志获国家专利权

苏州奇梦者科技有限公司李志获国家专利权

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

龙图腾网获悉苏州奇梦者科技有限公司申请的专利基于麦克风阵列的多目标神经网络语音处理方法及装置获国家发明授权专利权，本发明授权专利权由国家知识产权局授予，授权公告号为：CN114708880B 。

龙图腾网通过国家知识产权局官网在2025-09-19发布的发明授权授权公告中获悉：该发明授权的专利申请号/专利号为：202210451728.0，技术领域涉及：G10L21/0208；该发明授权基于麦克风阵列的多目标神经网络语音处理方法及装置是由李志;李霄;丘四海;王欢良;张李设计研发完成，并于2022-04-24向国家知识产权局提交的专利申请。

本基于麦克风阵列的多目标神经网络语音处理方法及装置在说明书摘要公布了：本发明公开了一种基于麦克风阵列的多目标神经网络语音处理方法及装置，该方法将多通道录音数据和多通道回采数据输入RLS滤波器进行多通道线性回声消除，再采用滤波器的误差信号和估计回声信号的频域相关度来计算每个频点的残余回声能量；将误差信号和估计的残余回声信号声学特征输入残差神经网络，且多目标递进，使残差神经网络能够在较小的网络结构中快速的收敛；后置的降噪、去回声、去混响算法使用多通道维纳滤波器配合mask统一计算，这样复杂度低，且避免了单个算法依次处理过程中的语音损失。从而实现了让语音降噪、去回声、去混响的目标融合在一起，具有计算复杂度低，延时低实时性好，且语音质量高的特点，符合实际的使用需求。

本发明授权基于麦克风阵列的多目标神经网络语音处理方法及装置在权利要求书中公布了：1.一种基于麦克风阵列的多目标神经网络语音处理方法，其特征在于，包括：步骤100、使用短时傅立叶变换获取多通道录音的频域数据和多路立体声回采的频域数据；步骤200、将多通道录音的频域数据与多路立体声回采的频域数据送入RLS滤波器中得到误差信号和回声估计信号，计算二者的频域相关度作为回声信号的泄漏系数，再乘以误差信号得到估计的各频点的残余回声信号；步骤300、提取误差信号和残余回声信号的BFCC特征输入多目标神经网络，获取融合的降噪、去回声、去混响的语音能量掩码；步骤400、将语音能量掩码通过波束形成滤波器滤波后，反变换到时域，得到干净的时域音频，所述波束形成滤波器为多通道维纳滤波；所述步骤200中，RLS线性滤波器的输出为； Lstyn,f＝WHn-1,fXn,f； En,f＝Yn,f-Lstyn,f； Wn,f＝Wn-1,f+kn,fEHn,f； kn,f＝Pn-1,fXn,f1+XHn,fPn-1,fXn,f；其中，X为多通道回采数据的频域组成的向量；W是RLS滤波器向量；E是误差信号；Lsty是回声估计信号；Y是近端语音信号；R是回采各频点上的协方差矩阵；P是R的逆矩阵；k是滤波器W的更新系数；n是帧数；f是频率点；步骤400中的所述波束形成滤波器采用如下公式计算： Hf＝Rssf+u*Rnnf-1Rssfe1； Rssn,f＝λ*Rssn-1,f+1-λ*maskn,fXn,fXHn,fmaskHn,f；其中，H是波束形成滤波器的系数；Rss是估计目标语音的协方差矩阵；Rnn是估计非目标信号的协方差矩阵；u是语音保真度系数，范围是0-1；e1是向量1；0；...；0；λ是协方差矩阵更新系数，范围是0-1；mask是神经网络估计的目标语音的掩蔽系数；X是原始的录音数据信号；n是帧数；f是频率点；各个频点的语音及噪声协方差矩阵采用学习率不断迭代的方式进行计算，并实时计算更新波束形成滤波器。

如需购买、转让、实施、许可或投资类似专利技术，可联系本专利的申请人或专利权人苏州奇梦者科技有限公司，其通讯地址为：215024 江苏省苏州市工业园区若水路388号E1905；或者联系龙图腾网官方客服，联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

请提出您的宝贵建议，有机会获取IP积分或其他奖励

苏州奇梦者科技有限公司李志获国家专利权

热门推荐

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务