武汉大学张海剑获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉武汉大学申请的专利一种基于多参考线索融合的目标语音提取方法及装置获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119229875B 。
龙图腾网通过国家知识产权局官网在2025-09-09发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411235333.2,技术领域涉及:G10L17/02;该发明授权一种基于多参考线索融合的目标语音提取方法及装置是由张海剑;周雨娆;陈佳佳;左世玉;吴思瑾设计研发完成,并于2024-09-04向国家知识产权局提交的专利申请。
本一种基于多参考线索融合的目标语音提取方法及装置在说明书摘要公布了:本发明公开一种基于多参考线索融合的目标语音提取方法,包括:将待提取的多通道混合语音通过特征提取模块,计算混合语音的复数谱和空间特征,得到混合语音特征图;将目标说话人的方位信息和参考语音通过嵌入特征提取模块,结合方向特征和声纹特征,得到目标说话人的嵌入特征;将混合语音特征图和目标说话人的嵌入特征输入基于双路径Fastformer神经网络的主提取网络,得到待提取语音的高维特征表示;将高维特征表示通过掩码估计模块转化为估计分离语音的复数掩码,将掩码作用于混合语音信号的复数谱;通过逆短时傅里叶变换重构估计提取语音的时域波形;将提取的目标说话人语音输入对比学习模块,使得目标说话人缺席的混合语音也能输出正确的提取语音。
本发明授权一种基于多参考线索融合的目标语音提取方法及装置在权利要求书中公布了:1.一种基于多参考线索融合的目标语音提取方法,其特征在于,包括: 将待提取的多通道混合语音通过特征提取模块,计算混合语音的复数谱和空间特征,并得到混合语音特征图; 将目标说话人的方位信息和参考语音通过嵌入特征提取模块,结合方向特征和声纹特征,得到目标说话人的嵌入特征; 将混合语音特征图和目标说话人的嵌入特征输入基于双路径Fastformer神经网络的主提取网络,输出待提取语音的高维特征表示; 将输出的高维特征表示通过掩码估计模块,将其转化为估计分离语音的复数掩码,并将掩码作用于混合语音信号的复数谱; 通过逆短时傅里叶变换重构估计提取语音的时域波形; 将提取的目标说话人语音输入对比学习模块,使得目标说话人缺席的混合语音也能输出正确的提取语音。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人武汉大学,其通讯地址为:430072 湖北省武汉市武昌区八一路299号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励