百度(美国)有限责任公司宋钊获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉百度(美国)有限责任公司申请的专利通过离散表示学习进行语音降噪获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN114267366B 。
龙图腾网通过国家知识产权局官网在2025-07-04发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202111039819.5,技术领域涉及:G10L21/0208;该发明授权通过离散表示学习进行语音降噪是由宋钊;平伟设计研发完成,并于2021-09-06向国家知识产权局提交的专利申请。
本通过离散表示学习进行语音降噪在说明书摘要公布了:本申请公开了一种用于训练降噪系统的计算机实现的方法。从综合的观点来看,本文开发和呈现的是用于音频降噪的新端到端方法的实施例。与在文本转语音系统中一样,实施例不是对输入信号中的噪声分量进行显式建模,而是直接从生成模型或声码器合成经降噪的音频。在一个或多个实施例中,为了生成用于自回归生成模型的语音内容,经由具有离散潜在表示的变分自编码器来进行学习。此外,在一个或多个实施例中,出于降噪的目的提出了新匹配损耗,当对应的潜在代码不同时,将其进行掩膜。与测试数据集上的其他方法相比,实施例实现了竞争性能,并且可以从头开始进行训练。
本发明授权通过离散表示学习进行语音降噪在权利要求书中公布了:1.一种用于训练降噪系统的计算机实现的方法,包括: 给定包括第一编码器、第二编码器、量化器和解码器的降噪系统,以及给定一组一个或多个干净-嘈杂音频对,其中每个干净-嘈杂音频对包括通过扬声器的干净音频内容以及通过扬声器的嘈杂音频内容: 对于每个干净音频,使用第一编码器生成干净音频的一个或多个连续潜在表示; 对于每个嘈杂音频,使用第二编码器生成嘈杂音频的一个或多个连续潜在表示; 对于干净音频的每个连续潜在表示,使用量化器生成对应的离散干净音频表示; 对于嘈杂音频的每个连续潜在表示,使用量化器生成对应的离散嘈杂音频表示; 对于每个干净-嘈杂音频对,将离散干净音频表示、干净音频和代表干净-嘈杂音频对的扬声器的说话者嵌入输入到解码器中以生成音频序列预测; 计算降噪系统的损耗,其中损耗包括潜在表示匹配损耗项,潜在表示匹配损耗项对于其中离散干净音频表示和离散嘈杂音频表示不同的时间步长,是基于对于所述时间步长的干净音频的连续潜在表示与嘈杂音频的连续潜在表示之间的距离量度的;以及 使用损耗更新降噪系统。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人百度(美国)有限责任公司,其通讯地址为:美国加利福尼亚州桑尼维尔波尔多道1195;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。