Document
拖动滑块完成拼图
个人中心

预订订单
服务订单
发布专利 发布成果 人才入驻 发布商标 发布需求

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 北京达佳互联信息技术有限公司许成林获国家专利权

北京达佳互联信息技术有限公司许成林获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉北京达佳互联信息技术有限公司申请的专利语音增强模型的训练方法和语音增强方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN114758668B

龙图腾网通过国家知识产权局官网在2025-07-04发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202210435868.9,技术领域涉及:G10L21/0208;该发明授权语音增强模型的训练方法和语音增强方法是由许成林;郑羲光;张旭;陈联武;任新蕾;张晨设计研发完成,并于2022-04-24向国家知识产权局提交的专利申请。

语音增强模型的训练方法和语音增强方法在说明书摘要公布了:本公开关于语音增强模型的训练方法和语音增强方法,包括:获取多个说话对象的训练样本;将每个说话对象的第一纯净语音信号样本输入语音表征提取器;将每个说话对象的语音表征输入分类器;将每个说话对象的语音表征和重叠语音带噪信号样本的幅度谱输入语音提取器,并根据预测的该说话对象的增强语音信号的幅度谱掩码确定预测的该说话对象的增强语音信号;根据每个说话对象对应的增强语音信号、第二纯净语音信号样本、标识预测结果以及标识标签,计算损失;通过损失调整语音提取器、语音表征提取器和分类器的参数,以对语音增强模型进行训练。这样,经过训练的语音增强模型可以从多个说话对象的语音信号中精准提取出指定说话对象的语音信号。

本发明授权语音增强模型的训练方法和语音增强方法在权利要求书中公布了:1.一种语音增强模型的训练方法,其特征在于,所述语音增强模型包含语音提取器、语音表征提取器和分类器,所述训练方法包括: 获取多个说话对象的训练样本,其中,每个说话对象的训练样本包括:该说话对象的第一纯净语音信号样本、第二纯净语音信号样本、重叠语音带噪信号样本和标识标签,其中,说话对象的重叠语音带噪信号样本是基于该说话对象的第二纯净语音信号样本叠加了至少一个其他说话对象的语音信号得到的; 将每个说话对象的第一纯净语音信号样本输入所述语音表征提取器,获得该说话对象的语音表征; 将每个说话对象的语音表征输入所述分类器,获得该说话对象的标识预测结果; 将每个说话对象的语音表征和重叠语音带噪信号样本的幅度谱输入所述语音提取器,获得预测的该说话对象的增强语音信号的幅度谱掩码,并根据预测的该说话对象的增强语音信号的幅度谱掩码确定预测的该说话对象的增强语音信号,其中,所述增强语音信号为从该说话对象的重叠语音带噪信号样本中提取得到的该说话对象的语音信号; 根据每个说话对象对应的增强语音信号、第二纯净语音信号样本、标识预测结果以及标识标签,计算损失; 通过所述损失调整所述语音提取器、所述语音表征提取器和所述分类器的参数,以对所述语音增强模型进行训练; 其中,所述根据每个说话对象对应的增强语音信号、第二纯净语音信号样本、标识预测结果以及标识标签,计算损失,包括: 根据每个说话对象对应的标识预测结果以及标识标签,计算第一损失; 根据每个说话对象对应的增强语音信号以及第二纯净语音信号样本,计算第二损失; 对所述第一损失和所述第二损失进行加权求和,获得所述损失; 其中,所述第二损失通过尺度不变的信号对失真比损失函数计算得到。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人北京达佳互联信息技术有限公司,其通讯地址为:100085 北京市海淀区上地西路6号1幢1层101D1-7;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。