网易(杭州)网络有限公司朱鹏程获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉网易(杭州)网络有限公司申请的专利语音转换模型的训练方法、语音转换方法、及其装置获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120148485B 。
龙图腾网通过国家知识产权局官网在2025-12-09发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510045796.0,技术领域涉及:G10L15/06;该发明授权语音转换模型的训练方法、语音转换方法、及其装置是由朱鹏程;姜月鹏;王平;毕梦霄;吕唐杰设计研发完成,并于2025-01-10向国家知识产权局提交的专利申请。
本语音转换模型的训练方法、语音转换方法、及其装置在说明书摘要公布了:本申请公开了一种语音转换模型的训练方法、语音转换方法、及其装置、电子设备、以及计算机可读存储介质。所述训练方法包括:获取多个音频训练数据,并提取第一特征训练数据和第二特征训练数据;获取音频训练数据对应的梅尔谱图,并获得梅尔谱图对应的掩码梅尔图片和噪声梅尔谱图;将音频训练数据对应的第一特征训练数据、第二特征训练数据、掩码梅尔谱图、以及噪声梅尔谱图输入待训练的语音转换模型,获得预测梅尔谱图;根据梅尔谱图和预测梅尔谱图,对待训练的语音转换模型进行模型参数调整,获得训练后的语音转换模型。该方法解决了现有技术存在的因无法兼顾音色相似度、噪声鲁棒性和表现力,导致语音转换效果不佳的技术问题。
本发明授权语音转换模型的训练方法、语音转换方法、及其装置在权利要求书中公布了:1.一种语音转换模型的训练方法,其特征在于,所述方法还包括: 获取多个音频训练数据,并从所述音频训练数据中提取第一特征训练数据和第二特征训练数据;其中,所述第一特征训练数据用于表征所述音频训练数据对应的内容特征,所述第二特征训练数据用于表征所述音频训练数据对应的全局特征; 获取所述音频训练数据对应的梅尔谱图,并对所述梅尔谱图进行局部掩码处理和加噪处理,获得所述梅尔谱图对应的掩码梅尔谱图和噪声梅尔谱图; 将所述音频训练数据对应的所述第一特征训练数据、所述第二特征训练数据、所述掩码梅尔谱图、以及所述噪声梅尔谱图输入待训练的语音转换模型,获得所述待训练的语音转换模型输出的预测梅尔谱图; 根据所述音频训练数据对应的所述梅尔谱图和所述预测梅尔谱图,对所述待训练的语音转换模型进行模型参数调整,获得训练后的语音转换模型; 其中,在所述将所述音频训练数据对应的所述第一特征训练数据、所述第二特征训练数据、所述掩码梅尔谱图、以及所述噪声梅尔谱图输入待训练的语音转换模型,获得所述待训练的语音转换模型输出的预测梅尔谱图的步骤之前,所述方法还包括: 对所述音频训练数据对应的所述第一特征训练数据和所述第二特征训练数据分别进行预设通道维度的降维处理,得到所述第一特征训练数据对应的第一表征训练数据、以及所述第二特征训练数据对应的第二表征训练数据; 根据所述音频训练数据对应的所述梅尔谱图的时序长度,将所述第一表征训练数据和所述第二表征训练数据填充至与所述梅尔谱图等长; 将填充后的第一表征训练数据、填充后的第二表征训练数据、所述掩码梅尔谱图、以及所述噪声梅尔谱图进行通道维度上的拼接,获得所述音频训练数据对应的拼接特征训练数据; 所述将所述音频训练数据对应的所述第一特征训练数据、所述第二特征训练数据、所述掩码梅尔谱图、以及所述噪声梅尔谱图输入待训练的语音转换模型,获得所述待训练的语音转换模型输出的预测梅尔谱图,包括: 将所述音频训练数据对应的所述拼接特征训练数据输入所述待训练的语音转换模型,获得所述待训练的语音转换模型输出的所述预测梅尔谱图。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人网易(杭州)网络有限公司,其通讯地址为:310052 浙江省杭州市滨江区长河街道网商路599号4幢7层;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励