支付宝(杭州)信息技术有限公司周佳依获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉支付宝(杭州)信息技术有限公司申请的专利音色克隆系统的微调方法及装置、音色克隆方法及装置获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120148471B 。
龙图腾网通过国家知识产权局官网在2026-01-06发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510353433.3,技术领域涉及:G10L13/027;该发明授权音色克隆系统的微调方法及装置、音色克隆方法及装置是由周佳依设计研发完成,并于2025-03-24向国家知识产权局提交的专利申请。
本音色克隆系统的微调方法及装置、音色克隆方法及装置在说明书摘要公布了:本说明书实施例披露一种音色克隆系统的微调方法及装置,其中音色克隆系统是对VITS模型进行改造而得到,所述改造包括增加风格编码器。该方法包括:先获取微调样本,其中包括目标说话人的真实语音和对应的音素序列;再将该语音的第一频谱和其频谱切片分别输入风格编码器,得到第一和第二音色嵌入;接着,基于两个音色嵌入的相似度确定第一损失项;再将第二音色嵌入和隐变量的第一融合结果输入解码器,得到解码结果,其中隐变量是利用后验编码器处理第一频谱而得到;之后,基于解码结果和真实语音确定第二损失项;再通过利用音色克隆系统中相较VITS模型未被改造的模型组件处理隐变量和音素序列,确定其他损失项;其中各损失项被用于音色克隆系统的微调。
本发明授权音色克隆系统的微调方法及装置、音色克隆方法及装置在权利要求书中公布了:1.一种对预训练的音色克隆系统进行微调的方法,其中音色克隆系统是对VITS模型进行改造而得到,所述改造包括增加风格编码器;所述方法包括: 获取微调样本,其中包括目标说话人的真实语音和该语音所对应文本的音素序列; 将所述真实语音的第一频谱,以及对所述第一频谱进行切片而得到的第二频谱分别输入所述风格编码器,对应得到真实语音的第一音色嵌入和参考语音的第二音色嵌入; 基于第一音色嵌入和第二音色嵌入的相似度,确定第一损失项; 将所述第二音色嵌入和隐变量的第一融合结果输入所述音色克隆系统中的解码器,得到预测解码结果;所述隐变量是利用所述音色克隆系统中的后验编码器处理所述第一频谱而得到; 基于所述预测解码结果和所述真实语音,确定第二损失项; 通过利用所述音色克隆系统中相较VITS模型未被改造的模型组件处理所述隐变量和音素序列,确定其他损失项; 基于确定出的各个损失项,对所述音色克隆系统进行微调。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人支付宝(杭州)信息技术有限公司,其通讯地址为:310000 浙江省杭州市西湖区西溪路543号-569号(单号连续)1幢2号楼5层518室;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励