平安科技(深圳)有限公司孙奥兰获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉平安科技(深圳)有限公司申请的专利情感语音合成模型的训练方法、装置、设备及存储介质获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119649793B 。
龙图腾网通过国家知识产权局官网在2025-11-11发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411758303.X,技术领域涉及:G10L13/04;该发明授权情感语音合成模型的训练方法、装置、设备及存储介质是由孙奥兰;王健宗;程宁设计研发完成,并于2024-12-02向国家知识产权局提交的专利申请。
本情感语音合成模型的训练方法、装置、设备及存储介质在说明书摘要公布了:本发明涉及人工智能技术领域,公开了一种情感语音合成模型的训练方法、装置、设备及存储介质,可应用于金融、保险、医疗等业务的智能语音对话场景中。本发明通过选定预训练语音合成模型的至少一个层作为目标层,并为目标层加载VB‑LoRA微调模块,再利用情感语音数据进行微调,使得模型实现了情感语音合成和输出,模型在训练阶段不加入情感信息,只在微调过程中加入情感信息,从而可以通过加入不同情感类别的情感信息进行微调,赋予模型不同情感类别的表达能力,增强了模型的可扩展性和灵活性;而且,在微调时,只调整加载了VB‑LoRA微调模块的目标层的参数,无需对整个模型进行全参数微调,降低模型微调的工作量,降低了计算成本。
本发明授权情感语音合成模型的训练方法、装置、设备及存储介质在权利要求书中公布了:1.一种情感语音合成模型的训练方法,其特征在于,包括: 获取预训练语音合成模型; 选择预训练语音合成模型的至少一个层作为目标层,并为目标层加载VB-LoRA微调模块; 获取情感语音数据,并基于情感语音数据对所述目标层的参数进行微调,得到训练好的情感语音合成模型,其中,情感语音数据包括情感文本、情感语音、情感嵌入数据、情感类别数据,情感文本、情感语音、情感嵌入数据、情感类别数据一一对应; 所述基于情感语音数据对所述目标层的参数进行微调,包括: 冻结预训练语音合成模型的参数,并初始化所述VB-LoRA微调模块的参数; 基于所述情感语音数据对所述目标层进行前向传播计算,得到所述目标层的输出; 基于所述目标层的输出计算模型损失; 根据模型损失进行反向传播更新所述VB-LoRA微调模块的参数; 所述目标层的输出包括预测情感语音、预测情感嵌入数据、预测情感类别数据,所述基于所述目标层的输出计算模型损失,包括: 根据所述情感语音数据中第i个样本的预测情感语音及对应样本中的情感语音,计算重建损失; 根据所述情感语音数据中第i个样本的预测情感嵌入数据及对应样本中的情感嵌入数据,计算情感嵌入损失; 根据所述情感语音数据中第i个样本的预测情感类别数据及对应样本中的情感类别数据,计算情感分类损失; 基于重建损失、情感嵌入损失以及情感分类损失计算模型损失。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人平安科技(深圳)有限公司,其通讯地址为:518000 广东省深圳市福田区福田街道福安社区益田路5033号平安金融中心23楼;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励