云知声智能科技股份有限公司周瑜秋获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉云知声智能科技股份有限公司申请的专利一种歌声合成模型的训练方法、装置、设备和存储介质获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115881086B 。
龙图腾网通过国家知识产权局官网在2025-06-24发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202211586680.0,技术领域涉及:G10L13/02;该发明授权一种歌声合成模型的训练方法、装置、设备和存储介质是由周瑜秋;孙见青;梁家恩设计研发完成,并于2022-12-10向国家知识产权局提交的专利申请。
本一种歌声合成模型的训练方法、装置、设备和存储介质在说明书摘要公布了:本发明公开了一种歌声合成模型的训练方法、装置、设备和存储介质。该方法包括:获取预先训练的歌声合成模型;采集目标用户输入的语音信息;获取所述语音信息对应的文本信息,并且提取所述语音信息中的每个音节对应的基频和时长;根据所述文本信息、所述语音信息以及所述语音信息中的每个音节对应的基频和时长,重训练所述歌声合成模型;其中,将所述语音信息包含的声学特征作为所述歌声合成模型的学习目标,以使所述歌声合成模型合成具有所述目标用户的音色的歌曲音频。本发明实施例在具备基础歌声合成模型的基础上,利用目标用户的语音信息,就可以训练出能够合成具有目标用户音色的歌曲的歌声合成模型。
本发明授权一种歌声合成模型的训练方法、装置、设备和存储介质在权利要求书中公布了:1.一种歌声合成模型的训练方法,其特征在于,包括: 获取预先训练的歌声合成模型;所述歌声合成模型,包括:相互连接的输入单元和声学模型;所述声学模型,包括:顺序连接的编码器,时长模型和解码器; 采集目标用户输入的语音信息; 获取所述语音信息对应的文本信息,并且提取所述语音信息中的每个音节对应的基频和时长; 根据所述文本信息、所述语音信息以及所述语音信息中的每个音节对应的基频和时长,重训练所述歌声合成模型; 所述重训练所述歌声合成模型,包括:使所述输入单元根据所述语音信息中的每个音节对应的基频和时长,生成曲谱信息,使所述声学模型根据所述文本信息和所述曲谱信息映射出声学特征,预先在所述语音信息中提取声学特征,根据在所述语音信息中提取的声学特征和所述声学模型映射出的声学特征,确定所述歌声合成模型的损失值,如果所述歌声合成模型的损失值大于预设的损失阈值,则调整所述歌声合成模型中的参数,并继续训练所述歌声合成模型,反之,则在所述歌声合成模型符合预设的收敛条件时,停止训练所述歌声合成模型; 所述使所述声学模型根据所述文本信息和所述曲谱信息映射出声学特征,包括:使所述编码器将所述文本信息和所述曲谱信息融合为歌谱信息,使所述时长模型为所述歌谱信息中每个音节的各个音素对应分配时长,使所述解码器根据歌谱信息以及所述歌谱信息中每个音节的各个音素对应的时长,映射声学特征; 其中,将所述语音信息包含的声学特征作为所述歌声合成模型的学习目标,以使所述歌声合成模型合成具有所述目标用户的音色的歌曲音频。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人云知声智能科技股份有限公司,其通讯地址为:100096 北京市海淀区西三旗建材城内1幢一层101号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。