Document
拖动滑块完成拼图
个人中心

预订订单
商城订单
发布专利 发布成果 人才入驻 发布商标 发布需求

请提出您的宝贵建议,有机会获取IP积分或其他奖励

投诉建议

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 积分商城 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 华侨大学田晖获国家专利权

华侨大学田晖获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉华侨大学申请的专利跨域信息自适应融合的语音合成方法、装置、设备及介质获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN118447819B

龙图腾网通过国家知识产权局官网在2026-02-03发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202410766121.0,技术领域涉及:G10L13/08;该发明授权跨域信息自适应融合的语音合成方法、装置、设备及介质是由田晖;张强;卢璥;全韩彧;李越设计研发完成,并于2024-06-14向国家知识产权局提交的专利申请。

跨域信息自适应融合的语音合成方法、装置、设备及介质在说明书摘要公布了:本发明提供了跨域信息自适应融合的语音合成方法、装置、设备及介质,使用音素序列作为文本域信息,对数梅尔谱作为频域信息,建立样本文本及对应样本音频的数据库,从样本文本中获取音素序列和样本音频中提取对数梅尔谱;根据音素特征提取、频谱特征压缩、跨域特征对齐和频谱细节填充模块构建语音合成模型,将音素序列和对数梅尔谱输入语音合成模型中进行训练,得到训练后的语音合成模型;获取待合成文本数据,从待合成文本中获取音素序列,初始一个常量矩阵;将音素序列和常量矩阵输入训练后的语音合成模型中,得到待合成文本对应的合成对数梅尔谱。此外,现有自回归语音合成模型在训练中因长短期记忆网络而限制了并行能力,增加了训练时间成本。

本发明授权跨域信息自适应融合的语音合成方法、装置、设备及介质在权利要求书中公布了:1.跨域信息自适应融合的语音合成方法,其特征在于,包括: 获取待合成文本数据,并对所述待合成文本进行提取处理,从所述待合成文本中获取音素序列,同时,初始化一个常量矩阵; 调用训练好的语音合成模型对所述待合成文本的音素序列和所述常量矩阵进行预处理,生成与所述待合成文本相对应的合成对数梅尔谱,其中,所述语音合成模型由音素特征提取模块、频谱特征压缩模块、跨域特征对齐模块和频谱细节填充模块组成; 在调用训练好的语音合成模型对所述待合成文本的音素序列和所述常量矩阵进行预处理之前,还包括: 获取样本文本和与所述样本文本对应的样本音频,根据所述样本文本和所述样本音频建立样本数据库,并分别从所述样本文本和所述样本音频中提取音素序列和对数梅尔谱; 对预设的音素特征提取模块、频谱特征压缩模块、跨域特征对齐模块和频谱细节填充模块进行组成处理,构建生成初始语音合成模型; 将所述样本文本的音素序列和所述样本音频的对数梅尔谱作为输入数据,输入至所述初始语音合成模型中进行训练,得到训练后的语音合成模型,其中,所述音素特征提取模块配置为获取所述音素序列的音素特征,所述频谱特征压缩模块配置为获取所述对数梅尔谱的频谱特征,所述跨域特征对齐模块配置为利用音素特征和频谱特征获取音素对应的跨域融合特征,所述频谱细节填充模块配置为对所述对数梅尔谱进行细节丰富处理; 所述跨域特征对齐模块由多头对齐注意力机制和多头自注意力机制组成,所述跨域特征对齐模块的执行步骤,具体为: 将所述音素序列的音素特征和所述对数梅尔谱的频谱特征作为所述跨域特征对齐模块的输入,调用所述多头对齐注意力机制对所述音素序列的音素特征和所述对数梅尔谱的频谱特征进行特征对齐处理,生成音素频谱对齐特征,该过程形式化为:,其中,为所述多头对齐注意力机制的网络参数集合; 利用所述多头自注意力机制对所述音素频谱对齐特征进行特征融合处理,生成跨域融合特征,该过程形式化为:,其中,为所述多头自注意力机制的网络参数集合。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人华侨大学,其通讯地址为:362000 福建省泉州市城华北路269号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。