Document
拖动滑块完成拼图
个人中心

预订订单
服务订单
发布专利 发布成果 人才入驻 发布商标 发布需求

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 湘江实验室姜林获国家专利权

湘江实验室姜林获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉湘江实验室申请的专利一种基于VITS的韵律可控语音合成方法及相关装置获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120412544B

龙图腾网通过国家知识产权局官网在2025-09-12发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510918273.2,技术领域涉及:G10L13/027;该发明授权一种基于VITS的韵律可控语音合成方法及相关装置是由姜林;叶东凤;万薇;刘琪设计研发完成,并于2025-07-03向国家知识产权局提交的专利申请。

一种基于VITS的韵律可控语音合成方法及相关装置在说明书摘要公布了:本发明提供了一种基于VITS的韵律可控语音合成方法及相关装置,涉及语音合成技术领域。通过从输入文本中提取韵律特征信息;对输入文本进行语义编码,生成文本上下文特征表示;构建韵律控制器,并对所述韵律特征进行独立建模生成预测结果;将所述文本上下文特征表示与所述预测结果进行融合以生成韵律控制嵌入;基于VITS模型,结合所述韵律控制嵌入和说话人嵌入向量,生成多说话人语音频谱;通过解码器将所述多说话人语音频谱转换为时域语音信号;通过调整韵律特征参数,实现对合成语音的持续时长、基音周期、能量、停顿和节奏的独立控制,以提高生成的语音信号的主观质量。

本发明授权一种基于VITS的韵律可控语音合成方法及相关装置在权利要求书中公布了:1.一种基于VITS的韵律可控语音合成方法,其特征在于,包括: S1:从输入文本中提取韵律特征信息,所述韵律特征信息包括持续时长、基音周期、能量、停顿和节奏的韵律特征; S2:通过BERT预训练模型对输入文本进行语义编码,生成文本上下文特征表示; S3:构建包含持续时长预测器、能量预测器、基音周期预测器、停顿预测器和节奏预测器的韵律控制器,并通过所述韵律控制器对所述韵律特征进行独立建模并生成预测结果; S4:将所述文本上下文特征表示与所述预测结果进行融合以生成融合后的韵律控制嵌入; S5:基于VITS模型,结合所述韵律控制嵌入和说话人嵌入向量,生成多说话人语音频谱; S6:通过解码器将所述多说话人语音频谱转换为时域语音信号; S7:通过调整韵律特征参数,实现对合成语音的持续时长、基音周期、能量、停顿和节奏的独立控制; 其中,所述步骤S3中:所述韵律控制器采用一维卷积网络、双向长短期记忆网络及线性层构成,通过特征融合模块将各预测器的输出嵌入进行叠加,并应用Kolmogorov-Arnold表示定理实现多元特征的一元基函数融合,具体公式为: 其中,是权重,是基函数。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人湘江实验室,其通讯地址为:410000 湖南省长沙市高新区尖山路217号北斗产业园1栋;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由AI智能生成
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。