Document
拖动滑块完成拼图
个人中心

预订订单
商城订单
发布专利 发布成果 人才入驻 发布商标 发布需求

请提出您的宝贵建议,有机会获取IP积分或其他奖励

投诉建议

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 积分商城 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 北京达佳互联信息技术有限公司强春雨获国家专利权

北京达佳互联信息技术有限公司强春雨获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉北京达佳互联信息技术有限公司申请的专利一种音频编解码模型的训练方法及装置获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120766693B

龙图腾网通过国家知识产权局官网在2026-01-20发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202511259464.9,技术领域涉及:G10L19/02;该发明授权一种音频编解码模型的训练方法及装置是由强春雨;梁宇哲;陈睿龙;赵佳慧;王小鹏;尹慷;张晨;盖坤设计研发完成,并于2025-09-04向国家知识产权局提交的专利申请。

一种音频编解码模型的训练方法及装置在说明书摘要公布了:本申请实施例公开了一种音频编解码模型的训练方法及装置,主要的技术方案包括:获取包括多个音频样本的训练数据;利用训练数据训练音频编解码模型;其中,训练包括:提取音频样本的频谱表示,利用第一音频编码器提取音频样本的声学特征表示;利用第二音频编码器,将声学特征表示映射到隐空间中,得到音频样本的隐空间特征表示;对隐空间特征表示进行掩码处理,得到掩码后的隐空间特征表示;利用音频解码器基于隐空间特征表示进行解码处理,得到重建频谱;利用重建频谱和频谱表示,更新音频编解码模型的模型参数。这种方式,可以提高音频编解码模型的语义理解能力,进而提高语音生成任务的性能。

本发明授权一种音频编解码模型的训练方法及装置在权利要求书中公布了:1.一种音频编解码模型的训练方法,其特征在于,所述音频编解码模型包括第一音频编码器、第二音频编码器和音频解码器,所述方法包括: 获取包括多个音频样本的训练数据; 利用所述训练数据训练所述音频编解码模型;其中,所述训练包括:提取所述音频样本的频谱表示,将所述频谱表示输入所述第一音频编码器;利用所述第一音频编码器提取所述音频样本的声学特征表示;利用所述第二音频编码器,将所述声学特征表示映射到隐空间中,得到所述音频样本的隐空间特征表示;对所述隐空间特征表示中的至少一个时间帧对应的隐空间变量进行掩码处理,得到掩码后的隐空间特征表示,所述掩码处理包括短跨度掩码和长跨度掩码,所述短跨度掩码的掩码时间跨度短于所述长跨度掩码,所述短跨度掩码的情况多于所述长跨度掩码;利用所述音频解码器基于所述掩码后的隐空间特征表示进行解码处理,得到重建频谱;利用所述重建频谱和所述频谱表示,更新所述音频编解码模型的模型参数; 其中,训练得到的所述第二音频编码器和所述音频解码器用以进行语音合成。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人北京达佳互联信息技术有限公司,其通讯地址为:100085 北京市海淀区西二旗西路16号院12号楼8层101;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。