平安科技(上海)有限公司石岩获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉平安科技(上海)有限公司申请的专利语音编解码方法、装置、设备及介质获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN121054006B 。
龙图腾网通过国家知识产权局官网在2026-04-21发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202511197017.5,技术领域涉及:G10L19/00;该发明授权语音编解码方法、装置、设备及介质是由石岩;陈闽川设计研发完成,并于2025-08-25向国家知识产权局提交的专利申请。
本语音编解码方法、装置、设备及介质在说明书摘要公布了:本发明涉及人工智能技术领域,可应用于金融科技和医疗科技领域,公开了一种语音编解码方法、装置、设备及介质,该方法包括:获取原始语音信号并提取原始语音频谱特征;通过第一阶段镜像架构训练的编码器对其编码得到连续向量;将连续向量分割为子向量,经量化器与对应子编码字典匹配获取子索引,组合生成整体索引;解析整体索引得到子索引,调取子离散向量拼接为离散向量;通过第二阶段非镜像架构训练的解码器对离散向量重建得到目标语音频谱特征,再转换为目标语音信号。本发明采用双阶段训练,第一阶段镜像架构保证编码稳定性,第二阶段非镜像架构提升解码灵活性,结合乘积量化技术,在平衡计算效率与存储开销的同时,提高语音重建质量。
本发明授权语音编解码方法、装置、设备及介质在权利要求书中公布了:1.一种语音编解码方法,其特征在于,包括: 获取原始语音信号,将所述原始语音信号进行特征提取获取对应的原始语音频谱特征; 通过基于第一阶段采用镜像架构训练得到的编码器对所述原始语音频谱特征进行编码得到连续向量,其中,所述镜像架构的编码器与解码器的网络结构对称; 将所述连续向量分割为多个子向量,通过量化器将所述子向量与对应的子编码字典中的子离散向量进行相似度匹配,以获取与所述子向量匹配的子离散向量对应的子索引,并根据各所述子编码字典的大小对各所述子索引进行组合计算生成与所述连续向量匹配的离散向量对应的整体索引; 根据各所述子编码字典的大小对所述整体索引进行逆运算解析出各所述子索引,从与各所述子索引对应的各所述子编码字典中获取对应的子离散向量,将获取的多个子离散向量拼接得到与所述连续向量匹配的离散向量; 通过基于第二阶段采用非镜像架构训练得到的解码器对所述离散向量进行重建得到目标语音频谱特征,并将所述目标语音频谱特征转换为目标语音信号,其中,所述非镜像架构的编码器与解码器的网络结构非对称,所述第二阶段的编码器沿用所述第一阶段的所述编码器,所述第二阶段的解码器的结构与所述第一阶段的解码器的结构不同; 其中,训练得到的所述编码器和所述解码器的训练步骤包括:将训练数据输入至镜像架构的一阶段编码器和一阶段解码器中进行第一阶段训练以迭代更新所述一阶段编码器和所述一阶段解码器的参数,得到训练完成的所述一阶段编码器和所述一阶段解码器;将训练数据输入至非镜像架构的二阶段编码器和二阶段解码器中进行第二阶段训练以迭代更新所述二阶段编码器和所述二阶段解码器的参数,得到最终训练完成的所述编码器和所述解码器;其中,所述二阶段编码器沿用所述一阶段编码器且在所述第二阶段训练时冻结所述一阶段编码器的参数,以使最终训练得到的所述编码器为所述一阶段编码器;所述二阶段解码器沿用所述一阶段解码器的参数作为所述第二阶段训练的初始参数进行所述第二阶段的训练,以使所述第二阶段训练完成的所述二阶段解码器为最终训练得到的所述解码器。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人平安科技(上海)有限公司,其通讯地址为:200030 上海市徐汇区凯滨路166号18层、19层;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励