哈尔滨工业大学(深圳)汤步洲获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉哈尔滨工业大学(深圳)申请的专利一种基于对比学习和生成对抗网络的零样本通用声码器的工作方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115662451B 。
龙图腾网通过国家知识产权局官网在2025-07-08发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202211192592.2,技术领域涉及:G10L19/16;该发明授权一种基于对比学习和生成对抗网络的零样本通用声码器的工作方法是由汤步洲;李婉婷;陈屹婷设计研发完成,并于2022-09-28向国家知识产权局提交的专利申请。
本一种基于对比学习和生成对抗网络的零样本通用声码器的工作方法在说明书摘要公布了:本发明提供了一种基于对比学习和生成对抗网络的零样本通用声码器的工作方法,包括以下步骤:步骤1,将目标合成的梅尔谱输入模型并对值求对数进行变换;步骤2,将输入的梅尔谱输入说话人编码器,得到说话人编码表示;步骤3,将步骤1中输入的梅尔谱与步骤2中得到的说话人编码表示输入生成器,在经过对抗训练的生成模块中经过多次上采样与卷积,最后生成模块输出合成的人耳可听的波形。本发明的有益效果是:本发明在基于生成对抗网络的声码器上进行融合说话人表示的工作是对目前通用声码器工作的补充,提供了一种基于对比学习与说话人编码的零样本通用声码器的工作方法。
本发明授权一种基于对比学习和生成对抗网络的零样本通用声码器的工作方法在权利要求书中公布了:1.一种基于对比学习和生成对抗网络的零样本通用声码器的工作方法,其特征在于,包括以下步骤: 步骤1,将目标合成的梅尔谱输入模型并对值求对数进行变换; 步骤2,将输入的梅尔谱输入说话人编码器,得到说话人编码表示; 步骤3,将步骤1中输入的梅尔谱与步骤2中得到的说话人编码表示输入生成器,在经过对抗训练的生成模块中经过多次上采样与卷积,最后生成模块输出合成的人耳可听的波形; 在所述步骤2中,说话人编码器通过无监督方法对梅尔谱中隐含的说话人特征信息进行编码,利用预训练的对比学习方法训练的残差网络,对梅尔谱进行学习与编码表示; 在所述步骤2中,引入了对比学习方法来对说话人编码器进行预训练,具体步骤如下: 步骤221:在训练阶段,说话人编码器使用一组随机音频组成一个训练批次作为输入,在该训练批次中,每个音频随机选取了两段固定长度且不重叠的子音频段,而每个音频段对应的梅尔谱则是梅尔谱编码器的输入,其中源自同一个源音频的梅尔谱互相为正样例,而来自不同源音频的梅尔谱则互相为负样例; 步骤222:将步骤211中同一批次的训练集输入说话人编码器后,得到一组对应的梅尔谱片段的特征表示; 步骤223:根据对比学习的方法,使用对比损失对输出的表示矩阵,计算每个特征表示向量之间的距离并计算损失。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人哈尔滨工业大学(深圳),其通讯地址为:518000 广东省深圳市南山区桃源街道深圳大学城哈尔滨工业大学校区;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。