渊慧科技有限公司米科拉伊·宾科夫斯基获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉渊慧科技有限公司申请的专利利用对抗网络的高保真度语音合成获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN114503191B 。
龙图腾网通过国家知识产权局官网在2025-07-22发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202080068264.4,技术领域涉及:G10L13/02;该发明授权利用对抗网络的高保真度语音合成是由米科拉伊·宾科夫斯基;凯伦·西蒙尼扬;杰弗里·多纳休;艾丹·克拉克;桑德尔·艾蒂恩内·利·迪勒曼;埃里克·康拉德·埃尔森;路易斯·卡洛斯·科博·鲁斯;诺曼·卡萨格兰德设计研发完成,并于2020-09-25向国家知识产权局提交的专利申请。
本利用对抗网络的高保真度语音合成在说明书摘要公布了:方法、系统和装置,包括在计算机存储介质上编码的计算机程序,用于使用生成神经网络来生成输出音频示例。这些方法中的一种方法包括:获得训练调节文本输入;使用前馈生成神经网络来处理包括所述训练调节文本输入的训练生成输入,以生成训练音频输出;使用多个判别器中的每个判别器来处理所述训练音频输出,其中,所述多个判别器包括一个或多个有条件判别器和一个或多个无条件判别器;通过组合所述多个判别器的相应预测来确定第一组合预测;以及确定对于所述前馈生成神经网络的多个生成参数的当前值的更新,以增加所述第一组合预测中的第一误差。
本发明授权利用对抗网络的高保真度语音合成在权利要求书中公布了:1.一种训练前馈生成神经网络的方法,所述前馈生成神经网络具有多个生成参数并且被配置成使用调节文本输入来生成输出音频示例, 其中,每个调节文本输入包括在多个输入时间步中的每个输入时间步处的相应语言学特征表示, 其中,所述前馈生成神经网络被配置成接收包括调节文本输入的生成输入并且处理所述生成输入以生成音频输出,所述音频输出包括在多个输出时间步中的每个输出时间步处的相应音频样本,以及 其中,所述训练包括: 获得训练调节文本输入; 根据所述生成参数的当前值使用所述前馈生成神经网络来处理包括所述训练调节文本输入的训练生成输入,以生成训练音频输出; 使用多个判别器中的每个判别器来处理所述训练音频输出,其中: 所述多个判别器包括一个或多个有条件判别器,其中,每个有条件判别器处理所述训练音频输出的相应子集和所述训练调节文本输入,以生成对于所述训练音频输出是真实音频示例还是合成音频示例的预测,并且 所述多个判别器包括一个或多个无条件判别器,其中每个无条件判别器处理所述训练音频输出的相应子集而不处理所述训练调节文本输入,以生成对于所述训练音频输出是真实音频示例还是合成音频示例的预测; 通过组合所述多个判别器的相应预测来确定第一组合预测;以及 确定对所述生成参数的当前值的更新,以增加所述第一组合预测中的第一误差。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人渊慧科技有限公司,其通讯地址为:英国伦敦;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。