谷歌有限责任公司尼尔·泽格多尔获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉谷歌有限责任公司申请的专利使用自回归生成神经网络来生成音频获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN118887971B 。
龙图腾网通过国家知识产权局官网在2026-01-06发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202410903951.3,技术领域涉及:G10L25/30;该发明授权使用自回归生成神经网络来生成音频是由尼尔·泽格多尔;大卫·格朗吉耶;马尔科·塔利亚萨基;拉斐尔·马里尼耶;奥利维尔·泰布尔;佐兰·博尔绍什;安德里亚·阿戈斯蒂内利;蒂莫·伊曼纽尔·登克;安托万·凯伦;杰西·恩格尔;玛洛·韦尔泽蒂;克里斯蒂安·弗兰克;马修·谢里菲;亚当·约瑟夫·罗伯茨设计研发完成,并于2023-09-07向国家知识产权局提交的专利申请。
本使用自回归生成神经网络来生成音频在说明书摘要公布了:本申请涉及使用自回归生成神经网络来生成音频。用于生成音频信号的预测的方法、系统和设备,包括编码在计算机存储介质上的计算机程序。方法中的一种方法包括:接收生成音频信号的请求;获得音频信号的语义表示;使用一个或多个生成神经网络以至少语义表示为条件来生成音频信号的声学表示;以及使用解码器神经网络来处理至少声学表示以生成音频信号的预测。
本发明授权使用自回归生成神经网络来生成音频在权利要求书中公布了:1.一种用于生成音频信号的预测的计算机实现的方法,所述方法包括: 接收以输入为条件来生成音频信号的请求,所述音频信号具有在跨越时间窗口的多个输出时间步长中的每个输出时间步长处的相应音频样本; 使用嵌入神经网络来处理所述输入以将所述输入映射到一个或多个嵌入词元; 生成所述音频信号的语义表示,所述语义表示指定在跨越所述时间窗口的多个第一时间步长中的每个第一时间步长处的相应语义词元,每个语义词元是以所述嵌入词元为条件从语义词元词表中选择的并且表示所述音频信号在对应第一时间步长处的语义内容; 使用一个或多个生成神经网络以至少所述语义表示和所述嵌入词元为条件来生成所述音频信号的声学表示,所述声学表示指定在跨越所述时间窗口的多个第二时间步长中的每个第二时间步长处的一个或多个相应声学词元的集合,每个第二时间步长处的所述一个或多个相应声学词元表示所述音频信号在对应的第二时间步长处的声学特性;以及 使用解码器神经网络来处理至少所述声学表示以生成所述音频信号的所述预测。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人谷歌有限责任公司,其通讯地址为:美国;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励