平安科技(深圳)有限公司石岩获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉平安科技(深圳)有限公司申请的专利具有条件匹配流的语音合成方法、装置、设备及介质获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119517005B 。
龙图腾网通过国家知识产权局官网在2026-01-09发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411691282.4,技术领域涉及:G10L13/08;该发明授权具有条件匹配流的语音合成方法、装置、设备及介质是由石岩;陈闽川;王少军设计研发完成,并于2024-11-22向国家知识产权局提交的专利申请。
本具有条件匹配流的语音合成方法、装置、设备及介质在说明书摘要公布了:本发明涉及人工智能,公开一种具有条件匹配流的语音合成方法、装置、设备及介质,包括:接收文本信息,将文本信息编码为高维隐向量,获得文本信息向量;根据文本信息和语音之间的对齐关系形成标签信息,预测文本信息与语音的声学特征之间的关系;根据文本信息向量于语音数据集中匹配获取对应的文本相关语音,根据高斯噪声、文本相关语音和时间步生成中间态语音,采用条件匹配流模型根据中间态语音和时间步进行噪声预测,获得预测噪声,计算输入的高斯噪声和预测噪声之间的损失,并根据预测噪声结合中间态语音提取获得文本相关语音的声学特征;采用声学解码器根据获得的文本相关语音的声学特征生成解码语音波形。提升语音合成质量。
本发明授权具有条件匹配流的语音合成方法、装置、设备及介质在权利要求书中公布了:1.一种具有条件匹配流的语音合成方法,其特征在于,包括: 接收文本信息,将文本信息编码为高维隐向量,获得文本信息向量; 根据文本信息和语音之间的对齐关系形成标签信息,预测文本信息与语音的声学特征之间的关系; 根据文本信息向量于语音数据集中匹配获取对应的文本相关语音,根据高斯噪声、文本相关语音和时间步生成中间态语音,采用条件匹配流模型根据中间态语音和时间步进行噪声预测,获得预测噪声,计算输入的高斯噪声和预测噪声之间的损失,并根据预测噪声结合中间态语音提取获得文本相关语音的声学特征; 采用声学解码器根据获得的文本相关语音的声学特征生成解码语音波形; 所述采用条件匹配流模型根据中间态语音和时间步进行噪声预测中的所述条件匹配流模型采用Transfomer-UNet架构;所述条件匹配流模型包括多个依序相连的Transformer模块,每一所述Transformer模块包括卷积单元和Transformer单元,首尾序号对称的Transformer模块之间相互连接; 所述根据高斯噪声、文本相关语音和时间步生成中间态语音中的中间态语音采用以下公式计算获得: Xt=tX0+1-tX1; 式中,Xt表示中间态语音,t表示时间步,X0表示文本相关语音,X1表示高斯噪声。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人平安科技(深圳)有限公司,其通讯地址为:518000 广东省深圳市福田区福田街道福安社区益田路5033号平安金融中心23楼;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励