南京邮电大学李燕萍获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉南京邮电大学申请的专利基于基频差异补偿的StyleGAN情感语音转换方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN114299917B 。
龙图腾网通过国家知识产权局官网在2025-10-24发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202210004168.4,技术领域涉及:G10L13/04;该发明授权基于基频差异补偿的StyleGAN情感语音转换方法是由李燕萍;于杰设计研发完成,并于2022-01-04向国家知识产权局提交的专利申请。
本基于基频差异补偿的StyleGAN情感语音转换方法在说明书摘要公布了:本发明公开了一种基于基频差异补偿的StyleGANStyleGenerativeAdversarialNetwork情感语音转换方法,首先提出了将风格编码器提取的多种情感风格特征作为标签信息,采用自适应实例归一化将情感风格特征与内容特征相融合,使生成器不仅能够充分学习目标情感的风格特征,而且可以实现不在训练集内的情感之间的转换,即完成开集情形下的任意情感之间的转换;进一步,在传统对数高斯归一化基频转换的基础上,提出了基频差异补偿,从而增强不同情感之间的幅度差异,解决了传统对数高斯归一化基频转换后基频仅呈现整体上升,而均值和均方差无法准确描述不同情感的基频包络幅度差异的问题,有效提升转换后语音的情感饱和度,实现开集情形下高质量的情感语音转换。
本发明授权基于基频差异补偿的StyleGAN情感语音转换方法在权利要求书中公布了:1.一种基于基频差异补偿的StyleGAN情感语音转换方法,其特征在于,包括训练阶段和转换阶段,所述训练阶段包括以下步骤: 步骤1、获取训练语料,训练语料由一个说话人的多种情感的语料组成,所述情感包括源情感和目标情感; 步骤2、从训练语料中提取不同情感语音的频谱特征作为声学特征向量; 步骤3、将所获得的声学特征向量输入到StyleGAN-EVC网络中进行训练,不断优化其目标函数,直至设置的迭代次数,从而得到训练好的StyleGAN-EVC网络;所述StyleGAN-EVC网络包括生成器G、鉴别器D和风格编码器S; 其中,所述生成器G分为编码器和解码器,编码器用于生成内容特征,解码器用于将获得的内容特征和风格编码器S提取的风格特征进行重构,生成重构语音; 步骤4、构建从源情感到目标情感的基频转换函数,在传统对数高斯归一化基频转换的基础上,引入基频差异补偿向量,构建最终的基频转换函数; 所述转换阶段包含以下步骤: 步骤5、选取一个说话人的不同的情感语音作为待转换语料,分别提取待转换语音的源情感梅尔频谱特征xs和目标情感梅尔频谱特征xt、对应的对数基频特征和及对应的非周期特征APs和APt作为声学特征向量; 步骤6、将所述源情感频谱特征xs和目标情感频谱特征xt输入步骤3训练好的StyleGAN-EVC网络之中,重构出转换情感频谱特征xst; 步骤7、通过步骤4得到的基频转换函数,将步骤5中提取的源情感对数基频特征转换为目标情感的基频特征 步骤9、将步骤6中生成的转换情感频谱特征xst、步骤7中得到的转换情感的基频特征步骤5中提取的源情感的非周期特征APs通过WORLD声码器,合成得到转换后的情感语音。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人南京邮电大学,其通讯地址为:210023 江苏省南京市栖霞区文苑路9号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励