Document
拖动滑块完成拼图
个人中心

预订订单
商城订单
发布专利 发布成果 人才入驻 发布商标 发布需求

请提出您的宝贵建议,有机会获取IP积分或其他奖励

投诉建议

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 积分商城 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 南京邮电大学李燕萍获国家专利权

南京邮电大学李燕萍获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉南京邮电大学申请的专利基于基频差异补偿的StyleGAN情感语音转换方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN114299917B

龙图腾网通过国家知识产权局官网在2025-10-24发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202210004168.4,技术领域涉及:G10L13/04;该发明授权基于基频差异补偿的StyleGAN情感语音转换方法是由李燕萍;于杰设计研发完成,并于2022-01-04向国家知识产权局提交的专利申请。

基于基频差异补偿的StyleGAN情感语音转换方法在说明书摘要公布了:本发明公开了一种基于基频差异补偿的StyleGANStyleGenerativeAdversarialNetwork情感语音转换方法,首先提出了将风格编码器提取的多种情感风格特征作为标签信息,采用自适应实例归一化将情感风格特征与内容特征相融合,使生成器不仅能够充分学习目标情感的风格特征,而且可以实现不在训练集内的情感之间的转换,即完成开集情形下的任意情感之间的转换;进一步,在传统对数高斯归一化基频转换的基础上,提出了基频差异补偿,从而增强不同情感之间的幅度差异,解决了传统对数高斯归一化基频转换后基频仅呈现整体上升,而均值和均方差无法准确描述不同情感的基频包络幅度差异的问题,有效提升转换后语音的情感饱和度,实现开集情形下高质量的情感语音转换。

本发明授权基于基频差异补偿的StyleGAN情感语音转换方法在权利要求书中公布了:1.一种基于基频差异补偿的StyleGAN情感语音转换方法,其特征在于,包括训练阶段和转换阶段,所述训练阶段包括以下步骤: 步骤1、获取训练语料,训练语料由一个说话人的多种情感的语料组成,所述情感包括源情感和目标情感; 步骤2、从训练语料中提取不同情感语音的频谱特征作为声学特征向量; 步骤3、将所获得的声学特征向量输入到StyleGAN-EVC网络中进行训练,不断优化其目标函数,直至设置的迭代次数,从而得到训练好的StyleGAN-EVC网络;所述StyleGAN-EVC网络包括生成器G、鉴别器D和风格编码器S; 其中,所述生成器G分为编码器和解码器,编码器用于生成内容特征,解码器用于将获得的内容特征和风格编码器S提取的风格特征进行重构,生成重构语音; 步骤4、构建从源情感到目标情感的基频转换函数,在传统对数高斯归一化基频转换的基础上,引入基频差异补偿向量,构建最终的基频转换函数; 所述转换阶段包含以下步骤: 步骤5、选取一个说话人的不同的情感语音作为待转换语料,分别提取待转换语音的源情感梅尔频谱特征xs和目标情感梅尔频谱特征xt、对应的对数基频特征和及对应的非周期特征APs和APt作为声学特征向量; 步骤6、将所述源情感频谱特征xs和目标情感频谱特征xt输入步骤3训练好的StyleGAN-EVC网络之中,重构出转换情感频谱特征xst; 步骤7、通过步骤4得到的基频转换函数,将步骤5中提取的源情感对数基频特征转换为目标情感的基频特征 步骤9、将步骤6中生成的转换情感频谱特征xst、步骤7中得到的转换情感的基频特征步骤5中提取的源情感的非周期特征APs通过WORLD声码器,合成得到转换后的情感语音。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人南京邮电大学,其通讯地址为:210023 江苏省南京市栖霞区文苑路9号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。