南京邮电大学李燕萍获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉南京邮电大学申请的专利基于CBAM和动态卷积分解的歌唱语音转换方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115881088B 。
龙图腾网通过国家知识产权局官网在2026-03-27发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202211423682.8,技术领域涉及:G10L13/033;该发明授权基于CBAM和动态卷积分解的歌唱语音转换方法是由李燕萍;高崧皓设计研发完成,并于2022-11-15向国家知识产权局提交的专利申请。
本基于CBAM和动态卷积分解的歌唱语音转换方法在说明书摘要公布了:本发明属于语音转换技术领域,具体地说,是一种基于CBAM和动态卷积分解的歌唱语音转换方法,包括训练阶段和转换阶段,模型网络包括生成器、鉴别器和风格编码器。首先在生成器中引入动态卷积分解,通过动态通道融合来代替通道组的动态关注,解决生成器中动态卷积会导致卷积权重的数量增加K倍的问题,减轻了联合优化的难度,并且使得模型在不牺牲精度的情况下,需要的参数更少,提高算法的运行性能。进一步在生成器的编码网络和解码网络引入CBAM注意力模块,在通道和空间施加注意力,提升对频谱中细节信息的关注与捕获,显著改善转换歌唱语音的质量。
本发明授权基于CBAM和动态卷积分解的歌唱语音转换方法在权利要求书中公布了:1.一种基于CBAM和动态卷积分解的歌唱语音转换方法,其特征在于,包括训练阶段和转换阶段: 所述训练阶段包括以下步骤: 步骤1.1、获取训练语料,训练语料由多名歌手的歌唱语音组成; 步骤1.2、使用WORLD语音分析合成模型提取出源歌唱语音频谱特征xs、基频特征f0s和非周期性特征; 步骤1.3、通过风格编码器S提取目标歌唱语音风格特征st,生成器G包括编码网络和解码网络,通过编码网络生成源歌唱语音内容特征xc,然后通过解码网络将源歌唱语音内容特征xc和目标歌唱语音风格特征st进行重构,恢复出歌唱语音; 步骤1.4、不断调整转换网络的超参数,使得损失函数最小化,直至理想的迭代次数,从而得到训练好的转换网络; 步骤1.5、构建从源歌唱语音基频特征f0s到目标歌唱语音基频特征f0t的基频转换函数; 所述转换阶段包括以下步骤: 步骤2.1、使用WORLD语音分析合成模型提取出待转换语料中源歌唱语音的频谱特征xs′、基频特征f0s′和非周期性特征; 步骤2.2、通过风格编码器S提取目标歌唱语音风格特征st′,将上述源歌唱语音的频谱特征xs′和目标歌唱语音风格特征st′输入到步骤1.4中训练好的转换网络中,重构出目标歌唱语音频谱特征xst′; 步骤2.3、通过步骤1.5中的基频转换函数,将步骤2.1提取出的源歌唱语音的基频特征f0s′转换为目标歌唱语音基频特征f0t′; 步骤2.4、使用WORLD语音分析合成模型将步骤2.1中提取的非周期性特征、步骤2.2中得到的重构目标歌唱语音频谱特征xst′和步骤2.3中得到的目标歌唱语音基频特征f0t′进行合成,得到转换后的歌唱语音; 所述步骤1.4中,所述的转换网络由生成器G、鉴别器D、风格编码器S组成,所述的生成器G由编码网络和解码网络构成,将生成器中的动态卷积的核进行分解,通过动态通道融合来代替对通道组的动态关注,降低潜在空间的维数,并且在编码网络的后四层和解码网络的前四层网络中引入CBAM注意力模块。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人南京邮电大学,其通讯地址为:210023 江苏省南京市栖霞区文苑路9号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励