武汉大学任延珍获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉武汉大学申请的专利一种语音转换说话人溯源方法及装置获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN116665687B 。
龙图腾网通过国家知识产权局官网在2026-02-06发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202310236391.6,技术领域涉及:G10L21/013;该发明授权一种语音转换说话人溯源方法及装置是由任延珍;朱洪承;翟黎明;孙宗锟;沈茹冰;王丽娜设计研发完成,并于2023-03-10向国家知识产权局提交的专利申请。
本一种语音转换说话人溯源方法及装置在说明书摘要公布了:本发明公开了一种语音转换说话人溯源方法及装置。针对语音转换技术在实际应用过程中滥用时难以主动追溯源说话人身份的问题,本发明设计了一个基于异步VAE‑Glow的追溯方法,既能在语音转换过程中并行隐藏源说话人身份,又能从压缩的转换语音中准确地恢复隐藏的源说话人身份甚至原始语音。本方法可与任意的语音转换框架集成并用于各类社交媒体和语音通话应用中,在不影响转换语音质量的前提下实现说话人身份的隐藏和溯源,在面临大范围比特率16~128kbps的主流音频和语音压缩标准如AAC、MP3、Opus和SILK时仅凭0.74s的语音就能实现接近100%的溯源准确率。
本发明授权一种语音转换说话人溯源方法及装置在权利要求书中公布了:1.一种语音转换说话人溯源方法,其特征在于,包括:语音转换阶段、隐藏阶段、传输阶段以及溯源阶段; 其中,在语音转换阶段,采用预训练的VC模型以源语音s和目标语音t作为输入,输出合成的Mel谱图m; 在隐藏阶段,通过预训练的说话人ID提取器以源语音s作为输入,生成表示说话人身份的说话人嵌入v,然后通过ID编码器将v映射到遵循高斯分布的潜码z,再将z输入以Mel语谱图m为条件的语音生成器,合成转换语音x; 在传输阶段,转换语音x在互联网上传输,通过各种有损压缩和音频处理操作后得到语音 在溯源阶段,通过语音反转器以从获得的Mel语谱图为条件,将经过压缩或处理的语音重新转换为潜码然后通过ID解码器将重新映射为说话人嵌入用于两种类型的验证:说话人验证和语音验证;其中,根据与从注册语音中提取的说话人嵌入v的比较情况实现说话人验证,将输入到语音恢复模型以获得恢复的语音根据与源语音s的比较情况实现语音验证。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人武汉大学,其通讯地址为:430072 湖北省武汉市武昌区八一路299号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励