南京航空航天大学杨群获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉南京航空航天大学申请的专利一种基于Actor-Critic算法和扩散模型的语音增强方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119741930B 。
龙图腾网通过国家知识产权局官网在2025-09-26发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411837247.9,技术领域涉及:G10L21/02;该发明授权一种基于Actor-Critic算法和扩散模型的语音增强方法是由杨群;刘思行;东鑫;李秋林设计研发完成,并于2024-12-13向国家知识产权局提交的专利申请。
本一种基于Actor-Critic算法和扩散模型的语音增强方法在说明书摘要公布了:本申请公开了一种基于Actor‑Critic算法和扩散模型的语音增强方法,涉及语音增强领域,包括:将用来做扩散的NCSN++模型作为Actor模型,利用语音增强数据集和Actor‑Critic算法训练该模型,使用语音质量评估模型作为环境给予的反馈,使模型训练以提升语音质量作为目标,对于扩散中的每一步,给予‑1的奖励,将训练好的模型作为待微调语音增强模型,将该模型作为Actor模型,利用无监督语音数据集和Actor‑Critic算法训练该模型,实现对该模型的微调,进而得到最终的语音增强模型。本申请可实现在不同场景里都能取得一个很好的语音增强效果,同时也能够比较快速的得到质量较好的干净语音。
本发明授权一种基于Actor-Critic算法和扩散模型的语音增强方法在权利要求书中公布了:1.一种基于Actor-Critic算法和扩散模型的语音增强方法,其特征在于,所述基于Actor-Critic算法和扩散模型的语音增强方法包括: 获取语音增强数据集、语音评估数据集和无监督语音数据集;所述语音增强数据集包括VoiceBank-DEMAND数据集;所述语音评估数据集包括NISQA、PSTN、Tencent数据集;所述无监督语音数据集包括不同的语音; 利用所述语音评估数据集训练NISQA模型,将训练好的NISQA模型作为语音质量评估模型; 将用来做扩散的NCSN++模型作为Actor模型,采用多层Transformer堆叠,后接自适应池化层作为Critic模型,利用所述语音增强数据集和Actor-Critic算法进行NCSN++模型的训练,使用所述语音质量评估模型作为环境给予的反馈,使NCSN++模型训练以提升语音质量作为目标,对于扩散中的每一步,给予-1的奖励,将训练好的NCSN++模型作为待微调语音增强模型; 将所述待微调语音增强模型作为Actor模型,初始化Critic模型参数,利用所述无监督语音数据集和Actor-Critic算法训练所述待微调语音增强模型,使用所述语音质量评估模型作为环境给予的反馈,使所述待微调语音增强模型以提升语音质量作为目标,对于扩散中的每一步,给予-1的奖励,将训练好的待微调语音增强模型作为最终的语音增强模型; 利用所述最终的语音增强模型对待增强语音进行语音增强,得到干净语音。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人南京航空航天大学,其通讯地址为:211106 江苏省南京市江宁区将军路29号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励