Document
拖动滑块完成拼图
个人中心

预订订单
服务订单
发布专利 发布成果 人才入驻 发布商标 发布需求

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 北京大学陈婧获国家专利权

北京大学陈婧获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉北京大学申请的专利引入基频线索的生成式语音分离方法和装置获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115910091B

龙图腾网通过国家知识产权局官网在2025-07-29发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202211184016.3,技术领域涉及:G10L21/0272;该发明授权引入基频线索的生成式语音分离方法和装置是由陈婧;吴玺宏;李想;孙溢凡;栗楠设计研发完成,并于2022-09-27向国家知识产权局提交的专利申请。

引入基频线索的生成式语音分离方法和装置在说明书摘要公布了:本发明公开了一种引入基频线索的生成式语音分离方法和装置。本发明开创性地利用基频线索作为条件,结合混合语音提供的频谱细节信息,使用生成式神经网络生成目标说话人语音,与传统通过估计混合语音的时频掩膜来提取目标语音的方法相比,分离语音的音质和可懂度得到提高。相比于同时分离所有说话人语音的方法,本发明通过引入基频线索解决了现有方法中说话人数目不确定和难以确定网络输出与真实说话人之间对应关系的问题。本发明依托于听觉加工机制和神经网络结构,取得了与当前最优方法可比的性能,为机器在复杂场景中解决语音分离任务提供了可能。

本发明授权引入基频线索的生成式语音分离方法和装置在权利要求书中公布了:1.一种引入基频线索的生成式语音分离方法,其步骤包括: 1对于给定的混合语音,依次进行分帧、加窗、短时傅里叶变换操作,得到混合语音的短时傅里叶变换频谱; 2将1中得到的频谱与目标说话人的基频轨迹序列输入生成器G1中,通过基频条件约束生成器G1生成目标说话人的语音频谱; 3将2中得到的目标说话人的语音频谱输入到生成器G2中,输入频谱经过一维反卷积模块、上采样模块和残差模块,再通过一维卷积和激活函数层,输出满足时域信号数值范围的表示,即目标说话人的语音; 4将3中生成的目标说话人的语音和目标说话人的基频轨迹序列输入到判别器中,判别器判断生成语音是否是真实目标说话人语音,以此为结果计算生成器G1、G2的优化目标函数值,并以此为依据调整生成器G1、G2的参数,同时根据训练数据的真实标签计算判别器的优化目标函数值,以此为依据调整判别器参数; 5训练时,循环执行步骤1~4,直至生成器G1、G2和判别器各自的损失函数值趋于稳定,即达到收敛状态,此时固定生成器与判别器的参数设置; 6对于待进行语音分离的混合语音,以收敛状态下生成器G1、G2的参数设置为标准,执行步骤1~3,步骤3中输出的语音即为最终分离出的目标说话人语音。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人北京大学,其通讯地址为:100871 北京市海淀区颐和园路5号北京大学;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。