Document
拖动滑块完成拼图
个人中心

预订订单
服务订单
发布专利 发布成果 人才入驻 发布商标 发布需求

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 北京大学陈婧获国家专利权

北京大学陈婧获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉北京大学申请的专利基于双向级联框架的迭代式基频估计与语音分离方法和装置获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115862659B

龙图腾网通过国家知识产权局官网在2025-07-15发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202211184250.6,技术领域涉及:G10L21/0272;该发明授权基于双向级联框架的迭代式基频估计与语音分离方法和装置是由陈婧;吴玺宏;李想;孙溢凡;栗楠设计研发完成,并于2022-09-27向国家知识产权局提交的专利申请。

基于双向级联框架的迭代式基频估计与语音分离方法和装置在说明书摘要公布了:本发明公开了一种基于双向级联框架的迭代式基频提取与语音分离方法和装置,对混合语音逐帧迭代地进行“基频预测‑语音分离‑基频更新”,在迭代中提升二者的性能。基频预测模块为后续模块提供基频线索,解决了多个输出带来的置换问题和说话人数目不确定的问题。语音分离模块利用有条件的生成对抗网络进行生成式语音分离,提升分离的语音质量。基频更新模块从已分离出的干净语音中,重新提取基频,更新基频预测的预测值,实现了“预测‑分离‑更新”过程的闭环。在本发明提出的双向级联框架下,语音分离与基频提取这两个任务以迭代的方法交替更新,互相依赖、互相促进,两个任务都取得了更好的性能。

本发明授权基于双向级联框架的迭代式基频估计与语音分离方法和装置在权利要求书中公布了:1.一种基于双向级联框架的迭代式基频估计与语音分离方法,其步骤包括: 1对于给定的混合语音,依次进行分帧、加窗、短时傅里叶变换操作,得到混合语音时频谱,然后逐帧地循环执行步骤2~步骤4,直至遍历过所有帧; 2利用基频预测模块,以当前时刻的混合语音帧和历史时刻的基频预测值为条件,预测当前时刻的基频值,提取混合语音中某一说话人的基频序列; 3利用语音分离模块,以混合语音和步骤2得到的基频序列为输入,利用条件生成对抗网络,生成对应该基频序列的说话人语音; 4利用基频更新模块,以步骤3生成的说话人语音作为输入,提取基频轨迹,并用以更新步骤2输出的当前帧的基频预测值; 5经过步骤1所述循环,可得到混合语音中完整的某一说话人的基频轨迹,该说话人由混合语音中领先的说话人决定,将该基频轨迹作为基频条件,联合混合语音频谱,输入到步骤3中的条件生成对抗网络,分离出对应基频条件的说话人语音; 6从混合语音中减去步骤5中已分离的说话人语音,对残差语音再次执行步骤1~5的迭代过程,如此循环,直到残差语音中不包含任何语音,以上循环过程停止,从而分离出混合语音中各说话人的语音。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人北京大学,其通讯地址为:100871 北京市海淀区颐和园路5号北京大学;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。