厦门大学史晓东获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉厦门大学申请的专利基于领域适配与时域信息引导的戏曲音源分离方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN121148415B 。
龙图腾网通过国家知识产权局官网在2026-03-13发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202511689921.8,技术领域涉及:G10L21/0308;该发明授权基于领域适配与时域信息引导的戏曲音源分离方法是由史晓东;孙武进;白鹏;陈毅东设计研发完成,并于2025-11-18向国家知识产权局提交的专利申请。
本基于领域适配与时域信息引导的戏曲音源分离方法在说明书摘要公布了:基于领域适配与时域信息引导的戏曲音源分离方法,涉及音频信号处理与人工智能技术领域。方法包括:构建融合中国传统乐器的领域适配训练数据集MUSDB18,通过向MUSDB18数据集叠加民族乐器音频弥合域差异;采用预训练VAD模型处理混合音频,生成时域置信度序列并施加高斯衰减得到时域权重序列;以Mel‑BandRoFormer为基础架构,构建带VAD加权损失的MSS模型,通过加权损失引导模型聚焦人声区域;将模型应用于真实戏曲音频分离。解决戏曲民族乐器建模不足、在无有效人声区域过度投入注意力的问题,在戏曲测试集上SDR达10.81dB、SIR达28.77dB。
本发明授权基于领域适配与时域信息引导的戏曲音源分离方法在权利要求书中公布了:1.基于领域适配与时域信息引导的戏曲音源分离方法,其特征在于包括以下步骤: 步骤1:构建融合中国传统乐器的领域适配训练数据集:从公开数据集获取中国传统戏曲常用纯乐器音频片段,将其切分后,以随机增益叠加至标准流行音乐源分离数据集的混合音频中,生成新的混合音频,并保留原有的人声轨道作为目标标签; 步骤2:生成时域权重序列:采用预训练的语音活动检测模型处理所述新的混合音频,输出时域置信度序列;对每个包含人声的连续片段,以其时域置信度序列中心施加高斯衰减权重,并进行归一化处理,得到时域权重序列; 所述高斯衰减权重的计算公式为: 其中,为时域置信度序列,为波形音频当前时间点,为片段中心时刻,σ为控制衰减范围的超参数,exp为指数函数,为经过高斯衰减权重处理后的最终置信度值; 所述控制衰减范围的超参数σ的取值为片段长度的16; 步骤3:构建并训练带VAD加权损失的音源分离模型:以频域音乐音源分离模型为主干,输入为步骤1生成的混合音频,输出为目标人声估计;以前述时域权重序列对损失函数进行加权,定义VAD信息加权损失函数,并以该损失函数为优化目标训练模型; 所述VAD信息加权损失的函数为: 其中,为模型输出人声,为权重,为真实人声音频在对应窗口值下的频谱,为模型输出的人声音频在对应窗口值下的频谱,为权重扩展到对应的频谱大小的权重矩阵;S为窗口总数,的取值范围是;表示范数运算; 步骤4:人声分离与测试:将训练后的音源分离模型应用于真实戏曲音频,进行人声分离,并在测试集上进行指标测试以评估分离质量。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人厦门大学,其通讯地址为:361005 福建省厦门市思明南路422号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励