Document
拖动滑块完成拼图
个人中心

预订订单
服务订单
发布专利 发布成果 人才入驻 发布商标 发布需求

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 四川大学魏骁勇获国家专利权

四川大学魏骁勇获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉四川大学申请的专利基于DCT-DDPM的音乐音频修复方法及系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN116072134B

龙图腾网通过国家知识产权局官网在2025-07-04发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202310105130.0,技术领域涉及:G10L21/01;该发明授权基于DCT-DDPM的音乐音频修复方法及系统是由魏骁勇;刘凯洋;杨震群设计研发完成,并于2023-02-07向国家知识产权局提交的专利申请。

基于DCT-DDPM的音乐音频修复方法及系统在说明书摘要公布了:本发明公开了一种基于DCT‑DDPM的音乐音频修复方法及系统,属于语音处理领域和深度学习领域,解决现有技术只能进行无条件修改,无法还原原始片段信息的问题。本发明包括1音乐音频数据的获取;2将音频数据变换到频域;3处理得到带有Mask的梅尔频谱图;4训练DCT‑DDPM;5基于训练好的DCT‑DDPM对对音频进行修复;6将修复得到的梅尔频谱图变换到时域。本发明用于音乐音频修复。

本发明授权基于DCT-DDPM的音乐音频修复方法及系统在权利要求书中公布了:1.一种基于DCT-DDPM的音乐音频修复方法,其特征在于,包括如下步骤: 步骤1:获取音乐的音频及对应音频的乐谱,其中,乐谱为MIDI文件; 步骤2:使用短时傅里叶变换和梅尔滤波器将音频转换为梅尔频谱图,并把梅尔频谱图平均切分,将乐谱转换为pianoroll格式,转换后并进行切分,将切分后的音频的梅尔频谱图和pianoroll格式的乐谱对齐; 步骤3:将梅尔频谱图的随机范围替换为高斯噪声作为Mask,得到带有Mask的梅尔频谱图,其中,Mask表示遮挡; 步骤4:在无条件修复的情况下,将带有Mask的梅尔频谱图和步骤2得到的梅尔频谱图使用拼接函数在通道维度上拼接后送入DCT-DDPM进行训练,在条件修复的情况下,将Pianoroll格式的乐谱特征提取后再与带有Mask的梅尔频谱图使用拼接函数在通道维度上拼接后送入DCT-DDPM进行训练,最后得到对应的训练后的DCT-DDPM,其中,DCT-DDPM为离散余弦变换去噪扩散概率模型; 步骤5:当DCT-DDPM训练完毕后,对于有间隙的音频,将待修复的音频转换为待修复的梅尔频谱图后,在无条件修复的情况下,首先随机初始化一个与待修复的梅尔频谱图形状相同的高斯噪声,然后将待修复的梅尔频谱图和高斯噪声在通道维度拼接后送入DCT-DDPM,得到完整的梅尔频谱图,在条件修复的情况下,使用乐谱编码器提取待修复的音频所对应的Pianoroll格式的乐谱的乐谱特征后,再与带有Mask的梅尔频谱图在通道维度拼接后送入DCT-DDPM,得到完整的梅尔频谱图; 步骤6:使用神经网络声码器或者PGHI相位重建算法将得到的完整的梅尔频谱图反转为音频波形。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人四川大学,其通讯地址为:610000 四川省成都市一环路南一段24号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。