西华大学史沧红获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉西华大学申请的专利音频复制移动深度伪造检测方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN118865987B 。
龙图腾网通过国家知识产权局官网在2025-07-11发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202410867697.6,技术领域涉及:G10L17/26;该发明授权音频复制移动深度伪造检测方法是由史沧红;邱新;李孝杰;吴敏;邵敏锋;熊玲;牛宪华设计研发完成,并于2024-07-01向国家知识产权局提交的专利申请。
本音频复制移动深度伪造检测方法在说明书摘要公布了:本发明公开了一种音频复制移动深度伪造检测方法,属于数字音频技术领域,包括如下步骤:获取待检测音频,基于待检测音频生成梅尔频谱图和希尔伯特黄频谱图;将梅尔频谱图和希尔伯特黄频谱图进行加权融合,得到融合频谱图;构建音频分类卷积神经网络,并设定网络预设参数;对音频分类卷积神经网络进行训练,得到训练好的音频分类卷积神经网络;将融合频谱图输入训练好的音频分类卷积神经网络进行音频复制移动深度伪造检测,得到音频复制移动深度伪造检测结果。本发明解决了现有音频复制移动伪造检测精度不足和无法检测音乐音频的问题。
本发明授权音频复制移动深度伪造检测方法在权利要求书中公布了:1.一种音频复制移动深度伪造检测方法,其特征在于,包括如下步骤: S1、获取待检测音频,基于待检测音频生成梅尔频谱图和希尔伯特黄频谱图; S2、将梅尔频谱图和希尔伯特黄频谱图进行加权融合,得到融合频谱图; 所述S2中融合频谱图的计算表达式如下: 其中,Ffusionx,y表示融合频谱图上横坐标为x且纵坐标为y处的像素,ω1表示第一融合权重系数,F1x,y表示梅尔频谱图上横坐标为x且纵坐标为y处的像素,ω2表示第二融合权重系数,F2x,y表示希尔伯特黄频谱图上横坐标为x且纵坐标为y处的像素; 若音频复制移动伪造检测对应的攻击模式为加性噪声时,令第一融合权重系数取值为0.7,第二融合权重系数取值为0.3,并进行梅尔频谱图和希尔伯特黄频谱图的加权融合; 若音频复制移动伪造检测对应的攻击模式为中值滤波进行时,令第一融合权重系数取值为0.8,第二融合权重系数取值为0.2,并进行梅尔频谱图和希尔伯特黄频谱图的加权融合; 若音频复制移动伪造检测对应的攻击模式为压缩音频攻击时,令第一融合权重系数取值为0.9,第二融合权重系数取值为0.1,并进行梅尔频谱图和希尔伯特黄频谱图的加权融合; 若音频复制移动伪造检测对应的攻击模式未知时,令第一融合权重系数取值为0.8,第二融合权重系数取值为0.2,并进行梅尔频谱图和希尔伯特黄频谱图的加权融合; S3、构建音频分类卷积神经网络,并设定网络预设参数; 所述音频分类卷积神经网络包括依次连接的图像输入层、第一卷积模块、第二卷积模块、第三卷积模块、第四卷积模块、全连接层和softmax层; 所述第一卷积模块包括依次连接的第一卷积层、批归一化层和第一最大池化层和第一激活层; 所述第二卷积模块包括依次连接的第二卷积层、第二最大池化层和第二激活层; 所述第三卷积模块包括依次连接的第三卷积层、第三激活层和第一平均池化层; 所述第四卷积模块包括依次连接的第四卷积层、第四激活层和第二平均池化层; S4、对音频分类卷积神经网络进行训练,得到训练好的音频分类卷积神经网络; S5、将融合频谱图输入训练好的音频分类卷积神经网络进行音频复制移动深度伪造检测,得到音频复制移动深度伪造检测结果。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人西华大学,其通讯地址为:610039 四川省成都市金牛区土桥金周路999号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。