深圳市大数据研究院王力获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉深圳市大数据研究院申请的专利音频深度伪造检测方法、装置、计算机设备及存储介质获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119694319B 。
龙图腾网通过国家知识产权局官网在2025-11-11发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411863864.6,技术领域涉及:G10L17/02;该发明授权音频深度伪造检测方法、装置、计算机设备及存储介质是由王力;武执政设计研发完成,并于2024-12-16向国家知识产权局提交的专利申请。
本音频深度伪造检测方法、装置、计算机设备及存储介质在说明书摘要公布了:本申请公开了音频深度伪造检测方法、装置、计算机设备及存储介质,其方法实现,包括:获取提示音频数据以及待检测音频数据;分别对所述提示音频数据与所述待检测音频数据进行特征提取,以得到提示音频特征以及待检测音频特征;将所述提示音频特征与对应的标签作为上下文提示信息,通过预设预测模型对所述待检测音频特征进行预测;基于预测结果,确定所述待检测样本数据是否为伪造音频。本申请实施例中,通过上下文学习能力提升模型对未知伪造方法的泛化能力,并且通过上下文学习的方式,在模型判别测试样本时,给予一定的提示样本,帮助模型更好地理解伪造音频特征,并提升检测的准确性。
本发明授权音频深度伪造检测方法、装置、计算机设备及存储介质在权利要求书中公布了:1.一种音频深度伪造检测方法,其特征在于,所述方法,包括: 获取提示音频数据以及待检测音频数据; 分别对所述提示音频数据与所述待检测音频数据进行特征提取,以得到提示音频特征以及待检测音频特征,包括:将所述提示音频数据与所述待检测音频数据分别转换为梅尔频谱图;基于所述梅尔频谱图,生成高级音频特征,以作为所述提示音频特征以及待检测音频特征,其中,所述高级音频特征通过如下方式得到:将所述梅尔频谱图分别输入至卷积模块以及Transformer模块中进行特征编码,通过所述卷积模块提取局部特征,通过所述Transformer模块提取全局特征;对所述局部特征以及所述全局特征进行特征融合,并进行归一化和残差连接,以生成所述高级音频特征; 将所述提示音频特征与对应的标签作为上下文提示信息,通过预设预测模型对所述待检测音频特征进行预测; 基于预测结果,确定所述待检测音频数据是否为伪造音频; 其中,所述通过预设预测模型对所述待检测音频特征进行预测之前,还包括: 构建训练音频样本数据集,所述训练音频样本数据集包括提示样本以及训练样本; 从所述训练音频样本数据集中选取多个所述提示样本进行特征提取,以得到多个提示特征,从所述训练音频样本数据集中选取初始训练样本进行特征提取,以得到训练特征; 将各所述提示特征与对应的标签作为上下文提示信息,通过初始预测模型对所述训练特征进行预测; 基于预设损失函数,计算本次预测结果的损失值; 若所述损失值大于预设阈值,则从所述训练音频样本数据集中选取下一个训练样本进行特征提取与预测,直到符合预设收敛条件时,得到所述预设预测模型。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人深圳市大数据研究院,其通讯地址为:518000 广东省深圳市龙岗区龙城街道龙翔大道2001号道远楼225室;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励