东南大学陈阳获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉东南大学申请的专利一种基于多版本预处理序列融合的对抗样本还原方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN116884401B 。
龙图腾网通过国家知识产权局官网在2026-02-24发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202310846992.9,技术领域涉及:G10L15/06;该发明授权一种基于多版本预处理序列融合的对抗样本还原方法是由陈阳;陈凯;汪哲贤设计研发完成,并于2023-07-11向国家知识产权局提交的专利申请。
本一种基于多版本预处理序列融合的对抗样本还原方法在说明书摘要公布了:本发明公开了一种即插即用的语音对抗样本防御方法,首先通过高斯噪声对输入的语音进行平滑处理,生成具有细微不同的平滑语音序列,然后将平滑语音序列输入到多版本预处理算法模块,用不同实现的压缩算法和增强算法对平滑语音进行处理,生成多版本语音序列;接着将生成的多版本语音序列输入到语音识别系统中,获取对应的语音转录文本序列;最后通过众数投票权重分配ModeVotingWeightAllocation,MVWA方法对各个文本序列进行权重分配,然后根据权重以识别器输出投票错误减少RecognizerOutputVotingErrorReduction,ROVER算法对输入语音的良性转录进行估计。通过本发明能够实现将有攻击性的对抗样本还原成良性样本,提高了语音识别系统的安全性能,为对抗样本的防御提供了一种有效的还原方法。
本发明授权一种基于多版本预处理序列融合的对抗样本还原方法在权利要求书中公布了:1.一种基于多版本预处理序列融合的对抗样本还原方法,其特征在于,所述方法具体步骤如下: 步骤1,将良性样本或者对抗样本输入到MVPSF算法中,旨在对良性样本处理后不会影响其转录,而对抗样本的转录会恢复为良性转录;使用高斯噪声算法对输入的语音进行平滑处理,即使用高斯噪声算法生成n个长度与输入长度相同的、均值为、0方差为σ的高斯噪声序列,然后将n个噪声分别加到输入上,从而获得了具有细微不同的平滑语音序列,并能对对抗扰动进行一定程度的破坏; 步骤2,将得到的平滑处理语音序列输入到多版本预处理算法模块中进行处理,该模块有n个不同实现的压缩算法和增强算法共同构成;具体来说,将步骤1中的n个平滑语音分别使用一个预处理算法进行处理并输出,便通过该模块获得了多版本预处理语音序列; 步骤3,将原始输入语音以及多版本语音序列同时输入到目标语音识别系统中,目标语音识别系统对每一个语音进行转录并输出,最终获得了原始转录p以及多版本语音转录序列; 步骤4,将原始转录p以及多版本语音转录序列输入到众数投票权重分配模块进行权重的计算; 步骤5,将多版本语音转录序列和各转录的权重序列输入到ROVER模块中投票进行良性样本转录的提取并输出,即为给定的对抗样本的良性转录估计; 其中步骤4中,在众数投票权重分配模块中,其输入有两个变量以及一个常量,输入的变量为原始音频的转录以及多版本语音转录序列;输入的常量为多版本预处理算法模块中各个预处理算法对应的对抗样本二分类的字符错误率阈值数组,在众数权重分配模块中,首先根据原始音频的转录以及多版本语音转录序列计算多版本语音预处理算法处理后的文本的字符错误率;然后根据阈值以及计算得到的字符错误率进行对抗样本的分类;最后根据样本被分类为对抗样本的预处理算法的个数来进行样本分类,具体如下,当样本被分类为对抗样本的预处理算法个数不低于预处理算法总数的一半时,则认为该样本为对抗样本的概率更大,反之为良性样本的概率更大;最后根据样本的分类情况进行权重的计算,权重的计算公式为: 式中,num表示将输入样本分类为对抗样本的预处理算法数量,表示第ii=1,…,n个预处理算法设置的字符错误率分类阈值。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人东南大学,其通讯地址为:210096 江苏省南京市玄武区四牌楼2号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励