四川大学王海舟获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉四川大学申请的专利一种基于对抗样本的大字符集验证码攻击防御方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN116665214B 。
龙图腾网通过国家知识产权局官网在2025-12-12发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202310377899.8,技术领域涉及:G06V30/10;该发明授权一种基于对抗样本的大字符集验证码攻击防御方法是由王海舟;杨涵;傅宇成;孙国恒;黄骏天设计研发完成,并于2023-04-11向国家知识产权局提交的专利申请。
本一种基于对抗样本的大字符集验证码攻击防御方法在说明书摘要公布了:本发明公开了一种基于对抗样本的大字符集验证码攻击防御方法,首先采集中文验证码服务网站上现有的大字符集验证码数据并进行人工标注,同时模仿爬取到的验证码生成极为相似的新的验证码,从而构建了一个扩充后的验证码数据集;然后别构建字符检测和识别模型,基于这两类模型分别在验证码的字符和背景上生成噪声;最后根据结合输入变换、梯度攻击和注意力机制的对抗样本验证码生成方法,生成针对验证码字符识别模型的对抗样本字符;对于验证码字符检测模型的威胁,采用集成式的对抗样本生成方法,集成多种不同架构字符检测模型的损失函数,将不同架构字符检测模型的黑盒设置转换为白盒设置,在验证码的背景上生成对抗噪声以防御字符检测模型。
本发明授权一种基于对抗样本的大字符集验证码攻击防御方法在权利要求书中公布了:1.一种基于对抗样本的大字符集验证码攻击防御方法,其特征在于,包括以下步骤: 步骤1:采集中文验证码服务网站上现有的大字符集验证码数据并进行人工标注,同时模仿得到的验证码生成新的验证码,从而构建扩充的验证码数据集; 步骤2:构建字符检测模型和字符识别模型,字符检测模型包括用于生成针对字符检测模型的噪声的白盒模型,以及用于测试对抗样本的迁移效果的黑盒模型;字符识别模型包括用于生成对抗样本字符以防御字符识别模型的白盒模型,以及用于测试对抗样本的迁移效果的黑盒模型;基于字符检测模型和字符识别模型分别在验证码的字符和背景上生成噪声; 步骤3:对抗样本验证码的生成 步骤3.1:在对抗样本验证码生成过程中,采用结合梯度攻击、输入变换和注意力机制的对抗样本生成方法,生成针对验证码字符识别模型的对抗样本字符; 步骤3.2:面对验证码字符检测模型的威胁,采用集成式的对抗样本生成方法,集成多种不同架构字符检测模型的损失函数,将不同架构字符检测模型的黑盒设置转换为白盒设置,在验证码的背景上生成对抗噪声以防御字符检测模型; 所述步骤3中生成针对验证码字符识别模型的对抗样本字符具体包括: 步骤3.1.1:确定对抗样本生成模型的损失函数; 寻找的对抗样本图片满足以下条件 1 2 其中,为对抗样本生成模型的参数,为任意的输入字符图片,为图片的类别真实标签,为每个像素点处的最大噪声幅度; 通过最大化对抗样本生成模型下输入字符图片对真实类别的损失值来达到寻找对抗样本的目的,采用类别交叉熵作为对抗样本生成模型的损失函数: 3 步骤3.1.2:基于梯度的攻击; 计算得到对损失函数的导数,在梯度迭代步骤中结合梯度方差缩减和Nesterov迭代;在每次迭代前,将当前epoch中的对抗样本字符进行一次更新得到: 4 其中,为当前epoch中的对抗样本字符,为动量衰减因子,为每一步迭代中添加的噪声幅度,为更新后的对抗样本字符;为第迭代的梯度; 在每一个epoch中,更新梯度后,根据以下公式更新梯度方差: 5 其中,为更新后的梯度方差;且 6 式中,代表在计算梯度方差时,对当前周围的个临近点的梯度进行采样;的临近点定义为,其中代表随机向量,每一个点都服从范围内的均匀分布,为梯度方差计算的超参数,代表第个随机向量;代表采样自的随机向量;表示随机采样前对损失函数的导数,表示的临近点对损失函数的导数; 在梯度更新时,将上一步得到的梯度方差和对损失函数的导数相加,基于动量更新第次迭代的梯度: 7 其中,为经过动量更新后的梯度,表示L1范数; 步骤3.1.3:输入变换攻击 采用多种输入方法:在字符图片被输入到对抗样本生成模型之前,以概率对其施加整形和填充: 8 采用平移不变性方法:将图片进行平移以达到数据扩增的目的,并使用核矩阵与原图片进行卷积运算: 9 其中,为预定义的卷积核矩阵,为经过卷积运算后的梯度,为原始梯度; 采用放缩不变性方法:将单个输入图片扩增成一系列的新图片,并在计算梯度时取这些新图片梯度的加权平均: 10 其中,表示扩增后图片的数量; 步骤3.1.4:在验证码字符上基于注意力机制调整噪声幅度 为获得白盒模型特征层中的每一个位置对于结果的贡献,将对抗样本生成模型的注意力近似看作特征图对输入图片的真实标签的空域池化梯度: 11 其中,代表第层的第个特征图,是归一化因子,使得;则得到相对于真实标签的第个卷积层第个特征图的注意力权重;表示白盒模型;、n分别表示像素点的横、纵坐标; 将不同的特征图经过注意力权重进行放缩,获取模型更加关注的特征,随后对各通道的特征进行求和并使用ReLu激活函数进行处理,去除负值得到: 12 其中,表示去除负值的注意力激活图; 对特征图加权求和后的结果取绝对值,同时将结果再次归一化到[0,1],随后将得到的整形到与输入图片相同大小;由于卷积神经网络的平移不变性,映射回去的热力图表现模型在原图片中不同位置的注意力权重: 13 其中,表示取绝对值后的注意力激活图; 根据构造一个基于的掩膜,其决定在迭代式对抗样本生成过程中在对抗样本更新噪声时每一次迭代所能够更新的噪声幅度: 14 其中,为每一个epoch的噪声更新幅度,,是每个点处允许的最大噪声幅度,是迭代轮数,是用于放大步幅的超参数,它在迭代结束对图片进行裁剪以保证。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人四川大学,其通讯地址为:610065 四川省成都市武侯区一环路南一段24号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励