杭州市滨江区浙工大网络空间安全创新研究院翔云获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉杭州市滨江区浙工大网络空间安全创新研究院申请的专利一种基于自动机解释的文本对抗样本检测方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN117216612B 。
龙图腾网通过国家知识产权局官网在2026-01-09发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202311191887.2,技术领域涉及:G06F18/23213;该发明授权一种基于自动机解释的文本对抗样本检测方法是由翔云;李香玉;朱艺沁设计研发完成,并于2023-09-15向国家知识产权局提交的专利申请。
本一种基于自动机解释的文本对抗样本检测方法在说明书摘要公布了:本发明公开了一种基于自动机解释的文本对抗样本检测方法,属于文本处理技术领域,包括构建原始分类模型;依据概率学习算法,从原始网络模型中抽象生成概率自动机;基于测试数据集生成对抗样本,加入到测试集中,构成待筛选的混合数据集;将待筛选的混合数据集输入原始网络模型,进而得到样本在概率自动机上的运行轨迹,将样本在自动机上的运行信息带入指标计算公式,根据指标结果对样本进行筛选。本发明通过计算样本在循环神经网络模型的代理模型‑概率自动机上运行的信息,通过可疑度指标来度量样本是对抗样本的可疑程度,通过对样本可疑度指标进行排序,可以有效筛选出样本集中的对抗样本。
本发明授权一种基于自动机解释的文本对抗样本检测方法在权利要求书中公布了:1.一种基于自动机解释的文本对抗样本检测方法,其特征在于,包括以下步骤: 步骤1:获取文本样本,构建文本样本测试集; 步骤2:构建循环神经文本网络分类模型,通过所述文本样本测试集训练得到原始分类网络模型; 步骤3:根据概率学习算法,从所述原始分类网络模型中生成概率自动机; 步骤4:基于所述文本样本测试集生成所述原始分类网络模型的对抗样本,将所述对抗样本加入到所述文本样本测试集中,构成待筛选的混合数据集; 步骤5:将所述待筛选的混合数据集输入所述原始分类网络模型中,获取所述混合数据集的文本样本在所述概率自动机上的运行轨迹,根据所述运行轨迹得到对应的所述文本样本的指标结果;根据所述指标结果对所述待筛选的混合数据集中的文本样本进行筛选,得到目标对抗样本; 所述步骤5具体包括: 步骤5.1:将所述待筛选的混合数据集输入到所述原始分类网络模型中,得到对应的抽象轨迹; 步骤5.2:将所述抽象轨迹展现在所述概率自动机中,通过所述抽象轨迹在所述概率自动机中的运行信息,计算出所述待筛选的混合数据集中文本样本的三个筛选指标数值; 步骤5.3:给每个指标设置权重,将样本的三个筛选指标合并成一个指标数据; 步骤5.4:将每个文本样本的指标数值与阈值进行比较,小于阈值的即为所述目标对抗样本; 所述三个筛选指标分别是指路径平均概率、状态跳变率和错误步数累计率; 所述路径平均概率定义为: 其中,state_proi是所述文本样本的抽象轨迹每一步跳转的概率,N是所述文本样本的抽象轨迹序列长度; 所述状态跳变率定义为: 其中state_trace是文本样本抽象轨迹前i-1步在概率自动机上的状态集,statei为第i步跳转的状态,N是所述文本样本的抽象轨迹序列长度; 所述错误步数累计率定义为: 其中statepro是文本样本的抽象轨迹概率自动机上第i步的概率,state_tracei是概率自动机在当前状态去往下一个状态的概率序列。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人杭州市滨江区浙工大网络空间安全创新研究院,其通讯地址为:310051 浙江省杭州市滨江区长河街道湖西路575号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励