Document
拖动滑块完成拼图
个人中心

预订订单
服务订单
发布专利 发布成果 人才入驻 发布商标 发布需求

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 杭州电子科技大学吴震东获国家专利权

杭州电子科技大学吴震东获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉杭州电子科技大学申请的专利一种大模型越狱攻击测试样例生成方法及系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119988242B

龙图腾网通过国家知识产权局官网在2025-07-04发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510481810.1,技术领域涉及:G06F11/3668;该发明授权一种大模型越狱攻击测试样例生成方法及系统是由吴震东;叶江伟;薛鋆豪;徐凡壹;郭子轩;苏畅设计研发完成,并于2025-04-17向国家知识产权局提交的专利申请。

一种大模型越狱攻击测试样例生成方法及系统在说明书摘要公布了:本发明公开了一种大模型越狱攻击测试样例生成方法及系统,该方法首先选择若干预训练LLM模型做为子模型的基座模型,并构建去安全保护子模型训练数据集、越狱评判子模型训练数据集和任务分解子模型训练数据集,分别训练去安全保护子模型、越狱评判子模型和任务分解子模型。其次根据训练后的去安全保护子模型,构建意图隐藏子模型。然后基于意图隐藏子模型,获得越狱任务评判四元组,并构建奖励函数,对任务分解子模型实施强化学习。最后使用的奖励函数对任务分解子模型进行迭代训练,并装配子模型组件,完成自动化越狱测试样例生成。本发明通过搜索多种不同的攻击路径,可更全面地评估LLM的安全性。

本发明授权一种大模型越狱攻击测试样例生成方法及系统在权利要求书中公布了:1.一种大模型越狱攻击测试样例生成方法,其特征在于,包括以下步骤: 步骤1、选择若干预训练LLM模型做为子模型的基座模型; 步骤2、构建去安全保护子模型训练数据集、越狱评判子模型训练数据集和任务分解子模型训练数据集; 步骤3、根据步骤2得到的三个训练集,分别训练去安全保护子模型、越狱评判子模型和任务分解子模型; 去安全保护子模型:在基座模型基础上经过敏感数据集训练后,得到去安全保护的子模型; 越狱评判子模型:用于提供训练任务分解子模型时强化学习的奖励信号; 步骤4、根据训练后的去安全保护子模型,构建意图隐藏子模型; 步骤5、基于意图隐藏子模型,获得越狱任务评判四元组,并构建奖励函数,对任务分解子模型实施强化学习; 所述获得越狱任务评判四元组具体为:将任务分解后的每个子任务K11分别输入意图隐藏子模型LLM-INTENT-HIDING得到输出的意图隐藏后的子任务K12,然后将意图隐藏后的每一个子任务K12,分别输入目标模型LLM_TARGET,获取每个子任务的输出K13;原任务K10、分解后子任务K11、意图隐藏后的子任务K12和目标模型LLM_TARGET输出K13组成了评判越狱任务是否成功的四元组; 步骤6、使用的奖励函数对任务分解子模型进行迭代训练,并装配子模型组件,完成自动化越狱测试样例生成; 所述装配子模型组件具体为:使用任务分解子模型LLM-DECOMP和意图隐藏子模型LLM-INTENT-HIDING,对原任务实施分解和意图隐藏,先将其输入任务分解子模型LLM-DECOMP获取该任务的所有分解子任务,然后把所有分解子任务分解输入到意图隐藏子模型LLM-INTENT-HIDING中,得到意图隐藏后的子任务;将意图隐藏后的子任务分别输入目标模型LLM_TARGET,得到回答;使用去安全保护子模型LLM-UNALIGNED整合所有回答,运用LLM的总结能力,获取最终的越狱样例回答。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人杭州电子科技大学,其通讯地址为:310018 浙江省杭州市钱塘区白杨街道2号大街1158号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。