成都信息工程大学李斌勇获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉成都信息工程大学申请的专利一种基于分层三阶段深度强化学习的数据检测方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN121509111B 。
龙图腾网通过国家知识产权局官网在2026-03-27发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202610037414.4,技术领域涉及:H04L9/40;该发明授权一种基于分层三阶段深度强化学习的数据检测方法是由李斌勇;肖旸睿;朱鹏陈;杨金鑫设计研发完成,并于2026-01-13向国家知识产权局提交的专利申请。
本一种基于分层三阶段深度强化学习的数据检测方法在说明书摘要公布了:本发明公开了一种基于分层三阶段深度强化学习的数据检测方法,涉及网络入侵检测技术领域,包括获取流量数据样本,将流量样本输入二分类器,并基于通过二分类器的阈值进行分类判断的得到可疑样本集合,将可疑攻击样本输入多分类器,多分类器得到可疑攻击样本属于每个类别的概率向量,基于概率向量构建类别混淆关系图并结合类别混淆关系图归类得到混淆样本集,根据混淆样本集构建对应数量的带有权重的专家分类,专家分类基于类别权重对对应的混淆样本子集进行判别,得到最终混淆结果集。本申请采用上述方法针对少数类和混淆类显著提升了入侵预测的性能。
本发明授权一种基于分层三阶段深度强化学习的数据检测方法在权利要求书中公布了:1.一种基于分层三阶段深度强化学习的数据检测方法,其特征在于,包括以下步骤: S1、获取流量数据样本,将流量样本输入LightGBM二分类器,模型输出向量,为正常概率; 通过LightGBM二分类器的阈值判断,若攻击的概率小于,则流量数据样本为良性样本,归类为; 若攻击的概率大于等于,则流量数据样本为可疑样本集合; S2、将可疑攻击样本输入LightGBM多分类器,LightGBM多分类器得到可疑攻击样本集的预测类别集; 基于所有样本的预测类别集构建类别混淆关系图并结合类别混淆关系图归类得到混淆样本集; S3、根据混淆样本集构建对应数量的带有权重的LightGBM专家分类,LightGBM专家分类基于类别权重对对应的混淆样本子集进行判别,得到最终混淆结果集; 所述LightGBM专家分类的类别权重由DDQN智能体动态优化; 基于每一个样本预测类别构建类别混淆关系图并结合类别混淆关系图归类得到混淆样本集的具体内容为: 通过基于5折交叉验证的混淆识别机制进行混淆处理得到每一个样本预测类别,进而得到可疑样本集在验证集上的混淆矩阵; 基于这个混淆矩阵,计算出任意两个类别之间的对称混淆权重; 基于混淆阈值,将所有混淆权重高于该阈值的类别对识别出来,并构建类别混淆关系图; 基于类别混淆关系图推理来分流可疑样本集; 若可疑样本在类别混淆关系图属于孤立节点,则定义为容易被分类的攻击类别,直接输出结果; 若可疑样本在类别混淆关系图属于某个由多条混淆边连接而成的连通子图,则将样本归类为混淆样本并存储在混淆样本集中; 基于5折交叉验证的混淆识别机制包括在可疑攻击样本上通过5折交叉验证,为每一个训练样本都生成折外预测结果集即样本预测类别; 基于折外预测结果集和可疑攻击样本的真实标签构建折外预测混淆矩阵OOF; 基于可疑攻击样本的真实标签和所有的折外预测混淆矩阵OOF构建混淆矩阵; 对称混淆权重为类别和类别之间的对称混淆权重; 基于混淆阈值,将所有混淆权重高于该阈值的类别对识别出来,并构建类别混淆关系图的具体内容为: 所述类别混淆关系图为无向加权图,其中,表示混淆关系图的所有点的集合,每一个点表示一种攻击类别;表示每一个点之间的边的集合,也就是每一个点之间的混淆关系; 其中每个攻击类别是一个顶点; 若任意两个类别和之间的混淆权重高于,在类别和类别之间添加一条边; 所述DDQN智能体的状态空间为,包括状态; 其中,; 其中,t为当前时间步,表示混淆组中的类别数量,表示类别在当前时间步的权重,表示在当前权重下类别当前训练集上训练后取得的宏平均F1分数,则表示当前时间步所有混淆类别的宏平均F1分数; 通过状态空间,DDQN智能体得到每一个类别的权重对于每一个类别的宏平均F1分数与总体宏平均F1分数的影响; 所述DDQN智能体的动作空间为; 在当前时间步,DDQN智能体选择一个动作,动作空间定义为: ; 其中,m表示动作数量,表示要调整的类别,表示当前时间步对该类进行的具体操作为动作; 所述DDQN智能体的奖励函数为; 奖励为宏平均F1分数的增量,奖励的表达式为: ; 其中,是执行动作后,即当前时间步在验证集上得到的宏平均F1分数,为上一个时间步在验证集上得到的宏平均F1分数; 所述DDQN智能体采用双重深度Q网络为核心算法; 双重深度Q网络包括:用于进行动作选择的当前Q网络,其参数为; 用于评估动作价值的目标网络,其参数为; 在训练过程中,DDQN智能体的交互经验,即一系列的状态转移元组,被存储在一个经验回放池中; 训练时,从中随机采样一个小批量的数据; 对于每一个样本,DDQN通过最小化一个均方误差损失函数来更新当前Q网络的参数 其中,是当前Q网络对在状态下执行动作的价值预测; TD目标的表达式为: 其中,是执行动作后获得的即时奖励,是折扣因子,一个介于之间的超参数,用于权衡即时奖励与未来奖励的重要性,是当前Q网络来选择在下一状态中价值最高的动作,而表示这一部分使用目标网络来评估那个被选出的动作的价值。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人成都信息工程大学,其通讯地址为:610225 四川省成都市双流区西南航空港学府路一段24号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励