中国科学院高能物理研究所齐法制获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉中国科学院高能物理研究所申请的专利一种基于粗粒度数据标签的不平衡恶意流量检测方法及系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115378641B 。
龙图腾网通过国家知识产权局官网在2025-10-31发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202210820235.X,技术领域涉及:H04L9/40;该发明授权一种基于粗粒度数据标签的不平衡恶意流量检测方法及系统是由齐法制;李镇宇;王佳荣;颜田;周彩秋设计研发完成,并于2022-07-13向国家知识产权局提交的专利申请。
本一种基于粗粒度数据标签的不平衡恶意流量检测方法及系统在说明书摘要公布了:本发明涉及一种基于粗粒度数据标签的不平衡恶意流量检测方法及系统,其方法包括:S1:分别在不同时段采集恶意流量数据和正常流量数据,构建数据集合,对每个数据集合标注粗粒度标签y,每个数据xi继承其所属数据集合的标签y;S2:对数据xi用多种聚类算法按照不同子特征进行聚类,计算恶意流量数据的预估得分si;S3:将xi的稠密向量表示ei输入多示例学习模型,输出各个xi的预测值pi,用si构建损失函数以训练多示例学习模型;S4:根据pi更新si,当pi属于恶意流量,则增加si值,反之则减小si值。本发明提供的方法只需进行粗粒度数据标记,利用预估恶意数据分数,使得多示例学习模型的恶意数据预测准确率接近细粒度数据标记的监督学习模型的效果。
本发明授权一种基于粗粒度数据标签的不平衡恶意流量检测方法及系统在权利要求书中公布了:1.一种基于粗粒度数据标签的不平衡恶意流量检测方法,其特征在于,包括: 步骤S1:分别在不同时段采集恶意流量数据和正常流量数据,按照不同时段构建数据集合,对每个所述数据集合标注粗粒度标签,每个数据继承其所属数据集合的标签,得到的标签;其中,有N+1个类别标签,前N个为恶意数据标签,第N+1个为正常数据标签,具体包括: 步骤S11:在不同时段,对恶意网络攻击进行模拟仿真,获取恶意流量数据,同时,在安全的网络环境下,进行正常的网络操作,获取正常流量数据; 步骤S12:将同一时段的所述恶意流量数据和所述正常流量数据进行合并,构建该时段的数据集合,按照所述数据集合中包含数据的类别,对每个所述数据集合进行标注,得到其粗粒度标签,并且每个数据继承其所属数据集合的标签,得到的标签;其中,有N+1个类别标签,前N个为恶意数据标签,第N+1个为正常数据标签; 步骤S2:将数据的不同子特征经过嵌入编码后,得到稠密向量表示,采用多种聚类算法按照所述子特征进行聚类,计算每个带有恶意数据标签的数据的预估得分,具体包括: 步骤S21:将向子特征空间投影,提取的不同子特征;将不同所述子特征经过嵌入编码后,得到稠密向量表示; 步骤S22:使用一种聚类算法对在一个所述子特征进行聚类,得到不同簇,每个所述簇的每个所述数据保留其继承自所属数据集合的粗粒度标签; 步骤S23:在每个所述簇中,计算每类恶意数据集合所占比例,作为该恶意数据类别在该簇的预估得分,带有正常数据类别标签的数据的预估得分均记为0; 步骤S24:使用不同聚类算法,重复步骤S22~S23; 步骤S25:重复步骤S22~S24,对不同的所述子特征进行聚类以及计算预估得分; 步骤S26:对于每个带有恶意数据标签的所述数据,将其在每一次聚类过程中得到的预估得分求平均值,作为其最终的预估得分; 步骤S3:将输入多示例学习模型,输出各个对应的预测值,并利用构建损失函数以训练所述多示例学习模型,具体包括: 步骤S31:获取同一时间段的数据、对应的粗粒度标签和预估得分; 步骤S32:将对应的稠密向量表示输入多示例学习模型,通过神经网络的前向传播计算,得到的预测值; 步骤S34:利用计算所述多示例学习模型预测的损失值Loss,如公式1~2所示,通过梯度下降算法更新所述多示例学习模型,使其能够拟合正常网络流量和恶意网络流量的数据分布: Loss=1 2 其中,表示交叉熵损失函数,表示正常数据标签值,表示为恶意数据标签值,λ是一个超参数; 公式2中表示在该时间段分区内所有数据中为恶意流量数据概率最高的数据; 步骤S4:当所述多示例学习模型在训练模式下,根据所述预测值更新,即属于恶意流量,则增加值,反之则减小值;当所述多示例学习模型在预测模式下,根据值进行预警。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人中国科学院高能物理研究所,其通讯地址为:100049 北京市石景山区玉泉路19乙物资楼101;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励