哈尔滨工业大学苏小红获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉哈尔滨工业大学申请的专利基于跨模态细粒度特征对齐和融合的语句级漏洞检测方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119475352B 。
龙图腾网通过国家知识产权局官网在2025-09-09发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411576635.6,技术领域涉及:G06F21/57;该发明授权基于跨模态细粒度特征对齐和融合的语句级漏洞检测方法是由苏小红;陶文鑫;张丝敏;柯晔坤;韩一;郑宇设计研发完成,并于2024-11-06向国家知识产权局提交的专利申请。
本基于跨模态细粒度特征对齐和融合的语句级漏洞检测方法在说明书摘要公布了:本发明公开了一种基于跨模态细粒度特征对齐和融合的语句级漏洞检测方法,所述方法将高级程序语言代码转换为源代码语句与汇编代码指令序列对齐且源代码变量与汇编代码寄存器对齐的双模态融合信息的汇编代码,通过双模态互切和双模态净化方法对代码进行预处理,得到净化后的源代码切片和汇编代码切片;将净化后到的双模态切片代码段送入编码网络进行双模态特征融合并学习语句的长依赖关系;将双模态信息融合的代码切片高级向量表示送入解码网络,将编码器得到的语义向量转换为特定序列;将解码网络的输出结果送入分类器中判别待测代码语句是否含有漏洞。本发明可检测出包含多种类型的漏洞或跨越多行语句的复杂漏洞结构,有效地降低误报率和漏报率。
本发明授权基于跨模态细粒度特征对齐和融合的语句级漏洞检测方法在权利要求书中公布了:1.一种基于跨模态细粒度特征对齐和融合的语句级漏洞检测方法,其特征在于所述方法包括如下步骤: 步骤1:将高级语言源代码转换为源代码语句与汇编代码指令序列对齐且寄存器与变量对齐的双模态融合信息的汇编代码; 步骤2:使用静态分析工具解析源代码,生成其抽象语法树和程序依赖图; 步骤3:根据源代码的切片准则生成未经净化的源代码和汇编代码的切片代码段; 步骤4:对步骤3获得的源代码切片进行净化处理,即删除源代码切片内无对应汇编指令序列的源代码语句行,得到净化处理后的基于源代码切片准则的源代码切片代码段; 步骤5:基于汇编代码的切片准则生成未经净化的源代码和汇编代码的切片代码段; 步骤6:合并步骤3与步骤5中得到的未经净化的汇编切片代码段,并进行净化处理,即用包含双模态融合信息的汇编代码切片代码段的操作数信息替换为融合汇编信息中的注释信息,将净化后的汇编代码切片组成汇编代码切片数据集; 步骤7:合并步骤4获得的基于源代码切片准则的净化后的源代码切片和步骤5获得的基于汇编代码切片准则的源代码切片,并将包含漏洞语句的双模态切片代码段中的漏洞语句所在的行标记为1,表示其为“漏洞语句”,其它语句标记为0,表示其为“非漏洞语句”,组成源代码切片数据集; 步骤8:将双模态切片代码段内的每条双模态语句输入到由CodeBERT构成的语句编码网络中,获得每一条语句融合信息的向量表示,然后将获得的语句融合信息的向量表示输入到由Self-attention构成的程序编码网络,学习语句的长依赖关系; 步骤9:将步骤8获得的双模态信息融合的代码切片高级向量表示送入到由BiGRU构成的解码网络中,学习语句序列的前后关系,增强双模态语句序列间的结构特征; 步骤10:将步骤9解码网络输出的语句隐藏向量表示送入由FCN组成的分类器中,然后经过SoftMax函数后得到预测结果向量,最终得到分类结果,根据分类器的输出结果与代码语句的实际标签计算交叉熵损失,根据损失反向传播调整多模态表示学习模型参数,直到损失值不再下降为止,训练结束; 步骤11:使用训练好的由语句编码网络、程序编码网络、解码网络和分类器构成的细粒度漏洞定位模型对待测试代码进行漏洞检测。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人哈尔滨工业大学,其通讯地址为:150001 黑龙江省哈尔滨市南岗区西大直街92号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励