四川大学杨秋辉获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉四川大学申请的专利一种基于扰动和冻结预训练模型的程序自动修复方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119759659B 。
龙图腾网通过国家知识产权局官网在2025-07-25发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411835331.7,技术领域涉及:G06F11/14;该发明授权一种基于扰动和冻结预训练模型的程序自动修复方法是由杨秋辉;张李政设计研发完成,并于2024-12-13向国家知识产权局提交的专利申请。
本一种基于扰动和冻结预训练模型的程序自动修复方法在说明书摘要公布了:本发明涉及一种基于扰动和冻结预训练模型的程序自动修复方法。首先通过开源代码仓库构建缺陷修复数据集,从包含缺陷修复的历史提交中提取缺陷代码、代码上下文、修复代码,并清洗数据集;通过基于矩阵的扰动方法为预训练模型增加噪声;通过冻结模型的编码器网络减少训练参数量;此外通过检查点集成策略,保存模型训练过程中的多个检查点;最后使用多个检查点推理生成候选补丁列表,对补丁列表重排序后,得到最终的候选补丁列表,最后对列表中的Top‑N的补丁运行测试套件,检查补丁是否能通过所有测试用例,输出正确的补丁。该方法既减少了训练成本,又能提升模型的修复效果。
本发明授权一种基于扰动和冻结预训练模型的程序自动修复方法在权利要求书中公布了:1.一种基于扰动和冻结预训练模型的程序自动修复方法,其特征在于,包括以下步骤: 步骤1,构建程序缺陷修复数据集,所述步骤1包含以下步骤: 步骤1.1,在开源代码仓库的代码提交历史中,查询提交信息包含缺陷修复的历史记录; 步骤1.2,从缺陷修复历史记录中,提取缺陷代码、代码上下文、正确补丁,构建数据集; 步骤1.3,对数据集进行数据清洗,过滤数据集中重复的和修复代码缺失的数据; 步骤2,通过扰动和冻结的方法微调预训练模型,所述步骤2包含以下步骤: 步骤2.1,扰动预训练模型CodeT5的参数; 步骤2.2,冻结预训练模型CodeT5的编码器; 步骤3,通过模型的多个检查点生成补丁,所述步骤3包含以下步骤: 步骤3.1,在模型训练阶段,保存k个检查点,k=5; 步骤3.2,在模型推理阶段,对需要修复的缺陷代码,将缺陷代码和代码上下文作为检查点的输入,在k个检查点上使用束搜索,在每个检查点上为缺陷代码生成n个候选补丁,n=100; 步骤4,补丁排序和验证,所述步骤4包含以下步骤: 步骤4.1,对k个候选补丁列表,首先去除掉重复的补丁,然后按照补丁在原列表中的排名顺序排列,对于排名一样的补丁,按照补丁的置信度得分逆序排序,得到最终的候选补丁列表; 步骤4.2,对于候选列表中排在前面的100个补丁,运行对应的测试套件,检查是否能够通过所有的测试用例。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人四川大学,其通讯地址为:610065 四川省成都市武侯区一环路南一段24号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。