烟台哈尔滨工程大学研究院赵宇轩获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉烟台哈尔滨工程大学研究院申请的专利一种具备自我调试能力的代码开发系统及方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN121349416B 。
龙图腾网通过国家知识产权局官网在2026-02-24发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202511912613.7,技术领域涉及:G06F8/20;该发明授权一种具备自我调试能力的代码开发系统及方法是由赵宇轩;李鑫彤;徐国庆;范文卓;李冬雪设计研发完成,并于2025-12-18向国家知识产权局提交的专利申请。
本一种具备自我调试能力的代码开发系统及方法在说明书摘要公布了:本发明公开了一种具备自我调试能力的代码开发系统及方法,涉及人工智能与软件工程技术领域。该系统包括代码缺陷获取模块、自我调试模型模块、可验证评估模块和策略更新模块。自我调试模型模块基于大语言模型生成候选代码修复方案;策略更新模块采用自适应熵引导强化学习方法,通过计算模型策略熵的变化量,动态调整用于训练的优势函数,以激励模型在探索新修复路径与利用已知有效方法之间实现智能权衡。对应的方法基于该系统进行模型训练与代码修复。本发明解决了现有基于强化学习的代码调试方法中探索能力不足、修复策略过早收敛的问题,能够提升模型生成修复方案的多样性与鲁棒性。
本发明授权一种具备自我调试能力的代码开发系统及方法在权利要求书中公布了:1.一种具备自我调试能力的代码开发系统,包括代码生成模块,所述代码生成模块基于大语言模型,其特征在于:代码生成模块为自我调试模型模块;还包括代码缺陷获取模块、可验证评估模块和策略更新模块; 所述代码缺陷获取模块用于接收待调试的源代码文件,并从编译器或静态代码分析工具中获取与该源代码相关的错误报告信息; 所述自我调试模型模块,用于接收所述源代码和所述代码缺陷获取模块输出的错误报告信息,并生成一个或多个候选代码修复方案; 所述可验证评估模块用于对每个候选的代码修复方案进行编译和执行,并通过预设的单元测试用例集进行验证,根据验证结果为每个代码修复方案生成一个可量化的奖励信号; 所述策略更新模块用于根据所述奖励信号,采用自适应熵引导强化学习方法对所述自我调试模型模块中的大语言模型参数进行更新; 其中,策略更新模块所采用的自适应熵引导强化学习方法的步骤包括: 步骤P1:计算模型在当前代码生成策略下的策略熵,得到策略熵的变化量; 策略熵的变化量的计算方式为: ; 上式中,为自我调试模型模块在当前代码生成策略下的策略熵,为上一次更新迭代时的策略熵; 对于任意一次更新迭代,策略熵的计算公式为: ; 上式中,为本次更新时自我调试模型模块生成的代码修复方案总数,表示本次代码修复方案的平均长度,即每个方案包含的平均时间步数;表示第个代码修复方案在第个时间步的状态,即当时的代码上下文和错误报告信息;表示在时间步模型生成的一个可能的动作,每一个时间步选择一个最终的动作,该动作将影响状态;表示对当前时间步所有可能的动作对应的计算对象进行求和;表示对于自我调试模型模块中当前参数为的大语言模型,在状态下生成动作的概率; 步骤P2:基于策略熵的变化量计算自适应熵引导的优势函数; 步骤P2中,设本次更新时自我调试模型模块生成的代码修复方案为,第个代码修复方案通过可验证评估模块获得的奖励信号记为;若该代码修复方案通过验证,则;否则; 计算自适应熵引导的优势函数的方式为: 步骤P2-1:计算该次所有代码修复方案的平均奖励以及每个代码修复方案的原始优势函数; 步骤P2-2:基于所述原始优势函数和所述策略熵的变化量,计算各代码修复方案的自适应熵引导的优势函数; 自适应熵引导的优势函数的计算公式为: ; 上式中,为第个代码修复方案的自适应熵引导的优势函数;为第个代码修复方案的原始优势函数,是原始优势函数的绝对值;和是预设的超参数;是双曲正切函数 步骤P3:根据自适应熵引导的优势函数计算损失并更新模型参数; 步骤P3具体包括: 步骤P3-1:设本次更新时自我调试模型模块生成的代码修复方案为,构建待最大化的目标函数: ; 上式中,是重要性采样比率;是截断函数,用于限制在区间内;为超参数;为第个代码修复方案的自适应熵引导的优势函数; 的计算公式为: ; 上式中,表示本次代码修复方案的平均长度,表示本次迭代时自我调试模型模块的大语言模型在第个时间步的状态下生成该时间步最终所选择的动作的概率;表示对于上一次迭代时自我调试模型模块的大语言模型在第个时间步的状态下生成该时间步最终所选择的动作的概率;表示本次迭代时大语言模型的参数,表示上一次迭代时大语言模型的参数; 步骤P3-2:构建用于梯度下降优化的损失函数;通过优化器最小化此损失函数,对自我调试模型模块的大语言模型的参数进行更新,从而完成一次训练迭代。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人烟台哈尔滨工程大学研究院,其通讯地址为:264000 山东省烟台市烟台经济技术开发区青岛大街1号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励