上海人工智能创新中心孙秋实获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉上海人工智能创新中心申请的专利用于合成代码生成训练数据的计算设备、方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120524999B 。
龙图腾网通过国家知识产权局官网在2025-09-16发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202511021118.7,技术领域涉及:G06N3/0475;该发明授权用于合成代码生成训练数据的计算设备、方法是由孙秋实;龚敬洋;郭琦鹏设计研发完成,并于2025-07-24向国家知识产权局提交的专利申请。
本用于合成代码生成训练数据的计算设备、方法在说明书摘要公布了:本发明涉及利用计算模型的计算机系统,公开了用于合成代码生成训练数据的计算设备、方法。一种用于合成代码生成训练数据的计算设备包括计算资源、第一智能体和第二智能体。第一智能体被计算资源执行,并被配置成执行数据生成。第二智能体被计算资源执行,并被配置成执行数据反馈。其中经第一智能体和第二智能体迭代生成并反馈的数据所包含的指令集和代码通过了反馈融合判断,其可作为用于训练基座模型来完成代码生成任务的训练数据集。根据本发明的计算设备克服了基于大语言模型的合成代码生成训练数据的技术难以生成高质量的指令‑代码对的局限性,提升了得到用于训练大语言模型执行代码生成任务的高质量指令‑代码对的能力。
本发明授权用于合成代码生成训练数据的计算设备、方法在权利要求书中公布了:1.一种用于合成代码生成训练数据的计算设备,其特征在于,包括: 计算资源;以及 第一智能体,所述第一智能体被所述计算资源执行,并被配置成调用第一模型,以: 接收种子数据,所述种子数据包括指令集和用于所述指令集中的每条指令的关键词集合,每条指令以及相关联的关键词集合与该指令的执行所对应的任务相关联,所述种子数据包括原始种子数据或经更新的种子数据; 针对所述指令集中的第一指令,确定输出代码和测试样例; 将所述输出代码发送到编译器环境;以及 第二智能体,所述第二智能体被所述计算资源执行,并被配置成调用第二模型,以: 接收所述种子数据、所述输出代码、所述测试样例和编译结果,其中,所述编译结果由所述编译器环境对所述输出代码进行编译而得到; 基于所述种子数据、所述输出代码和所述测试样例,确定自然语言反馈; 基于所述编译结果和所述自然语言反馈进行反馈融合判断; 基于所述反馈融合判断的结果,调整所述种子数据中的所述关键词集合中的关键词并基于经调整的关键词更新所述第一指令,所述经更新的种子数据基于经调整的关键词和经更新的第一指令而得到; 基于所述反馈融合判断的结果,选择性地使所述指令集中的所述第一指令和所述输出代码被存储到训练数据集中,所述训练数据集被用于训练基座模型来完成代码生成任务。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人上海人工智能创新中心,其通讯地址为:200233 上海市徐汇区龙文路129号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。