Document
拖动滑块完成拼图
个人中心

预订订单
商城订单
发布专利 发布成果 人才入驻 发布商标 发布需求

请提出您的宝贵建议,有机会获取IP积分或其他奖励

投诉建议

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 积分商城 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 南通大学陈翔获国家专利权

南通大学陈翔获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉南通大学申请的专利一种基于主动学习的代码注释生成方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115480821B

龙图腾网通过国家知识产权局官网在2026-02-06发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202211129739.3,技术领域涉及:G06F8/73;该发明授权一种基于主动学习的代码注释生成方法是由陈翔;周彦琳;曲豫宾;施伊涵;杨光;于池;赵俊杰设计研发完成,并于2022-09-16向国家知识产权局提交的专利申请。

一种基于主动学习的代码注释生成方法在说明书摘要公布了:本发明提供了一种基于主动学习的代码注释生成方法,属于计算机技术领域,解决了在有限的人工标注预算下,导致模型训练数据不足,难以生成高质量代码注释的问题其技术方案为:包括以下步骤:1搜集域内数据集;2预训练通用模型;3设计基于聚类和注意力分散的主动学习采样策略;4在数据采样、标记和模型微调这两个步骤中不断迭代,直到预算用完或达到预定义的终止条件;5在有限的人工标注预算下微调后的模型会为代码段生成更高质量的代码注释。本发明的有益效果为:基于主动学习训练的模型可以在有限的标注预算下使用较少的训练数据为代码片段生成更高质量的注释,从而平衡地达到一定注释质量所需的人力。

本发明授权一种基于主动学习的代码注释生成方法在权利要求书中公布了:1.一种基于主动学习的代码注释生成方法,其特征在于,包括以下步骤: 1搜集域内数据集:从GitHub和Etherscan.io中挖掘高质量的开源项目,搜集开源代码内的函数和对应的注释,形成注释生成数据集D,并进一步划分成训练集和验证集,训练集即为初始的未标记注释生成数据集U; 2预训练通用模型:基于域外标记数据集,预训练一个通用深度学习模型CodeBERT,初始化模型参数,该模型考虑6种编程语言,使用自然语言和编程语言作为其输入,捕捉自然语言和编程语言之间的语义连接,并输出广泛支持自然语言-编程语言任务的通用表示; 3设计主动学习采样策略:基于注意力分散的采样策略和基于聚类的采样策略; 4在验证集中使用神经机器翻译自动评估指标评估生成注释的质量,如果指标数值大于所设阈值或标记预算用完,则终止采样过程,如果指标数值小于或等于所设阈值,则继续执行步骤5; 5数据采样与标记:利用上述步骤3中基于聚类和基于注意力分散的主动学习采样策略,从未标记注释生成数据集U中选出指定数量的代码段进行人工标记,将采样的数据添加到已标记注释生成数据集L中,并从U中移除这些数据,剩余的形成新的未标记注释生成数据集UU=U-L; 6模型微调:基于已标记注释生成数据集L,对代码注释生成模型进行微调,重新训练模型参数,并执行步骤4; 7注释生成阶段:基于主动学习方法微调后的模型在有限的人工标注预算下能为一个新的目标代码段生成更高质量的代码注释。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人南通大学,其通讯地址为:226019 江苏省南通市崇川区啬园路9号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。