Document
拖动滑块完成拼图
个人中心

预订订单
服务订单
发布专利 发布成果 人才入驻 发布商标 发布需求

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 广东工业大学凌枫获国家专利权

广东工业大学凌枫获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉广东工业大学申请的专利基于大语言模型分类与原型集成的代码搜索方法、系统及设备获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119961381B

龙图腾网通过国家知识产权局官网在2025-09-12发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510438207.5,技术领域涉及:G06F16/33;该发明授权基于大语言模型分类与原型集成的代码搜索方法、系统及设备是由凌枫;张凡龙设计研发完成,并于2025-04-09向国家知识产权局提交的专利申请。

基于大语言模型分类与原型集成的代码搜索方法、系统及设备在说明书摘要公布了:本发明公开了基于大语言模型分类与原型集成的代码搜索方法、系统及设备,涉及代码语义分析技术领域,步骤如下:S01、清洗待处理语料段并提取查询源Token和代码源Token,得到清洗后的“查询‑代码”源Token对;S02、使用大语言模型对其进行分类;S03、将所述不同类别的“查询‑代码”源Token对输入到预训练模型中进行模型训练,得到不同类别的专家模型;S04、利用专家模型分别进行代码搜索,得到初步搜索结果;S05、筛选初步搜索结果;S06、对所述筛选后的代码搜索结果进行集成,得到最终的搜索结果。本发明采用上述方法、系统及设备,能够有效地缩小查询与代码之间的语义差距,解决模棱两可的查询可能导致的语义模糊性的问题,从而提高代码搜索的性能。

本发明授权基于大语言模型分类与原型集成的代码搜索方法、系统及设备在权利要求书中公布了:1.基于大语言模型分类与原型集成的代码搜索方法,其特征在于,步骤如下: S01、对含多个“查询-代码”对的待处理语料段进行数据清洗后提取查询源Token和代码源Token,得到清洗后的“查询-代码”源Token对; S02、使用大语言模型对所述“查询-代码”源Token对进行分类,得到不同类别的“查询-代码”源Token对; S03、将所述不同类别的“查询-代码”源Token对输入到多个预训练模型中,使用基于类别特性的多模态硬负样本损失进行模型训练,得到训练好的不同类别的专家模型;所述基于类别特性的多模态硬负样本损失包括焦点损失和三重多模态损失;所述基于类别特性的多模态硬负样本损失的表达式为: , 式中,表示焦点损失,表示三重多模态损失,表示焦点损失的权重,表示三重损失的权重; S04、利用训练好的不同类别的专家模型分别进行代码搜索,得到初步搜索结果; S05、利用粗粒度大语言模型分类筛选模块,对所述初步搜索结果进行筛选,得到筛选后的代码搜索结果;所述粗粒度的大语言模型分类筛选模块使用大语言模型对查询与代码分别预测一个类别,对预测得到相同类别的搜索结果赋予更高的置信度,相同类别的代码和查询应具有相对较高的相似性得分,不同类别的代码和查询应具有较低的相似性得分,相似性得分的表达式为: , 式中,表示第个查询样本,表示第个代码样本,表示当预测得到完全相同类别时添加的置信度系数,表示当预测得到的类别存在交集时添加的置信度系数,与分别表示由大模型预测得到的第个查询样本与第个代码样本的分类标签; S06、利用细粒度多模态集成模块,对所述筛选后的代码搜索结果进行集成,得到最终的搜索结果;所述细粒度多模态集成模块使用基于原型的集成方法对不同类别专家模型的初步搜索结果进行集成,其表达式为: , 式中,表示第个查询样本,表示第个代码样本,表示对第个类别专家进行筛选后的代码搜索结果,表示集成方法; 集成方法的目的是根据输入数据的特征准确选择最佳专家,根据输入查询生成专家预测准确性的概率分布,最终输出是所有专家输出的加权和,其表达式为: , 式中,表示第个查询的特征,表示第类查询数据的原型,表示余弦相似度,表示由大模型预测得到的第个查询样本的分类标签,表示当预测的类别与类别匹配时,添加的置信度系数; 其中,所述原型表示能捕捉一类数据的本质的具有代表性的特征向量;假设同一类别中的查询样本在训练后会表现出相似的特征,将这些特征定义为原型,不同类别的特征具有不同的原型,某一类别的原型通过对训练的该类别的所有特征取平均表示: , 式中,表示训练类别中第个查询的特征,表示训练类别下查询样本的总数。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人广东工业大学,其通讯地址为:510000 广东省广州市东风东路729号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。