厦门大学曹刘娟获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉厦门大学申请的专利一种基于多目标分类的开放词汇目标检测方法、系统、介质及程序产品获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119919634B 。
龙图腾网通过国家知识产权局官网在2026-02-24发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411980224.3,技术领域涉及:G06V10/25;该发明授权一种基于多目标分类的开放词汇目标检测方法、系统、介质及程序产品是由曹刘娟;钱东麟;马世元;张声传设计研发完成,并于2024-12-31向国家知识产权局提交的专利申请。
本一种基于多目标分类的开放词汇目标检测方法、系统、介质及程序产品在说明书摘要公布了:一种基于多目标分类的开放词汇目标检测方法、系统、介质及程序产品,属于计算机视觉技术领域,该方法利用上下文信息,检测出训练集中没有出现的过的新的类别的物体,包括如下步骤:利用主干特征提取网络对图像进行特征提取得到特征图;区域建议网络在特征图中生成一组候选框,对所有候选框应用候选框拓展模块,得到扩展框;利用蒸馏模块从CLIP图像编码器中学习知识得到蒸馏损失;将候选框和扩展框提取的特征和文本特征输入多目标分类模块中,得到分类损失;结合蒸馏损失和分类损失对模型进行训练;最后,将待检测的图片输入到训练后的模型中,生成预测的目标区域和对应的类别名称及对应的置信度,以此实现更精准的开放词汇目标检测。
本发明授权一种基于多目标分类的开放词汇目标检测方法、系统、介质及程序产品在权利要求书中公布了:1.一种基于多目标分类的开放词汇目标检测方法,其特征在于,利用上下文信息,检测出训练集中没有出现的过的新的类别的物体,包括如下步骤: 步骤S1,构建基于多目标分类的开放词汇目标检测模型;该模型包括主干特征提取网络ResNet50、区域建议网络RPN、候选框拓展模块CBM、蒸馏模块KD和多目标分类模块MSC; 步骤S2,对该模型进行训练,具体包括如下步骤: 步骤S21,给定训练图片样本集; 步骤S22,从训练图片样本集中任意选取一张图像,利用主干特征提取网络ResNet50对所述图像进行特征提取得到特征图,并将特征图输入到区域建议网络RPN; 步骤S23,区域建议网络RPN在特征图中生成一组候选框,再对所有候选框应用候选框拓展模块CBM,得到位于候选框附近的用于增加上下文信息的拓展框; 步骤S24,利用蒸馏模块KD从CLIP图像编码器中学习知识,利用模型的主干特征提取网络ResNet50提取所述拓展框和候选框的特征FE;利用CLIP图像编码器处理所述候选框和拓展框得到其特征FC,再应用InfoNCELoss计算两种对应特征FE和FC之间的蒸馏损失LKD; 步骤S25,利用CLIP文本编码器处理训练图片样本集的基础类别名称而获得文本特征FT,将特征FE和文本特征FT输入多目标分类模块MSC中对候选框进行分类,得到总分类损失LMSC; 步骤S26,结合蒸馏损失LKD和总分类损失LMSC对该模型进行训练,得到训练后的多目标分类的开放词汇目标检测模型; 步骤S3,将待检测的图片输入到训练后的模型中,利用训练后的模型在图片上生成预测的目标区域和该目标区域对应的类别名称,并给出这组预测对应的置信度,这个置信度来自于多目标分类模块MSC对这个目标区域的分类概率得分。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人厦门大学,其通讯地址为:361000 福建省厦门市思明南路422号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励