Document
拖动滑块完成拼图
个人中心

预订订单
商城订单
发布专利 发布成果 人才入驻 发布商标 发布需求

请提出您的宝贵建议,有机会获取IP积分或其他奖励

投诉建议

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 积分商城 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 中建三局智能技术有限公司李欣获国家专利权

中建三局智能技术有限公司李欣获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉中建三局智能技术有限公司申请的专利基于跨模态特征融合的开放词汇目标检测方法及装置获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120599650B

龙图腾网通过国家知识产权局官网在2025-12-16发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202511102209.3,技术领域涉及:G06V30/413;该发明授权基于跨模态特征融合的开放词汇目标检测方法及装置是由李欣;肖菲;郑江华;孙逸;黄文欢;杜浩文设计研发完成,并于2025-08-07向国家知识产权局提交的专利申请。

基于跨模态特征融合的开放词汇目标检测方法及装置在说明书摘要公布了:一种基于跨模态特征融合的开放词汇目标检测方法及装置,在模型的多个阶段中添加深度特征融合方法,实现图片与文本特征信息之间的交互功能,学习高质量的语言感知视觉表征和实现卓越的迁移学习性能,以增强开放词汇目标检测模型的泛化能力,从而提高模型对于未知类别的检测能力。方法中特征融合模块针对目前大多数开放词汇目标检测方法中采用基于预训练视觉语言模型这种浅融合方法对于学习高质量的语言感知视觉表征信息不佳的问题,增强了模态之间的联系,以实现图片文本特征信息交互功能,能够产生更有辨识力的特征表达,从而提高识别未知类别的准确度。

本发明授权基于跨模态特征融合的开放词汇目标检测方法及装置在权利要求书中公布了:1.一种基于跨模态特征融合的开放词汇目标检测方法,其特征在于,所述基于跨模态特征融合的开放词汇目标检测方法包括: 将包含特定目标的图片放入图片集,其中,特定目标在所属图片中的位置及其类别标签为已知信息; 以图片集作为训练集对区域分类器模块M1进行训练,得到含有经过训练的区域提示的M1',包括:针对图片集中的任一张图片,基于特定目标在图片中的位置进行区域特征提取,得到区域图像特征,在中添加区域提示,得到区域嵌入结果,计算与区域文本特征集合中每个区域文本特征的相似度,基于最大相似度对应的文本特征确定特定目标的预测类别标签,并结合特定目标的类别标签计算得到图片对应的第一类损失,综合图片集中所有图片对应的第一类损失对区域提示进行训练,直至达到停止条件时,得到含有经过训练的区域提示的M1';其中,通过使用可学习的区域提示来增强区域特征并且修复错位信息,区域提示由训练集中的已知类别标签的目标的位置训练得到,微调CLIP图片编码器得到的区域特征;在训练的过程中保存其他模型权值冻结,只对需要学习的区域提示部分进行训练; 以图片集作为训练集对目标检测模型M2进行训练,得到训练后的M2',包括:针对图片集中的任一张图片,提取全局图像特征,将图片输入M1',得到M1'输出的区域分类结果,并将区域分类结果输入CLIP文本编码器,再通过全连接层升维后,得到图片的文本特征信息,将和输入特征融合模块,获取特征融合模块输出的融合图像信息,将送入DAB-DETR的编码器、以区域分类结果作为查询送入DAB-DETR的解码器,得到目标检测结果,基于目标检测结果和已知信息计算得到图片对应的第二类损失;综合图片集中所有图片对应的第二类损失对M2包含的特征融合模块、DAB-DETR的编码器以及DAB-DETR的解码器进行训练,直至达到停止条件时,得到训练完成的M2'; 利用M1'和M2'进行目标检测任务。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人中建三局智能技术有限公司,其通讯地址为:430075 湖北省武汉市东湖开发区高新大道797号中建科技产业园G3栋10层;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。