中国科学院大学吕科获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉中国科学院大学申请的专利基于文本提示的三维小物体目标检测方法、系统、介质及设备获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119919928B 。
龙图腾网通过国家知识产权局官网在2026-01-06发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411982694.3,技术领域涉及:G06V20/64;该发明授权基于文本提示的三维小物体目标检测方法、系统、介质及设备是由吕科;宁童;薛健设计研发完成,并于2024-12-31向国家知识产权局提交的专利申请。
本基于文本提示的三维小物体目标检测方法、系统、介质及设备在说明书摘要公布了:本发明涉及计算机视觉及自动驾驶领域,公开了一种基于文本提示的三维小物体目标检测方法、系统、介质及设备,其包括:获取多视角图像,通过骨干网络和特征金字塔网络对输入的多视角图像进行处理,提取图像特征;图像特征基于开放词汇目标检测器和文本提示生成二维类别感知查询键,并针对小物体目标生成二维边界框;将二维边界框结合几何线索生成三维查询键,几何线索包括基于轻量级深度估计网络的三维定位、三维大小和方向;采用对比学习机制对生成的三维查询键进行优化,以抑制假阳性查询键并提升正确查询键的置信度;基于优化后的查询键生成最终的三维边界框,以用于目标检测。本发明能提升对三维小物体目标的检测精度。
本发明授权基于文本提示的三维小物体目标检测方法、系统、介质及设备在权利要求书中公布了:1.一种基于文本提示的三维小物体目标检测方法,其特征在于,包括: 获取多视角图像,通过骨干网络和特征金字塔网络对输入的多视角图像进行处理,提取图像特征; 图像特征基于开放词汇目标检测器和文本提示生成二维类别感知查询键,并针对小物体目标生成二维边界框,具体为:图像特征输入到热图头中以生成二维全局查询键;同时,开放词汇目标检测器结合文本提示输入,生成二维类别感知查询键;二维类别感知查询键根据小物体目标的类别信息生成二维边界框,边界框的中心点用于初始化类别感知查询键; 将二维边界框结合几何线索生成三维查询键,几何线索包括基于轻量级深度估计网络的三维定位、三维大小和方向,具体为:将二维全局查询键和二维类别感知查询键进行融合,形成完整的二维查询集;采用几何线索进行处理,结合每个查询键的几何信息生成三维查询键;在训练期间,三维和二维的真实标签分别与相应的三维和二维查询键配对,以用于对比学习模块的优化; 在生成三维查询键之后,还包括采用可变形注意力机制聚合二维查询键周围的语义信息的步骤:二维查询键被投影回图像特征中,生成更新后的二维查询键;通过可变形注意力机制从二维查询键位置的周围像素中聚合语义信息,以充分捕捉图像中的丰富语义信息; 采用对比学习机制对生成的三维查询键进行优化,以抑制假阳性查询键并提升正确查询键的置信度,具体为:将二维和三维的真实标签与生成的查询键进行配对,并通过匈牙利匹配算法计算每个查询键的匹配程度;通过对比学习损失函数来强化正确查询键,抑制错误查询键; 损失函数为: 其中,是二维查询键的对比损失,是三维查询键的对比损失,和为权重系数; 基于优化后的查询键生成最终的三维边界框,以用于目标检测。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人中国科学院大学,其通讯地址为:101408 北京市怀柔区雁栖湖东路1号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励