同济大学贾宁获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉同济大学申请的专利一种基于区域提示的视觉语言目标检测器Zone-YOLO获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN118940803B 。
龙图腾网通过国家知识产权局官网在2025-12-09发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411048379.3,技术领域涉及:G06N3/0464;该发明授权一种基于区域提示的视觉语言目标检测器Zone-YOLO是由贾宁;杨嘉雄;柳先辉设计研发完成,并于2024-08-01向国家知识产权局提交的专利申请。
本一种基于区域提示的视觉语言目标检测器Zone-YOLO在说明书摘要公布了:本发明提出了一种基于区域提示的视觉语言目标检测器Zone‑YOLO,包括视觉编码器、文本编码器、Scale‑AwareVL‑PANNeck、wordembedding单词嵌入、zoneprompts区域提示、Adapter适配器、TextContrastiveHead图文对比头、ZoneHead,其中。本发明首创了尺度感知多模态融合模块,充分挖掘文本特征,学习在不同尺度下无缝融合多模态表征;本发明提出一种新的区域提示学习模块,将文本特征引入回归头,并捕获区域‑类别‑实例三重共现信息,显著提高了模型的定位性能。大量实验表明,ZoneYOLO取得了具有竞争力的结果,并证明了基于预训练VLOD的闭集检测微调的优越性。
本发明授权一种基于区域提示的视觉语言目标检测器Zone-YOLO在权利要求书中公布了:1.一种基于区域提示的视觉语言目标检测器Zone‑YOLO,其特征在于,包括视觉编码器、文本编码器、Scale‑Aware VL‑PAN Neck、word embedding单词嵌入、zone prompts区域提示、Adapter、Text Contrastive Head图文对比头、Zone Head,其中: 所述视觉编码器使用预训练好的YOLOv8Backbone,输出的图像编码为多尺度图像特征; 所述文本编码器使用CLIP text encoder,输入的类名和区域短语,编码输出为word embedding和zone prompts; 所述Scale‑Aware VL‑PAN Neck将视觉编码器输出的多尺度图像特征以及文本编码器输出的word embedding作为输入,实现多模态多尺度特征的对齐融合; 所述Text Contrastive Head,将Scale‑Aware VL‑PAN Neck的输出和word embedding作为输入,计算图像特征和文本特征的相似度,进行对比学习; 所述的Adapter,将文本编码器的输出word embedding和zone prompts作为输入,捕捉类别与区域的共现信息,得到类别相关的区域嵌入Class‑specific zone embedding; 所述Zone Head,将Scale‑Aware VL‑PAN Neck和Adapter的输出作为输入,捕捉区域‑类别‑实体的三重共现,进而引导检测器更好地回归。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人同济大学,其通讯地址为:200092 上海市杨浦区上海市四平路1239号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励