当前位置 : 首页 > 专利喜报 > 西安电子科技大学袁笛获国家专利权

西安电子科技大学袁笛获国家专利权

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

龙图腾网获悉西安电子科技大学申请的专利基于自然语言与目标状态信息的视觉目标跟踪方法获国家发明授权专利权，本发明授权专利权由国家知识产权局授予，授权公告号为：CN121033725B 。

龙图腾网通过国家知识产权局官网在2026-03-27发布的发明授权授权公告中获悉：该发明授权的专利申请号/专利号为：202511119146.2，技术领域涉及：G06V20/40；该发明授权基于自然语言与目标状态信息的视觉目标跟踪方法是由袁笛;耿固;申昊林;陈睿设计研发完成，并于2025-08-11向国家知识产权局提交的专利申请。

本基于自然语言与目标状态信息的视觉目标跟踪方法在说明书摘要公布了：本发明公开了基于自然语言与目标状态信息的视觉目标跟踪方法，包括以下步骤；步骤1：构建训练样本集；步骤2：构建基于自然语言与目标状态信息的视觉目标跟踪模型；步骤3：调整图像‑文本编码器的参数并加载预训练权重，得到文本与第一模板融合后的特征、第二模板的特征和搜索图像的特征；步骤4：将样本集中的目标的位置信息与目标的边界框信息融合到第二模板的特征之中；步骤5：获取联合建模后的特征；步骤6：获取查询后包含目标位置信息的token；步骤7：获取预测的目标边界框回归结果；步骤8：获取最终的跟踪结果。本发明有效提高了基于自然语言的视觉跟踪器的跟踪准确率。

本发明授权基于自然语言与目标状态信息的视觉目标跟踪方法在权利要求书中公布了：1.基于自然语言与目标状态信息的视觉目标跟踪方法，其特征在于，包括以下步骤；步骤1：从网络开源数据集中获取带标注的训练视频，并对训练视频进行预处理操作，利用预处理后的视频帧构建训练样本集；步骤2：利用目标状态信息融合模块、特征联合建模模块、目标查询模块、分类回归网络和预训练的图像-文本编码器构建基于自然语言与目标状态信息的视觉目标跟踪模型；所述步骤2中，所述图像-文本编码器包含12个Transformer编码层；所述目标状态信息融合模块包含一个线性映射层，用于将模板目标状态信息映射到特征空间之中；所述特征联合建模模块包含6个Transformer编码层，用于建模模板与搜索图像之间的关系；所述目标查询模块包含6个Transformer解码层，用于从建模后的搜索图像特征中查找目标；所述分类回归网络由一个4层的卷积神经网络构成；步骤3：调整图像-文本编码器的参数并加载预训练权重，使用图像-文本编码器对输入的样本集中的文本描述、第一模板图像、第二模板图像和搜索图像进行特征提取，得到文本与第一模板融合后的特征、第二模板的特征和搜索图像的特征；第一模板图像是视频序列的第一帧，与文本描述相融合，第二模板图像不断更新为准确度较高的跟踪结果；步骤4：通过目标状态信息融合模块将样本集中的目标的位置信息与目标的边界框信息融合到所述第二模板特征之中；步骤5：将所述搜索图像特征、所述文本与第一模板的融合特征以及融合信息的第二模板特征沿空间维度拼接到一起，输入到特征联合建模模块中，得到联合建模后的特征；步骤6：将联合建模后的特征与一个可学习的查询token输入到目标查询模块中，得到查询后包含目标位置信息的token；步骤7：通过查询后的token、联合建模后的特征以及搜索图像特征，得到预测的目标边界框回归结果；步骤8：由真实目标边界框与预测的目标边界框计算出跟踪损失，然后迭代的修正跟踪结果，实现模型参数的优化，将优化后的模型参数加载到模型中获取最终的跟踪结果。

如需购买、转让、实施、许可或投资类似专利技术，可联系本专利的申请人或专利权人西安电子科技大学，其通讯地址为：710071 陕西省西安市雁塔区太白南路2号；或者联系龙图腾网官方客服，联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

请提出您的宝贵建议，有机会获取IP积分或其他奖励

西安电子科技大学袁笛获国家专利权

热门推荐

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务