Document
拖动滑块完成拼图
个人中心

预订订单
服务订单
发布专利 发布成果 人才入驻 发布商标 发布需求

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 大连理工大学王栋获国家专利权

大连理工大学王栋获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉大连理工大学申请的专利一种基于知识蒸馏的单流轻量化目标跟踪方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119963928B

龙图腾网通过国家知识产权局官网在2025-07-25发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510435465.8,技术领域涉及:G06V10/764;该发明授权一种基于知识蒸馏的单流轻量化目标跟踪方法是由王栋;刘鹏宇;赵洁;刘洋;卢湖川设计研发完成,并于2025-04-09向国家知识产权局提交的专利申请。

一种基于知识蒸馏的单流轻量化目标跟踪方法在说明书摘要公布了:本发明属于机器学习、计算机视觉、目标跟踪领域,提供了一种基于知识蒸馏的单流轻量化目标跟踪方法。本发明实现了基于纯Transformer主干网络的轻量化单流目标跟踪网络模型,并采用OSTrack算法作为教师模型对轻量化跟踪模型进行蒸馏。本发明提出模板与特征区域的相似度矩阵,该相似度矩阵可以在单流跟踪算法中高效表示模板与搜索区域的交互信息,以该信息作为知识蒸馏中的监督信号,可以提升轻量化单流目标跟踪模型的性能。本发明提升了轻量化目标跟踪网络的性能,为边缘计算场景提供性能更强的目标跟踪模型。

本发明授权一种基于知识蒸馏的单流轻量化目标跟踪方法在权利要求书中公布了:1.一种基于知识蒸馏的单流轻量化目标跟踪方法,其特征在于,步骤如下: 步骤1:建立单流目标跟踪模型; 单流目标跟踪模型主要由图像块嵌入模块、Transformer编码器模块以及跟踪头部组成; 图像块嵌入模块由一层卷积核为16×16、跨度为16的卷积层,变形和拼接操作组成;图像块嵌入模块的输入是一个图像对,包含模板与搜索区域两张图像;模板是基于视频流中的初始帧中的目标位置进行裁切获得,搜索区域是在视频流中的当前帧画面中基于前一帧的目标位置进行裁切获得的;模板和搜索区域首先通过共享参数的卷积层进行16倍下采样,然后均通过变形转化成词元序列,并加入位置编码;此处还引入分类词元和蒸馏词元;再将模板和搜索区域生成的词元序列和分类词元、蒸馏词元拼接成一个新的词元序列,作为图像块嵌入模块的输出; Transformer编码器模块主要由多个堆叠的多头注意力模块与多层感知机组成,其输入是图像块嵌入模块输出的新的词元序列,输出是完成特征提取与特征交互的词元序列特征;在完成特征提取与特征交互后,将词元序列特征重新拆分成模板特征和搜索区域特征,分类词元与蒸馏词元仅用于增强特征提取; 跟踪头部由分类分支和回归分支组成,两个分支的输入均为搜索区域特征;分类分支输出下采样后的搜索区域每个特征点的得分,得到目标的中心点的位置;回归分支对目标的中心点位置进行校准,并输出目标的大小;将分类头与回归头的输出合并在一起即获得目标的准确位置; 步骤2:加载初始化权重,采用基于知识蒸馏实现的DeiT图像分类模型的权重作为主干网络的初始化权重,具体如下:单流目标跟踪模型中的图像块嵌入模块和Transformer编码器模块需要DeiT图像分类模型的权重用于初始化,其中单流目标跟踪模型中图像块嵌入模块与DeiT图像分类模型的图像块嵌入模块的结构不同,在权重的加载过程中需要进行如下处理:为了进行格式的适配,首先将权重中的位置编码的分类词元和蒸馏词元分离出来,将位置编码中剩余的序列形式的位置编码先变形成二维图像格式,再通过双线性插值将二维图像格式适配模板与搜索区域的不同图像尺寸,实现位置编码部分的初始化权重的加载;单流目标跟踪模型中Transformer编码器与DeiT图像分类模型的Transformer编码器的结构相同,直接加载权重即可; 步骤3:搭建知识蒸馏的计算框架,具体如下:知识蒸馏部分包括蒸馏的信息表达方式、教师模型的配置以及损失函数; 在蒸馏的信息表达方式中,引入模板特征与搜索区域特征的相似矩阵,对模板特征与搜索区域特征中的每个词元两两计算余弦相似度,公式为: 其中,feature1和feature2分别为模板特征中的词元和搜索区域特征中的词元,相似度矩阵用于描述模板特征与搜索区域特征之间的关系; 教师模型选用单流目标跟踪的OSTrack模型,需要全部词元的输出特征,所以采用其没有候选词元淘汰的模型,学生模型为步骤1中的单流目标跟踪模型;在训练的过程中,教师模型输入与学生模型相同的图像数据,采用评估模式,不进行梯度计算和参数更新,仅保留教师模型在特征提取后通过模板特征和搜索区域特征计算的相似度矩阵,学生模型输出的相似度矩阵以教师模型的相似度矩阵作为监督信号; 损失函数部分,学生模型的分类头采用Focal损失函数,回归头采用GIOU损失函数和L1损失函数,相似度矩阵蒸馏的损失函数采用L1损失函数;总损失函数为: loss=αFocallFocal+αL1lL1+αGIOUlGIOU+αsimilaritylsimilarity 其中,αFocal、αL1、αGIOU、αsimilarity分别代表Focal损失函数、L1损失函数、GIOU损失函数以及相似度矩阵蒸馏的损失函数的权重。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人大连理工大学,其通讯地址为:116000 辽宁省大连市甘井子区凌工路2号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。