恭喜浙江师范大学张大伟获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网恭喜浙江师范大学申请的专利一种基于卷积注意力融合的RGBT目标跟踪方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120088292B 。
龙图腾网通过国家知识产权局官网在2025-07-04发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510582564.9,技术领域涉及:G06F16/00;该发明授权一种基于卷积注意力融合的RGBT目标跟踪方法是由张大伟;王炫;肖昕;何小卫;陈灏;郑忠龙设计研发完成,并于2025-05-07向国家知识产权局提交的专利申请。
本一种基于卷积注意力融合的RGBT目标跟踪方法在说明书摘要公布了:本发明公开了一种基于卷积注意力融合的RGBT目标跟踪方法,属于计算机视觉技术领域,包括以下步骤:步骤一、视频预处理;步骤二、特征提取:通过线性映射和Transformer编码器将输入图像信息编码为特征序列;步骤三、局部特征增强与融合:通过滑动窗口来选定局部区域,将当前模态的局部特征与另一个模态全局特征进行交叉注意力计算,从而实现局部特征增强,并有效融合了跨模态信息;步骤四、目标跟踪预测。本发明通过对局部特征信息的充分提取与融合,实现了更稳定的RGBT目标跟踪,在多个视频跟踪数据集上的性能优于其它先进的RGBT跟踪算法。
本发明授权一种基于卷积注意力融合的RGBT目标跟踪方法在权利要求书中公布了:1.一种基于卷积注意力融合的RGBT目标跟踪方法,其特征在于,包括以下步骤: 步骤一、视频预处理; 在数据集中随机选取一段视频序列,其中每一帧为一张图像;在可见光与热红外模态的第一帧的相同位置选定目标所在的矩形区域,将该区域缩放,并保存作为该视频序列的目标模板;从第二帧起,以上一帧目标位置为中心点,选取范围大于目标所在区域的正方形区域,并缩放后作为当前帧的搜索区域; 步骤二、特征提取; 将可见光与热红外模态的目标模板与搜索区域切割为若干区块并展开拼接,通过线性映射层将图像信息映射为一维特征序列,并向其加入全局位置编码;对两个模态的特征分别使用参数共享的主干网络的Transformer编码器提取特征; 主干网络采用OSTrack作为基线模型并扩展为双分支,令原始输入的可见光、热红外特征分别为X r 、X t ,第i层Transformer编码器表示为Encoder i ,特征提取过程可公式化表达为: ; 其中,表示第i层可见光特征,表示第i层热红外特征,表示第(i+1)层可见光特征,表示第(i+1)层热红外特征; 步骤三、局部特征增强与融合; 在Transformer编码器之间插入卷积注意力融合模块:通过滑动窗口将一维特征序列进行二维化处理,随后在其周围进行零填充,使用滑动窗口从左上角开始循环滑动,滑动窗口遍历整个特征图,选定局部区域;将局部区域序列化并计算可见光与热红外模态的局部交叉注意力;最后将各个滑动窗口的局部交叉注意力结果进行合并; 通过滑动窗口选定局部区域,具体步骤如下: 对于输入的一维线性特征序列X∈R (H×W)×C ,将其展开为二维特征,并通过零填充将其扩展至(H+2×padding)×(W+2×padding),其中,H、W、C分别为原始特征图的高、宽和通道数,padding为填充大小;将扩展后的区域分割为p×p的区块,将每个区块视为一个维数为P∈R p×p×C 的特征点,其中,P指代任意特征点;随后使用边长为ks的滑动窗口从扩展后的特征图左上角开始滑动,步长为stride,选定局部区域X left:left+ks,top:top+ks ,其中(left,top)为左上角坐标,滑动窗口表示为X'∈R ks×ks×C ;滑动窗口通过不断地循环滑动,最终得到所有局部区域的局部特征;其中,N num 表示总滑动次数,计算公式为: ; 将局部区域序列化并计算可见光与热红外模态的局部交叉注意力,具体步骤如下: 定义局部位置编码E∈R 1×(ks×ks)×1 ,将其广播至与S相同的维数,并加入到全部的滑动窗口中;通过局部线性映射层,将局部区域映射得到局部查询Q local 与键值K local ;通过全局线性映射层,将原始特征图映射为全局权重V global ; 计算可见光与热红外模态的局部交叉注意力,采用以下公式: (a) 其中,dk表示特征通道维数; 将各个滑动窗口的局部交叉注意力结果进行合并,具体步骤如下: 将局部注意力结果分割为N num 个局部特征图,得到S'∈R ks×ks×C ,S'表示局部特征图,并将局部特征图恢复到滑动窗口对应的原始特征图的位置,对局部特征图的重叠部分求平均值,将局部注意力结果按对应位置相加,根据滑动窗口在各个区块的覆盖量计算注意力平均值,作为最终的局部注意力得分; 步骤四、目标跟踪预测:主干网络最终层的Transformer编码器输出可见光与热红外两个模态特征,使用卷积合并,输入预测头进行预测,得到目标位置。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人浙江师范大学,其通讯地址为:321000 浙江省金华市婺城区迎宾大道688号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。