天津职业技术师范大学(中国职业培训指导教师进修中心)耿树泽获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉天津职业技术师范大学(中国职业培训指导教师进修中心)申请的专利位姿引导跨注意力特征融合的遮挡行人重识别方法及装置获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN116740642B 。
龙图腾网通过国家知识产权局官网在2026-01-06发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202310771936.3,技术领域涉及:G06V20/52;该发明授权位姿引导跨注意力特征融合的遮挡行人重识别方法及装置是由耿树泽;刘一凡;王梓晋设计研发完成,并于2023-06-28向国家知识产权局提交的专利申请。
本位姿引导跨注意力特征融合的遮挡行人重识别方法及装置在说明书摘要公布了:本发明属于行人重识别技术领域,涉及一种位姿引导的跨注意力特征融合的遮挡行人重识别算法。首先,通过前景感知的通道注意力机制和关键特征空间跨注意力融合机制来引导骨干网络实现对行人外观信息的感知;其次,利用人体关键点的置信度的鲁棒特性,以数学建模的方式生成预定义骨骼区域的掩膜;最后,为行人的骨骼局部特征和骨干网络输出的特征图建立交互关系矩阵,在空间注意力掩膜的约束下,通过局部上下文信息的融合,增强骨骼局部特征的语义对齐能力。实验结果表明,所提出的算法相比现有方法有明显的性能提升。
本发明授权位姿引导跨注意力特征融合的遮挡行人重识别方法及装置在权利要求书中公布了:1.一种位姿引导跨注意力特征融合的遮挡行人重识别方法,其特征在于, 步骤S1,通过前景感知的通道注意力机制和关键特征空间跨注意力融合机制来引导骨干网络实现对行人外观信息的感知; 步骤S2,利用人体关键点的置信度的鲁棒特性,以数学建模的方式生成预定义骨骼区域的掩膜; 步骤S3,为行人的骨骼局部特征和骨干网络输出的特征图建立交互关系矩阵,在空间注意力掩膜的约束下,通过局部上下文信息的融合,生成高层语义对齐的行人检索特征; 所述前景感知的通道注意力机制为: 首先,对关键点热图Fk的非零区域所对应的特征进行全局平均池化下采样来得到通道信号向量该过程表示为: Vc=AvgPoolFin⊙Fk 式中,⊙表示特征图逐元素乘积;AvgPool·表示全局平均池化操作; 其次,连接两个不同的卷积层{Cinr,1×1,1}和{Cin,1×1,1},并在各卷积层之后添加ReLU和Sigmoid激活函数,在两层的卷积层的参数{Cinr,1×1,1}和{Cin,1×1,1}设定中,第一项表示输出的通道数,第二项表示卷积核的尺寸,第三项表示卷积核的步长;通道注意力向量的计算过程表示为: Ac=sigmoidW2reluW1Vc 其中,和分别表示两个卷积层的权重参数;r为维度衰减比率; 最后,生成的通道分数向量Ac以乘积的方式作用于模块输入的特征图Fin,生成通道加权后的特征图 所述关键特征空间跨注意力融合机制为: 首先,根据14个关键点的热图来提取得到对应的特征向量,组成为稀疏特征图而前景感知子模块的输出加权得到的特征图视为稠密特征图; 将Fd通过一个1×1的卷积层对通道降维,并在空间层面展平,得到跨注意力机制的输入同理,将Fs经过两次独立操作,得到和其中Qd、Vs和Ks分别表示为query向量、value向量和Key向量,t表示维度衰减比率; 最后,通过一个1×1的卷积层将跨注意力模块输出特征图的通道数恢复至Cin,并将其尺寸重整为Hin×Win×Cint,然后与特征图Fd进行残差连接,输入到ResNet网络的下一个卷积层中; 所述Resnet网络内部结构被分为5个部分,分别定义为conv1,以及由Bottleneck组成的conv.B1、conv.B2、conv.B3和conv.B4,其中,后面的4个部分分别包含3、4、6和3个Bottleneck残差块,每个残差块包含3个卷积层; 步骤S2具体方法为: 首先,需要对行人的骨骼区域进行预定义; 其次,对预定义的每个骨骼区域分别建模,得到对应的权重掩膜,分别定义某一个骨骼区域两端的关键点为A和B,C点i,j为图像平面空间的任意位置点,O点cx,cy为AB的中点,A、B两点的置信度分别为δA和δB,某个特定的局部骨骼区域的权重掩膜M表示为: r=α*expγ-sinθ2lAO 其中,θ表示线段AB和CO之间的夹角,lAO表示线段AO的长度,r表示辐射范围,α和γ分别表示辐射整体尺度扩张系数和辐射尺度的横向挤压系数,I·,·表示当前局部骨骼区域的置信度,在计算该置信度时,需要将δA+δB2的结果和阈值ρ进行比较,若超过阈值则保留该结果,反之则将该结果压缩为原来的0.5,其中阈值ρ=0.7是通过调试得到的最优阈值; 得到局部特征掩膜之后,在提取每个骨骼区域对应的局部特征时,对Conv.B1、VARA1、Conv.B4层的输出特征图进行融合,得到特征图F'∈R4H×4W×C; 将每层的掩膜Mi∈R4H×4W×1分别和特征图F′进行对应像素乘积,得到骨骼区域局部特征图再经过一个全局平均池化得到通道数为C的局部特征向量该过程表示为: 式中,pool·表示全局平均池化操作; 步骤S3具体方法为:输入为骨干网络输出的展平后的特征图G∈RHW×C、骨骼局部特征f*∈R14×C和骨骼掩膜生成的注意力权重图Fw∈R14×HW,G和f*分别经过1×1的卷积层进行降维,得到Gin∈RHW×C′和C′为1×1卷积层的滤波器个数; 骨骼局部特征图会先输入到一个多头自注意力模块中,此时自注意力机制在特征图上进行全局分析并挖掘特征之间的相互关系;然后,多头自注意力输出的结果作为query矩阵输入到骨骼调制的跨注意力子模块中;key矩阵和value矩阵由Cin提供;骨骼调制的跨注意力子模块的计算过程表示为: 式中,和分别表示三个全连接层的权重,dw表示尺度因子, 将注意力权重图Fw与骨骼调制的跨注意力子模块中生成的跨注意力图进行对应元素的相乘,在局部空间层面对融合的过程进行约束,每个骨骼特征在对齐融合时,只关注其掩膜对应的相关区域,最后,经过残差连接、一个归一化层和一个全连接层,便得到融合后的骨骼局部特征
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人天津职业技术师范大学(中国职业培训指导教师进修中心),其通讯地址为:300222 天津市津南区大沽南路1310号天津职业技术师范大学;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励