长沙理工大学周书仁获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉长沙理工大学申请的专利用于遮挡行人重识别的结合卷积神经网络优化ViT的方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115565048B 。
龙图腾网通过国家知识产权局官网在2026-03-31发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202211104302.4,技术领域涉及:G06V10/82;该发明授权用于遮挡行人重识别的结合卷积神经网络优化ViT的方法是由周书仁;资帅;朱俣健设计研发完成,并于2022-09-09向国家知识产权局提交的专利申请。
本用于遮挡行人重识别的结合卷积神经网络优化ViT的方法在说明书摘要公布了:本发明公开了一种用于用于遮挡行人重识别的结合卷积神经网络优化ViT的方法,结合了卷积神经网络优化了VisionTransformer的网络结构,将CNN与Transformer的优点结合起来。本发明设计了CNN与Transformer双分支的网络结构,使图片提取的特征既有Transform的优点,又能吸收CNN的优点,这样既通过Transformer获取了tokens之间全局关系,又通过CNN获取了tokens的局部信息,最后融合了局部信息与全局信息,获得了具有鲁棒性的特征。最后结合三元组损失和交叉熵损失,对模型进行迭代优化,将模型最终损失减少到最小值,提升特征的准确性以及模型的性能。这样有效解决了遮挡情况下的行人重识别问题,为遮挡行人重识别在实际应用中提供了一种更为高效的框架。
本发明授权用于遮挡行人重识别的结合卷积神经网络优化ViT的方法在权利要求书中公布了:1.一种用于遮挡行人重识别的结合卷积神经网络优化ViT的方法,其特征在于,所述方法由计算机执行,包括以下步骤: S1、构建网络框架,该网络由CNN及ViT两部分组成,该网络框架的输入数据是行人图像,S1的具体实现过程如下: S101、构建一个CNN与ViT并存的框架,由两个分支组成; S102、将行人图像送入CNN分支,同时铺平送入ViT分支提取特征; S2、在用CNN网络提取局部特征的同时也使用ViT网络提取全局特征信息; S3、融合经过线性投影的局部特征以及拉伸转置操作之后的全局特征; S4、使用优化后的transformer架构加强特征内部之间的联系,将S3得到的特征送入transformer的自注意力模块,S4的具体实现过程如下: S401、将步骤S3得到的融合特征再加上位置嵌入PE, 其中表示已经加上位置嵌入后的特征, S402、使用transformer的自注意力模块来增强特征内部之间的联系,捕捉全局信息,模块的输出结果是通过输入结果两两运算得出权重之后再对输入进行加权求和得到的; 其中,Q,K,V是对输入的矩阵进行不同的线性变换得到的结果,Attention表示自注意力模块,softmax表示激活函数,KT表示对K矩阵进行转置的结果,d表示Q和K的维度; S403、将S402得到的结果加上本身,再经过一层MLP得到之后再加上其本身得到经过多层transformer层后得到最终结果 其中,L表示有L层transformer层,表示经过i层之后的结果,LN表示LayerNomal层,MLP表示多层感知机,MSA表示多头自注意力模块; S5、最后根据输出的特征计算交叉熵损失以及三元组合损失,并根据损失持续优化模型。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人长沙理工大学,其通讯地址为:410114 湖南省长沙市天心区万家丽路二段960号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励