上海理工大学陈罡获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉上海理工大学申请的专利基于多视图Pooling Transformer的三维对象识别方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN114972794B 。
龙图腾网通过国家知识产权局官网在2025-07-22发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202210671530.3,技术领域涉及:G06V10/44;该发明授权基于多视图Pooling Transformer的三维对象识别方法是由陈罡;王文举;周浩然;王晓琳设计研发完成,并于2022-06-15向国家知识产权局提交的专利申请。
本基于多视图Pooling Transformer的三维对象识别方法在说明书摘要公布了:本发明提供一种基于多视图PoolingTransformer的三维对象识别方法,首先基于待测对象的多视图的信息熵构造得到了最佳视图集,从而减少了多视图的冗余性,提高了网络模型进行识别的精准度。其次,采用ResNet网络和Embedding网络一次性对所有视图进行特征信息提取,获取了最佳视图集的多视图低级局部特征token序列,从而使之能够输入到PoolingTransformer完成并行化训练。然后,通过PoolingTransformer将所述多视图低级局部特征token序列的局部视图信息token序列,实现分别从全局和局部聚合多视图低级局部特征token序列为一个紧凑而单一的3D全局描述符。最后,由分类器识别该3D全局描述符得到待测对象的识别结果。该方法能够高效、准确地捕获多个视图之间的相关特征信息,极大地提高了网络模型的识别精度和训练效率。
本发明授权基于多视图Pooling Transformer的三维对象识别方法在权利要求书中公布了:1.一种基于多视图PoolingTransformer的三维对象识别方法,其特征在于,包括以下步骤: 步骤S1,构建Multi-viewPoolingTransformer网络模型,该模型具有最佳视图集获取模块、低级局部特征token序列生成模块、基于PoolingTransformer的全局描述符生成模块以及分类器; 步骤S2,将待测对象输入至所述Multi-viewPoolingTransformer网络模型,通过所述最佳视图集获取模块获取对应的多视图,并根据所述多视图的信息熵构建最佳视图集; 步骤S3,由所述低级局部特征token序列生成模块提取所述最佳视图集的多视图低级局部特征,并基于该多视图低级局部特征生成对应的多视图低级局部特征token序列; 步骤S4,所述全局描述符生成模块将所述多视图低级局部特征token序列的局部视图信息token序列,与其全局特征信息序列聚合生成所述待测对象的3D全局描述符; 步骤S5,所述分类器将所述3D全局描述符作为输入进行三维对象识别,从而得到所述待测对象的识别结果, 其中,所述全局描述符生成模块包括基于Transformer的全局特征信息生成子模块和基于Pooling的局部视图信息token序列聚合子模块, 所述基于Transformer的全局特征信息生成子模块具有LayerNormalization网络、Multi-HeadMulti-ViewAttention网络、多层感知机网络以及残差连接, 所述步骤S4包括以下子步骤: 步骤S4-1,所述LayerNormalization网络对所述多视图低级局部特征token序列进行归一化处理: 步骤S4-2,所述Multi-HeadMulti-ViewAttention网络将归一化后的token序列通过线性变换完成MHMVA计算,生成token序列XMHMVA, 所述Multi-HeadMulti-ViewAttention网络由多个Multi-ViewAttention组成, 所述MHMVA计算是进行多个并行化的Multi-ViewAttention计算: 步骤S4-2-1,将经过归一化处理的先通过线性变换生成Query、Key、Value三个向量: 步骤S4-2-2,根据Head数量N将上一步的三个向量均分为多个Multi-ViewAttention的输入qi、ki、vi,能够形成多个子空间,关注输入特征不同部分的信息,最后将这些特征信息拼接能获得更加丰富的信息: 步骤S4-2-3,Multi-ViewAttention根据输入进行MVA的计算,即,计算qi与ki转置的乘积得到一个score,除以进行归一化处理来稳定梯度,再将归一化后的结果值作为softmax函数的输入,该softmax函数的输出与vi点乘得到 式中,dk为ki的维度; 步骤S4-2-4,对于计算后的每个进行Concat,再经过一次线性变换最终完成MHMVA计算: 步骤S4-3,对token序列XMHMVA使用残差连接得到token序列X1从而避免梯度消失,再将X1输入至所述LayerNormalization网络进行归一化处理后输入至所述多层感知机网络; 步骤S4-4,将多层感知机网络的输出结果与X1进行残差连接,得到所述局部视图信息token序列:其中,所述局部视图信息token序列由全局和局部视图信息token序列组成,其中全局保存了局部视图token序列的全局特征信息,即 步骤S4-5,所述基于Pooling的局部视图信息token序列聚合子模块将所述局部视图信息token序列进行池化处理得到单个最佳局部视图信息token,再将该最佳局部视图信息token与全局进行拼接聚合,最终生成对应的3D全局描述符Y:
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人上海理工大学,其通讯地址为:200093 上海市杨浦区军工路516号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。