当前位置 : 首页 > 专利喜报 > 上海理工大学陈罡获国家专利权

上海理工大学陈罡获国家专利权

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

龙图腾网获悉上海理工大学申请的专利基于多视图Pooling Transformer的三维对象识别方法获国家发明授权专利权，本发明授权专利权由国家知识产权局授予，授权公告号为：CN114972794B 。

龙图腾网通过国家知识产权局官网在2025-07-22发布的发明授权授权公告中获悉：该发明授权的专利申请号/专利号为：202210671530.3，技术领域涉及：G06V10/44；该发明授权基于多视图Pooling Transformer的三维对象识别方法是由陈罡;王文举;周浩然;王晓琳设计研发完成，并于2022-06-15向国家知识产权局提交的专利申请。

本基于多视图Pooling Transformer的三维对象识别方法在说明书摘要公布了：本发明提供一种基于多视图PoolingTransformer的三维对象识别方法，首先基于待测对象的多视图的信息熵构造得到了最佳视图集，从而减少了多视图的冗余性，提高了网络模型进行识别的精准度。其次，采用ResNet网络和Embedding网络一次性对所有视图进行特征信息提取，获取了最佳视图集的多视图低级局部特征token序列，从而使之能够输入到PoolingTransformer完成并行化训练。然后，通过PoolingTransformer将所述多视图低级局部特征token序列的局部视图信息token序列，实现分别从全局和局部聚合多视图低级局部特征token序列为一个紧凑而单一的3D全局描述符。最后，由分类器识别该3D全局描述符得到待测对象的识别结果。该方法能够高效、准确地捕获多个视图之间的相关特征信息，极大地提高了网络模型的识别精度和训练效率。

本发明授权基于多视图Pooling Transformer的三维对象识别方法在权利要求书中公布了：1.一种基于多视图PoolingTransformer的三维对象识别方法，其特征在于，包括以下步骤：步骤S1，构建Multi-viewPoolingTransformer网络模型，该模型具有最佳视图集获取模块、低级局部特征token序列生成模块、基于PoolingTransformer的全局描述符生成模块以及分类器；步骤S2，将待测对象输入至所述Multi-viewPoolingTransformer网络模型，通过所述最佳视图集获取模块获取对应的多视图，并根据所述多视图的信息熵构建最佳视图集；步骤S3，由所述低级局部特征token序列生成模块提取所述最佳视图集的多视图低级局部特征，并基于该多视图低级局部特征生成对应的多视图低级局部特征token序列；步骤S4，所述全局描述符生成模块将所述多视图低级局部特征token序列的局部视图信息token序列，与其全局特征信息序列聚合生成所述待测对象的3D全局描述符；步骤S5，所述分类器将所述3D全局描述符作为输入进行三维对象识别，从而得到所述待测对象的识别结果，其中，所述全局描述符生成模块包括基于Transformer的全局特征信息生成子模块和基于Pooling的局部视图信息token序列聚合子模块，所述基于Transformer的全局特征信息生成子模块具有LayerNormalization网络、Multi-HeadMulti-ViewAttention网络、多层感知机网络以及残差连接，所述步骤S4包括以下子步骤：步骤S4-1，所述LayerNormalization网络对所述多视图低级局部特征token序列进行归一化处理：步骤S4-2，所述Multi-HeadMulti-ViewAttention网络将归一化后的token序列通过线性变换完成MHMVA计算，生成token序列XMHMVA，所述Multi-HeadMulti-ViewAttention网络由多个Multi-ViewAttention组成，所述MHMVA计算是进行多个并行化的Multi-ViewAttention计算：步骤S4-2-1，将经过归一化处理的先通过线性变换生成Query、Key、Value三个向量：步骤S4-2-2，根据Head数量N将上一步的三个向量均分为多个Multi-ViewAttention的输入qi、ki、vi，能够形成多个子空间，关注输入特征不同部分的信息，最后将这些特征信息拼接能获得更加丰富的信息：步骤S4-2-3，Multi-ViewAttention根据输入进行MVA的计算，即，计算qi与ki转置的乘积得到一个score，除以进行归一化处理来稳定梯度，再将归一化后的结果值作为softmax函数的输入，该softmax函数的输出与vi点乘得到式中，dk为ki的维度；步骤S4-2-4，对于计算后的每个进行Concat，再经过一次线性变换最终完成MHMVA计算：步骤S4-3，对token序列XMHMVA使用残差连接得到token序列X1从而避免梯度消失，再将X1输入至所述LayerNormalization网络进行归一化处理后输入至所述多层感知机网络；步骤S4-4，将多层感知机网络的输出结果与X1进行残差连接，得到所述局部视图信息token序列：其中，所述局部视图信息token序列由全局和局部视图信息token序列组成，其中全局保存了局部视图token序列的全局特征信息，即步骤S4-5，所述基于Pooling的局部视图信息token序列聚合子模块将所述局部视图信息token序列进行池化处理得到单个最佳局部视图信息token，再将该最佳局部视图信息token与全局进行拼接聚合，最终生成对应的3D全局描述符Y：

如需购买、转让、实施、许可或投资类似专利技术，可联系本专利的申请人或专利权人上海理工大学，其通讯地址为：200093 上海市杨浦区军工路516号；或者联系龙图腾网官方客服，联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由AI智能生成

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

上海理工大学陈罡获国家专利权

热门推荐

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务