浙江理工大学张海翔获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉浙江理工大学申请的专利一种基于Transformer令牌掩码的高效人体姿态估计方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN117292429B 。
龙图腾网通过国家知识产权局官网在2025-09-05发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202310915293.5,技术领域涉及:G06V40/20;该发明授权一种基于Transformer令牌掩码的高效人体姿态估计方法是由张海翔;李少华;马汉杰;冯杰设计研发完成,并于2023-07-25向国家知识产权局提交的专利申请。
本一种基于Transformer令牌掩码的高效人体姿态估计方法在说明书摘要公布了:本发明公开了一种基于Transformer令牌掩码的高效人体姿态估计方法,所采用的网络模型TMPose性能出色,能够让网络十分高效的完成高质量的人体姿态估计任务。本发明网络模型TMPose包括骨干网络、令牌生成器、Transformer模块以及热图回归模块,其有着很大的科学研究价值和实际应用价值,由于令牌掩码的方法具有一定的泛化性,因此可以很容易的与其他网络模型相结合,启发更多的工作。除此之外TMPose由于在保持较高水准精度的同时,大幅度减低了计算复杂度,因此在实际的部署中可以高效的应用于更多场景。
本发明授权一种基于Transformer令牌掩码的高效人体姿态估计方法在权利要求书中公布了:1.一种基于Transformer令牌掩码的高效人体姿态估计方法,包括如下步骤: 1获取大量含有人物的图片,并对图片中人物的关节点位置进行标注; 2构建TMPose网络模型框架,其包括骨干网络、令牌生成器、Transformer模块以及热图回归模块,其中: 所述骨干网络用于对输入的图片进行特征提取; 所述令牌生成器用于将骨干网络提取得到的特征图转化为一维序列形式,并通过部分掩码生成Token,具体操作过程如下: 首先,将骨干网络提取得到的特征图切分成个网格,将每个网格展平成尺寸为Ph×Pw×C的一维序列,进而将展平后的序列通过线性层将其映射为视觉令牌,于此同时随机初始化生成M个可学习的关键点令牌,其序列长度与视觉令牌一致,其中H、W、C分别为特征图的高度、宽度、通道维度; 然后,通过映射函数将视觉令牌掩码成L×M·R大小,掩码过程中采用的映射函数包括随机采样、均匀采样、片区采样,采用的比率R=0.4、0.6或0.8,其中L、M分别为视觉令牌的序列长度和序列数量; 最后,对视觉令牌进行位置编码,即利用二维的位置嵌入对视觉令牌中每条序列进行位置标记,进而将关键点令牌与位置编码完后的视觉令牌拼接在一起得到Token,送入至Transformer模块; 所述Transformer模块用于对输入的Token进行编码,从而输出M个一维序列,M为标注的关节点数量; 所述热图回归模块用于对这M个一维序列进行reshape生成M个热图,从中解码出各关节点位置坐标的预测结果;热图回归模块只取M个关键点令牌作为输出,进而通过多层感知机将其重新映射回二维的热图形式,具体地:将Transformer模块的输出X送入到多层感知机中,在多层感知机中首先将X映射回二维生成P,其尺寸为M×H*×W*,H*和W*分别为原图高度H和宽度W的14,最后将P重塑成M个热图,且热图尺寸与原图一致,在此基础上通过在热图上找到最大响应位置来定位人体的各关节点坐标; 3利用步骤1中获取的图片及其标注信息对上述模型框架进行训练; 4将包含人物的待估计图片输入至训练好的模型中,即可预测出该图片中人物各关节点的位置坐标。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人浙江理工大学,其通讯地址为:310018 浙江省杭州市经济技术开发区白杨街道2号大街928号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。