南通大学;南京联云智能系统有限公司邵叶秦获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉南通大学;南京联云智能系统有限公司申请的专利一种3D人体姿态估计方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115984965B 。
龙图腾网通过国家知识产权局官网在2026-01-06发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202211734556.4,技术领域涉及:G06V40/20;该发明授权一种3D人体姿态估计方法是由邵叶秦;尹和;吕昌;王梓腾;孙昌俊设计研发完成,并于2022-12-31向国家知识产权局提交的专利申请。
本一种3D人体姿态估计方法在说明书摘要公布了:本发明公开了一种3D人体姿态估计方法,该方法包括坐标Transformer编码器和时域Transformer编码器两个组件,分别从空间和时间的角度增强网络提取特征的能力。首先利用坐标Transformer编码器将输入的2D人体姿态序列生成多个可行解,并利用多层感知机实现多个可行解之间的信息交换;然后通过多对一的映射生成一个更加可靠的可行解;再利用时域Transformer编码器捕获输入序列的全局依赖关系,最后通过一个回归首部输出3D人体姿态坐标。本发明的优点在于,使网络预测更加准确,同时避免了传统的膨胀时序卷积方法时间窗受限的问题。
本发明授权一种3D人体姿态估计方法在权利要求书中公布了:1.一种3D人体姿态估计方法,其特征在于,具体包括如下步骤: 数据集建立步骤,录入多组2D人体姿态坐标序列以及每组2D人体姿态坐标序列对应的真实3D人体姿态坐标序列; 坐标转换步骤,将所述2D人体姿态坐标序列的横纵坐标连接,转换为Transformer编码器可读的2D人体姿态坐标序列,输出第一转换数据; 可行解生成步骤,将所述第一转换数据输入坐标Transformer编码器生成一个可行解; 所述可行解生成步骤具体包括如下步骤: 坐标嵌入步骤,将所述第一转换数据嵌入一个可学习的坐标位置,并执行Dropout模块,坐标位置嵌入公式为 其中,为输入数据中的某一帧的人体姿态坐标数据,为坐标位置嵌入,为坐标位置嵌入后的数据; 第一数据连接步骤,将所述作为输入,执行LayerNorm操作后输入到一个多头自注意机制模块,然后执行所述Dropout模块,输出第一输出特征,并通过跳跃连接将所述第一输出特征与所述第一转换数据连接,自注意计算公式为 其中,为查询,为键,为值,为维度,MSA将、、分割为份,为MSA的头数,MSA为多头自注意机制,分别进行上述运算; 第二数据连接步骤,将所述第一输出特征作为输入,执行所述LayerNorm操作后,输入到一个多层感知机模块,所述多层感知机模块包括多个线性层,在每个线性层后都执行所述Dropout模块,输出第二输出特征,并通过跳跃连接将所述第一输出特征与所述第二输出特征相连接,在所述多层感知机模块中的计算公式为 其中,为GELU函数,、分别为两个线性层的权值,、分别为两个线性层的偏置项; 可行解获取步骤,将连接后的所述第一转换数据与所述第二输出特征通过跳跃连接组成一个样本,对所述样本的不同特征进行所述LayerNorm操作,获取一个可行解; 重复执行步骤,至少重复执行所述可行解生成步骤三次,获得至少三个可行解; 通道调整步骤,对每个可行解执行一个一维卷积将每个可行解的通道进行调整,从而获得每个可行解的高维特征; 最优可行解获取步骤,将多个可行解沿通道维度拼接,并利用多层感知机实现所述多个可行解之间的信息交换,并通过一个多对一的映射,获得一个最优可行解; 所述最优可行解获取步骤具体包括如下步骤: 可行解拼接步骤,将所述多个可行解延通道维度拼接形成新的可行解,使所述新的可行解的特征通道数量为每个可行解的多倍; 信息交换步骤,将所述新的可行解执行LayerNorm操作之后,输入到一个多层感知机,所述多层感知机模块包括多个线性层,并执行两个Dropout模块,进行每个可行解之间的信息交换,输出第一输出数据,并通过跳跃连接连接所述新的可行解与所述第一输出数据,在所述多层感知机模块中的计算公式为 其中,为GELU函数,、分别为两个线性层的权值,、分别为两个线性层的偏置项,为多层感知机; 通道数缩减步骤,将所述第一输出数据执行BatchNorm操作后,利用所述一维卷积对所述第一输出数据完成多对一的映射,输出最优可行解; 依赖关系捕获步骤,将所述最优可行解输入时域Transformer编码器,获得包含输入序列全局依赖关系的高维特征编码; 所述依赖关系捕获步骤具体包括如下步骤: 数据转换步骤,将所述最优可行解的数据进行转换,生成第二转换数据; 时间位置嵌入步骤,将所述第二转换数据嵌入一个可学习的时间位置,并执行Dropout模块,时间位置嵌入公式如下: 其中,为输入数据中的某一帧的人体姿态时域数据,为时间位置嵌入,为时间位置嵌入后的数据; 第三数据连接步骤,将所述作为输入,执行LayerNorm操作后输入到所述多头自注意机制模块,然后执行Dropout模块,输出第三输出特征,并通过跳跃连接将所述第三输出特征与所述最优可行解连接,自注意计算公式为: 其中,为查询,为键,为值,为维度,MSA将、、分割为份,为MSA的头数,MSA为多头自注意机制,分别进行上述运算; 第四数据连接步骤,将所述第三输出特征作为输入,执行LayerNorm操作后输入到所述多层感知机模块,所述多层感知机模块包括多个线性层,在每个线性层后都执行所述Dropout模块,输出第四输出特征,并通过跳跃连接将所述第四输出特征与第三输出特征连接,在所述多层感知机模块中的计算公式为: 其中,为GELU函数,、分别为两个线性层的权值,、分别为两个线性层的偏置项,为多层感知机; 特征编码获取步骤,通过跳跃连接将所述第四输出特征与所述最优可行解连接的数据执行所述LayerNorm操作,获得包含输入序列全局依赖关系的高维特征编码; 坐标预测步骤,将一个一维卷积作为回归首部调整特征通道数,并输出预测的3D人体姿态坐标序列。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人南通大学;南京联云智能系统有限公司,其通讯地址为:226019 江苏省南通市啬园路9号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励