浙江大学耿卫东获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉浙江大学申请的专利全局与局部特征融合的SMPL-X动作到文本生成方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN121502730B 。
龙图腾网通过国家知识产权局官网在2026-04-10发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202610040219.7,技术领域涉及:G06F18/27;该发明授权全局与局部特征融合的SMPL-X动作到文本生成方法是由耿卫东;孟旺旺设计研发完成,并于2026-01-13向国家知识产权局提交的专利申请。
本全局与局部特征融合的SMPL-X动作到文本生成方法在说明书摘要公布了:本发明提供的全局与局部特征融合的SMPL‑X动作到文本生成方法,属于人工智能领域。通过对输入的SMPL‑X动作序列进行预处理编码为双流动作特征;通过跨模态映射模块,对双流动作特征分别通过独立的投影分支映射至预训练的大语言模型,得到全局条件和局部动作前缀嵌入;通过文本生成模块,以预训练的大语言模型的解码器为主干网络,基于用户给定的文本指令提取文本提示词嵌入,将局部动作前缀嵌入与文本提示词嵌入拼接后输入解码器,并通过交叉注意力机制将全局条件注入解码器每一层,以自回归方式生成描述文本。本发明能够稳定、准确地生成与动作语义一致且细节充分的描述文本,并在动作序列存在扰动时提高生成稳定性与跨场景适用性。
本发明授权全局与局部特征融合的SMPL-X动作到文本生成方法在权利要求书中公布了:1.一种全局与局部特征融合的SMPL-X动作到文本生成方法,其特征在于,包括以下步骤: 对输入的SMPL-X动作序列进行预处理后,编码为双流动作特征;所述的编码为双流动作特征,包括:通过动作编码器的骨骼嵌入层将预处理后的SMPL-X动作序列映射为帧级嵌入序列;在帧级嵌入序列的首部拼接一个可学习的全局标记,并添加位置编码,得到输入序列;将输入序列输入至动作编码器进行编码,得到顶层隐藏状态序列;从顶层隐藏状态序列中提取位于序列首位的特征作为序列级全局动作特征,并提取后续位置的特征作为帧级局部细粒度动作特征,序列级全局动作特征和帧级局部细粒度动作特征作为双流动作特征; 通过跨模态映射模块,对双流动作特征分别通过独立的投影分支映射至预训练的大语言模型的隐空间,得到全局条件和局部动作前缀嵌入;所述的独立的投影分支包括全局分支和局部分支;所述全局分支,用于对双流动作特征中的序列级全局动作特征进行投影,得到全局条件;所述局部分支,用于对双流动作特征中的帧级局部细粒度动作特征进行逐时刻投影,得到局部动作前缀嵌入; 通过文本生成模块,以预训练的大语言模型的解码器为主干网络,基于用户给定的文本指令提取文本提示词嵌入,将局部动作前缀嵌入与文本提示词嵌入拼接后输入解码器,并通过交叉注意力机制将全局条件注入解码器的每一层,以自回归方式生成描述文本;所述的以自回归方式生成描述文本,包括:将局部动作前缀嵌入与文本提示词嵌入拼接后的特征输入至解码器,解码器的每一层均依次执行自注意力计算、交叉注意力计算和前馈网络计算,生成描述文本; 其中,所述自注意力计算的输入基于上一层输出的隐状态进行自注意力计算得到第一输出;所述交叉注意力计算以当前层的第一输出为查询向量,以所述全局条件为键向量和值向量,进行交叉注意力计算得到第二输出;所述前馈网络对第二输出进行非线性变换,逐步生成描述文本。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人浙江大学,其通讯地址为:310058 浙江省杭州市西湖区余杭塘路866号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励