南京理工大学舒祥波获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉南京理工大学申请的专利一种文本驱动三维人体动作生成方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119810382B 。
龙图腾网通过国家知识产权局官网在2025-08-01发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411881863.4,技术领域涉及:G06T19/00;该发明授权一种文本驱动三维人体动作生成方法是由舒祥波;马运国设计研发完成,并于2024-12-19向国家知识产权局提交的专利申请。
本一种文本驱动三维人体动作生成方法在说明书摘要公布了:本发明公开了一种文本驱动三维人体动作生成方法,通过扩散模型与大型语言模型实现细粒度人体动作生成。首先利用文本编码器提取文本的多层语义特征,同时使用大语言模型识别核心与非核心身体部位;然后将人体划分为左臂、右臂、左腿、右腿和躯干五个区域,通过多头交叉注意力机制对词级文本特征与各部位动作特征进行融合与细化;利用自适应损失函数优化核心部位动作,保持非核心部位自然流畅;最终通过扩散模型去噪生成全身运动。此外,该方法支持参数编辑与运动补全功能,能够灵活控制动作幅度和补全部分输入的动作。该方法可以应用于虚拟现实、动画制作和人机交互领域,生成的动作自然、精确且符合文本描述。
本发明授权一种文本驱动三维人体动作生成方法在权利要求书中公布了:1.一种基于扩散模型和大语言模型的文本驱动三维人体动作生成方法,其特征在于,包括如下步骤: 步骤1:文本特征提取模块构建 构建文本特征提取模块,该模块利用预训练文本模型对输入文本进行处理,以获得词级文本特征和句子级特征; 通过大型语言模型对文本描述的动作进行分析,区分涉及核心和非核心身体部位的动作,具体过程是通过结构化提示和示例分析,使大语言模型能够理解文本并提取所涉及的核心非核心参与部位的动作; 步骤2:人体运动分区处理 将人体运动划分为多个独立区域;从整体动作特征中分离出每个部位的运动特征;将五个独立区域划分为核心参与部位和非核心参与部位; 步骤3:构建多头交叉注意力融合细化层 细化层通过多头交叉注意力机制将词级文本特征与局部动作特征相融合,实现对各身体部位的细粒度调整; 步骤4:自适应优化核心与非核心部位 采用自适应损失函数区分优化核心和非核心部位;通过分析输入文本中的动作描述,确定核心和非核心部位的分布,并动态调整对应的损失权重; 步骤5:全身运动的集成与合成 通过集成层将细化后的局部动作特征合成为完整的人体运动;首先,将细化后的各身体部位动作特征合并,生成完整的全身运动表示;合并过程包括对各身体部位的空间和时间维度特征对齐;接着,合并后的全身动作与句子级文本特征相融合;最后,通过编码器优化全身运动,从而生成符合文本描述的自然运动序列; 步骤6:基于扩散模型的人体运动生成 基于条件扩散模型生成人体运动,训练过程中,通过马尔可夫噪声链逐步向输入运动数据添加噪声,生成多级噪声样本,用于训练模型的去噪能力,使模型能够逐步还原符合文本描述的清晰运动;在生成阶段,从完全高斯噪声开始,逆向去噪生成符合文本输入的人体运动;整个去噪过程包含多个时间步,每步生成的运动序列基于输入文本及可选控制参数,以在各阶段的输出; 步骤7:损失函数设计与优化目标;通过细化层和集成层的自适应损失函数优化生成的运动质量: 细化层损失函数:用于优化局部动作生成效果,区分核心和非核心部分,优化目标是:其中λ核心和λ非核心分别表示核心部位与非核心部位的参数权重,和是采用相同的损失函数计算的损失:表示从第1到第T时间步生成的动作特征与真实动作特征X0的均方差损失; 集成层损失函数:用于优化全身运动的整体一致性及与文本描述的对齐性; 总损失函数:通过细化层和集成层的损失结合并赋予相应的权重,优化目标是: 其中,λ细化层与λ集成层用于平衡训练时细化层和集成层在整个模型中的作用。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人南京理工大学,其通讯地址为:210094 江苏省南京市孝陵卫街200号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。