世优(北京)科技股份有限公司邓先才获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉世优(北京)科技股份有限公司申请的专利行为决策模型的训练方法及数字人的自适应交互方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120354176B 。
龙图腾网通过国家知识产权局官网在2025-09-16发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510833804.8,技术领域涉及:G06F18/24;该发明授权行为决策模型的训练方法及数字人的自适应交互方法是由邓先才;李睿设计研发完成,并于2025-06-20向国家知识产权局提交的专利申请。
本行为决策模型的训练方法及数字人的自适应交互方法在说明书摘要公布了:本发明公开了一种行为决策模型的训练方法及数字人的自适应交互方法。其中,该训练方法包括:获取样本训练集;使用样本训练集对待训练的行为决策模型进行迭代训练,直到待训练的行为决策模型的目标函数损失值小于预设的损失阈值;其中,目标函数损失值是通过以下得到的:基于待训练的行为决策模型对正样本输出的第一预测行为分布与对负样本输出的第二预测行为分布之间的相对熵,生成对比损失;基于第一预测行为分布与第一目标行为分布之间的均方误差、以及第二预测行为分布与第二目标行为分布之间的均方误差,生成分布对齐损失;基于对比损失和分布对齐损失,生成目标函数损失值。本发明解决了MR场景数字人的行为决策存在不足的技术问题。
本发明授权行为决策模型的训练方法及数字人的自适应交互方法在权利要求书中公布了:1.一种行为决策模型的训练方法,其特征在于,包括: 获取样本训练集,其中,所述样本训练集包括正样本和负样本,所述样本训练集中的每个样本由多模态数据组成,所述多模态数据包括视觉图像序列、语音语调、骨骼动作数据以及环境状态参数; 使用所述样本训练集对待训练的行为决策模型进行迭代训练,直到待训练的所述行为决策模型的目标函数损失值小于预设的损失阈值,以得到训练好的所述行为决策模型; 其中,所述目标函数损失值是通过以下得到的: 基于待训练的所述行为决策模型对所述正样本输出的第一预测行为分布与对所述负样本输出的第二预测行为分布之间的相对熵,生成对比损失; 基于所述第一预测行为分布与第一目标行为分布之间的均方误差、以及所述第二预测行为分布与第二目标行为分布之间的均方误差,生成分布对齐损失,其中,所述第一目标行为分布是基于与各训练轮次对应的第一置信度权重与第一预测行为分布的分布熵对所述各训练轮次的第一预测行为分布进行加权聚合得到的目标行为分布,所述第二目标行为分布是基于与所述各训练轮次对应的第二置信度权重与第二预测行为分布的分布熵对所述各训练轮次的第二预测行为分布进行加权聚合得到的目标行为分布; 基于所述对比损失和所述分布对齐损失,生成所述目标函数损失值; 其中,基于所述第一预测行为分布与第一目标行为分布之间的均方误差、以及所述第二预测行为分布与第二目标行为分布之间的均方误差,生成分布对齐损失,包括:对所述第一预测行为分布与所述第一目标行为分布之间的均方误差、以及所述第二预测行为分布与所述第二目标行为分布之间的均方误差进行区间离散化处理,将所述第一预测行为分布与所述第一目标行为分布之间的均方误差、以及所述第二预测行为分布与所述第二目标行为分布之间的均方误差划分为多个不同数值区间,并计算所述不同数值区间的加权残差;基于所述不同数值区间的加权残差,计算所述第一预测行为分布和所述第二预测行为分布之间的非线性响应误差变化,并将所述非线性响应误差变化作为所述分布对齐损失。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人世优(北京)科技股份有限公司,其通讯地址为:100015 北京市朝阳区酒仙桥北路7号60幢一层021;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。