Document
拖动滑块完成拼图
个人中心

预订订单
商城订单
发布专利 发布成果 人才入驻 发布商标 发布需求

请提出您的宝贵建议,有机会获取IP积分或其他奖励

投诉建议

在线咨询

联系我们

龙图腾公众号
专利交易 商标交易 积分商城 国际服务 IP管家助手 科技果 科技人才 会员权益 需求市场 关于龙图腾 更多
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 西北工业大学刘星获国家专利权

西北工业大学刘星获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉西北工业大学申请的专利面向机器人操作技能学习的人员仿真现实混合训练方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN116047904B

龙图腾网通过国家知识产权局官网在2026-03-27发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202211737858.7,技术领域涉及:G05B13/04;该发明授权面向机器人操作技能学习的人员仿真现实混合训练方法是由刘星;黄攀峰;王高照;刘正雄;常海涛;马志强设计研发完成,并于2022-12-30向国家知识产权局提交的专利申请。

面向机器人操作技能学习的人员仿真现实混合训练方法在说明书摘要公布了:本发明公开了一种面向机器人操作技能学习的人员仿真现实混合训练方法,首先进行基于规则知识指导的复杂操作任务阶段的划分及运动规划的生成,使用人的先验知识分析所要学习的操作技能的流程,把操作过程划分成若干阶段;其次构建了融合专家偏好评价和固定指标评价的操作技能学习优化方法;之后构建了一种从仿真环境到实际场景的操作技能转移及评价框架,以相似度函数为依据,生成实际环境中的探索参数与动作指令,完成操作技能的转移;最后构建了机器人技能学习与技能转移的逻辑框架,通过迭代的方法渐次提升机器人操作技能学习的完成度和技能转移的完整度。本发明有效提高了机器人技能学习的效率。

本发明授权面向机器人操作技能学习的人员仿真现实混合训练方法在权利要求书中公布了:1.一种面向机器人操作技能学习的人员仿真现实混合训练方法,其特征在于,包括以下步骤: 步骤1:操作过程预处理部分; 步骤1-1:划分操作过程阶段; 操作过程涉及到的环境和机器人的所有运动学和动力学参数的集合称为状态空间,用集合S来表示; 将完成操作任务所需的全部中间状态提取出来,设有n个中间状态,从而全部中间状态表示为:S0,S1,S2,…,Sn,依据这n个中间状态将全部操作过程划分为n个阶段,用G1,G2,…,Gn表示;阶段Gi表示从状态Si-1到状态Si的一个状态转化,用下式表示: Gi=triggerSi-1,Si1 步骤1-2:明确阶段转移的约束条件; 如果有n个操作过程阶段,就会相应生成n-1个转换条件判断函数,用C1,C2,…,Cn表示;转换条件Ci表示对阶段Gi-1的状态是否满足阶段Gi条件的一个判断; 转换条件Ci表示为如下形式: 其中conditionsSi∈Si,表示阶段Gi所必须满足的状态; 步骤1-3:生成机器人的动作规划; 阶段Gi看成是一段点到点的运动轨迹,机器人根据环境的约束条件和任务要求,得到约束后的运动轨迹,用下式表示: 其中参数Wi=wi1,wi2,…,wim表示运动轨迹生成所需的参数,bi表示约束条件;所有动作规划的集合表示成:A=A1,A2,…,An; 步骤1-4:完成对关键特征参数的提取; 关键特征参数就是优化算法要优化的参数,用符号K表示,参数的选取范围包括:conditionsS、W、b; 步骤2:仿真环境中参数的优化部分; 步骤2-1:更新与仿真环境交互的运动规划; 使用高斯分布对特征参数K取N个向量值,表示为:其中μ和σ分别为特征参数高斯分布的均值和标准差;然后更新步骤1-3中的运动规划: 步骤2-2:生成执行动作策略; 采用跟踪控制的方法实现轨迹追踪: 其中是t时刻的跟踪误差; 步骤2-3:计算动作策略的奖励函数; 从步骤2-2收集回来N段轨迹ρ:ρ1,ρ2,…,ρN,构建奖励值计算每次执行任务的奖励值 步骤2-4:关键特征参数的优化; 根据步骤2-3生成的奖励函数,采用梯度上升算法计算奖励值对特征参数方差的梯度,然后通过如下公式对参数更新的学习率α进行调节: α=α0+εμ7 其中参数εμ代表人对参数迭代步长的判断,基于奖励值对应的参数值的情况做出的; 参数更新的公式如下: μ←μ+αΔμ8 σ←σ-Δσ-εσ9 其中参数Δσ为定值,参数εσ根据操作任务的实际情况调整;越靠近最大奖励值点,参数εσ越小; 一次更新完成后,返回步骤2-1,直到奖励值稳定; 步骤3:仿真环境到实际操作环境技能转移部分; 步骤3-1:相似度函数的构建; 比较仿真环境与实际环境的动力学参数的相似程度,如果已知此参数的数学特性,则直接计算仿真环境与真实环境中此参数特性分布的KL散度;否则,需要估计此参数的动力学特性,通过进行对比试验的方式获得;最终获得的KL散度矩阵如下,作为相似度的衡量指标: R=[Dx1,x′1,Dx2,x′2,…,Dxp,x′p,…]T 其中Dxp,x′p为动力学参数xp在仿真与现实中特性的KL散度; 步骤3-2:特征参数的筛选与转移; 衡量每一个特征参数K涉及到的环境动力学参数,根据每一个动力学参数对特征参数的重要程度赋予其重要性权值w,列写重要性权重矩阵W: W=[w1,w2,…,wp,…]T 再与相似度函数矩阵对应项相乘,获得此特征参数仿真环境与真实环境的相对误差值: EK=WT*R11 如果特征参数K对应的相对误差值大于等于阈值,则特征参数K作为真实环境中需要进一步探索的参数;如果相对误差值小于阈值,则不改变特征参数K的大小,直接转移到真实的环境中;得到真实环境中探索的特征参数:Kphysical; 步骤3-3:运动规划的转移; 比较仿真与实际环境的空间特征,对照仿真环境的标准设计实际机器人的控制参数; 步骤4:实际环境中的技能优化部分; 步骤4-1:生成与真实环境交互的动作策略; 使用高斯分布对特征参数Kphysical取N′个向量值,表示为:更新运动规划:采用式4的方法实现轨迹追踪; 步骤4-2:特征参数的优化; 构建奖励函数根据式5~10的方法对特征参数进行更新; 一次更新完成后,返回步骤4-1,直到算法收敛,算法结束; 最终机器人系统得到在实际操作环境中的特征参数,进而掌握此项操作技能。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人西北工业大学,其通讯地址为:710072 陕西省西安市友谊西路;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。