哈尔滨工业大学高海波获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉哈尔滨工业大学申请的专利一种基于强化学习的六足机器人腿臂复用控制方法及装置获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120993711B 。
龙图腾网通过国家知识产权局官网在2026-02-03发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202511508291.X,技术领域涉及:G05B11/42;该发明授权一种基于强化学习的六足机器人腿臂复用控制方法及装置是由高海波;丁亮;张哲霖;徐鹏;杨怀广;邓宗全设计研发完成,并于2025-10-22向国家知识产权局提交的专利申请。
本一种基于强化学习的六足机器人腿臂复用控制方法及装置在说明书摘要公布了:本申请公开了一种基于强化学习的六足机器人腿臂复用控制方法及装置,涉及运动控制领域。所述方法包括:获取目标六足机器人的观测信息;将观测信息输入至控制策略模型,得到目标六足机器人的期望关节角度;控制策略模型是根据构建的多任务训练环境,采用强化学习的方法,基于价值网络对训练架构进行策略更新后得到的;训练架构是基于师生特权学习确定的;价值网络包括依次连接的共享特征层以及多任务头;训练架构包括:状态估计编码器、地形信息编码器、特权信息编码器、历史信息编码器和本体网络;采用PD控制方法基于期望关节角度确定关节力矩,以对目标六足机器人腿臂复用进行控制。本申请可实现对六足机器人的腿臂复用控制。
本发明授权一种基于强化学习的六足机器人腿臂复用控制方法及装置在权利要求书中公布了:1.一种基于强化学习的六足机器人腿臂复用控制方法,其特征在于,包括: 获取目标六足机器人的观测信息; 将所述观测信息输入至控制策略模型,得到目标六足机器人的期望关节角度;所述控制策略模型是根据构建的多任务训练环境,采用强化学习的方法,基于价值网络对训练架构进行策略更新后得到的;所述训练架构是基于师生特权学习确定的;所述价值网络包括依次连接的共享特征层以及多任务头;所述训练架构包括:状态估计编码器、地形信息编码器、特权信息编码器、历史信息编码器和本体网络; 采用PD控制方法基于所述期望关节角度确定关节力矩,以对目标六足机器人腿臂复用进行控制; 所述多任务训练环境是采用课程化的方式并添加鲁棒训练机制确定的;所述多任务训练环境包括基础运动控制任务模态、静止态全身操作任务模态以及动态运动耦合操作任务模态; 其中,基础运动控制任务模态是通过生成节律性步态模式实现目标线速度与角速度的动态跟踪; 静止态全身操作任务模态是在维持稳定支撑姿态的同时,指定肢体末端执行器对预设目标位置进行跟踪,通过正向运动学与碰撞检测算法确定腿部工作空间内所有可行区域,并随机选取设定个数的肢体末端对随机采样目标点进行轨迹跟踪; 动态运动耦合操作任务模态是同步执行基座速度指令与指定足端执行器的联合轨迹跟踪; 鲁棒训练机制为在基座移动训练中,通过向目标六足机器人根部施加任意方向冲量模拟外部扰动环境;在操作训练阶段,采用全向力-扭矩组合对足端执行器进行随机加载,以模拟负载交互场景。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人哈尔滨工业大学,其通讯地址为:150001 黑龙江省哈尔滨市南岗区西大直街92号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励