东北大学刘奇获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉东北大学申请的专利一种基于多智能体强化学习的单体机器人动态操纵方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN121650025B 。
龙图腾网通过国家知识产权局官网在2026-04-14发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202610172202.7,技术领域涉及:B25J9/16;该发明授权一种基于多智能体强化学习的单体机器人动态操纵方法是由刘奇;穆子航;徐一博;张翔智;王一洲;于健;丁其川设计研发完成,并于2026-02-06向国家知识产权局提交的专利申请。
本一种基于多智能体强化学习的单体机器人动态操纵方法在说明书摘要公布了:本发明提供一种基于多智能体强化学习的单体机器人动态操纵方法,涉及单体机器人技术领域。本发明的方法将单一带臂四足机器人的动态操纵构建为一个协作式的多智能体强化学习MARL问题。具体而言,该方法基于多智能体近端策略优化算法MAPPO,四条腿分别视为四个独立的同构智能体,并通过共享同一套网络参数实现高效的运动协同,同时将机械臂建模为另一个独立的异构的智能体,采用另一套参数以专注于操纵任务。通过这种异构智能体的协同建模方式,能够在统一的强化学习框架下实现移动与操纵的紧密配合,从而显著提升带臂四足机器人在非结构化环境中的任务完成效率与鲁棒性。
本发明授权一种基于多智能体强化学习的单体机器人动态操纵方法在权利要求书中公布了:1.一种基于多智能体强化学习的单体机器人动态操纵方法,其特征在于,包括以下步骤: 步骤1:对单一带臂四足机器人进行建模,并进行形式化描述; 步骤2:设计状态感知模块; 所述状态感知模块用于采集机器人各部位的状态信息; 步骤3:设计策略推理模块、Actor网络以及评论家Critic网络; 所述策略推理模块将带臂四足机器人划分为四足运动系统与机械臂操纵系统,其中四足运动系统由四个同构智能体构成,并通过共享同一套参数的第一Actor网络接收四足运动系统中四个腿部智能体的局部串联观测,而机械臂操纵系统则作为一个独立的异构智能体,采用另一套参数的第二Actor网络处理机械臂智能体的专属的操纵观测,从而在统一的强化学习框架下实现运动与操纵的协同推理,具体基于多智能体近端策略优化算法MAPPO,通过集中式价值函数评估与分布式策略执行机制实现; 步骤4:建立分层解耦奖励机制,具体引入了末端执行器速度跟踪奖励,以及末端执行器位姿跟踪奖励; 步骤5:两阶段训练流程实现动态操纵; 通过在CTDE范式建立多智能体强化学习框架,将状态感知模块、策略推理模块与分层解耦奖励机制统一集成,在此架构下,采用两阶段训练流程,第一阶段仅训练四足运动系统获得稳定的行走基础策略,第二阶段则在保留行走基础策略的基础上引入机械臂智能体的局部观测与专有奖励,使四足与机械臂在统一框架下实现协同优化,实现单体机器人动态操纵。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人东北大学,其通讯地址为:110819 辽宁省沈阳市和平区文化路三号巷11号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励