山东大学周乐来获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉山东大学申请的专利一种双四足串联组合体控制方法、系统、介质及设备获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN121043154B 。
龙图腾网通过国家知识产权局官网在2026-02-03发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202511587449.7,技术领域涉及:B25J9/16;该发明授权一种双四足串联组合体控制方法、系统、介质及设备是由周乐来;李国伟;孙靖宇;荣学文;李贻斌设计研发完成,并于2025-11-03向国家知识产权局提交的专利申请。
本一种双四足串联组合体控制方法、系统、介质及设备在说明书摘要公布了:本发明涉及机器人控制技术领域,提供了一种双四足串联组合体控制方法、系统、介质及设备,包括:对于前后子系统,分别获取观测数据,使用各自的子系统演员网络,生成适用于各自子系统的动作;将两个子系统的动作整合为一个可以在组合体上执行的整体动作,并将整体动作部署到组合体,进行环境交互;进行环境交互后,对于前后子系统,分别更新观测数据,使用各自的子系统评论家网络,生成各自子系统的状态值估计,基于状态值估计,计算各自的总体损失,依据总体损失,进行各自的子系统演员网络和评论家网络的更新后,进入下一轮的动作生成和环境交互。在保证整体协调性的同时,提高了训练效率和两个子系统的灵活性。
本发明授权一种双四足串联组合体控制方法、系统、介质及设备在权利要求书中公布了:1.一种双四足串联组合体控制方法,其特征在于,包括: 设计双子系统的观测空间与奖励函数; 对观测数据进行分类,产生的观测数据被划分为前子系统观测数据和后子系统观测数据两类,前子系统观测数据和后子系统观测数据均由整体全局状态和各子系统局部状态两部分构成; 对奖励函数分类,奖励函数根据子系统进行分类,分别设计为前子系统奖励函数和后子系统奖励函数; 双子系统演员-评论家神经网络的设计与独立更新; 定义两个独立的演员-评论家神经网络多层感知机,分别是前子系统演员-评论家多层感知机和后子系统演员-评论家多层感知机,用于前后两个子系统策略的独立更新;前后子系统的演员-评论家多层感知机处理各自对应系统的观测数据; 设计基于强化学习算法的优化策略; 采用PPO算法优化策略函数,通过设计前子系统策略优化模块和后子系统策略优化模块,实现双策略独立优化;包括:动作概率计算、动态调整学习率、总体损失计算; 所述总体损失包括策略损失、价值损失和熵损失; 所述策略损失用于优化策略网络,计算公式为: ;其中,为子系统新旧策略比;是裁剪范围的超参数;是优势函数估计;表示子系统的即时奖励;clip是一种限制策略更新幅度的机制; 所述价值损失用于优化价值网络,计算公式为:;其中,为子系统累计回报;为子系统状态下的状态值估计;表示第i个子系统在时间步t的状态; 所述熵损失计算公式为:; 其中,;是策略的熵;为子系统i当前策略,参数为;为子系统状态;为子系统在状态采取的动作; 基于独立策略的动作生成与部署; 同策略运行器基于不断更新的演员-评论家网络参数生成前子系统动作和后子系统动作,并将两者整合为一个整体动作,该动作将在机器人上进行执行,产生新的观测数据。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人山东大学,其通讯地址为:250000 山东省济南市历下区经十路17923号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励