苏州工学院赵彩虹获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉苏州工学院申请的专利基于强化学习的移动机器人导航控制方法、系统及存储介质获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN121277190B 。
龙图腾网通过国家知识产权局官网在2026-03-27发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202511845602.1,技术领域涉及:G05D1/43;该发明授权基于强化学习的移动机器人导航控制方法、系统及存储介质是由赵彩虹;周旭;陈燕雨;周瑞;杨家杰设计研发完成,并于2025-12-09向国家知识产权局提交的专利申请。
本基于强化学习的移动机器人导航控制方法、系统及存储介质在说明书摘要公布了:本发明公开了一种基于强化学习的移动机器人导航控制方法、系统及存储介质,将机器人运动的实际环境离散化为网格地图,在此基础上构建机器人的强化学习模型用于导航;估计环境中障碍物的变化规律,在利用强化学习获取最优策略的过程中得到各障碍物向不同方向变化的概率,计算任一时刻任一障碍物组合变化条件下的重学习的累计回报和维持原策略的累计回报;计算任一时刻的重学习收益,和重学习代价,得到任一时刻的重学习净收益,根据得到的重学习净收益确定进行重学习的最佳时刻。避免每次环境变化都会重新进行一次强化学习以获得当前变化环境后的最优策略,可以降低每一时刻均重学习所带来的安全风险。
本发明授权基于强化学习的移动机器人导航控制方法、系统及存储介质在权利要求书中公布了:1.一种基于强化学习的移动机器人导航控制方法,其特征在于,包括以下步骤: S01:将机器人运动的实际环境离散化为网格地图,在此基础上构建机器人的强化学习模型用于导航; S02:估计环境中障碍物的变化规律,在利用强化学习获取最优策略的过程中得到各障碍物向不同方向变化的概率,计算任一时刻任一障碍物组合变化条件下的重学习的累计回报和维持原策略的累计回报; S03:计算任一时刻的重学习收益,和重学习代价,得到任一时刻的重学习净收益,根据得到的重学习净收益确定进行重学习的最佳时刻;计算任一时刻的重学习收益为: 其中,表示第种障碍物组合变化的概率,,表示第i个障碍物向第j个方向变化的概率,为障碍物的总个数,为阈值;为进行重学习后在变化后环境中的累计回报,为维持原策略在变化后环境中的累计回报; 计算任一时刻的重学习代价为: 其中,为当前强化学习已经获得或者具备的最优策略根据当前状态求出对应的动作,是危险动作集合,为一个函数,当时,值为1,否则值为0。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人苏州工学院,其通讯地址为:215500 江苏省苏州市常熟市南三环路99号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励