Document
拖动滑块完成拼图
个人中心

预订订单
服务订单
发布专利 发布成果 人才入驻 发布商标 发布需求

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 北京理工大学宋鹏获国家专利权

北京理工大学宋鹏获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉北京理工大学申请的专利一种基于元强化学习的多机器人动态任务规划方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN118859952B

龙图腾网通过国家知识产权局官网在2025-07-18发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202410901603.2,技术领域涉及:G05D1/43;该发明授权一种基于元强化学习的多机器人动态任务规划方法是由宋鹏;史大威;陈怀宇;崔楷欣;王军政设计研发完成,并于2024-07-05向国家知识产权局提交的专利申请。

一种基于元强化学习的多机器人动态任务规划方法在说明书摘要公布了:本发明公开了一种基于元强化学习的多机器人动态任务规划方法,涉及机器人系统任务调度领域,S1:建立多个具有代表性的任务规划场景的数学模型;S2:应用元强化学习方法,在步骤S1中建立的任务规划场景中进行预训练,得到通用的任务规划算法参数;S3:建立目标任务规划场景的数学模型;S4:应用深度强化学习方法,基于步骤S2中得到的算法参数进行微调,得到适合目标场景的最优任务规划方法。本发明设计了一种基于元强化学习的任务规划算法,在任务无法预先确定的动态任务规划场景中,能在较短时间内获得效率较高的任务规划方案,且在场景发生变化时,能在少次更新后达到与原先持平的性能水平,极大地提高了算法对动态环境的适应能力。

本发明授权一种基于元强化学习的多机器人动态任务规划方法在权利要求书中公布了:1.一种基于元强化学习的多机器人动态任务规划方法,其特征在于:包括以下步骤: S1:建立多个具有代表性的任务规划场景的数学模型; 挑选多个具有代表性的任务规划场景作为预训练场景,并对其进行建模,定义场景中的关键变量和约束条件,将实际规划问题转化为组合优化问题,具体表示为: 将任务规划问题的时间范围划分为个离散时间段,每个时间段长度相等,定义任务的时间相关信息均离散为时间段长度的整数倍,则任务的时间相关约束如公式1至公式3所示, (1) (2) (3) 其中公式(1)表示任务实际被分配时段必须在任务可用时段及任务对机器人可用时段内;公式(2)表示任务实际被分配时段的长度应为移动至任务所需时长与任务执行时长之和;公式(3)表示同一机器人执行的不同任务不应有重叠; 公式(1)-(3)中,与分别表示任意两个不同任务的序号;表示任意一个机器人的序号;表示时段的开始时间,表示时段的结束时间;为第个任务的执行时长;为移动至第个任务所需时长;与分别表示任务可用时段的起始时间与结束时间;与分别表示任务对机器人可用时段的起始时间与结束时间;与表示任务实际被分配给机器人的时段的起始时间与结束时间; 定义目标函数如公式4所示: (4) 表示大小为的机器人集合,;表示大小为的任务集合,;为时间片段数量;表示中任意一个任务的序号;表示中任意一个机器人的序号;表示任务的优先级;表示任务是否被分配给机器人,取值为1时,表示任务被分配给机器人,为0时则相反;规划成功的任务越多,规划的任务优先级越高,值越大;算法在最大化值的同时,也应服从机器人间的约束,约束公式如公式(5)所示: (5) 约束表示任一任务被不同机器人执行的次数应不大于1; 算法与环境进行互动时,从环境获取状态,使用大小为机器人数量乘时间片段数量的状态矩阵来表示每个机器人在每个时间片段的占用情况,如公式6所示: (6) 其中,表示在第步中,机器人在第个时间片段上的占用情况,将环境的所有可能的状态定义为状态集,状态矩阵的所有可能取值均在状态集中; S2:应用元强化学习方法,在步骤S1中建立的任务规划场景中进行预训练,得到通用的任务规划算法参数; S3:建立目标任务规划场景的数学模型; S4:应用深度强化学习方法,基于步骤S2中得到的算法参数进行微调,得到适合目标场景的最优任务规划方法。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人北京理工大学,其通讯地址为:100081 北京市海淀区中关村南大街5号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。