合肥工业大学魏振春获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉合肥工业大学申请的专利基于边权建模的图分层强化学习方法、终端及存储介质获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120874901B 。
龙图腾网通过国家知识产权局官网在2026-01-06发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202511366505.4,技术领域涉及:G06N3/042;该发明授权基于边权建模的图分层强化学习方法、终端及存储介质是由魏振春;赵成;吕增威;乔焰;刘彬彬;石雷;徐娟;张弛;张本宏设计研发完成,并于2025-09-24向国家知识产权局提交的专利申请。
本基于边权建模的图分层强化学习方法、终端及存储介质在说明书摘要公布了:本发明涉及分层强化学习技术领域,公开了基于边权建模的图分层强化学习方法、终端及存储介质。该方法从下层缓冲池的轨迹数据中随机采样得到第一候选节点集,从上层缓冲池的轨迹数据中随机采样得到第二候选节点集,在候选节点集中选取若干目标节点形成图结构节点集合;针对图结构节点集合中的任意两个节点,分别计算状态转移边权、能量距离边权和神经网络预测边权,将三种边权进行加权融合以计算总边权值;当两个节点间的总边权值不小于预设阈值时,保留对应的边并在该边中加入总边权值,形成具备语义边权的图结构,将图结构应用于分层强化学习的策略训练与路径规划。本发明提升了图结构的代表性和全局性,图结构具备更强的表达能力和可解释性。
本发明授权基于边权建模的图分层强化学习方法、终端及存储介质在权利要求书中公布了:1.基于边权建模的图分层强化学习方法,其特征在于,用于构建图结构,所述图结构应用于机械臂或移动机器人在分层强化学习中的策略训练与路径规划;所述方法包括以下步骤: S1.从下层缓冲池的轨迹数据中随机采样得到第一候选节点集,从上层缓冲池的轨迹数据中随机采样得到第二候选节点集;其中,下层缓冲池和上层缓冲池中的轨迹数量相同;下层缓冲池的每条轨迹包含T1个时间步,每个时间步的格式为,从下层缓冲池中采样得到若干个时间步作为第一候选节点集;上层缓冲池的每条轨迹包含T2个时间步,每个时间步的格式为;其中,T1>T2,表示节点状态,表示下层智能体实现的目标,表示子目标,表示执行的动作,表示理想目标;上层缓冲池用于优先保留任务中的关键状态,所述关键状态包括迷宫中的分岔路口、机器人操作中的抓取时刻; S2.在第一候选节点集与第二候选节点集中选取若干个目标节点,形成图结构节点集合; S3.针对图结构节点集合中的任意两个节点,分别计算状态转移边权、能量距离边权和神经网络预测边权,并将三种边权进行加权融合以计算总边权值;其中,所述状态转移边权基于当前策略下由一节点状态到另一节点状态的可达概率确定;所述能量距离边权基于节点间状态空间的欧氏距离以及所需动作的能量综合确定;所述神经网络预测边权基于训练得到的评分模型确定,该评分模型以节点状态对与理想目标构成的三元组作为输入,通过多层感知网络结构进行非线性映射与特征融合,从而生成表征节点状态对之间可达性、任务相关性及执行成功概率的语义化评分值; S4.当两个节点之间的总边权值不小于预设阈值时,保留对应的边并在该边中加入总边权值,形成具备语义边权的图结构。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人合肥工业大学,其通讯地址为:230009 安徽省合肥市包河区屯溪路193号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励