安徽大学张义军获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉安徽大学申请的专利优化子目标生成方法、覆盖路径规划方法、设备及介质获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120907562B 。
龙图腾网通过国家知识产权局官网在2025-12-09发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202511448325.0,技术领域涉及:G01C21/20;该发明授权优化子目标生成方法、覆盖路径规划方法、设备及介质是由张义军;邹宗霖;杜库;余涛;胥成林;余志伟;赵冬;钟凯设计研发完成,并于2025-10-11向国家知识产权局提交的专利申请。
本优化子目标生成方法、覆盖路径规划方法、设备及介质在说明书摘要公布了:本发明公开了优化子目标生成方法、覆盖路径规划方法、设备及介质,所述方法包括:为分层强化学习的高层策略和底层策略提供多尺度观测空间;定义一组具有高层策略和底层策略的分层强化学习框架;在一组多尺度地图上训练并使用一组邻接网络,用于将指定环境状态坐标映射至一组嵌入空间,使得在所述嵌入空间中的欧氏距离能够用于有效表征两点状态之间在真实环境中的可达性或过渡成本;在分层强化学习框架中利用所述邻接网络对高层策略生成的子目标进行约束,优先选择局部可达的子目标。本发明能够有效缩小高层策略的子目标搜索空间,使其生成的子目标既具有全局战略性,又具备局部可行性。
本发明授权优化子目标生成方法、覆盖路径规划方法、设备及介质在权利要求书中公布了:1.优化子目标生成方法,用于优化智能体移动轨迹的路径子目标,其特征在于,包括: 定义一组具有高层策略和底层策略的分层强化学习框架; 在一组多尺度地图上训练并使用一组参数集合为的邻接网络,用于将指定环境状态坐标映射至一组嵌入空间,所述嵌入空间中的欧氏距离用于表征状态间的可达性; 在分层强化学习框架中利用所述邻接网络对高层策略生成的子目标进行约束,优先选择局部可达的子目标; 所述邻接网络的训练流程包括: 使用随机策略或专家策略在指定环境中收集任一组智能体的状态转移轨迹; 对于状态转移轨迹中的任一状态对,如果所述状态对的时间步差小于等于预设阈值,则所述状态对设定为邻接,否则设定为不邻接; 使用标注好的数据,通过对比损失函数训练邻接网络,使邻接的状态对在嵌入空间中的距离减小,使不邻接的状态对在嵌入空间中的距离增大; 对于训练后的邻接网络,使用一组总损失函数对高层策略生成的子目标进行约束,具体包括: L1.利用训练好的邻接网络,将高层策略选择子目标的行为约束为其近似最短转移距离,存在邻接损失,所述邻接损失的形式为铰链损失函数,所述邻接损失定义为: 其中,是由所述邻接网络输出的嵌入向量距离计算得到的状态间近似最短转移距离,k为邻接步数阈值; L2.定义一个伪地标作为临时的引导方向,其中存在地标损失,所述地标损失定义为: 其中,为L2范数,地标损失用于衡量子目标在嵌入空间中与伪地标的接近程度; L3.将上述损失项与标准强化学习损失结合,形成高层策略的最终总损失函数,所述总损失函数定义为: 其中,表示为标准强化学习损失,用于高层策略学习的奖励损失项,表示为邻接损失的权重超参数,用于平衡局部可行性约束的强度,表示为地标损失的权重超参数,用于平衡全局引导的强度。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人安徽大学,其通讯地址为:230601 安徽省合肥市经济技术开发区九龙路111号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励