西南科技大学周怀芳获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉西南科技大学申请的专利引入剂量因子的深度强化学习核应急机器人路径规划方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119164396B 。
龙图腾网通过国家知识产权局官网在2025-07-22发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411282334.2,技术领域涉及:G01C21/20;该发明授权引入剂量因子的深度强化学习核应急机器人路径规划方法是由周怀芳;霍建文;张华;向索祎;张仕靖;凌铭润;胡旭林;孙俊;李林静;林海涛;张雨楠设计研发完成,并于2024-09-13向国家知识产权局提交的专利申请。
本引入剂量因子的深度强化学习核应急机器人路径规划方法在说明书摘要公布了:本发明提供了一种引入剂量因子的深度强化学习核应急机器人路径规划方法,涉及机器人路径规划技术领域,该方法以深度强化学习算法为基础,利用A*算法启发式函数,引入累积辐射剂量算子和距离算子,训练得到应用于辐射环境路径规划的目标网络;利用目标网络,在辐射剂量和障碍物发生动态变化时,完成对核应急机器人路径的自适应调整。本发明通过加强核应急机器人在作业过程中与环境的交互能力,为核应急机器人提供辐射风险小的无碰撞自适应作业路径,为核应急机器人应急决策提供支持。
本发明授权引入剂量因子的深度强化学习核应急机器人路径规划方法在权利要求书中公布了:1.一种引入剂量因子的深度强化学习核应急机器人路径规划方法,其特征在于,包括以下步骤: S1、基于深度强化学习算法,综合考虑辐射剂量和时间对核应急机器人的影响,通过引入累积辐射剂量算子和距离算子,训练得到应用于核应急机器人路径规划的目标网络; S2、根据目标网络参数,对核应急机器人路径进行规划; 所述步骤S1包括以下步骤: S101、初始化机器人初始状态矩阵st、容量为H的经验池D、目标网络target_net的参数、策略网络policy_net的参数,其中,初始状态st包括核应急地图中障碍物信息和辐射剂量分布信息s1以及核应急机器人执行的动作信息s2; S102、生成两个0到1之间的随机数α和ε; S103、判断是否αε,若是,则引入累积辐射剂量算子和距离算子得到核应急机器人需要执行的动作at和下一个状态矩阵st+1,其中,核应急机器人执行动作选择过程中引入A*算法启发式思想,否则,进入步骤S104; S104、利用策略网络policy_net确定核应急机器人需要执行的动作at,得到下一个状态矩阵st+1; S105、计算核应急机器人执行动作at后获得的奖励值rt; S106、将st,at,rt,st+1放入经验池D中; S107、随机从经验池D中采集B个样本数据minibatch={sj,aj,rj,sj+1},其中,sj,aj,rj,sj+1分别表示从经验池D中取出的B个状态、动作、奖励值和下一个状态,j表示从经验池中采集的样本序号; S108、结合采集的B个样本数据,根据策略网络policy_net得到动作价值和期望值yj,其中,表示在当前的动作状态矩阵,aj和θe分别表示利用policy_net后得到的动作和policy_net参数; S109、根据和yj求损失函数,并对损失函数进行梯度下降,完成对策略网络policy_net参数的更新; S1010、当更新次数达到设置的阈值后,结合目标网络target_net复制策略网络policy_net中的参数,完成对目标网络target_net的更新; 所述步骤S103中核应急机器人需要执行的动作at的表达式如下: at=min{ω1Disi+ω2Dosei} 其中,ω1和ω2分别表示核应急机器人路径距离和累积辐射剂量之间的权重系数,Dosei和Disi为两个集合,表示核应急机器人分别执行集合At中的动作后与终点E之间的累积辐射剂量和距离,At表示核应急机器人执行第i个动作后与相邻可执行动作组成的集合,N表示将核应急机器人当前位置到终点E之间的距离划分的段数,z表示划分后的节点集合,表示核应急机器人可执行动作集合At中第i个动作与第z个节点之间的累积辐射剂量,表示核应急机器人可执行动作集合At中第i个动作与第z+1个节点之间的累积辐射剂量,表示核应急机器人执行第i个动作后与终点之间的欧式距离,v表示核应急机器人的速度。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人西南科技大学,其通讯地址为:621010 四川省绵阳市涪城区青龙大道59号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。
请提出您的宝贵建议,有机会获取IP积分或其他奖励