哈尔滨工业大学白成超获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉哈尔滨工业大学申请的专利一种基于改进A-star算法与强化学习的集群路径规划方法及系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119902432B 。
龙图腾网通过国家知识产权局官网在2025-07-25发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411951191.X,技术领域涉及:G05B13/04;该发明授权一种基于改进A-star算法与强化学习的集群路径规划方法及系统是由白成超;颜鹏;郑红星;张家维;陈亮;孙云彬;胡砚洋设计研发完成,并于2024-12-27向国家知识产权局提交的专利申请。
本一种基于改进A-star算法与强化学习的集群路径规划方法及系统在说明书摘要公布了:本发明提供一种基于改进A‑star算法与强化学习的集群路径规划方法及系统,属于无人机集群控制领域。为解决现有传统路径规划中未考虑集群体积导致其碰撞和在高动态环境下失效问题。本发明基于改进的A*路径规划算法进行路径规划,考虑约束条件生成最优路径;通过局部目标点的设定,引导高速飞行器沿最短路径飞行;结合SAC强化学习算法,构建奖励函数以引导高速飞行器向目标飞行;根据高速飞行器的约束条件设计目标飞行奖励;采用基于改进A‑star与深度强化学习的分层控制框架,进一步优化集群飞行路径和避障能力。本发明在复杂障碍环境中确保集群的精确路径规划与稳定编队控制,有效提升了无人机集群在复杂环境中的避障能力和协同控制。
本发明授权一种基于改进A-star算法与强化学习的集群路径规划方法及系统在权利要求书中公布了:1.一种基于改进A-star算法与强化学习的集群路径规划方法,其特征在于,包括以下步骤: S100、无人机建模与环境建模,包括对高速无人机进行运动学建模以及对任务优化问题进行建模; S200、采用分层控制器的编队控制框架,上层使用改进的A*算法对障碍物密集区域的情况进行控制,考虑无人机集群体积与障碍物影响范围、高速飞机过载约束与飞行轨迹平滑度构建启发函数; 考虑高速飞行器的过载约束和飞行轨迹的平滑性,在完成基于A*算法进行的初始规划后,将若干区间两端的节点连接起来,作为高速飞行器集群的局部目标点;集群将自主完成从一个目标点到下一个目标点的飞行任务; 对智能体的动作空间进行如下表达: a=[ax,ay] ax,ay∈[-2,-1,0,1,2] ax+ay≥2,ax×ay≠1 其中,ax,ay分别代表向x方向和y方向的动作; 将障碍物设置为圆形障碍物,若智能体与障碍物发生碰撞,则移除该方向上的路径点,并停止对碰撞点位置的进一步探索; 为了检查路径是否与障碍物相交,将上一时刻的出发点与当前目标点的连线,若该连线的投影上不包含障碍物,则路径应满足如下约束: ||xnext,ynext-xobs,yobs||2>robs 其中,xnext,ynext表示当前路径的局部目标点,xobs,yobs表示距离无人机当前位置最近的障碍物位置坐标,则两坐标间的距离需要大于障碍物半径robs; 若局部路径线的投影中包含障碍物,则路径满足如下约束: dxobs,yobs-linexcurrent,ycurrent,xnext,ynext<robs 其中,linexcurrent,ycurrent,xnext,ynext表示局部路径线,从当前位置到下一局部目标点的路径线,xobs,yobs表示障碍物位置坐标; 若障碍物位置到路径线的距离小于预设的障碍物半径,则认为此时的路径线是与障碍物圆柱相交的,若无人机集群按照此路线行驶则会与障碍物发生碰撞; 对集群体积进行约束,假设飞行器集群的半径为rformation,虚拟障碍物的半径为: r=robs+rformatio\ S300、规划算法完成初步规划后,在地图中生成到达目标点的最短路径,以规定的搜索步长选取最短路径上的局部目标点; S400、下层通过SAC强化学习算法实现无人机的局部路径跟踪控制和动态避障控制,包括设计观测空间、动作空间和奖励函数; SAC强化学习算法的输入是观测空间中采集到观测数据并输出从动作空间中选取无人机应当执行的动作, 每个智能体通过与环境的交互来学习策略,飞行器的目标是在单个回合中获得最大的长期期望奖励总和: 其中,γ∈[0,1]为折扣因子,当γ→1时允许学习策略更多地关注长期奖励,Rt+k代表智能体在第t+k步获得的奖励; 高速飞行器的观测空间包括自身状态、周围飞行器状态、障碍物信息和目标状态;飞行器自身的状态包括飞行器自身位置信息[x,y,z],飞行器飞行速度信息[vx,vy,vz];周围飞行器状态信息则包括自身飞行器与周围飞行器相对位置关系[Δx,Δy,Δz]和相对速度关系[Δvx,Δvy,Δvz];障碍物信息包括障碍物与飞行器的相对位置信息[Δxo,Δyo];以及获取目标与飞行器的相对位置信息[Δxt,Δyt,Δzt]; 高速飞行器的动作空间由飞行器的法向过载组成,法向过载包括两个方向[ny,nz],由神经网络输出的过载大小需要进行限幅以确保飞行器的实际过载是小于其允许的最大过载值。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人哈尔滨工业大学,其通讯地址为:150001 黑龙江省哈尔滨市南岗区西大直街92号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。