中国北方车辆研究所盖江涛获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉中国北方车辆研究所申请的专利基于深度强化学习的履带车辆轨迹跟踪精度优化方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119830011B 。
龙图腾网通过国家知识产权局官网在2026-01-06发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411900138.7,技术领域涉及:G06F18/214;该发明授权基于深度强化学习的履带车辆轨迹跟踪精度优化方法是由盖江涛;陈宇轩;李耀恒;贺帅;成城;李欢欢;邹武俊设计研发完成,并于2024-12-23向国家知识产权局提交的专利申请。
本基于深度强化学习的履带车辆轨迹跟踪精度优化方法在说明书摘要公布了:本发明属于无人履带车辆轨迹跟踪控制技术领域,具体涉及一种基于深度强化学习的履带车辆轨迹跟踪精度优化方法,包括:步骤一:根据履带车辆建立基于瞬时转向中心的运动学模型;步骤二:根据经验设置预测时域控制时域,对未来轨迹进行预测;步骤三:设计深度强化学习状态量和动作量;步骤四:设计深度强化学习Critic网络和Actor网络的结构;步骤五:对智能体进行训练;进行多轮迭代优化,直至达到理想的训练效果;步骤六:导出训练好的智能体进行在线运算,实时解算出需要的补偿输出值,与步骤二输出的控制量相加,作为底层执行系统的输入;至此,完成控制量的补偿,实现对轨迹跟踪控制的实时优化。该方法提升了履带车辆轨迹跟踪的精度。
本发明授权基于深度强化学习的履带车辆轨迹跟踪精度优化方法在权利要求书中公布了:1.一种基于深度强化学习的履带车辆轨迹跟踪精度优化方法,其特征在于,所述方法包括: 步骤一:根据履带车辆建立基于瞬时转向中心的运动学模型,将运动学模型在参考点处一阶泰勒展开,使用雅可比矩阵求状态空间方程的系数矩阵A和B,将非线性系统线性化; 步骤二:根据经验设置预测时域、控制时域,对未来轨迹进行预测,确定损失函数J,使用预测过程中的参数表示损失函数,设置约束条件考虑电机的响应特性和车辆的横向稳定性,使用二次规划求解器结算出最优控制序列ΔU,采用第一组控制量Δut,将过去的控制量与求解出的Δut求和输出; 步骤三:设计深度强化学习状态量和动作量;选取车辆状态参数作为观测量,确定补偿参数为输出量,并设计奖励函数r; 步骤四:设计深度强化学习Critic网络和Actor网络的结构,搭建基于深度强化学习算法的智能体,设置训练参数; 步骤五:对智能体进行训练;根据训练效果,调整奖励函数,进行多轮迭代优化,直至达到理想的训练效果; 步骤六:导出训练好的智能体进行在线运算,实时解算出需要的补偿输出值,与步骤二输出的控制量相加,作为底层执行系统的输入;至此,完成控制量的补偿,实现对轨迹跟踪控制的实时优化; 其中,所述步骤一中,根据履带车辆建立基于瞬时转向中心的运动学模型, 其中,车辆在全局坐标系中的位置和姿态为X,Y,θ,其中θ为履带车的航向角;在局部车体坐标系中,vx,vy,ωz分别是车辆的纵向速度,横向速度和横摆角速度;xc,yc为履带车的转向中心,xl,yl为履带车辆左侧履带的瞬时转向中心,xr,yr为履带车辆右侧履带的瞬时转向中心,分别为履带左侧卷绕速度和右侧卷绕速度; 将运动学模型在参考点处一阶泰勒展开,使用雅可比矩阵求状态空间方程的系数矩阵,将非线性系统线性化,再进行离散化,得到状态空间方程: 其中X=[X,Y,θ]T,为状态量,为控制量; 需要对其进行线性化和离散化;将运动学方程在参考点处进行泰勒展开,并通过前向欧拉进行离散化得 其中, 其中,Ts为采样时间,为左右主动轮轮速的参考值,θd为航向角的参考值。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人中国北方车辆研究所,其通讯地址为:100072 北京市丰台区槐树岭4号院;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励