集美大学黄伯敏获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉集美大学申请的专利基于简化环境与动力学的无人艇路径规划强化学习方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120235212B 。
龙图腾网通过国家知识产权局官网在2025-10-03发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510711379.5,技术领域涉及:G06N3/092;该发明授权基于简化环境与动力学的无人艇路径规划强化学习方法是由黄伯敏;李俞謄;张爽设计研发完成,并于2025-05-29向国家知识产权局提交的专利申请。
本基于简化环境与动力学的无人艇路径规划强化学习方法在说明书摘要公布了:本发明提出基于简化环境与动力学的无人艇路径规划强化学习方法,步骤如下:搭建真实环境,设定无人艇状态s为无人艇位置,奖励函数r为无人艇规划路径的长度的负值,无人艇具有高阶带不确定参数的动力学模型,控制信号为u;搭建简易环境,无人艇状态ss、奖励函数rs、环境障碍物的设定与真实环境相同,无人艇具有二阶积分串型动力学模型,控制信号为us;设计第一策略网络与简易环境交互,输入和输出分别为简易环境无人艇状态ss和控制信号us;设计第二策略网络与第一策略网络和真实环境交互,输入和输出分别为简易环境的控制信号us和真实环境的控制信号u;并完成两个策略网络的训练。本发明简化了无人艇系统在复杂环境中的路径规划。
本发明授权基于简化环境与动力学的无人艇路径规划强化学习方法在权利要求书中公布了:1.基于简化环境与动力学的无人艇路径规划强化学习方法,其特征在于,具体包括以下步骤: 步骤1:搭建真实环境E,设定无人艇状态s包括无人艇位置,奖励函数r为无人艇规划路径的长度的负值,无人艇具有高阶带不确定参数的动力学模型,输入的控制信号为u; 步骤2:搭建简易环境Es,其中无人艇状态ss、奖励函数rs、环境障碍物的设定与真实环境E相同,并且无人艇具有二阶积分串型动力学模型,输入的控制信号为us; 步骤3:基于多层感知机设计第一策略网络;所述第一策略网络与简易环境Es交互,且第一策略网络输入为简易环境的无人艇状态ss,输出为简易环境的控制信号us; 所述第一策略网络用于实现简易环境和简易模型中的路径规划;所述多层感知机包括输入层、L层隐藏层和输出层;在输入层和输出层之间,网络通过全连接层进行数据处理; 输入层接收简易环境无人艇状态ss;每一隐藏层的输出hl表示为: hl=σWlhl‑1+bl,l=1,2...,L其中,l取1时,hl‑1为输入层h0,表示无人艇的状态ss;Wl和bl分别是第l层的权重矩阵和偏置项,σ是激活函数; 输出层的计算为: youtput=WouthL+bout其中,hL是最后一层隐藏层L的输出;Wout和bout分别是输出层的权重矩阵和偏置项;输出层的输出youtput即为简易环境的控制信号us; 步骤4:基于多层感知机设计第二策略网络;所述第二策略网络与第一策略网络和真实环境E交互,且第二策略网络输入为简易环境的控制信号us,输出为真实环境的控制信号u; 所述第二策略网络用于将简易环境和简易模型得到的路径规划控制信号转化为真实环境和真实模型中的控制信号;所述第二策略网络包括输入层、L层隐藏层和输出层;网络输入层接收简易环境的控制信号us,输出层输出真实环境的控制信号u; 步骤5:基于PPO算法训练第一策略网络,训练目标为最大化简易环境奖励函数rs对应的累计奖励; 步骤6:基于PPO算法训练第二策略网络,训练目标为最小化两个环境中状态之间的误差和奖励之间的误差。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人集美大学,其通讯地址为:361021 福建省厦门市集美区银江路185号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。
请提出您的宝贵建议,有机会获取IP积分或其他奖励