北京科技大学夏丽娜获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉北京科技大学申请的专利多无人机最优博弈受限加速强化学习控制方法及装置获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120779739B 。
龙图腾网通过国家知识产权局官网在2026-01-23发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510938915.5,技术领域涉及:G05B13/04;该发明授权多无人机最优博弈受限加速强化学习控制方法及装置是由夏丽娜;范筱玥;马靖超;李擎;宋睿卓;鲁小雅;芮溢泽;袁立;李江昀;杨高富;张意坚;刘路;王圣然;唐梦兆设计研发完成,并于2025-07-08向国家知识产权局提交的专利申请。
本多无人机最优博弈受限加速强化学习控制方法及装置在说明书摘要公布了:本发明提供一种多无人机最优博弈受限加速强化学习控制方法及装置,涉及加速强化学习技术领域。该方法包括:构建评判神经网络,逼近带双曲线正切函数和博弈邻居项的性能指标函数、无人机的最优受限控制输入和无人机最坏情况下的受限控制输入;基于上述输入参数,构建哈密尔顿‑雅可比误差方程;通过误差方程,构建包含当前信息和过去信息的带调节参数的求和平方误差;设计评判神经网络的权值更新律;根据权值更新律,计算下一次迭代的权值;求解相邻两次迭代权值的误差,并与预设阈值进行比较,若误差小于预设的阈值,停止迭代,输出逼近分布式无人机系统最优博弈一致控制问题的解。采用本发明可提升无人机之间的协作效率。
本发明授权多无人机最优博弈受限加速强化学习控制方法及装置在权利要求书中公布了:1.一种多无人机最优博弈受限加速强化学习控制方法,其特征在于,所述方法包括: S1、构建评判神经网络,初始化评判神经网络的权值; S2、基于评判神经网络,逼近带双曲线正切函数和博弈邻居项的性能指标函数、无人机的最优受限控制输入和无人机最坏情况下的受限控制输入; 其中,所述S2的基于评判神经网络,逼近带双曲线正切函数和博弈邻居项的性能指标函数、无人机的最优受限控制输入和无人机最坏情况下的受限控制输入的过程,通过下述公式1-3表示: 1 2 3 其中,表示性能指标函数估计值;表示初始化评判神经网络权值;表示基函数;表示无人机i的相对状态误差;表示无人机的最优博弈受限控制估计值;表示无人机j的最优博弈受限控制估计值;tanh表示双曲正切函数;表示对称正定矩阵;表示矩阵的逆;是矩阵的转置;表示基函数关于的偏导;是的转置;是无人机控制输入受限的界;是无人机i控制输入受限的界;是对称正定矩阵的逆,是无人机输入动态矩阵的转置,是衰减水平; 其中,所述无人机i的相对状态误差通过下述公式4表示: 4 其中,表示无人机系统动态矩阵;表示无人机i相对状态误差;表示无人机的入度邻居数量;代表从无人机到无人机存在一个有向路径,否则,;代表无人机可以获取参考追随信息,否则,;是无人机的输入动态矩阵,是无人机的控制输入; S3、根据所述性能指标函数、无人机的最优受限控制输入和无人机最坏情况下的受限控制输入,构建哈密尔顿-雅可比误差方程; S4、根据哈密尔顿-雅可比误差方程,构建包含当前无人机状态信息和过去无人机状态信息的带调节参数的求和平方误差; S5、根据所述带调节参数的求和平方误差,设计评判神经网络的权值更新律;根据评判神经网络的权值更新律,计算下一次迭代的最新权值; S6、求解当前迭代的评判神经网络权值与下一次迭代评判神经网络权值的误差;将所述误差与预设的阈值进行比较,若所述误差小于预设的阈值,停止迭代,输出当前迭代的评判神经网络权值;其中当前迭代的评判神经网络权值为逼近分布式无人机系统最优博弈一致控制问题的解。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人北京科技大学,其通讯地址为:100083 北京市海淀区学院路30号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励