南栖仙策(南京)高新技术有限公司胡刚获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉南栖仙策(南京)高新技术有限公司申请的专利一种基于离线强化学习的无人机自主特技飞行的通用方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119902552B 。
龙图腾网通过国家知识产权局官网在2025-12-30发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411715398.7,技术领域涉及:G05D1/495;该发明授权一种基于离线强化学习的无人机自主特技飞行的通用方法是由胡刚设计研发完成,并于2024-11-27向国家知识产权局提交的专利申请。
本一种基于离线强化学习的无人机自主特技飞行的通用方法在说明书摘要公布了:本发明公开了一种基于离线强化学习的无人机自主特技飞行的通用方法,包括收集无人机的历史飞行数据,收集时尽量覆盖无人机飞行中的各种姿态;筛选无人机关键的观测量、动作量,对观测量和动作量进行处理,构建符合马尔科夫决策过程的飞行数据;构建无人机空气动力学网络模型;利用符合马尔科夫决策过程的飞行数据,对无人机空气动力学网络模型进行训练,得到贴合真实数据的无人机空气动力学的网络模型;在贴合真实数据的无人机空气动力学的网络模型中利用强化学习算法训练策略模型;将特定的特技飞行轨迹处理后输入训练后的策略模型,模型输出动作,指导无人机实现特定的特技飞行动作,本方法放弃传统的基于监督学习的虚拟环境克隆,使用基于对抗神经网络和分布对齐损失的优化方法,同时本方法采用双环境检验,避免策略学习中的过拟合问题。
本发明授权一种基于离线强化学习的无人机自主特技飞行的通用方法在权利要求书中公布了:1.一种基于离线强化学习的无人机自主特技飞行的通用方法,其特征在于,所述方法包括以下步骤: S1、收集无人机的历史飞行数据,收集时尽量覆盖无人机飞行中的各种姿态; S2、筛选无人机关键的观测量、动作量,对观测量和动作量进行处理,构建符合马尔科夫决策过程的飞行数据; S3、构建无人机空气动力学网络模型; S4、利用符合马尔科夫决策过程的飞行数据,对无人机空气动力学网络模型进行训练,得到贴合真实数据的无人机空气动力学的网络模型; 所述步骤S4的具体步骤,利用符合马尔科夫决策过程的飞行数据,对无人机空气动力学网络模型进行训练,得到贴合真实数据的无人机空气动力学的网络模型; 马尔科夫决策过程数学形式为: 状态序列:S=s0,s1,s2,…,st,其中st∈S表示在时间步t的状态, 动作序列:A=a0,a1,a2,…,at,其中at∈A表示在时间步t的动作, 转移概率,状态转移可表示为:Pst+1|st,at,表示在状态st下采取动作at后,转移到下一个状态st+1的概率, 整条轨迹形式: 无人机空气动力学网络模型的训练过程,即是学习真实世界中的状态转移概率P的过程,训练目标是对于无人机的任意状态和该状态下做出的任意合法动作sany,aany,真实世界的概率转移和网络模型输出的概率转移相同; 使用基于对抗神经网络和分布对齐损失的优化方法: 1从一条轨迹的起始点开始,将起始点的状态量和动作量s0,a0输入生成网络,输出下一时刻的状态量将和轨迹中下一时刻的动作量a1组合起来得到输入生成网络,输出下一时刻的状态量以此类推得到整条轨迹的预测状态量 2将整条轨迹的预测状态量与历史数据中的状态量s0,s1,s2,…,st计算分段分布对齐损失,其中,设置分段长度L,将整条轨迹切分为N段,相邻两段前后有13的状态量是重复的,针对每段计算分布对其损失; 3判别网络用于判断一段数据是否是真实数据,训练数据为历史数据s0,a0,s1,a1,s2,a2,…,st和生成网络的生成数据s0,a0,训练过程中也采用了分段的策略; 4为了生成网络见过更多的动作,提升在动作上的泛化性,提供可选择的第二阶段训练,第二阶段的生成器会同时生成下一时刻的状态量和动作量,得到整条轨迹的预测状态量s0,a0,使用s0,a0,s1,a1,s2,a2,…,st和s0,a0,计算分段分布对齐损失,并优化判别器; S5、在贴合真实数据的无人机空气动力学的网络模型中利用强化学习算法训练策略模型; S6、将特定的特技飞行轨迹处理后输入训练后的策略模型,模型输出动作,指导无人机实现特定的特技飞行动作。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人南栖仙策(南京)高新技术有限公司,其通讯地址为:211135 江苏省南京市江宁区麒麟科技创新园天骄路100号江苏南京侨梦苑A栋703室;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励