南京信息工程大学何易臻获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉南京信息工程大学申请的专利一种适用于微控制器的快速训练型无人机强化学习策略方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN121256961B 。
龙图腾网通过国家知识产权局官网在2026-02-17发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202511793935.4,技术领域涉及:G06F30/15;该发明授权一种适用于微控制器的快速训练型无人机强化学习策略方法是由何易臻;杨溢;李朝阳设计研发完成,并于2025-12-02向国家知识产权局提交的专利申请。
本一种适用于微控制器的快速训练型无人机强化学习策略方法在说明书摘要公布了:本发明公开了一种适用于微控制器的快速训练型无人机强化学习策略方法,属于无人机控制技术领域,包括:构建包含电机一阶延迟特性的标准四旋翼动力学模型模拟真实物理系统;采用非对称演员‑评论家架构确保策略的鲁棒性和可迁移性;通过基于课程学习机制动态调整奖励函数系数,采用离线策略算法优化网络参数;进行网络训练及过程优化;对训练好的策略网络进行轻量化处理与部署流程,将仿真中的策略落地至资源受限的真实硬件平台,共同实现快速训练、可靠迁移与轻量部署,实现无人机在嵌入式平台上高频率的自主飞行控制。本发明方法可以使高性能强化学习控制策略在资源受限的微控制器上稳定、高效运行,极大降低了智能无人机的硬件成本与功耗。
本发明授权一种适用于微控制器的快速训练型无人机强化学习策略方法在权利要求书中公布了:1.一种适用于微控制器的快速训练型无人机强化学习策略方法,其特征在于,包括如下步骤: 步骤1、无人机动力学模型建模与仿真环境框架搭建:构建包含电机一阶延迟特性的标准四旋翼动力学模型,模拟真实物理系统,搭建基于深度强化学习训练的仿真框架,进行超实时快速训练数据生成,得到高精度浮点型初始策略网络; 步骤2、构建深度强化学习模型:采用非对称演员‑评论家架构,通过演员网络处理真实系统可用的观测,通过评论家网络利用仿真特权信息指导训练,并在演员网络输入中引入动作历史,补偿电机延迟带来的可观性问题; 步骤3、构建策略网络的迭代优化算法:基于课程学习机制动态调整奖励函数系数,将TD3算法应用于包含电机延迟和高阶动态的无人机仿真环境中,通过经验回放缓冲区中的数据,以离线策略方式交替优化演员网络与评论家网络; 步骤4、网络训练过程优化,包括:经验回放缓冲区进行分层采样优化、梯度更新的双阶段约束优化、训练稳定性的自适应学习率调整及嵌入式部署适配的训练后期量化感知优化; 步骤5、模型轻量化与部署:对训练好的策略网络进行轻量化部署处理,通过推理加速与容错控制保证轻量化模型的稳定,生成优化的嵌入式推理代码并集成至微控制器,微控制器通过调用推理引擎,实时处理传感器估计的状态信息并直接输出电机控制指令,实现无人机在嵌入式平台上高频率的自主飞行控制。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人南京信息工程大学,其通讯地址为:210032 江苏省南京市江北新区宁六路219号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励