当前位置 : 首页 > 专利喜报 > 东南大学曹向辉获国家专利权

东南大学曹向辉获国家专利权

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

龙图腾网获悉东南大学申请的专利一种基于多智能体强化学习方法的无人机集群分布式协同制导律获国家发明授权专利权，本发明授权专利权由国家知识产权局授予，授权公告号为：CN116610139B 。

龙图腾网通过国家知识产权局官网在2025-07-15发布的发明授权授权公告中获悉：该发明授权的专利申请号/专利号为：202310415715.2，技术领域涉及：G05D1/46；该发明授权一种基于多智能体强化学习方法的无人机集群分布式协同制导律是由曹向辉;吴忠浩设计研发完成，并于2023-04-18向国家知识产权局提交的专利申请。

本一种基于多智能体强化学习方法的无人机集群分布式协同制导律在说明书摘要公布了：本发明公开了一种基于多智能体强化学习的无人机集群分布式协同制导律，包括以下几个步骤：步骤1：初始化强化学习网络参数，并将当前网络参数复制到目标网络，初始化经验回放池；步骤2：与环境进行交互，对于每个智能体获得初始状态，以及相应的局部观测；步骤3：将每个智能体获得的局部观测输入对应的策略网络，步骤4：将策略网络输出项通过协同制导律得到每个智能体对应的动作；步骤5：每个智能体执行动作，并且与环境进行交互，获得当前动作的奖励以及下一时刻的状态以及观察，并存入经验回放池；步骤6：从经验回放池中取出历史经验，等；该方案具有更快的训练速度以及更强的协同性，能够有效实现无人机集群分布式协同制导。

本发明授权一种基于多智能体强化学习方法的无人机集群分布式协同制导律在权利要求书中公布了：1.一种基于强化学习的无人机集群分布式协同制导律，其特征在于，该制导律中强化学习网络训练包括以下步骤：步骤1：初始化强化学习网络参数，并将当前网络参数复制到目标网络，初始化经验回放池以及环境，步骤2：与环境进行交互，对于每个智能体获得初始状态，以及相应的局部观测，步骤3：将每个智能体获得的局部观测输入对应的策略网络，得到当前的有效导航比和协同控制项，步骤4：将策略网络输出项通过协同制导律得到每个智能体对应的动作，步骤5：每个智能体执行动作，并且与环境进行交互，获得当前动作的奖励以及下一时刻的状态以及观察，并存入经验回放池，步骤6：从经验回放池中取出历史经验，通过评价网络和混合网络来获得历史动作的值，并通过损失函数对网络参数进行梯度更新，步骤7：采取软更新方式更新在线网络和目标网络的参数，步骤8：重复上述步骤，直到强化学习网络达到收敛；其中，步骤4中将每个智能体的有效导航比和协同控制项输入基于强化学习的协同制导律，其中有效导航比作为强化学习输出动作通过比例导引律输出对应部分动作，计算公式如下：式中，为当前有效导航比，表示第架无人机与目标之间的相对距离，表示第架无人机与目标的弹目视线角速度, 其中，与通过无人机与目标的非线性相对运动方程解出，形式如下：式中，，代表无人机，代表目标，表示目标速度，表示第架无人机的速度，表示第架无人机的加速度，表示弹道倾角，表示弹目视线角，为第架无人机的航向角误差，表示目标相对第架无人机的弹道倾角，表示目标相对第架无人机的弹目视线角，表示目标相对第架无人机的航向角误差，为第架无人机与目标之间的相对距离, 最后对于智能体，其对应动作为有效导航比输入传统比例引导律得到的加速度与强化学习网络输出的协同控制项结合：

如需购买、转让、实施、许可或投资类似专利技术，可联系本专利的申请人或专利权人东南大学，其通讯地址为：210096 江苏省南京市玄武区四牌楼2号；或者联系龙图腾网官方客服，联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

请提出您的宝贵建议，有机会获取IP积分或其他奖励

东南大学曹向辉获国家专利权

热门推荐

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务