中国海洋大学李光亮获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉中国海洋大学申请的专利一种生成对抗交互自模仿学习的多AUV编队与避障方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119336013B 。
龙图腾网通过国家知识产权局官网在2025-12-12发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411137054.2,技术领域涉及:G05D1/43;该发明授权一种生成对抗交互自模仿学习的多AUV编队与避障方法是由李光亮;陈天浩;方政;沈天设计研发完成,并于2024-08-19向国家知识产权局提交的专利申请。
本一种生成对抗交互自模仿学习的多AUV编队与避障方法在说明书摘要公布了:本发明公开了一种生成对抗交互自模仿学习的多AUV编队与避障方法,多AUV编队与避障方法基于多个AUV,每个AUV分别部署有一个策略网络、一个价值网络以及一个鉴别器,每个AUV还分别具有一个临时轨迹池,每个AUV具有专家演示轨迹,所述多AUV编队与避障方法包括:编队训练各AUV,包括:对所有AUV进行编队,按照编队顺序分别训练各个AUV的策略模型;AUV的策略模型训练方法包括:将AUV放置在目标环境中运动,获得时间步的局部观测;生成策略轨迹;从策略轨迹和专家演示轨迹中抽取一定数量的状态动作对训练所述AUV的鉴别器。本发明的生成对抗交互自模仿学习的多AUV编队与避障方法,在多AUV策略模型训练过程中,每个AUV仅通过自己的局部观测进行决策,极大地减小了需要频繁交换信息带来的通信延迟、数据丢失等问题。
本发明授权一种生成对抗交互自模仿学习的多AUV编队与避障方法在权利要求书中公布了:1.一种生成对抗交互自模仿学习的多AUV编队与避障方法,其特征在于,所述多AUV编队与避障方法基于多个AUV,每个AUV分别部署有一个策略网络、一个价值网络以及一个鉴别器,每个AUV还分别具有一个临时轨迹池,每个AUV具有专家演示轨迹,所述多AUV编队与避障方法包括: 编队训练各AUV,包括:对所有AUV进行编队,按照编队顺序分别训练各个AUV的策略模型; AUV的策略模型训练方法包括: 将AUV放置在目标环境中运动,获得时间步t的局部观测oi,t,其中,i表示AUV的编号; 将局部观测oi,t输入至所述AUV的策略网络得到动作ai,t; 执行动作ai,t,获得下一个时间步t+1的局部观测,直至完成当前回合的所有动作; 生成当前回合的状态动作对的合集,为策略轨迹τi: τi=[oi,1,ai,1,oi,2,ai,2,…,oi,t,ai,t]; 从策略轨迹τi和专家演示轨迹τiE中抽取一定数量的状态动作对训练所述AUV的鉴别器 该回合鉴别器输出的所有奖励更新所述AUV的策略网络和价值网络 所述多AUV编队与避障方法还包括将策略轨迹τi与专家演示轨迹τiE进行比较,如果策略轨迹τi优于专家演示轨迹τiE,则将τi存放至临时轨迹池τiT中,否则进入下一回合; 当临时轨迹池τiT达到存储上限时,将当前专家演示轨迹τiE替换为临时轨迹池τiT,同时清空临时轨迹池τiT。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人中国海洋大学,其通讯地址为:266100 山东省青岛市崂山区松岭路238号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励