Document
拖动滑块完成拼图
个人中心

预订订单
商城订单
发布专利 发布成果 人才入驻 发布商标 发布需求

请提出您的宝贵建议,有机会获取IP积分或其他奖励

投诉建议

在线咨询

联系我们

龙图腾公众号
专利交易 商标交易 积分商城 国际服务 IP管家助手 科技果 科技人才 会员权益 需求市场 关于龙图腾 更多
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 中科南京人工智能创新研究院张琳获国家专利权

中科南京人工智能创新研究院张琳获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉中科南京人工智能创新研究院申请的专利基于多智能体强化学习的水下潜航器协同探测方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN121254280B

龙图腾网通过国家知识产权局官网在2026-03-27发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202511802195.6,技术领域涉及:G01S15/86;该发明授权基于多智能体强化学习的水下潜航器协同探测方法是由张琳;黄振宇;力环才设计研发完成,并于2025-12-02向国家知识产权局提交的专利申请。

基于多智能体强化学习的水下潜航器协同探测方法在说明书摘要公布了:本发明公开了一种基于多智能体强化学习的水下潜航器协同探测方法,包括:获取潜航器的原始观测流、海流场数据及声速剖面数据,生成包含潜航器运动学估计与水声链路延迟分布的时序增强状态;基于时序增强状态,调用预先训练的策略模型,输出约束乘子向量;依据约束乘子向量,并结合能量上限约束、信噪比阈值约束与最小安全距离约束,执行下层优化,生成包含路径集合与连通性配置的可行规划解;基于可行规划解,调用预先训练的评论家模型,核算通信价值评估;依据通信价值评估与通信触发门限,决策是否执行水声通信。本发明解决了高延迟异步状态下的表征失效、强化学习与复杂物理约束解耦困难及通信资源效率低下的技术问题。

本发明授权基于多智能体强化学习的水下潜航器协同探测方法在权利要求书中公布了:1.一种基于多智能体强化学习的水下潜航器协同探测方法,其特征在于,包括: 获取潜航器的原始观测流、海流场数据及声速剖面数据,生成包含潜航器运动学估计与水声链路延迟分布的时序增强状态; 基于时序增强状态,调用预先训练的策略模型,输出约束乘子向量; 依据约束乘子向量,并结合能量上限约束、信噪比阈值约束与最小安全距离约束,执行下层优化,生成包含路径集合与连通性配置的可行规划解; 基于可行规划解,调用预先训练的评论家模型,核算通信价值评估; 依据通信价值评估与预设的通信触发门限,决策是否执行水声通信; 预先训练的策略模型和评论家模型,训练步骤,包括: 在训练环境中,获取海流场数据及声速剖面数据,生成训练时序状态; 基于训练时序状态,执行双层联合优化,生成训练可行规划解,并生成反映能量上限约束、信噪比阈值约束与最小安全距离约束松紧程度的对偶奖励; 基于训练可行规划解与对偶奖励,执行事件触发通信仿真,生成包含状态-动作对与对偶奖励的经验样本集; 利用经验样本集,执行一体化训练,用于更新策略模型与评论家模型; 执行双层联合优化,包括: 由策略模型预设的上层策略网络,依据训练时序状态,推断出训练约束乘子向量; 下层带约束优化利用训练约束乘子向量,求解生成训练可行规划解及拉格朗日乘子; 基于训练可行规划解与拉格朗日乘子,核算生成影子价格集合; 依据影子价格集合与训练可行规划解对应的约束违约度,构造生成对偶奖励; 核算生成影子价格集合,包括: 基于训练可行规划解与拉格朗日乘子,组装KKT系统; 针对包括能量上限、信噪比阈值或最小安全距离在内的关键约束,对KKT系统执行隐式微分; 基于隐式微分后的KKT系统,求解关键约束对训练约束乘子向量的敏感度指标,将敏感度指标计算为影子价格集合。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人中科南京人工智能创新研究院,其通讯地址为:211135 江苏省南京市江宁区创研路266号麒麟人工智能产业园3号楼3楼;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。