Document
拖动滑块完成拼图
个人中心

预订订单
商城订单
发布专利 发布成果 人才入驻 发布商标 发布需求

请提出您的宝贵建议,有机会获取IP积分或其他奖励

投诉建议

在线咨询

联系我们

龙图腾公众号
专利交易 积分商城 国际服务 IP管家助手 科技果 科技人才 商标交易 会员权益 需求市场 关于龙图腾 更多
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 山东大学宋勇获国家专利权

山东大学宋勇获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉山东大学申请的专利基于深度强化学习的多智能体地标覆盖方法及系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN116227622B

龙图腾网通过国家知识产权局官网在2026-03-10发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202310094608.4,技术领域涉及:G06N20/00;该发明授权基于深度强化学习的多智能体地标覆盖方法及系统是由宋勇;郭仕凤;庞豹;许庆阳;袁宪锋;刘冰;李贻斌设计研发完成,并于2023-02-07向国家知识产权局提交的专利申请。

基于深度强化学习的多智能体地标覆盖方法及系统在说明书摘要公布了:本公开涉及智能体控制技术领域,提出了一种基于深度强化学习的多智能体地标覆盖方法及系统,为了避免智能体训练到后期出现收敛速度慢的现象,将深度强化学习方法与传统人工势场方法相结合,将人工势场信息添加到原状态空间对状态空间升维,解决智能体由于环境部分观测导致决策效果差的问题,其次针对步数与相对距离结合设计奖励函数解决探索初期智能体所获得的奖励稀疏的问题,使得智能体有效避障,同时有效提升智能体的学习效率,提升训练效率,提高了地标覆盖的效率。

本发明授权基于深度强化学习的多智能体地标覆盖方法及系统在权利要求书中公布了:1.基于深度强化学习的多智能体地标覆盖方法,其特征在于,包括如下步骤: 针对多智能体,建立基于深度确定性策略梯度算法的多智能体强化学习框架模型; 将人工势场信息添加到原状态空间对状态空间升维,将智能体每个状态下的势场与原状态空间结合进行智能体自身状态更新; 将步数与相对距离结合改进奖励函数,在智能体每个状态根据距离与步数信息对智能体进行奖励或惩罚;改进后的奖励函数包括距离引导奖励、步数惩罚奖励、障碍碰撞惩罚奖励及目标到达奖励; 根据升维后的状态空间以及改进后的奖励函数,对深度确定性策略梯度算法的多智能体强化学习框架模型,进行训练得到更新后的模型参数; 获取进行地标覆盖的任务分配信息,以及智能体的状态信息,输入至训练好的多智能体强化学习框架模型,得到多智能体的最优运动规划路径; 人工势场信息的确定方法为,设定目标点对智能体产生引力场,障碍物对智能体产生斥力场,通过智能体与障碍物之间的相对距离、智能体与目标点之间的相对距离计算对应的引力或斥力,斥力和引力之和为智能体所受合力,智能体所受合力为人工势场信息; 距离引导奖励表示为: ; ; 其中,为智能体当前位置坐标,为智能体目标点坐标,为智能体与目标之间的距离; 采用人工势场进行奖励引导,公式为: ; ; 其中,为人工势场路径坐标,为智能体偏移人工势场路径坐标的距离。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人山东大学,其通讯地址为:264209 山东省威海市文化西路180号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。