Document
拖动滑块完成拼图
个人中心

预订订单
商城订单
发布专利 发布成果 人才入驻 发布商标 发布需求

请提出您的宝贵建议,有机会获取IP积分或其他奖励

投诉建议

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 积分商城 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 上海交通大学王琳获国家专利权

上海交通大学王琳获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉上海交通大学申请的专利一种基于对抗强化学习的自动驾驶优化控制方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN116224996B

龙图腾网通过国家知识产权局官网在2026-02-06发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202211715787.0,技术领域涉及:G05D1/46;该发明授权一种基于对抗强化学习的自动驾驶优化控制方法是由王琳;刘克宇;周俊洁设计研发完成,并于2022-12-28向国家知识产权局提交的专利申请。

一种基于对抗强化学习的自动驾驶优化控制方法在说明书摘要公布了:本发明涉及一种基于对抗强化学习的自动驾驶优化控制方法,包括以下步骤:设计对抗智能体控制部分关键场景因素,以构建对抗场景;利用对抗场景对车辆进行训练,得到优化后的驾驶算法;将优化后的驾驶算法应用于车辆控制器,以相应控制车辆的行驶状态。与现有技术相比,本发明在给定场景下,为本车设计第1代强化学习的驾驶策略,再采用不完全零和博弈构建对抗过程,生成多个对抗智能体与本车的驾驶算法进行对抗,不断迭代优化本车驾驶算法的鲁棒性。由此基于对抗强化学习的方式,以迭代优化得到鲁棒性增强的自动驾驶算法,从而有效提升自动驾驶控制的效率和场景鲁棒性。

本发明授权一种基于对抗强化学习的自动驾驶优化控制方法在权利要求书中公布了:1.一种基于对抗强化学习的自动驾驶优化控制方法,其特征在于,包括以下步骤: S1、设计对抗智能体控制部分关键场景因素,以构建对抗场景; S2、利用对抗场景对车辆进行训练,得到优化后的驾驶算法; S3、将优化后的驾驶算法应用于车辆控制器,以相应控制车辆的行驶状态; 步骤S1具体是通过生成多个非零和博弈对抗智能体,由对抗智能体与本车进行对抗,所述本车和对抗智能体的对抗目标为: 其中,μego和μsat分别是本车智能体和场景智能体的策略函数,是优化目标,Gt为积累回报,St为环境状态随机变量,γ为回报折扣,Rn为环境提供的回报随机变量,与环境、本车智能体、场景智能体以及其他场景元素有关; 所述本车智能体的策略函数μego的优化目标为优化策略函数得到最大的积累回报;所述场景智能体为了对抗本车,优化目标是优化策略函数最小化该积累回报; 步骤S2具体是将生成得到的多个对抗场景提供给本车进行训练,在本车每回合训练时采样出一个不同的场景提供给本车进行训练; 步骤S2使用优先成功率方法从场景库中筛选出训练场景,假设共有n个场景,在训练过程中实时统计本车在n个场景中的任务成功率,根据任务成功率从低到高进行排序,记场景Si的排名为rankSi,则Si被采样到的概率pi为 其中,δ∈Z为随机扰动,场景i归一化后的采样概率Pi即为

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人上海交通大学,其通讯地址为:200240 上海市闵行区东川路800号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。