南京大学迟宇翔获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉南京大学申请的专利基于强化学习的多目标复杂交通场景下自动驾驶解决方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN114701517B 。
龙图腾网通过国家知识产权局官网在2025-07-22发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202210370991.7,技术领域涉及:B60W60/00;该发明授权基于强化学习的多目标复杂交通场景下自动驾驶解决方法是由迟宇翔;范彧设计研发完成,并于2022-04-07向国家知识产权局提交的专利申请。
本基于强化学习的多目标复杂交通场景下自动驾驶解决方法在说明书摘要公布了:本发明公开一种基于强化学习的多目标复杂交通场景下自动驾驶解决方法,该方法可以使用一套强化学习自动驾驶建模方法处理所有交通场景,具有较好的通用性。强化学习综合建模基于传统强化学习框架,使用环境感知信息及结合人类知识提取的特征量作为观测空间。模型训练基于时变训练策略,提高训练速度和策略应用的泛化性。为对其形式安全性作进一步保障,还提出了基于长短时记忆LSTM网络的危险动作识别器与基于人类知识体的规则约束器,从环境中采样并训练危险动作识别器,使车辆具备识别危险动作与危险场景的能力,并针对特定情形设计规则约束对输出动作加以限制,可以大大提高安全性,减少碰撞次数,以保障车辆的行驶安全。
本发明授权基于强化学习的多目标复杂交通场景下自动驾驶解决方法在权利要求书中公布了:1.一种基于强化学习的多目标复杂交通场景下自动驾驶解决方法,其特征在于,包括如下步骤: 步骤1,准备用于自动驾驶仿真的模拟器环境以及复杂行驶场景; 步骤2,在观测空间中添加训练强化学习模型所需的环境特征信息作为环境观测信息,包括自车信息、他车信息和道路信息,根据所述环境特征信息计算关键特征信息,包括每条车道距离前车的碰撞时间、自车距离碰撞点的碰撞时间差、自车与前方路点的朝向角方差; 步骤3,设置所述强化学习模型训练所需的奖励框架; 步骤4,基于时变训练法训练所述强化学习模型,再结合使用元模型在不同的交通场景下继续训练,每隔一定迭代轮数根据智能体行车表现情况及发生碰撞的种类修改训练时的奖励权重,重复修改多次权重以结束训练; 步骤5,输出训练完成的所述强化学习模型后构建危险动作识别器与规则约束器,根据所述环境观测信息判断场景危险程度,来限制或调整所述强化学习模型所输出的规划量,并通过在仿真环境中观察效果不断手动添加和优化规则。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人南京大学,其通讯地址为:210046 江苏省南京市栖霞区仙林大道163号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。